Nghiên cứu phương pháp tư vấn dựa trên hành vi người dùng mạng xã hội (tt)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (706.71 KB, 20 trang )

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
---------------------------------------

NGUYỄN THỊ YẾN

NGHIÊN CỨU PHƯƠNG PHÁP TƯ VẤN DỰA TRÊN
HÀNH VI NGƯỜI DÙNG TRONG MẠNG XÃ HỘI

Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01.01

TÓM TẮT LUẬN VĂN THẠC SĨ

HÀ NỘI - 2016

Luận văn được hoàn thành tại:
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG

Người hướng dẫn khoa học: TS. VŨ VĂN THỎA

Phản biện 1:
……………………………………………………………………
Phản biện 2:
……………………………………………………………………

Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ
tại Học viện Công nghệ Bưu chính Viễn thông
Vào lúc: ....... giờ ....... ngày ....... tháng ....... .. năm 2017

Có thể tìm hiểu luận văn tại:

- Thư viện của Học viện Công nghệ Bưu chính Viễn thông

1

MỞ ĐẦU
1. Đặt vấn đề
Hê ̣ hê ̣ tư vấ n (Recommender System) là hê ̣ thố ng có khả năng tư ̣ đô ̣ng phân tích, dư ̣ đoán và gơ ̣i ý
thông tin mới phù hơ ̣p cho mỗ i người dùng các dịch vụ Internet.
Các phương pháp xây dưṇ g hê ̣ tư vấn trước đây xem xét tâ ̣p người dùng trong hê ̣ gơ ̣i ý là tâ ̣p người
dùng cố đinh
̣ có quyề n lơ ̣i gắ n bó mâ ̣t thiế t với hê ̣ thố ng và đươ ̣c hưởng lơ ̣i từ viêc̣ cung cấ p thông tin trong
hê ̣ thố ng.
Sự ra đời các mạng xã hội làm thay đổi phương thức trao đổi thông tin toàn cầ u. Người dùng trong
mạng xã hội tự do chia sẻ và bày tỏ quan điểm, ý tưởng, và đánh giá của mình tất cả các vấn đề với cộng
đồng các quan hệ khác nhau. Sự tương tác của người dùng với các mối quan hệ xã hội tạo nên nguồn tài
nguyên thông tin to lớn độc lập với nguồn tài nguyên sẵn có của các hệ thố ng gơ ̣i ý trước đây. Chính vì vậy,
nếu tích hợp hệ tư vấn được kết hợp với hành vi người dùng trong các mạng xã hội sẽ góp phần cải thiện
chất lượng tư vấn.
Với những lý do nêu trên, học viên lựa chọn đề tài “Nghiên cứu phương pháp tư vấn dựa trên
hành vi người dùng trong mạng xã hội” để thực hiện trong khuôn khổ luận văn thạc sĩ ngành khoa học máy
tính.

2. Mục tiêu của luận văn
Mục tiêu nghiên cứu luận văn là phương pháp tư vấn cộng tác kết hợp với hành vi friend, post, lile,
comment của người dùng trong ma ̣ng xã hội, đánh giá mức độ tương tự giữa các cặp người dùng đã tương
tác trên mạng xã hội, để từ đó ứng dụng vào hệ tư vấn sao cho việc tư vấn đạt hiệu quả nhất.

3. Các đóng góp của luận văn
- Nghiên cứu phương pháp xác định độ tương tự hành vi giữa các cặp người dùng trên mạng xã hội,

bao gồm: phương pháp xác định độ tương tự hành vi friend, post, like, comment.
- Nghiên cứu phương pháp xây dựng hệ tư vấn dựa vào một hành vi, hai hành vi, ba hành vi người
dùng và phương pháp kết hợp với tất cả hành vi người dùng.
- Xây dưṇ g tập dữ liệu thử nghiệm cho các điạ điể m du lich
̣ (khách sạn) do tâ ̣p người dùng trong
ma ̣ng xã hô ̣i đánh giá.

4. Bố cục của luận văn
Bố cục luận văn gồm 3 phần:
Chương 1. Độ tương đồng hành vi người dùng trong mạng xã hội.

2
Chương 2. Phương pháp tư vấn dựa trên hành vi người dùng
Chương 3. Thử nghiệm và đánh giá

3

CHƯƠNG 1: ĐỘ TƯƠNG ĐỒNG HÀNH VI NGƯỜI DÙNG TRÊN MẠNG XÃ
HỘI
1.1 Giới thiệu về mạng xã hội

1.1.1 Lịch sử hình thành
1.1.2 Cấu trúc chung của mạng xã hội
1.1.3 Một số mạng xã hội phổ biến hiện nay
1.2 Giới thiệu về hành vi trong mạng xã hội
Các hành vi trong mạng xã hội:
-

Đăng bài “Post” trên trang cá nhân

-

Thích “Like” là nút đưa ra một phản hồi tích cực đến thứ mà người dùng đang quan tâm.

-

Nhận xét “Comment” là khi người dùng đưa ra quan điểm hay nhận xét về một bài nào đó.

-

Kết bạn “Add friend” với một người nào đó mà người dùng muốn.

-

Tham gia hay gia nhập nhóm, cộng đồng là hành động người dùng quan tâm đến nội dung của nhóm
hay cộng đồng đó.

-

Theo dõi “Follow” với một người nào đó mà người dùng muốn.

-

Tạo/tham gia các sự kiện “Event” là hành động người dùng quan tâm đến nội dung của sự kiện.

-

Chia sẻ “Share” bài đăng lên trang cá nhân.

1.3 Độ tương đồng giữa các cặp người dùng dựa vào các hành vi mạng xã hội
Xét một hệ thống gồm N người dùng U  u1 , u2 ,..., u N  và M sản phẩm (hàng hóa, phim, ảnh, tạp
chí, tài liệu, sách, báo, dịch vụ hoặc bất kỳ dạng thông tin nào mà người dùng cần đến) P   p1 , p2 ,..., pM 
.
Trong mục này, luận văn sẽ đánh giá mức độ tương đồng giữa hai người dùng u i, uj, ký hiệu bởi cặp
(i, j), i, j = 1, 2, .., N (i≠ j) thông qua độ đo tương tự dựa vào các hành vi trong mạng xã hội (gọi tắt là độ
tương tự).

2.1.1 1.3.1 Độ tương tự giữa các cặp người dùng dựa vào hành vi Like
Mức độ hài lòng của tập người dùng U đối với tập sản phẩm P được biểu diễn thông qua ma trận Like
Li= {𝑙𝑖ix, 𝑖 = 1 … 𝑁, 𝑥 = 1 … 𝑀}. Mỗi giá trị 𝑙𝑖𝑖𝑥 ∈ {0,1} biểu diễn không thích/thích của người dùng

𝑖 ∈ 𝑈 đối với sản phẩm 𝑥 ∈ 𝑃 .
Không mất đi tính tổng quát của bài toán, giả sử 𝑙𝑖𝑖𝑥 = 1 nếu người dùng 𝑖 ∈ 𝑈 like sản phẩm 𝑥 ∈

𝑃, 𝑙𝑖𝑖𝑥 = 0 nếu người dùng không thích hoặc chưa từng biết đến sản phẩm 𝑥 ∈ 𝑃.
Để xác định mức độ tương tự giữa các cặp người dùng, ta dựa vào ma trận Like:

4
𝐿𝑖𝐿
={

𝐿𝑖. 𝐿𝑖 𝑇
𝐿𝑖. 𝐿𝑖 𝑇 . 𝐿𝑖𝐿−2

𝑛ế𝑢 𝐿 = 2
𝑛ế𝑢 𝐿 = 4, 6, 8, . .

(1.2)

3.1.1 1.3.2 Độ tương tự giữa các cặp người dùng dựa vào hành vi Post
Mối quan hệ giữa tập người dùng U và tập sản phẩm P được biểu diễn thông qua ma trận Post Po=

{𝑝𝑜ix, 𝑖 = 1 … 𝑁, 𝑥 = 1 … 𝑀}.
Mỗi giá trị 𝑝𝑜𝑖𝑥 ∈ {1, 0} biểu diễn việc post bài là tích cực, chưa post bài của người dùng 𝑖 ∈ 𝑈
đối với sản phẩm 𝑥 ∈ 𝑃.
Để xác định mức độ tương tự giữa các cặp người dùng, ta dựa vào ma trận Post.

𝑃𝑜𝐿
={

𝑃𝑜. 𝑃𝑜𝑇
𝑛ế𝑢 𝐿 = 2
𝑇
𝐿−2
𝑃𝑜. 𝑃𝑜 . 𝑃𝑜
𝑛ế𝑢 𝐿 = 4, 6, 8, . .

(1.4)

4.1.1 1.3.3 Độ tương tự giữa các cặp người dùng dựa vào hành vi Comment
Mối quan hệ giữa tập người dùng U và tập sản phẩm P được biểu diễn thông qua ma trận Comment
C= {𝑐ix, 𝑖 = 1 … 𝑁, 𝑥 = 1 … 𝑀}. Mỗi giá trị 𝑐𝑖𝑥 ∈ {1, 0} biểu diễn việc comment là tích cực,chưa
comment bài tích cực của người dùng 𝑖 ∈ 𝑈 đối với sản phẩm 𝑥 ∈ 𝑃.
Để xác định mức độ tương tự giữa các cặp người dùng, ta dựa vào ma trận Comment:

𝐶𝐿 = {

𝐶. 𝐶 𝑇
𝐶. 𝐶 𝑇 . 𝐶 𝐿−2

𝑛ế𝑢 𝐿 = 2
𝑛ế𝑢 𝐿 = 4, 6, 8, . .

(1.6)

5.1.1 1.3.4 Độ tương tự giữa các cặp người dùng dựa vào hành vi Friend
Mối quan hệ giữa các người dùng i với người dùng j (i ≠ j) trong tập người dùng U được biểu diễn
thông qua ma trận Friend F = {𝑓ij, 𝑖 = 1 … 𝑁, 𝑗 = 1 … 𝑁}. Mỗi giá trị 𝑓𝑖𝑗 ∈ {0,1} biểu diễn mối quan
hệ friend của người dùng 𝑖 ∈ 𝑈 đối với người dùng j ∈ 𝑈. Giá trị 𝑓𝑖𝑗 = 1 được hiểu rằng người dùng i và
người dùng j kết bạn với nhau.
Xác định mức độ tương tự giữa các cặp người dùng dựa vào ma trận Friend.

𝐹𝐿 = {

𝐹. 𝐹𝑇
𝐹. 𝐹𝑇 . 𝐹𝐿−2

𝑛ế𝑢 𝐿 = 2
𝑛ế𝑢 𝐿 = 4, 6, 8, . .

(1.8)

1.4 Kết luận chương 1
Trong chương 1, luận văn đã giới thiệu về mạng xã hội, các hành vi người dùng trên mạng xã hội,
phương pháp tính mức độ tương đồng giữa các cặp người dùng dựa vào các hành vi người dùng trong mạng
xã hội.

5
Đây là cơ sở cho việc tích hợp hành vi người dùng trong mạng xã hội vào hệ tư vấn dựa trên bài toán
tư vấn cổ điển sử dụng tập đánh giá sản phẩm kết hợp với các hành vi. Các kết quả đề xuất xây dựng phương
pháp tư vấn dựa vào hành vi người dùng trong mạng xã hội sẽ được trình bày chi tiết trong chương 2.

6

CHƯƠNG 2: PHƯƠNG PHÁP TƯ VẤN DỰA TRÊN HÀNH VI NGƯỜI
DÙNG
2.1. Phát biểu bài toán hệ tư vấn cộng tác dựa vào hành vi người dùng trong mạng xã
hội
Cho tập hợp hữu hạn gồm N người dùng U  u1 , u2 ,..., u N  , P   p1 , p2 ,..., pM  là tập hữu hạn
gồm M sản phẩm. Mỗi sản phẩm pxP có thể là hàng hóa, phim, ảnh, tạp chí, tài liệu, sách, báo, dịch vụ
hoặc bất kỳ dạng thông tin nào mà người dùng cần đến. Mối quan hệ giữa tập người dùng U và tập sản phẩm
P được biểu diễn thông qua ma trận đánh giá R={ rix: i = 1, 2, ..N; x = 1, 2,..M }. Giá trị rix thể hiện đánh giá
của người dùng uiU cho một số sản phẩm pxP. Ma trận R chính là đầu vào của các hệ thống tư vấn cộng
tác.
Hành vi Friend biểu diễn mối quan hệ bạn bè trong mạng xã hội của tập người dùng U được biểu diễn
bằng ma trận F = {f ij : i=1, 2, ..n; j=1, 2,..,n}. Hành vi Post của người dùng iU đối với sản xP được cho
bởi ma trận Po = {poix: i=1, 2,..,n; x =1, 2,..,m}. Hành vi Like của người dùng iU đối với sản xP được cho
bởi ma trận Li = {lix: i=1, 2,..,n; x =1, 2,..,m}. Hành vi Comment của người dùng iU đối với sản xP được
cho bởi ma trận C = {Cix: i=1, 2,..,n; x =1, 2,..,m}.
Tiếp đến ta ký hiệu, PiP là tập các sản phẩm xP được đánh giá bởi người dùng iU và UxU là tập
các người dùng iU đã đánh giá sản phẩm xP. Với một người dùng cần được tư vấn iU (được gọi là
người dùng hiện thời, người dùng cần được tư vấn, hay người dùng tích cực), nhiệm vụ của các phương pháp
tư vấn là gợi ý K sản phẩm x(P\Pi) phù hợp nhất đối với người dùng i.
Có nhiều phương pháp đề xuất khác nhau để giải quyết bài toán lọc cộng tác. Su và Khoshgoftaar [2]
phân loại các phương pháp giải quyết bài toán lọc cộng tác thành hai cách tiếp cận chính: Lọc cộng tác dựa

vào bộ nhớ (Memory-Based [3, 4, 5]) và Lọc cộng tác dựa vào mô hình (Model-Based [6, 7, 8]).
Trong hai phương pháp này, phương pháp lọc cộng tác dựa vào bộ nhớ được sử dụng rộng dãi hơn
cho các hệ thống lọc thông tin thực tế do cài đặt đơn giản, độ chính xác cao, chi phí tính toán thấp [9]. Chính
vì vậy, hướng tiếp cận của luận văn tập trung nghiên cứu phát triển phương pháp lọc cộng tác dựa vào bộ
nhớ.
Lọc cộng tác dựa trên bộ nhớ được tiếp cận theo hai phương pháp chính: Phương pháp lọc dựa vào
người dùng (UserBased) và lọc dựa vào sản phẩm (ItemBased). Mỗi phương pháp đều có những ưu điểm
riêng khai thác những khía cạnh liên quan đến người dùng hoặc sản phẩm. Đặc điểm chung của cả hai
phương pháp này là sử dụng toàn bộ tập dữ liệu đánh giá để dự đoán quan điểm của người dùng cần được tư
vấn (AU) về các sản phẩm mà họ chưa hề biết đến. Về thực chất, đây là phương pháp học lười (LL) hay học
dựa trên ví dụ (IBL) được sử dụng trong học máy. Phương pháp được thực hiện theo hai bước: Tính toán
mức độ tương tự và tạo nên dự đoán.

7


Tính toán mức độ tương tự sim(x, y): Mô tả khoảng cách, sự liên quan, hay trọng số giữa hai
người dùng x và y( hoặc giữa hai sản phẩm x và y).



Dự đoán: Đưa ra dự đoán cho người dùng cần được tư vấn bằng cách xác định tập láng giềng của
người dùng này. Tập láng giềng của người dùng cần tư vấn được xác định dựa trên mức độ tương tự
giữa các cặp người dùng hoặc sản phẩm.
Trên cơ sở 2 bước cơ bản của hệ tư vấn cộng tác cổ điển, luận văn đề xuất các phương pháp xây dựng

hệ tư vấn cộng tác dựa vào hành vi người dùng. Các kết quả đề xuất được trình bày trong các mục tiếp theo.

2.2. Phương pháp tư vấn dựa vào một hành vi

6.1.1 2.2.1 Phương pháp tư vấn dựa vào hành vi Like
Phương pháp tư vấn cộng tác dựa vào hành vi Combinated-Like đề xuất được thực hiện qua 5 bước
như sau:
Bước 1: tìm K1 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận đánh giá.
Bước 2: tìm K2 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận Like.
Bước 3: tìm Ki người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận đánh giá và ma
trận Like.
Bước 4: dự đoán quan điểm của người dùng i đối với các sản phẩm mới xP\Pi bằng cách lấy giá trị
trung bình các đánh giá của những người dùng j trong tập láng giềng Ki.
Bước 5: chọn K sản phẩm có mức độ tương tự cao nhất tư vấn cho người dùng i.

7.1.1 2.2.2 Phương pháp tư vấn dựa vào hành vi Post
Phương pháp tư vấn cộng tác dựa vào hành vi Combinated-Post đề xuất được thực hiện qua 5 bước
như sau:
Bước 1: tìm K1 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận đánh giá.
Bước 2: tìm K2 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận Post.
Bước 3: tìm Ki người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận đánh giá và ma
trận Post.
Bước 4: dự đoán quan điểm của người dùng i đối với các sản phẩm mới xP\Pi bằng cách lấy giá trị
trung bình các đánh giá của những người dùng j trong tập láng giềng Ki.
Bước 5: chọn K sản phẩm có mức độ tương tự cao nhất tư vấn cho người dùng i.

8

8.1.1 2.2.3 Phương pháp tư vấn dựa vào hành vi Comment
Phương pháp tư vấn cộng tác dựa vào hành vi Combinated-Comment đề xuất được thực hiện qua 5
bước như sau:
Bước 1: tìm K1 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận đánh giá.

Bước 2: tìm K2 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận Comment.
Bước 3: tìm Ki người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận đánh giá và ma
trận Comment.
Bước 4: dự đoán quan điểm của người dùng i đối với các sản phẩm mới xP\Pi bằng cách lấy giá trị
trung bình các đánh giá của những người dùng j trong tập láng giềng Ki.
Bước 5: chọn K sản phẩm có mức độ tương tự cao nhất tư vấn cho người dùng i.

9.1.1 2.2.4 Phương pháp tư vấn dựa vào hành vi Friend
Phương pháp tư vấn cộng tác dựa vào hành vi Combinated-Friend đề xuất được thực hiện qua 5
bước như sau:
Bước 1: tìm K1 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận đánh giá.
Bước 2: tìm K2 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận Friend.
Bước 3: tìm Ki người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận đánh giá và ma
trận Friend.
Bước 4: dự đoán quan điểm của người dùng i đối với các sản phẩm mới xP\Pi bằng cách lấy giá trị
trung bình các đánh giá của những người dùng j trong tập láng giềng Ki.
Bước 5: chọn K sản phẩm có mức độ tương tự cao nhất tư vấn cho người dùng i.

2.3 Phương pháp tư vấn kết hợp hai hành vi

10.1.1 2.3.1 Phương pháp tư vấn kết hợp hai hành vi Comment và Friend
Phương pháp tư vấn cộng tác dựa vào hành vi Combinated-Comment-Friend đề xuất được thực
hiện qua 6 bước như sau:
Bước 1: tìm K1 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận đánh giá.
Bước 2: tìm K2 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận Friend.
Bước 3: tìm K3 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận Comment.

9
Bước 4: tìm Ki người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận đánh giá và ma

trận Friend, ma trận Comment.
Bước 5: dự đoán quan điểm của người dùng i đối với các sản phẩm mới xP\Pi bằng cách lấy giá trị
trung bình các đánh giá của những người dùng j trong tập láng giềng Ki.
Bước 6: chọn K sản phẩm có mức độ tương tự cao nhất tư vấn cho người dùng i.

11.1.1 2.3.2 Phương pháp tư vấn kết hợp hai hành vi Comment và Like
Phương pháp tư vấn cộng tác dựa vào hành vi Combinated-Comment-Like đề xuất được thực hiện
qua 6 bước như sau:
Bước 1: tìm K1 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận đánh giá.
Bước 2: tìm K2 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận Comment.
Bước 3: tìm K3 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận Like.
Bước 4: tìm Ki người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận đánh giá và ma
trận Comment, ma trận Like.
Bước 5: dự đoán quan điểm của người dùng i đối với các sản phẩm mới xP\Pi bằng cách lấy giá trị
trung bình các đánh giá của những người dùng j trong tập láng giềng Ki.
Bước 6: chọn K sản phẩm có mức độ tương tự cao nhất tư vấn cho người dùng i.

12.1.1 2.3.3 Phương pháp tư vấn kết hợp hai hành vi Comment và Post
Phương pháp tư vấn cộng tác dựa vào hành vi Combinated-Comment-Post đề xuất được thực hiện
qua 6 bước như sau:
Bước 1: tìm K1 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận đánh giá.
Bước 2: tìm K2 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận Comment.
Bước 3: tìm K3 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận Post.
Bước 4: tìm Ki người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận đánh giá và ma
trận Comment, ma trận Post.
Tại bước 5: dự đoán quan điểm của người dùng i đối với các sản phẩm mới xP\Pi bằng cách lấy giá
trị trung bình các đánh giá của những người dùng j trong tập láng giềng Ki.
Bước 6: chọn K sản phẩm có mức độ tương tự cao nhất tư vấn cho người dùng i.

10
2.4 Phương pháp tư vấn kết hợp ba hành vi
Trong phần này, luận văn sẽ trình bày phương pháp tư vấn kết hợp hành vi Comment, hành vi Like
với lần lượt các hành vi Friend và Post.

13.1.1 2.4.1 Phương pháp tư vấn kết hợp ba hành vi Comment, Like, Friend
Phương pháp tư vấn cộng tác dựa vào hành vi Combinated-Comment-Friend-Like đề xuất được
thực hiện qua 7 bước như sau:
Bước 1: tìm K1 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận đánh giá.
Bước 2: tìm K2 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận Friend.
Bước 3: tìm K3 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận Like.
Bước 4: tìm K4 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận Comment.
Bước 5: tìm Ki người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận đánh giá và ma
trận Comment, ma trận Like, ma trận Friend.
Bước 6: dự đoán quan điểm của người dùng i đối với các sản phẩm mới xP\Pi bằng cách lấy giá trị
trung bình các đánh giá của những người dùng j trong tập láng giềng Ki.
Bước 7: chọn K sản phẩm có mức độ tương tự cao nhất tư vấn cho người dùng i.

14.1.1 2.4.2 Phương pháp tư vấn kết hợp ba hành vi Comment, Like, Post
Phương pháp tư vấn cộng tác dựa vào hành vi Combinated-Like-Post-Comment đề xuất
được thực hiện qua 7 bước như sau:
Bước 1: tìm K1 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận đánh giá.
Bước 2: tìm K2 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận Post.
Bước 3: tìm K3 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận Like.
Bước 4: tìm K4 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận Comment.
Bước 5: tìm Ki người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận đánh giá và ma
trận Comment, ma trận Like, ma trận Post.
Bước 6: dự đoán quan điểm của người dùng i đối với các sản phẩm mới xP\Pi bằng cách lấy giá trị
trung bình các đánh giá của những người dùng j trong tập láng giềng Ki.
Bước 7: chọn K sản phẩm có mức độ tương tự cao nhất tư vấn cho người dùng i.

11
2.5 Phương pháp tư vấn kết hợp bốn hành vi Comment, Like, Friend, Post
Phương pháp tư vấn cộng tác dựa vào hành vi Combinated- Comment-Friend- Like-Post đề xuất
được thực hiện qua 8 bước như sau:
Bước 1: tìm K1 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận đánh giá.
Bước 2: tìm K2 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận Friend.
Bước 3: tìm K3 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận Post.
Bước 4: tìm K4 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận Like.
Bước 5: tìm K5 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận Comment.
Bước 6: tìm Ki người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận đánh giá và ma
trận Friend, ma trận Like, ma trận Post, ma trận Comment.
Bước 7: dự đoán quan điểm của người dùng i đối với các sản phẩm mới xP\Pi bằng cách lấy giá trị
trung bình các đánh giá của những người dùng j trong tập láng giềng Ki.
Bước 8: chọn K sản phẩm có mức độ tương tự cao nhất tư vấn cho người dùng i.

2.6 Kết luận chương 2
Trong chương 2, luận văn đã trình bày các thuật toán kết hợp hành vi người dùng trong mạng xã hội
vào hệ tư vấn, trong đó lấy hành vi rate lần lượt kết hợp với các hành vi còn lại như like, friend, post,
comment. Sau đó, lấy hành vi đánh giá lần lượt kết hợp với hai hành vi, ba hành vi và cả bốn hành vi. Quá
trình tư vấn được xem xét thêm với các hành vi người dùng khi sử dụng mạng xã hội. Bằng cách này ta có
thể thu hẹp lại số lượng người dùng trong tập láng giềng có cùng mức độ tương tự.

12

CHƯƠNG 3. THỬ NGHIỆM VÀ ĐÁNH GIÁ
3.1 Dữ liệu thử nghiệm
Luận văn thu thập dữ liệu thực tế từ người dùng và các trang về khách sạn trên trang mạng xã hội

FaceBook. Dữ liệu người dùng bao gồm:
-

5090 người dùng

-

753 khách sạn

-

2702 hành vi Rate

-

2585 hành vi Add Friend

-

961 hành vi Post

-

4629 hành vi Like

-

1995 hành vi comment

Các hành vi lấy được từ mạng xã hội FaceBook là: Friend, Post, Like, Comment, Rate.

Mô hình dữ liệu hệ thống tư vấn khách sạn dựa trên hành vi người dùng trong mạng xã hội:

Hình 3.1: Mô hình dữ liệu hệ thống HotelRecomendSystem

3.2 Phương pháp thử nghiệm
Trong phạm vi luận văn sẽ thực hiện thử nghiệm và đánh giá dựa trên hai phương pháp sử dụng độ đo
trung bình tuyệt đối lỗi MAE.
Tập dữ liệu thử nghiệm được chia thành hai tập huấn luyện Utrain và tập kiểm tra Utest .
Trước tiên, toàn bộ dữ liệu thử nghiệm được chia thành hai phần, một phần Utr được sử dụng làm dữ
liệu huấn luyện, phần còn lại Ute được sử dụng để kiểm tra.Tập Utr chứa 85% đánh giá và tập Ute chứa 15%
đánh giá. Dữ liệu huấn luyện được sử dụng để xây dựng mô hình theo thuật toán mô tả ở trên. Với mỗi người
dùng i thuộc tập dữ liệu kiểm tra, các đánh giá (đã có) của người dùng được chia làm hai phần Oi và Pi.O i
được coi là đã biết, trong khi đó Pi là đánh giá cần dự đoán từ dữ liệu huấn luyện và Oi.

13
Sai số dự đoán MAEi với mỗi khách hàng i thuộc tập dữ liệu kiểm tra được tính bằng trung bình cộng
của sai số tuyệt đối giữa hai giá trị được dự đoán và giá trị thực của tất cả các sản phẩm thuộc tập Pi .

𝑀𝐴𝐸𝑖 =

1
∑ |𝑟̂𝑥𝑖 − 𝑟𝑥𝑖 |
|𝑃𝑖 |
𝑥∈𝑃𝑖

Sai số dự đoán trên toàn tập dữ liệu kiểm tra được tính bằng trung bình cộng sai số dự đoán cho mỗi
khách hàng thuộc Utest .

𝑀𝐴𝐸 =

∑𝑖∈𝑈𝑡𝑒𝑠𝑡 𝑀𝐴𝐸𝑖
|𝑈𝑡𝑒𝑠𝑡 |

3.3 Kết quả thử nghiệm
Kịch bản 1: Thử nghiệm độ đo trung bình tuyệt đối lỗi MAE dựa trên hành vi đánh giá.
Số lượng người dùng trong tập láng giềng
80
R

0.4257

100

120

0.4391

0.4891

140
0.4911

Bảng 3.1: Giá trị MAE thử nghiệm dựa trên hành vi đánh giá
Kịch bản 2: Thử nghiệm độ đo trung bình tuyệt đối lỗi MAE dựa trên việc kết hợp hành vi đánh giá với một
trong số các hành vi Friend, Like, Post, Comment.
Việc lấy giao giữa hành vi đánh giá và các hành vi khác được thực hiện như sau:
K=KR ∩ KX
if K = ∅ then K = KR
Số lượng người dùng trong tập láng giềng

Phương pháp
80
RF

120

100
0.1995

140

0.2127

0.2220

0.2366

RP

0.2832

0.2964

0.3465

0.3484

RL

0.2241

0.2373

0.2845

0.3299

RC

0.2495

0.2020

0.2061

0.2028

Bảng 3.2: Giá trị MAE thử nghiệm dựa trên việc kết hợp với một hành vi

14
Kết quả thử nghiệm cho thấy việc kết hợp với một hành vi trong mạng xã hội có độ trung bình tuyệt
đối lỗi MAE đã giảm đáng kể so với việc thử nghiệm chỉ dựa trên hành vi đánh giá ban đầu. Trong đó
phương pháp kết hợp Combinated-Comment cho kết quả tốt nhất.
Kịch bản 3: Thử nghiệm độ đo trung bình tuyệt đối lỗi MAE dựa trên việc kết hợp hành vi đánh giá với hai
hành vi người dùng trong mạng xã hội
Trong đó: Việc lấy giao giữa hành vi đanh giá và các hành vi khác được thực hiện với độ ưu tiên
theo kết quả dựa trên thí nghiệm 2, đó là RC, RL, RF, RP (độ ưu tiên giảm dần)
Số lượng người dùng trong tập láng giềng
Phương pháp

80

100

120

140

RLF

0.1371

0.1504

0.1561

0.2102

RLP

0.2241

0.2373

0.2845

0.3299

RCL

0.1986

0.2020

0.2061

0.2028

RFP

0.1995

0.2127

0.2220

0.2366

RCF

0.1984

0.1585

0.1212

0.1179

RCP

0.2495

0.2020

0.2061

0.2028

Bảng 3.3: Giá trị MAE thử nghiệm dựa trên việc kết hợp với hai hành vi
Các phương pháp kết hợp với hai hành vi đều cho giá trị MAE đều nhỏ hơn so với phương pháp kết
hợp với một hành vi thông thường. Điều này cho thấy việc kết hợp là có hiệu quả, trong đó phương pháp
Combinated-Comment-Friend là tốt nhất ứng với trường hợp k = 140.
Kịch bản 4: Thử nghiệm độ đo trung bình tuyệt đối lỗi MAE dựa trên việc kết hợp hành vi đánh giá với 3
hành vi
Việc lấy giao giữa hành vi đánh giá và các hành vi khác được thực hiện với độ ưu tiên theo kết quả
dựa trên kịch bản 3, đó là RCF, RCL, RCP, RLP, RFP, RLF (độ ưu tiên giảm dần)
Số lượng người dùng trong tập láng giềng

Phương
pháp

80

100

120

140

RFPL

0.1371

0.1504

0.1561

0.2102

RFPC

0.1984

0.1585

0.1212

0.1179

RFLC

0.1361

0.1395

0.1016

0.1505

RPLC

0.1986

0.2020

0.2061

0.2028

Bảng 3.4: Giá trị MAE thử nghiệm dựa trên việc kết hợp với ba hành vi

15
Kết quả thử nghiệm dựa trên việc kết hợp hành vi đánh giá với ba hành vi người dùng trong mạng xã
hội cho kết quả MAE nhỏ hơn so với phương pháp kết hợp giữa hai hành vi. Trong đó RFLC ứng với số
lượng người dùng trong tập láng giềng bằng 140 cho kết quả tốt nhất
Thí nghiệm 5: Thử nghiệm độ đo trung bình tuyệt đối lỗi MAE dựa trên việc kết hợp hành vi đánh giá với
tất cả các hành vi người dùng trong mạng xã hội
Việc lấy giao giữa hành vi đánh giá và các hành vi khác được thực hiện với độ ưu tiên giảm dần theo
kết quả dựa trên kịch bản 4, đó là Rate, Friend, Like, Comment, Post
Số lượng người dùng trong tập láng giềng

Phương pháp
RFPLC

80

100

120

0.1361

0.1395

0.1016

140
0.1505

Bảng 3.5: Giá trị MAE thử nghiệm dựa trên việc kết hợp với tất cả các hành vi
Kết quả thử nghiệm dựa trên việc kết hợp tất cả các hành vi cho kết quả MAE bằng với trường hợp
nhỏ nhất so với phương pháp kết hợp RFLC. Điều này được giải thích bằng việc không tồn tại người dùng
nào trong tập láng giềng qua việc lấy giao của hành vi đánh giá với cả 4 hành vi, thay vào đó việc lấy giao
này dựa trên kết quả của RFLC.

3.4. Kết luận chương 3
Kết quả thử nghiệm các phương pháp tư vấn kết hợp đề xuất cho thấy chất lượng tư vấn được cải
thiện đáng kể so với các phương pháp tư vấn cơ bản. Điều đó chỉ có thể lý giải phương pháp tiếp cận của
luận văn đã xác định được tốt hơn mức độ tương tự giữa các cặp người dùng, cũng như phương pháp dự
đoán thích hợp nhất.

16

KẾT LUẬN
1. Kết quả đạt được
Đề tài hướng tới một chủ đề có ý nghĩa về lý thuyết và thực tiễn của khoa học máy tính được cộng
đồng nghiên cứu quan tâm. Luận văn đã trình bày về các vấn đề liên quan đến mạng xã hội và một số
phương pháp tư vấn dựa vào hành vi người dùng trong mạng xã hội. Cụ thể là:

Giới thiệu về mạng xã hội, độ tương đồng giữa các cặp người dùng dựa vào các hành vi trong mạng xã
hội.
Luận văn trình bày phương pháp tư vấn dựa vào mỗi hành vi người dùng và kết hợp các hành vi người
dùng trong mạng xã hội bao gồm:
Phương pháp tư vấn kết hợp một hành vi:
-

Phương pháp tư vấn kết hợp hành vi Like

-

Phương pháp tư vấn kết hợp hành vi Post

-

Phương pháp tư vấn kết hợp hành vi Comment

-

Phương pháp tư vấn kết hợp hành vi Friend

Phương pháp tư vấn kết hợp hai hành vi:
-

Phương pháp tư vấn kết hợp hai hành vi Comment và Friend

-

Phương pháp tư vấn kết hợp hai hành vi Comment và Like

-

Phương pháp tư vấn kết hợp hai hành vi Comment và Post

Phương pháp tư vấn kết hợp ba hành vi:
-

Phương pháp tư vấn kết hợp ba hành vi Comment, Like, Friend

-

Phương pháp tư vấn kết hợp ba hành vi Comment, Like, Post

Phương pháp tư vấn kết hợp bốn hành vi Comment, Like, Friend, Post
Đề tài giới thiệu bộ dữ liệu thử nghiệm cho các thuật toán đã trình bày trong từng phương pháp tư vấn.
Thử nghiệm cài đặt trên Matlab cho từng thuật toán ứng với bộ dữ liệu đã thu thập được. Kết quả thử nghiệm
được đánh giá theo các tiêu chí về độ chính xác, sai số trung bình và thời gian thực hiện tư vấn.
Tuy nhiên trong quá trình thực hiện và cài đặt mô hình thuật toán vẫn còn một số hạn chế sau:
-

Thưa thớt dữ liệu người dùng: bộ dữ liệu sưu tập bằng tay lên còn hạn chế, trong quá trình thu thập dữ
liệu, người dùng trong mạng xã hội không công khai danh sách bạn bè, không thể hiện hết được hành
vi, mối quan hệ giữa các người dùng với nhau.
Đề tài sử dụng nhãn tích cực với các văn bản comment và post, chưa tính chưa xử lý khía cạnh nhãn là

tiêu cực.

17
2. Hướng phát triển

Hướng phát triển tiếp theo trong tương lai tiếp tục phát triển hệ thống với số lượng người dùng và
khách sạn lớn hơn, cập nhật bộ dữ liệu, phân loại thành tư vấn các địa điểm như các nhà hàng, khu vui chơi
giải trí, không gian làm việc.

18

TÀI LIỆU THAM KHẢO
[1] Nguyễn Duy Phương, Đỗ Thị Liên, Từ Minh Phương (2013), “Xác định độ tương tự cho người dùng và
sản phẩm trong lọc cộng tác dựa trên mô hình đồ thị”, Fair Huế 2013.
[2]C.C.Aggarwal, J.L. Wolf, K.L. Wu, and P.S.Yu, “Horting Hatches an Egg: A New Graph-Theoretic
Approach to Collaborative Filtering”, Proc. Fifth ACM SIGKDD Int’l Conf. Knowledge Discovery and
Data Mining (1999).
[3]Charu C. Aggarwal. 2011. Social Network Data Analytics (1st ed.). Springer Publishing Company,
Incorporated.
[4]J. S. Breese, D. Heckerman, and C. Kadie, “Empirical analysis of Predictive Algorithms for
Collaborative Filtering”, In Proc. of 14th Conf. on Uncertainty in Artificial Intelligence, pp. 43-52
(1998).
[5] Aaron J. Defazio and Tibério S. Caetano, “A Graphical Model Formulation of Collaborative Filtering
Neighbourhood Methods with Fast Maximum Entropy Training”, 2012.
[6]M. Deshpande, G. Karypis,“Item-Based Top-N Recommendation Algorithms”, ACM Transactions on
Information Systems. Volume 22, Issue 1, pp. 143 - 177
(2004).
[7]T. Hofmann, “Latent Semantic Models for Collaborative Filtering”, ACM Trans. Information Systems,
vol. 22, No. 1, pp. 89-115 (2004).
[8]J.L. Herlocker, J.A. Konstan, L.G. Terveen, and J.T. Riedl (2004), “Evaluating Collaborative Filtering
o
Recommender Systems”, ACM Trans. Information Systems, vol. 22, N . 1, pp. 5-53.
[9]B. Sarwar, G. Karypis, J. Konstan, and J. Riedl, “Item-Based Collaborative Filtering Recommendation
Algorithms”, WWW 2001: 285-295 (2001).

[10]X. Su, T. M. Khoshgoftaar (2009), “A Survey of Collaborative Filtering Techniques”. Advances in
Artificial Intelligence, vol 2009, pp.1-20.
[11] Zan Huang, “Graph-Based analysis for e-commerce recommendation”, 2005.
[12]R. Jin, L. Si, and C. Zhai, “Preference-Based Graphic Models for Collaborative Filtering”, Proc. 19th
Conf. Uncertainty in Artificial Intelligence (UAI 2003)
[13] />E1%BB%99i

Nghiên cứu phương pháp tư vấn dựa trên hành vi người dùng mạng xã hội (tt)

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về