Tải bản đầy đủ (.pdf) (15 trang)

Một số phương pháp gợi ý và ứng dụng trong thương mại điện tử

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.22 MB, 15 trang )

Vietnam J. Agri. Sci. 2021, Vol. 19, No. 4: 520-534

Tạp chí Khoa học Nơng nghiệp Việt Nam 2021, 19(4): 520-534
www.vnua.edu.vn

MỘT SỐ PHƯƠNG PHÁP GỢI Ý VÀ ỨNG DỤNG TRONG THƯƠNG MẠI ĐIỆN TỬ
Hồng Thị Hà1*, Ngơ Nguyễn Thức2
1

Khoa Cơng nghệ thông tin, Học viện Nông nghiệp Việt Nam
Sinh viên K57 - Khoa Công nghệ thông tin, Học viện Nông nghiệp Việt Nam

2

*

Tác giả liên hệ:

Ngày nhận bài: 20.07.2020

Ngày chấp nhận đăng: 29.03.2020
TĨM TẮT

Hệ gợi ý (Recommender System) là cơng cụ được thiết kế nhằm cung cấp những khuyến nghị hữu ích về sản
phẩm, dịch vụ,…cho người dùng. Hệ gợi ý dựa trên dữ liệu về mối quan hệ giữa người dùng, sản phẩm và các hành
vi của người dùng trong quá khứ đối với sản phẩm để đưa ra những gợi ý thơng minh, phù hợp với sở thích của
từng khách hàng. Hệ gợi ý giúp khách hàng nhanh chóng định vị được những sản phẩm họ quan tâm để từ đó đưa
ra quyết định đúng đắn khi mua sắm online. Trong bài báo này, chúng tơi trình bày tổng quan một số phương pháp
gợi ý, đánh giá điểm mạnh, điểm yếu, so sánh hiệu quả thực hiện của mỗi phương pháp. Chúng tơi chỉ ra lợi ích mà
các hệ gợi ý mang lại cho thương mại điện tử, đồng thời nêu ra những thách thức và giải pháp khắc phục. Kết quả
thực nghiệm của chúng tôi trên 4 tập dữ liệu chuẩn (Movielens, Epinions, BookCrossing, LastFM) cho thấy mỗi


phương pháp đều có những ưu điểm và hạn chế riêng, khơng có phương pháp nào là tốt nhất trên tất cả các tiêu chí.
Ngồi ra, chúng tơi cũng đưa ra quy trình chung để xây dựng hệ gợi ý trong các website thương mại và thực hiện tích
hợp các kỹ thuật hệ gợi ý trong website thương mại điện tử khắc phục vấn đề người dùng mới, sản phẩm mới (vấn
đề này còn gọi là “Cold start problem”) của các phương pháp gợi ý cá nhân hóa.
Từ khóa: Hệ gợi ý, lọc cộng tác, gợi ý dựa trên nội dung, hệ gợi ý kết hợp, thương mại điện tử.

Some Methods of Recommender System and its Application in E-Commerce
ABSTRACT
The designed recommender system is a tool to provide important suggestions forusers or customers. Based on
the datasets of user relationships, products, andprevious behavior of consumers, smart recommendations for the
preferences of eachconsumer are given, which helps consumers tomake good decisions while shopping online. In
this article, we present an overview of some methodologies of recommendation systems, techniques of recommender
systems, and evaluate the strengths and weaknesses of each technique, as well as comparedsome benefits of
recommender systems in e-commerce. Moreover, we report some challenges that the recommender systems are
facing and list some solutions to solve these challenges. Our experimental results on the four datasets
(Movielens100k, Epinions,BookCrossing, LastFM) showed that there was no best recommendation algorithm in all
evaluation metrics. Finally, we built an e-commerce website that integrated some different techniques of
recommender systems such as non-personalized methods, personalized methods to recommend the right product for
each customer. The experimental system gives some diverse suggestions to overcome the problem "Cold start
problem" of personalized methods.
Keywords: Recommender systems, collaborative filtering, content-based filtering, hyper filtering, E-Commerce.

1. ĐẶT VẤN ĐỀ
Trong nhĂng nëm gæn đåy, cùng vi s ph
bin cỷa mọng Internet v mỏy tớnh, thỵng
mọi điện tā đã phát triển nhanh chóng trên
phäm vi tồn cổu. Thỵng mọi in t ó thay

520


i hỡnh thc giao dch truyn thng. Ngy cng
cú nhiu ngỵi la chn hỡnh thĀc mua sím trăc
tuyến. Trong khi đị, để mć rộng th trỵng kinh
doanh, cỏc doanh nghip ó xồy dng ng dýng
thỵng mọi in t v cung cỗp rỗt nhiu sõn
phốm trên website. Tuy nhiên, khi thông tin


Hồng Thị Hà, Ngơ Nguyễn Thức

q nhiều, khách hàng sẽ tốn thąi gian để tìm
sân phèm họ cỉn. Điều này, làm giâm să hài
lòng và să trung thành cûa khách. giõi quyt
vỗn ny, ý tỵng chớnh cỷa cỏc chuyờn gia
thỵng mọi in t l thit lờp h thng gợi ý
thơng minh nhìm khám phá ra các mặt hàng
phù hp nhỗt cho tng ngỵi dựng. Vi h thng
gi ý t ng, khỏch hng cú th nhanh chúng
truy cờp ỵc sân phèm hợp vĆi sć thích và nhu
cỉu cûa họ, tit kim thi gian tỡm sõn phốm
cho ngỵi dựng (Thomas, 2006).
NhĂng nëm gæn đåy, các kỹ thuêt hệ gợi đã
và ang ỵc nghiờn cu, ng dýng nhiu lùnh
vc. Trong thỵng mọi in t, h gi ý mang
lọi nhiu li ớch cho cõ ngỵi cung cỗp dch vý
v ngỵi s dýng dch vý (Ionos, 2017). Hổu ht
cỏc cụng ty thỵng mọi ln nhỵ: Amazon
(Amazon.com), CDNOW (www.cdnow.com),
eBay
(eBay.com),

Alibaba
(Alibaba.com),
MovieFinder (MovieFinder.com), Youtube.com,
Facebook.com, u s dýng các kỹ thuêt gợi ý
trong website cûa họ để nõng cao trõi nghim
cho khỏch hng, nõng cao chỗt lỵng dðch vý và
tëng doanh thu bán hàng. Tuy nhiên, ć Vit
Nam - mt quc gia cú rỗt nhiu tim nởng v
thỵng mọi in t (Vin Thụng, 2020) lọi cú s
lỵng website thỵng mọi tớch hp h gi ý
khụng nhiu (Nguyn Hùng Düng & Nguyễn
Thái Nghe, 2013). Hiện Việt Nam đang cũ 44%
doanh nghip ó tham gia xồy dng website
thỵng mọi, nhỵng chợ cú 32% doanh nghip
ỵc ỏnh giỏ cao kờnh bỏn hng thụng qua
trang web (Nguyn Thanh Hỵng, 2019).
Bi bỏo ny trỡnh by tng quan cỏc
phỵng phỏp gi ý, ỏnh giá hiệu quâ cûa các
thuêt toán gợi ý (Content-based, user-based và
item-based) trên một số têp dĂ liệu chuèn bao
gồm: Movielens, Epinions, BookCrossing và
LastFM. Chúng tôi thâo luên nhĂng điểm
mänh, điểm yu cỷa mi phỵng phỏp, thỏch
thc v giõi phỏp khớc phýc khi xõy dng h gi
ý trong thỵng mọi in t. ng thi, chỳng tụi
ỵa ra quy trỡnh xồy dng h gi ý trong cỏc
website thỵng mọi v thc hin ci t cỏc k
thuờt h gi ý trong website thỵng mọi in t.
Kt quõ ci t cho thỗy, khi website ỵc tớch
hp cỏc phỵng phỏp h gi ý h thng s t


ng ỵa ra nhng gi ý thụng minh, a dọng
ti ngỵi dựng.

2. CC K THUT H GI í
Cỏc k thuờt h gi ý thỵng ỵc chia
thnh hai nhúm chớnh là: hệ gợi ý cá nhân hóa
và hệ gợi ý khơng cá nhân hóa. Chúng tơi têp
trung giĆi thiệu tóm tớt phỵng phỏp gi ý
khụng cỏ nhõn húa v mt s thuờt toỏn gi ý cỏ
nhõn húa tiờu biu thỵng ỵc s dýng trong
cỏc trang thỵng mọi in t.
2.1. H gợi ý khơng cá nhân hóa (nonpersonalized recommender systems )
Là nhũm phỵng phỏp khụng da vo h s
cỏ nhõn tng khách hàng mà chỵ dăa vào đặc
tính cûa sân phèm (sõn phốm mi) v ỏnh giỏ
t cng ng nhỵ: sõn phốm bỏn chọy nhỗt, sõn
phốm ỵc ỏnh giỏ tt nhỗt, (Singh, 2019)
2.2. Hệ gợi ý cá nhân hóa (personalized
recommender systems)
Nhịm phỵng phỏp ny ỵc ỏnh giỏ l
mang lọi hiu quõ cao i vi thỵng mọi in t.
Nu doanh nghip hiu rõ tÿng khách hàng cûa
mình dăa trên nhĂng gì họ tỵng tỏc v mua
hng trờn mọng, doanh nghip cú th tỵ vỗn cho
khỏch hng nhng sõn phốm phự hp vi mong
muốn và sć thích cûa khách hĄn (Google &
Temasek, 2018). Khỏch hng s tit kim ỵc
thi gian tỡm kim sõn phốm, mua ỵc nhng
mũn hng ỳng s thớch. T ũ, doanh nghip s

tởng ỵc s lỵng ngỵi mua hng, tởng giá trð
đĄn hàng, tëng doanh số bán hàng.
Theo nghiên cĀu cỷa Schafer & cs. (2001),
nu doanh nghip s dýng phỵng pháp gợi ý cá
nhân hòa để gāi email tĆi khách hàng thì tỷ lệ
giao dðch thơng qua email cao hĄn gỗp hai lổn
so vi cỏc email ỵc gi khụng ỏp dýng phỵng
phỏp ny (Stephan, 2019). Do ũ, cỏc phỵng
phỏp gi ý cỏ nhồn hũa lm tởng mc tỵng
tỏc v chuyn i trong giao dch thỵng mọi
in t.
Mt s phỵng phỏp gi ý thuc loọi cỏ
nhõn húa nhỵ sau:

521


Một số phương pháp gợi ý và ứng dụng trong thng mi in t

Filtering - CF)

ngỵi dựng ũ kt hp quan im cỷa nhng
ngỵi dựng khỏc. ồy l k thuờt mọnh v ó
ỵc ỏp dýng khỏ thnh cụng trong cỏc h
thng thỵng mọi ln. Lc cng tỏc thu thờp
phõn hi t nhiu ngỵi dựng i vi sõn phốm,
lỵu tr phõn hi cỷa ngỵi dựng dỵi dọng ma
trờn ngỵi dựng (users) - sân phèm (items). Mỗi
dòng là một vectĄ chĀa giá tr phõn hi cỷa
ngỵi dựng i vi cỏc sõn phốm. Sau ũ, tớnh

tỵng t gia cỏc users hoc gia cỏc items
trong h thng, tỡm ra mi tỵng quan v ỵa
ra gi ý phự hp. tỵng t gia cỏc user hoc
gia cỏc item ỵc tớnh theo cụng thc Cosin
hoc Pearson.

Lc cng tỏc gi ý sõn phốm ti ngỵi dựng
da trờn lch s tỵng tỏc sõn phốm cỷa chớnh

Bõng 1 l ma trờn biu din ỏnh giỏ cỷa
ngỵi dựng trờn các sân phèm.

2.2.1. Gợi ý dựa trên nội dung (Contentbased filtering)
Phỵng phỏp gi ý ny da trờn mụ tõ cỷa
sõn phốm v profile cỷa tng ngỵi dựng
(khụng quan tồm n ngỵi dựng khỏc). Gi ý
da trờn ni dung s thu thờp h s cỷa ngỵi
dựng: h tờn, gii tớnh, ngh nghip... v tỵng
tỏc cỷa cỏ nhồn ngỵi dựng trờn cỏc sân phèm,
sau đò so sánh đặc điểm các sân phèm trong cĄ
sć dĂ liệu vĆi đặc điểm các sân phèm mà khách
hàng đã quan tåm để gợi ý cho khách hàng.
2.2.2.

Lọc

cộng

tác


(Collaborative

Hình 1. Mơ hình hệ gợi ý dựa trên nội dung
Bâng 1. Ma trận biểu diễn người dùng - sân phẩm của tiếp cận lọc cộng tác

522


Hong Th H, Ngụ Nguyn Thc

Cũ hai phỵng phỏp lc cng tỏc:
User-based: D oỏn da trờn s tỵng t
gia cỏc users. í tỵng quan trng cỷa phỵng
phỏp ny l nhng khỏch hng tỵng t cú xu
hỵng s dýng nhng sõn phốm tỵng t
(Singh & Pramod, 2019). Nu hai khỏch hng A,
B cú lch s ỏnh giỏ cỏc sõn phốm tỵng tă
nhau thì User-basedsẽ dă đốn khách hàng A
có khâ nëng s quan tõm ti nhng sõn phốm
chỵa ỵc trõi nghim nhỵng ó ỵc khỏch
hng B thớch v ngỵc lọi. Phỵng phỏp ny
phõn tớch ma trờn user-item tỡm ra nhng
ngỵi dựng tỵng t.
Item-based : D oỏn da trờn s tỵng tă
giĂa các items. Hai sân phèm i và i’ đã ỵc
cng ng ỏnh giỏ tỵng t nhau thỡ cú th s
ỵc ỏnh giỏ tỵng t bi nhng ngỵi dựng
cũn lọi. Phỵng phỏp ny phồn tớch ma trờn
user-item nhờn din cỏc sõn phốm tỵng t.
Ngy nay, k thuờt lc cng tỏc ỵc s

dýng khỏ ph bin trờn cỏc trang thỵng

mọi in t ln nhỵ Amazon, Tiki, Youtube
v Facebook.
2.2.3.
Phng
(hybrid method)

phỏp

kt

hp

Phỵng phỏp này kết hợp giĂa kỹ thuêt gợi
ý dăa trên nội dung v lc cng tỏc. K thuờt
ny ỵc xem l khỏ hiu quõ v giõi quyt
ỵc vỗn cold - start problem trong rỗt
nhiu nghiờn cu. Trang thỵng mọi in t
in hỡnh ó ng dýng phỵng phỏp ny l
Spotify.com. H ó tớch hp phỵng phỏp h gi
ý tng hp täo ra danh sách các bài hát hàng
tuæn cho tÿng khỏch hng riờng bit. Website
ó tng hp d liu ngỵi dựng da trờn thúi
quen nghe nhọc v nhng ngỵi dựng tỵng t
tọo ra mt danh sỏch cỏc bi hỏt độc đáo phù
hợp vĆi sć thích cûa tÿng khách hàng.
2.3. Mục tiêu của các phương pháp gợi ý
Mýc tiêu cûa cỏc phỵng phỏp gi ý ỵc
th hin trong bõng 2.


Hỡnh 2.Tiến trình lọc cộng tác

Hình 3. Lọc cộng tác dựa trên User-based và Item-based

523


Một số phương pháp gợi ý và ứng dụng trong thương mại điện tử

Hình 4. Mơ hình hệ gợi ý kết hợp
Bâng 2. Mục tiêu khái niệm của các phương pháp gợi ý
Phương pháp (Methods)

Mục tiêu (concept goals)

Đầu vào (Inputs)

Gợi ý khơng cá nhân hóa
(Non-personalized
recommender systems)

Gợi ý những sản phẩm mà người dùng có thể thích
dựa trên sản phẩm mới hoặc ý kiến cộng đồng.

Lọc dựa trên nội dung
(Content-based filtering)

Gợi ý những sản phẩm khách hàng có thể thích dựa
trên hồ sơ cá nhân của người dùng và độ tương tự

giữa các sản phẩm trong cơ sở dữ liệu với những sản
phẩm mà khách hàng đã thích trong quá khứ.

Thuộc tính (item attributes) của sản phẩm
hoặc Profiles của người dùng.

Lọc cộng tác (Collaborative
Filtering)

Gợi ý những sản phẩm mà người dùng có thể thích
dựa trên những người dùng có sở thích tương tự.

Đánh giá của User + Đánh giá của cộng
đồng

Phương pháp kết hợp
(Hybrid method)

Gợi ý những sản phẩm mà người dùng có thể thích
dựa trên việc kết hợp Content-based filtering và
Collaborative Filtering.

Thuộc tính của sản phẩm+ đánh giá của
Users và cộng đồng.

3. VAI TRÒ CỦA HỆ GỢI Ý TRONG
THƯƠNG MẠI IN T
Trong thỵng mọi in t, h gi ý ũng vai
trủ nhỵ mt chuyờn gia thụng minh h tr
khỏch hng trong quá trình tìm và chọn mua

sân phèm. Hệ gợi ý thỳc ốy thỵng mọi in t
(Schafer & cs., 2001) theo cỏc cỏch sau:
- Chuyn khỏch vóng lai thnh ngỵi mua
hng (Converting Browsers into Buyers): Khỏch
vóng lai thỵng ghộ thởm website để xem trang
web mà không mua hàng. Các hệ thống gợi ý sẽ
hiểu nhu cæu cûa khách, hiển thð nhĂng sân
phèm mà khách thích, hoặc đang muốn tìm
mua. Bìng cách này, hệ thống sẽ chuyển nhĂng
khách vãng lai thành khỏch mua hng.
- Tởng cỵng bỏn chộo (Increasing Crosssell): Cỏc hệ thống gợi ý câi thiện bán chéo bìng
cách đề xuỗt cỏc mt hng liờn quan n sõn
phốm, cỏc sõn phèm phý kiện bổ sung cho
khách mua hàng.

524

- Xây dăng lũng trung thnh (Building
Loyalty): Trong chin lỵc kinh doanh, vic ọt
ỵc lũng trung thnh cỷa ngỵi tiờu dựng l
mt iu cỉn thiết. Khi lịng trung thành cûa
khách hàng tëng lên, lợi nhuên cüng sẽ tëng lên
(Reichheld & F., 1993). Các hệ thống gợi ý câi
tiếnlịng trung thành bìng cách tìm hiểu, thu
thêp thơng tin, nhu cỉu, sć thích và các mối
quan tâm cûa khách. Tÿ đị, sā dýng các tht
tốn thơng minh cá nhån hịa để gợi ý phù hợp
chotÿng khách hàng, giúp họ hài lịng, có niềm
tin quay läi trang web để mua hàng.
VĆi nhĂng khâ nëng trên, hệ gợi ý mang läi

trâi nghiệm tốt cho khách hàng, giúp khách
hàng giâm thąi gian tìm kiếm sân phèm, nâng
cao tỷ lệ chuyển đổi mua hàng, câi thiện việc bó
gió hàng và giĂ khách quay trć läi mua hàng.
Tÿ đò, hệ gi ý giỳp cỏc thỵng nhồn tởng giỏ
tr n hng trung bình, tëng doanh thu
bán hàng (Dias & cs., 2008; Jordan, 2016;
Stephan, 2019).


Hồng Thị Hà, Ngơ Nguyễn Thức

4. THÁCH THỨC CỦA HỆ GỢI Ý TRONG
THƯƠNG MẠI ĐIỆN TỬ VÀ GIẢI PHÁP
KHẮC PHỤC
4.1. Vấn đề khách hàng mới, sân phẩm mới
(Cold-startproblem)
Một trong nhĂng thỏch thc i vi bỗt k
h thng gi ý no l vỗn ngỵi dựng mi (new
user) hoc sõn phốm mi (new item). H s cỷa
ngỵi dựng rng v h chỵa xp họng bỗt k sõn
phốm no. Vỡ vờy, cỏc giõi thuờt gi ý khụng th
hiu ỵc khỏch hng v khụng d oỏn ỵc s
thớch, nhu cổu cỷa h (Sharma & Gera, 2013).
Vỗn ny gi l Cold start problem v cú th
ỵc giõi quyt bỡng cỏch s dýng h gợi ý khơng
cá nhån hịa để gợi ý nhĂng sân phốm mi,
nhng sõn phốm bỏn chọy, nhng sõn phốm
ỵc nhiu ngỵi ỏnh giỏ cao,... (Schafer & cs.,
2007; Mohamed & cs., 2019).

4.2. Vấn đề khâ năng mở rộng và hiệu suất
thời gian thc
Khi lỵng d liu ngy cng ln dổn lờn,
lm thế nào để các hệ gợi ý làm việc hiệu quâ
đang là mối quan tâm cûa các nhà khoa học v
cỷa doanh nhõn s dýng h thng thỵng mọi
in t. VĆi website lĆn, hệ thống phâi täo ra
các gợi ý trong vñng đĄn vð giây trong khi phýc
vý hàng trëm hoc hng ngn ngỵi tiờu dựng
cựng mt lỳc. S lỵng yờu cổu gi ý ng thi
ngy cng ln, s lỵng sõn phốm ngy cng
tởng, hnh vi tỵng tỏc cỷa ngỵi dùng trên các
sân phèm ngày càng nhiều. Hiện täi, để giõi
quyt phổn no vỗn ny ngoi vic ổu tỵ lĆn
hĄn cho các hệ thống tính tốn mänh cỉn phâi
áp dýng thêm các thuêt toán giâm chiều, xā lý
song song và đặc biệt nên chäy các tht tốn
offline để có thể gợi ý online nhanh hĄn (Khusro
& cs., 2016). Tuy nhiờn, ồy l vỗn khú v
ang l mt thỏch thĀc cûa các hệ thống gợi ý.
4.3. Vấn đề thưa thớt của dữ liệu đánh giá
(Sparsity)
Một thách thĀc nĂa đối vi h gi ý tọi cỏc
trang thỵng mọi in t l s thỵa tht v d
liu khỏch hng ỏnh giỏ sõn phốm. Rỗt nhiu

website, lỵng khỏch hng ỏnh giỏ trờnsõn
phốm rỗt ớt, nờn cỏc thuờt toỏn gi ý khũ oỏn
ỵc s thớch cỷa ngỵi dựng. ồy cỹng l mt
vỗn lĆn cûa các hệ gợi ý (Sharma & Gera,

2013). Bći dĂ liệu phâi đû lĆn các thuêt toán gợi
ý mĆi có nhĂng gợi ý chính xác. Các nhà khoa học
đã v ang c gớng nghiờn cu lm giõm vỗn
ny, nhỵng hin vộn cũn l mt bi toỏn khú
cổn ỵc nghiờn cu nhiu hn. Dỵi ồy l mt
s giõi phỏp ỵc xuỗt (Khusro & cs., 2016):
Giõi phỏp 1: Sā dýng mơ hình gợi ý đa
chiều (Adomavicius & cs., 2005) và sā dýng các
kỹ thuêt hiệu quâ giâi quyết bi toỏn d oỏn
i vi ma trờn thỵa nhỵ giõi pháp cûa Xue &
cs. (2015), giâi pháp cûa Lei & cs. (2019).
Giâi pháp 2: Dăa trên nhĂng phân hồi tiềm
èn cỷa ngỵi dựng (implicit feedback) nhỵ: lch
s xem hng, mua hng b sung d liu vo
ma trờn ngỵi dựng - sõn phốm nhỡm họn ch
mc thỵa cỷa ma trờn ớt ngỵi dựng ỏnh giỏ.
Giõi phỏp 3: Chia s thụng tin ngỵi dựng
gia cỏc trang web khụng cú cọnh tranh, đặc
biệt có thể khai thác thêm dĂ liệu tÿ cỏc trang
mọng xó hi. Thụng tin ngỵi dựng cng nhiu,
cng đỉy đû sẽ giúp các tht tốn gợi ý hiểu
khách hng hn v tỵ vỗn chớnh xỏc hn. Lỵu ý,
cỏc bờn khi chia s d liu ngỵi dựng phõi cam
kt chợ dựng d liu ỵc chia s phýc vý tỵ
vỗn tt hn v cú trỏch nhim bõo v thụng tin
ngỵi dựng.

5. NH GI CC PHNG PHP GI í
5.1. im mänh và điểm yếu của các
phương pháp hệ gợi ý

Bâng 3 l kt luờn cỷa chỳng tụi v nhng
ỵu im v họn ch cỷa cỏc phỵng phỏp h
gi ý.
5.2. ỏnh giá độ chính xác của các phương
pháp gợi ý
5.2.1. Dữ liệu thực nghiệm
Chúng tôi đánh giá hiệu quâ thăc hiện cỷa
cỏc thuờt toỏn content-based, user-based, item
based ó ỵc gii thiu ć trên bìng cách chäy
thā nghiệm trên 4 têp dĂ liệu chuèn: Movielens

525


Một số phương pháp gợi ý và ứng dụng trong thương mại điện tử

(GroupLens, 1998), Epinions (Trademark
Notice, 2003), BookCrossing (University of
Freiburg, 2004), LastFM (GroupLens, 2011).
5.2.2. Phương pháp đánh giá và môi trường
thử nghiệm
a. Phương pháp đánh giá
Chúng tôi chia têp d liu ra lm 2 phổn,
lỗy ngộu nhiờn 70% tờp dĂ liệu để training và
30% dĂ liệu còn läi để testing. Chúng tơi thăc
hiện 5 lỉn lặp trên các têp dĂ liệu.Độ đo
NRMSE (Normalized Root Mean Square Error)
và thąi gian thc hin (time) ỵc chỳng tụi s
dýng ỏnh giỏ hiệu quâ cûa các thuêt toán.
Độ đo NRMSE dùng để xác đðnh sai số

chn hóa cûa các tht tốn và ỵc xỏc nh
bỡng cụng thc:

NRMSE

RMSE
Rating max Rating min

Trong đò:
RMSE 

1 n
 pi  ri
n 1





2

vĆi n là số quan sát, pi là giá trð dă đoán
đánh giá cûa sân phèm i và ri là giá trð đánh giá
thăc t cỷa sõn phốm i.
Ratingmax, Ratingmin lổn lỵt l im ln nhỗt
v nhú nhỗt cho phộp ngỵi dựng ỏnh giỏ.
b. Mụi trng th nghim
Mụi trỵng ỵc s dýng th nghim là
máy tính Intel(R) Corei5-6300U, CPU @
2.5GHz, RAM 8GB và ngơn ngĂ Python trên hệ

điều hành Microsoft Window 10.

Bâng 3. Điểm mänh và điểm yếu của các phương pháp gợi ý
STT

Phương pháp

1

Gợi ý khơng cá nhân
hóa (Non-personalized
recommender
systems)

1. Đơn giản

Lọc dựa trên nội dung
(Content-based
filtering)

1. Hệ thống không sử dụng dữ liệu của người
dùng khác mà vẫn gợi ý được những sản
phẩm phù hợp với sở thích của từng khác
hhàng riêng biệt.

2

Điểm mạnh

2. Gợi ý không phụ thuộc vào dữ liệu của

khách hàng trên hệ thống nên áp dụng được
cho mọi khách hàng, giúp tăng cơ hội chuyển
đổi khách hàng.

2. Có khả năng gợi ý được cả những sản
phẩm mới cho người dùng.

Điểm yếu
1. Gợi ý chung chung, khơng cá nhân hóa
đến từng khách hàng. Vì vậy mọi khách đều
có kết quả gợi ý giống nhau.

1. Hệ thống phải phân tích và dị tìm tất cả
các đặc trưng của sản phẩm để tạo ra danh
sách gợi ý, nên có thể chậm hoặc nếu hồ sơ
về sản phẩm khơng đúng có thể dẫn đến
gợi ý sai.
2. Khơng thể gợi ý nếu khách hàng khơng
có lịch sử đánh giá xem/thích các sản phẩm
trên hệ thống.Với khách hàng mới, hệ thống
không thể cung cấp gợi ý phù hợp.
3. Khơng gợi ý được thêm các sở thích mới
của khách.

4

Lọc cộng tác
(Collaborative
Filtering)


1. Hệ thống không cần sử dụng đến hồ sơ
nhân khẩu học của người dùng để gợi ý
sản phẩm.
2. Có khả năng dự đốn được sở thích và nhu
cầu của người dùng mà không cần hiểu sản
phẩm.
3. Có thể gợi ý tới người dùng những sản
phẩm bên ngồi sở thích đang có.
Nhữngnhững sản phẩm này có thể phù hợp sở
thích mới của họ.

5

526

Phương pháp tổng
hợp (Hybrid method)

1. Kết hợp tất cả các ưu điểm của phương
pháp Content-based filtering và Collaborative
Filtering.

1. Không thể gợi ý nếu khách hàng chưa
từng tương tác với các mặt hàng.
2. Không thể gợi ý được các sản phẩm mới
hoặc sản phẩm chưa được ai đánh giá.
3. Khi lượng sản phẩm lớn nhưng số lượng
khách hàng đánh giá khơng nhiều thì
phương pháp này khơng hiệu quả.


1. Không thể gợi ý cho người dùng mới
2. Khi lượng sản phẩm lớn nhưng số lượng
khách hàng đánh giá khơng nhiều thì
phương pháp này khơng hiệu quả.


Hồng Thị Hà, Ngơ Nguyễn Thức

Bâng 4. Thơng tin các tập dữ liệu thử nghiệm
Datasets

#Items

#Users

# Rating

Range Rating

Mơ tả

Movielens 100K

1,700

1,000

100,000

1÷5


Chứa đánh giá của người dùng trên các các
bộ phim. Mỗi bộ phim có các đặc trưng (id,
title, realise date, type, rating, time )

Epinion

138,738

49,290

139,738

1÷5

Chứa quan điểm của người dùng về các
sản phẩm thương mại

BookCrossing

271,379

278,858

1,149,780

1÷10

Chứa đánh giá của người dùng về sách.


LastFM

17,632

1,892

92,834

Số lần các bài hát
được bật bởi
users

Chứa danh sách top những bài hát được
người dùng nghe nhiều nhất (2100 users
and 18,745)

5.2.3. Kết quõ th nghim
Kt quõ bõng 5 cho thỗy, thuờt tốn
Content - based có thąi gian chäy nhanh hĄn
User-based và Item-based, nhỵng chớnh xỏc
khụng cao. Gia thuờt toỏn User-based và
Item-based, nếu xét về sai số cûa dă đốn
thìtiếp cên lọc cộng tác dăa trên sân phèm
(Item-based) cho sai số thỗp hn (hay cho
chớnh xỏc cao hn) tip cờn lc cng tỏc da
trờnngỵi dựng (User - based) vi t lệ 3/4 têp
dĂ liệu. Tuy nhiên, xét về thąi gian thc hin
thỡ phỵng phỏp lc cng tỏc da trờn ngỵi
dựng thc hin nhanh hn nhiu so vi phỵng
phỏp lc cng tỏc da trờn sõn phốm cõ giai

oọn huỗn luyn (training) và giai đoän kiểm
thā (testing) ć câ 4 têp dĂ liu. Do ũ, cũ th núi
phỵng phỏp lc cng tỏc dăa trên User - based
sẽ có khâ nëng mć rộng (scability) tt hn
phỵng phỏp Item - based. Vỡ vờy, khú cú thuờt
toỏn no l tt nhỗt trờn mi tiờu chớ. Tùy theo
mýc đích gợi ý và Āng dýng thăc tế chn
phỵng phỏp gi ý phự hp.

6. TCH HP H GỢI Ý TRONG HỆ THỐNG
BÁN HÀNG TRỰC TUYẾN
Để thā nghiệm trc quan h gi ý ng dýng
trong thỵng mọi in tā, chúng tôi tiến hành
xây dăng hệ thống bán sách trăc tuyến tích hợp
vĆi các tht tốn gợi ý đã trình bày ć trên.
Hệ thống sā dýng tht tốn gợi ý khơng cá
nhån hịa để hiển thð các sân phèm mi, sõn
phốm bỏn chọy nhỗt, sõn phốm ỵc ỵa thớch
nhỗt. Đặc biệt, hệ thống tích hợp một số kỹ

thuêt gợi ý cỏ nhồn hũa nhỵ: phỵng phỏp gi ý
da trờn ni dung, phỵng phỏp gi ý lc cng
tỏc thụng báo cho khách hàng nhĂng sân
phèm họ có thể thích, hỗ trợ khách hàng trong
quá trình tìm mua sân phèm.
6.1. Tổng quan về cách tiếp cận
Cách tiếp cên tổng quan cỷa chỳng tụi ỵc
th hin trong hỡnh 5.
6.2. Lung x lý chính trong hệ thống
Luồng xā lý chính trong hệ thng ỵc th

hin trong hỡnh 6.
Giõi thớch: H thng s kiểm tra xem khách
hàng cị đëng nhêp hay khơng. Nếu khách hàng
cò đëng nhêp, hệ thống sẽ kiểm tra xem khỏch
hng ó cũ tỵngt vi ngỵi khỏc hay chỵa,
nu có thì sẽ sā dýng mơ hình lọc cộng tác
hin th thụng tin gi ý, ngỵc lọi h thng sẽ
kiểm tra xem khách hàng có thơng tin cá nhân
để quyết đðnh lăa chọn mơ hình nhân khèu học
hoặc khơng cỏ nhồn ỵa ra gi ý cho khỏch
hng. Trỵng hợp gợi ý dăa trên mơ hình khơng
cá nhân thì s ỵa ra nhng sõn phốm mi, sõn
phốm bỏn chọy, sõn phốm ỵc nhiu khỏch
hng quan tõm.
Trong trỵng hp khỏch hàng không đëng
nhêp, hệ thống sẽ kiểm tra lðch sā khách hàng
đã tÿng truy cêp vào trang web dăa vào IP
mỏy tớnh m khỏch hng truy cờp, h thng s
lỵu vết läi lðch sā q trình truy cêp. Nếu có
thơng tin da theo a chợ IP, h thng s ỵa
ra gợi ý về nhĂng sân phèm mà khách hàng đã
tÿng xem.

527


Một số phương pháp gợi ý và ứng dụng trong thương mại điện tử

Bâng 5. Sai số dự đoán và thời gian thực hiện trung bình 5 lần chäy
của các phương pháp lọc cộng tác

Dataset
Movielens (100K)

Epinion
BookCrossing
LastFM

Thuật toán

NRMSE

Thời gian(sec)
Training

testing

Content - based

0,317

0,093

0,027

User - based

0,280

1,126


3,107

Item - based

0,288

0,147

7,793

User - based

0,285

6,515

158,91

Item - based

0,254

7,518

3869,7

User - based

0,248


9,126

171,73

Item - based

0,282

20,142

4030,5

User - based

0,0131

4,313

165,398

Item - based

0,0103

39,326

4431,387

Ghi chú: giá trị tốt nhất của các tiêu chí trên mỗi tập dữ liệu được tô đậm.


Thông tin
về Users
(products cataluge)
Recommender System

Thông tin về sản phẩm
(products cataluge)

(peocduct

(Peocduct

Tương tác của User-item
(User product interactions)
(products cataluge)

Danh sách các sản phẩm
gợi ý cho khách

Hình 5. Tổng quan về cách tiếp cận
6.3. Tiến trình gợi ý trong hệ thống website
thương mọi

sõn phốm mi, sõn phốm bỏn chọy, sõn phốm
ỵc nhiu ngỵi ỏnh giỏ.

Tin trỡnh gi ý sõn phốm trong h thng
thỵng mọi in t ỵc th hin trong hỡnh 7.

- Nhóm 2: Sā dýng nhóm tht tốn cá

nhån hịa đã trình bày ć mýc 2.2 để gợi ý cho
khách hàng: thuêt toán nhân khèu học, thuêt
toán gợi ý dăa trên nội dung (content - based),
thuêt toán lọc cộng tác (Collaborative filtering)
để đoán các sân phèm phù hợp vĆi khách hàng.

Tiến trình này bao gồm 3 giai độn:
Giai độn 1: Thu thờp thụng tin ngỵi dựng
cú th d oỏn ỵc s thớch cỷa ngỵi
dựng, h thng phõi hc mt mụ hỡnh ngỵi
dựng (User model). Mụ hỡnh ngỵi dựng m
chỳng tụi thu thờp l cỏc d liu cỷa ngỵi dựng
nhỵ: thụng tin cỏ nhồn, thụng tin lch s tỵng
tỏc cỷa ngỵi dùng trên sân phèm.

Giai đoän 3: Gợi ý: Giai đoän này, cën cĀ
vào tÿng đặc điểm cûa khách hàng, hệ thống sẽ
dă đoán và gợi ý nhĂng sân phèm mà khách
hàng có thể thích.

Giai độn 2: Sā dýng các tht tốn gợi ý:
Giai độn này, chúng tơi sā dýng dĂ liu thu
thờp ỵc giai oọn 1 v d liu sân phèm để
chäy 2 nhóm tht tốn:

6.4. Một số giao diện kết q chính ứng với

- Nhóm 1: Sā dýng tht tốn gợi ý khơng
cá nhân hóa (Non - personalized) gi ý cỏc


Giao din ỏnh giỏ sõn phốm ỵc thể hiện
trong hình 8.

528

3 giai độn gợi ý của hệ thống
6.4.1. Trang đánh giá sản phẩm


Hồng Thị Hà, Ngơ Nguyễn Thức

Hình 6. Luồng xử lý chính trong hệ thống
Thu thập thơng tin
(Information collection)
Phản hồi
(Feedback)
Học
(Learning)

Dự đốn/Gợi ý
(Recommender System)

Hình 7. Tiến trình gợi ý trong hệ thống
6.4.2. Một số trang huấn luyện mơ hình
- Trang thống kê ỏnh giỏ sõn phốm cỷa
ngỵi dựng ỵc th hin trong hỡnh hỡnh 9.
- Trang o lỵng tỵng t gia cỏc ngỵi
dựng ỵc th hin trong hỡnh 10.
6.4.3. Cỏc kt quả gợi ý sản phẩm
a. Đối với khách hàng mới

Nếu l khỏch hng mi (khỏch hng chỵa
ỏnh giỏ bỗt k sân phèm nào), khi họ tìm

kiếm một sân phèm, hệ thống sẽ hiển thð danh
sách nhĂng sân phèm mĆi và nhng sõn phốm
tỵng t m nhiu ngỵi quan tồm gợi ý cho
khách hàng.
b. Đối với khách hàng thành viên
Nếu khách hàng là thành viên cûa hệ
thống, tÿng cò đánh giá sân phèm, website sẽ
gợi ý nhĂng sân phèm mĆi, sõn phốm nhiu
ngỵi quan tõm, sõn phốm tỵng t. Ngoi ra,
h thng cũn da vo tỵng t gia cỏc ngỵi

529


Một số phương pháp gợi ý và ứng dụng trong thương mại điện tử

dùng để hiển thð nhĂng sân phèm m khỏch
hng chỵa ỵc trõi nghim nhỵng ó ỵc cỏc
khỏch hng tỵng t khỏc ỏnh giỏ cao.
- Trang gi ý nhng sõn phốm ngỵi dựng
cú th thớch ỵc th hin trong hình 12.
- Trang hiển thð nhĂng sân phèm khách
hàng ó xem hoc ó mua ỵc th hin trong
hỡnh 13.
- Trang gi ý sõn phốm cú th ỵc mua
cựng nhau ỵc th hin trong hỡnh 14.


Nhỵ vờy, bỡng vic xõy dng mt ng dýng
thỵng mọi in t cú tớch hp a dọng cỏc
phỵng phỏp h gi ý, website ó t ng ỵa ra
cho khỏch hng cỏc gi ý khỏ thụng minh, đa
däng, trăc quan, phù hợp vĆi tÿng cá nhân khỏch
hng v ó khớc phýc ỵc vỗn ngỵi dựng
mi, sõn phốm mi. Vi nhng khõ nởng trờn cho
thỗy, h gợi ý mang läi trâi nghiệm tốt chokhách
hàng, giúp khách hàng giâm thąi gian tìm kiếm
sân phèm, tëng độ hài lñng, tëng cĄ hội mua
hàng và nâng cao tỷ lệ chuyển đổi mua hàng.

Hình 8. Giao diện đánh giá sân phẩm của người dùng

Hình 9. Giao diện kết quâ đánh giá sân phẩm của người dùng

530


Hồng Thị Hà, Ngơ Nguyễn Thức

Hình 10. Giao diện đo lường độ tương tự giữa các người dùng

Hình 11. Giao diện gợi ý cho người dùng mới

531


Một số phương pháp gợi ý và ứng dụng trong thương mại điện tử


Hình 12. Giao diện gợi ý các sân phẩm người dùng có thể thích

Hình 13. Giao diện hiển thị những sân phẩm người dùng đã xem/mua

Hình 14. Giao diện gợi ý các sân phẩm hay mua cùng nhau

532


Hồng Thị Hà, Ngơ Nguyễn Thức

7. KẾT LUẬN
Hệ gợi ý cú vai trũ rỗt quan trng trong
thỵng mọi in t. Nó là một trong nhĂng vü
khí mänh mẽ giúp nhiều doanh nghiệp tëng
doanh số bán hàng, là một trong nhĂng nhõn t
tọo nờn s thnh cụng cỷa cỏc trang thỵng mọi
in t v s ỵc ng dýng rng rói trong
tỵng lai.
Trong nghiên cĀu này, chúng tơi đã trình
bày tổng quan về hệ gợi ý, khám phá nhĂng tác
động cûa hệ gi ý i vi thỵng mọi in t.
Bỡng thc nghim, chỳng tụi ó so sỏnh ỵc
hiu quõ thc hin cỷa cỏc phỵng phỏp gi ý
Content-based, User-based v Item-based,
ỏnh giỏ ỵc nhng im mọnh, im yu cỷa
mi phỵng phỏp gi ý. Ngoi ra, chỳng tụi bỏo
cỏo thỏch thc cỷa cỏc phỵng phỏp gi ý khi ỏp
dýng trong thỵng mọi in t và chỵ ra giâi
pháp khíc phýc. Cuối cùng, chúng tơi đã xåy

dăng thành cơng hệ thống bán hàng trăc tuyến
có tớch hp cỏc phỵng phỏp gi ý khỏc nhau,
bao gm kỹ tht gợi ý khơng cá nhân hóa
(Non-personalized) và các k thuờt gi ý cỏ
nhõn húa hiu quõ nhỵ: gi ý dăa trên nội dung
(Content-based filtering), lọc cộng tác (Userbased, Item-based). Qua ũ, ngỵi c hiu ỵc
nn tõng lý thuyt hệ gợi ý, điểm mänh, điểm
yếu cûa các hệ gợi ý cỹng nhỵ quy trỡnh xồy
dng mt ng dýng thỵng mọi in t cú tớch
hp cỏc phỵng phỏp gi ý trong thc t.
Hỵng nghiờn cu trong tỵng lai cỷa lùnh
vc này còn khá rộng mć, đặc biệt là các kỹ
thuêt gợi ý cá nhân hóa. Chúng tơi sẽ tiếp týc
nghiên cĀu, câi tiến Āng dýng các thuêt toán gợi
ý trong lùnh vc e-commerce, lùnh vc
e-learning tr giỳp ngỵi dựng trong quỏ
trỡnh mua hng, tỡm kim ti liu cỹng nhỵ hỗ
trợ q trình học têp trăc tuyến.

LỜI CẢM ƠN
Chúng tơi câm Ąn Khoa Công nghệ thông
tin, Học viện Nông nghiệp Vit Nam ó tọo
iu kin tt nhỗt chỳng tụi thăc hiện
nghiên cĀu này.

TÀI LIỆU THAM KHẢO
Adomavicius G., Sankaranarayanan R., Sen S. &
Tuzhilin A. (2005). Incorporating contextual
information in recommender systems using a
multidimensional approach.. ACM Transactions on

Information Systems (TOIS). pp. 103-145.
Dias M.B., Locher D., Li M., El-Deredy W. & Lisboa
P.J. (2008). The value of personalised
recommender systems to e-business: a case study.
Proceedings of the 2008 ACM conference on
Recommender systems. pp. 291-294.
GroupLens (1998). MovieLens 100K Dataset,
Retrieved from />movielens/ on October 03, 2020.
Grouplens (2011). Last.FM. Retrieved from
/>on
October 03, 2020.
Google & Temasek (2018). Báo cáoReport e-Conomy
SEA
2018,
Retrieved
from
.
/>6730/Report_e-Conomy_SEA_2018_by_Google_
Temasek_v.pdf on March 20, 2020.
Ionos (2017). Recommendation systems in ecommerce. US: IONOS Inc. Retrieved from
/>eting/online-sales/how-to-use-recommendationsystems-in-e-commerce on May 15, 2020.
Jordan T. (2016). New insight from Experian
Marketing Services helps brands prepare for the
holiday season. .
Khusro S., Ali Z. & Ullah I. (2016). Recommender
systems: issues, challenges, and research
opportunities. In Information Science and
Applications (ICISA) 2016. Springer. In
Information Science and Applications (ICISA).
Lei Tang, Zongtao Duan, Yishui Zhu, Junchi Ma &

Zihang Liu (2019). Recommendation for
Ridesharing
Groups
Through
Destination
Prediction on Trajectory Data. IEEE Transactions
on Intelligent Transportation Systems. 99: 14.
Mohamed M.H., Khafagy M.H. & Ibrahim M.H. (2019).
Recommender Systems Challenges and Solutions
survey. International Conference on Innovative
Trends in Computer Engineering (ITCE)
Nguyễn Hùng Dũng & Nguyễn Thái Nghe (2013). Hệ
thống gợi ý sản phẩm trong bán hàng trực tuyến sử
dụng kỹ thuật lọc cộng tác Tạp chí Khoa học,
Trường Đại học Cần Thơ. 31: 15.
Nguyễn Thanh Hưng (2019). Báo cáo chỉ số thương
mại điện tử 2019. Hiệp hội thương mại điện tử
Việt Nam.
Reichheld & F.F. (1993). Loyalty-based management.
Harvard business review. 71(2): 64-73.

533


Một số phương pháp gợi ý và ứng dụng trong thương mại điện tử

Schafer Ben J., Joseph Konstan & John Riedl (2001).
E-commence Recommendation Applications.
Data Mining and Knowledge Discovery.
5(1-2): 115-153.

Sharma L. & Gera A. (2013). A survey of
recommendation system: Research challenges.
International Journal of Engineering Trends and
Technology (IJETT). 4(5): 1989-1992.
Singh P. (2019). A Survey of Recommendation
Systems in Electronic Commerce. Apress,
Berkeley, CA. pp. 123-157.
Stephan
S.
(2019).
Personalized
Product
Recommendation Tips and Stats. Retrieved
from on Feb 25, 2020.
Thomas T. (2006). Designing recommender systems
for e-commerce: an integration approach. ACM

534

International Conference Proceeding Series. ACM
press. New York, USA. 8.
Trademark Notice (2003). Epinions dataset. Retrieved
from on
October 03, 2020.
University of Freiburg (2004). BookCrossing,
Retrieved
from
on October 03, 2020
Viễn Thông (2020). Thương mại điện tử Việt Nam
2020

sẽ
ra
sao?
Truy
cập
từ
ngày10
tháng 3 năm 2020.
Xue A.Y., Qi J., Xie X., Zhang R., Huang J. & Li Y.
(2015). Solving the data sparsity problem in
destination prediction. The VLDB Journal.
24(2): 219-243.



×