Tải bản đầy đủ (.pdf) (15 trang)

SOME METHODS OF RECOMMENDER SYSTEM AND ITS APPLICATION IN E-COMMERCE - Full 10 điểm

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.22 MB, 15 trang )

Vietnam J. Agri. Sci. 2021, Vol. 19, No. 4: 520-534 Tạp chí Khoa học Nơng nghiệp Việt Nam 2021, 19(4): 520-534
www.vnua.edu.vn

MỘT SỐ PHƯƠNG PHÁP GỢI Ý VÀ ỨNG DỤNG TRONG THƯƠNG MẠI ĐIỆN TỬ

Hồng Thị Hà1*, Ngơ Nguyễn Thức2

1Khoa Công nghệ thông tin, Học viện Nông nghiệp Việt Nam
2Sinh viên K57 - Khoa Công nghệ thông tin, Học viện Nông nghiệp Việt Nam

*Tác giả liên hệ:

Ngày nhận bài: 20.07.2020 Ngày chấp nhận đăng: 29.03.2020

TÓM TẮT

Hệ gợi ý (Recommender System) là công cụ được thiết kế nhằm cung cấp những khuyến nghị hữu ích về sản
phẩm, dịch vụ,…cho người dùng. Hệ gợi ý dựa trên dữ liệu về mối quan hệ giữa người dùng, sản phẩm và các hành
vi của người dùng trong quá khứ đối với sản phẩm để đưa ra những gợi ý thông minh, phù hợp với sở thích của
từng khách hàng. Hệ gợi ý giúp khách hàng nhanh chóng định vị được những sản phẩm họ quan tâm để từ đó đưa
ra quyết định đúng đắn khi mua sắm online. Trong bài báo này, chúng tơi trình bày tổng quan một số phương pháp
gợi ý, đánh giá điểm mạnh, điểm yếu, so sánh hiệu quả thực hiện của mỗi phương pháp. Chúng tôi chỉ ra lợi ích mà
các hệ gợi ý mang lại cho thương mại điện tử, đồng thời nêu ra những thách thức và giải pháp khắc phục. Kết quả
thực nghiệm của chúng tôi trên 4 tập dữ liệu chuẩn (Movielens, Epinions, BookCrossing, LastFM) cho thấy mỗi
phương pháp đều có những ưu điểm và hạn chế riêng, khơng có phương pháp nào là tốt nhất trên tất cả các tiêu chí.
Ngồi ra, chúng tơi cũng đưa ra quy trình chung để xây dựng hệ gợi ý trong các website thương mại và thực hiện tích
hợp các kỹ thuật hệ gợi ý trong website thương mại điện tử khắc phục vấn đề người dùng mới, sản phẩm mới (vấn
đề này còn gọi là “Cold start problem”) của các phương pháp gợi ý cá nhân hóa.

Từ khóa: Hệ gợi ý, lọc cộng tác, gợi ý dựa trên nội dung, hệ gợi ý kết hợp, thương mại điện tử.


Some Methods of Recommender System and its Application in E-Commerce

ABSTRACT

The designed recommender system is a tool to provide important suggestions forusers or customers. Based on
the datasets of user relationships, products, andprevious behavior of consumers, smart recommendations for the
preferences of eachconsumer are given, which helps consumers tomake good decisions while shopping online. In
this article, we present an overview of some methodologies of recommendation systems, techniques of recommender
systems, and evaluate the strengths and weaknesses of each technique, as well as comparedsome benefits of
recommender systems in e-commerce. Moreover, we report some challenges that the recommender systems are
facing and list some solutions to solve these challenges. Our experimental results on the four datasets
(Movielens100k, Epinions,BookCrossing, LastFM) showed that there was no best recommendation algorithm in all
evaluation metrics. Finally, we built an e-commerce website that integrated some different techniques of
recommender systems such as non-personalized methods, personalized methods to recommend the right product for
each customer. The experimental system gives some diverse suggestions to overcome the problem "Cold start
problem" of personalized methods.

Keywords: Recommender systems, collaborative filtering, content-based filtering, hyper filtering, E-Commerce.

1. ĐẶT VẤN ĐỀ đổi hình thĀc giao dðch truyền thống. Ngày càng
cú nhiu ngỵi la chn hình thĀc mua sím trăc
Trong nhĂng nëm gæn đåy, cùng vĆi să phổ tuyến. Trong khi đò, để m rng th trỵng kinh
bin cỷa mọng Internet v mỏy tớnh, thỵng doanh, các doanh nghiệp đã xåy dăng Āng dýng
mäi điện tā đã phát triển nhanh chóng trên thỵng mọi in t v cung cỗp rỗt nhiu sõn
phọm vi ton cổu. Thỵng mọi in t ó thay phèm trên website. Tuy nhiên, khi thông tin

520

Hồng Thị Hà, Ngơ Nguyễn Thức


q nhiều, khách hàng sẽ tốn thąi gian để tìm động ỵa ra nhng gi ý thụng minh, a dọng
sõn phốm họ cæn. Điều này, làm giâm să hài ti ngỵi dựng.
lũng v s trung thnh cỷa khỏch. giõi quyt
vỗn ny, ý tỵng chớnh cỷa cỏc chuyờn gia 2. CC K THUT H GI í
thỵng mọi in tā là thiết lêp hệ thống gợi ý
thơng minh nhìm khám phá ra các mặt hàng Cỏc k thuờt h gi ý thỵng ỵc chia
phự hp nhỗt cho tng ngỵi dựng. Vi h thng thành hai nhóm chính là: hệ gợi ý cá nhân hóa
gợi ý tă động, khách hàng có thể nhanh chóng và hệ gợi ý khụng cỏ nhõn húa. Chỳng tụi tờp
truy cờp ỵc sân phèm hợp vĆi sć thích và nhu trung gii thiu túm tớt phỵng phỏp gi ý
cổu cûa họ, tiết kiệm thąi gian tìm sân phèm khơng cá nhân hóa và một s thuờt toỏn gi ý cỏ
cho ngỵi dựng (Thomas, 2006). nhân húa tiờu biu thỵng ỵc s dýng trong
cỏc trang thỵng mäi điện tā.
NhĂng nëm gổn ồy, cỏc k thuờt h gi ó
v ang ỵc nghiên cĀu, Āng dýng ć nhiều lïnh 2.1. Hệ gợi ý khơng cá nhân hóa (non-
văc. Trong thỵng mọi in t, h gi ý mang personalized recommender systems )
läi nhiều lợi ích cho cõ ngỵi cung cỗp dch vý
v ngỵi s dýng dðch vý (Ionos, 2017). Hæu hết L nhũm phỵng phỏp khụng da vo h s
cỏc cụng ty thỵng mọi ln nhỵ: Amazon cá nhân tÿng khách hàng mà chỵ dăa vào đặc
(Amazon.com), CDNOW (www.cdnow.com), tính cûa sân phèm (sân phèm mĆi) và đánh giá
eBay (eBay.com), Alibaba (Alibaba.com), tÿ cng ng nhỵ: sõn phốm bỏn chọy nhỗt, sõn
MovieFinder (MovieFinder.com), Youtube.com, phốm ỵc ỏnh giỏ tt nhỗt, (Singh, 2019)
Facebook.com, u s dýng cỏc k thuêt gợi ý
trong website cûa họ để nâng cao trâi nghiệm 2.2. Hệ gợi ý cỏ nhõn húa (personalized
cho khỏch hng, nõng cao chỗt lỵng dðch vý và recommender systems)
tëng doanh thu bán hàng. Tuy nhiên, ć Việt
Nam - một quốc gia cú rỗt nhiu tim nởng v Nhũm phỵng phỏp ny ỵc ỏnh giỏ l
thỵng mọi in t (Vin Thụng, 2020) läi có số mang läi hiệu quâ cao i vi thỵng mọi in t.
lỵng website thỵng mọi tích hợp hệ gợi ý Nếu doanh nghiệp hiểu rõ tÿng khách hàng cûa
không nhiều (Nguyễn Hùng Düng & Nguyễn mình dăa trờn nhng gỡ h tỵng tỏc v mua
Thỏi Nghe, 2013). Hiện Việt Nam đang cò 44% hng trờn mọng, doanh nghip cú th tỵ vỗn cho

doanh nghip ó tham gia xồy dng website khách hàng nhĂng sõn phốm phự hp vi mong
thỵng mọi, nhỵng chợ cú 32% doanh nghiệp mun v s thớch cỷa khỏch hn (Google &
ỵc đánh giá cao kênh bán hàng thông qua Temasek, 2018). Khách hàng s tit kim ỵc
trang web (Nguyn Thanh Hỵng, 2019). thi gian tỡm kim sõn phốm, mua ỵc nhĂng
mịn hàng đúng sć thích. Tÿ đị, doanh nghiệp sẽ
Bài báo này trình bày tổng quan các tởng ỵc s lỵng ngỵi mua hng, tởng giỏ tr
phỵng phỏp gi ý, ỏnh giỏ hiu quõ cỷa cỏc đĄn hàng, tëng doanh số bán hàng.
thuêt toán gợi ý (Content-based, user-based và
item-based) trên một số têp dĂ liệu chuèn bao Theo nghiên cĀu cûa Schafer & cs. (2001),
gồm: Movielens, Epinions, BookCrossing và nếu doanh nghiệp sā dýng phỵng phỏp gi ý cỏ
LastFM. Chỳng tụi thõo luờn nhĂng điểm nhân hòa để gāi email tĆi khách hng thỡ t l
mọnh, im yu cỷa mi phỵng phỏp, thách giao dch thụng qua email cao hn gỗp hai lổn
thc v giâi pháp khíc phýc khi xây dăng hệ gợi so vi cỏc email ỵc gi khụng ỏp dýng phỵng
ý trong thỵng mọi in t. ng thi, chỳng tụi phỏp ny (Stephan, 2019). Do ũ, cỏc phỵng
ỵa ra quy trình xåy dăng hệ gợi ý trong các pháp gợi ý cá nhån hòa lm tởng mc tỵng
website thỵng mọi v thc hin cài đặt các kỹ tác và chuyển i trong giao dch thỵng mọi
thuờt h gi ý trong website thỵng mọi in t. in t.
Kt quõ ci t cho thỗy, khi website ỵc tớch
hp cỏc phỵng phỏp hệ gợi ý hệ thống sẽ tă Một s phỵng phỏp gi ý thuc loọi cỏ
nhõn húa nhỵ sau:

521

Một số phương pháp gợi ý và ứng dụng trong thương mại điện tử

2.2.1. Gợi ý dựa trên nội dung (Content- ngỵi dựng ũ kt hp quan im cỷa nhng
based filtering) ngỵi dựng khỏc. ồy l k thuờt mänh và đã
ỵc ỏp dýng khỏ thnh cụng trong cỏc h
Phỵng phỏp gi ý này dăa trên mô tâ cûa thống thỵng mọi ln. Lc cng tỏc thu thờp
sõn phốm v profile cỷa tng ngỵi dựng phõn hi t nhiu ngỵi dựng i vi sõn phốm,

(khụng quan tồm n ngỵi dựng khỏc). Gi ý lỵu tr phõn hi cỷa ngỵi dựng dỵi dọng ma
da trờn ni dung s thu thờp h s cỷa ngỵi trờn ngỵi dựng (users) - sõn phốm (items). Mi
dựng: h tờn, gii tớnh, ngh nghip... v tỵng dòng là một vectĄ chĀa giá trð phân hồi cỷa
tỏc cỷa cỏ nhồn ngỵi dựng trờn cỏc sõn phốm, ngỵi dựng i vi cỏc sõn phèm. Sau đị, tính
sau đị so sánh đặc điểm các sõn phốm trong c tỵng tă giĂa các users hoặc giĂa các items
sć dĂ liệu vĆi đặc điểm các sân phèm mà khách trong h thng, tỡm ra mi tỵng quan v ỵa
hng ó quan tồm gi ý cho khỏch hàng. ra gi ý phự hp. tỵng t gia cỏc user hoặc
gia cỏc item ỵc tớnh theo cụng thc Cosin
2.2.2. Lc cộng tác (Collaborative hoặc Pearson.
Filtering - CF)
Bâng 1 là ma trên biểu diễn đánh giá cûa
Lọc cộng tác gợi ý sân phèm tĆi ngỵi dựng ngỵi dựng trờn cỏc sõn phốm.
da trờn lch s tỵng tỏc sõn phốm cỷa chớnh

Hình 1. Mơ hình hệ gợi ý dựa trên nội dung
Bâng 1. Ma trận biểu diễn người dùng - sân phẩm của tiếp cận lọc cộng tác

522

Hoàng Thị Hà, Ngô Nguyễn Thức

Cũ hai phỵng phỏp lc cng tỏc: mäi điện tā ln nhỵ Amazon, Tiki, Youtube
và Facebook.
User-based: D oỏn da trờn s tỵng t
gia cỏc users. í tỵng quan trng cỷa phỵng 2.2.3. Phng phỏp kt hp
phỏp ny l nhng khỏch hng tỵng t cú xu (hybrid method)
hỵng s dýng nhng sõn phốm tỵng t
(Singh & Pramod, 2019). Nếu hai khách hàng A, Phỵng phỏp ny kt hp gia kỹ thuêt gợi
B có lðch sā đánh giá các sân phốm tỵng t ý da trên nội dung và lọc cộng tác. Kỹ thuêt
nhau thì User-basedsẽ dă đoán khách hàng A ny ỵc xem l khỏ hiu quõ v giâi quyết

có khâ nëng sẽ quan tâm tĆi nhĂng sân phốm ỵc vỗn cold - start problem trong rỗt
chỵa ỵc trõi nghim nhỵng ó ỵc khỏch nhiu nghiờn cu. Trang thỵng mọi in t
hng B thớch v ngỵc lọi. Phỵng phỏp ny in hỡnh ó ng dýng phỵng phỏp ny là
phân tích ma trên user-item để tìm ra nhĂng Spotify.com. H ó tớch hp phỵng phỏp h gi
ngỵi dựng tỵng t. ý tổng hợp để täo ra danh sách các bài hát hàng
tuæn cho tÿng khách hàng riêng biệt. Website
Item-based : Dă oỏn da trờn s tỵng t ó tng hp d liu ngỵi dựng da trờn thúi
gia cỏc items. Hai sõn phốm i v i ó ỵc quen nghe nhọc v nhng ngỵi dựng tỵng t
cng ng ỏnh giỏ tỵng t nhau thỡ cú th s để täo ra một danh sách các bài hỏt c ỏo phự
ỵc ỏnh giỏ tỵng t bi nhng ngỵi dựng hp vi s thớch cỷa tng khỏch hng.
cũn lọi. Phỵng phỏp ny phồn tớch ma trờn
user-item nhờn din cỏc sõn phốm tỵng tă. 2.3. Mục tiêu của các phương pháp gợi ý

Ngày nay, k thuờt lc cng tỏc ỵc s Mýc tiêu cûa các phỵng phỏp gi ý ỵc
dýng khỏ ph bin trờn cỏc trang thỵng thể hiện trong bâng 2.

Hình 2.Tiến trình lọc cộng tác

Hình 3. Lọc cộng tác dựa trên User-based và Item-based

523

Một số phương pháp gợi ý và ứng dụng trong thương mại điện tử

Hình 4. Mơ hình hệ gợi ý kết hợp

Bâng 2. Mục tiêu khái niệm của các phương pháp gợi ý

Phương pháp (Methods) Mục tiêu (concept goals) Đầu vào (Inputs)


Gợi ý khơng cá nhân hóa Gợi ý những sản phẩm mà người dùng có thể thích Thuộc tính (item attributes) của sản phẩm
(Non-personalized dựa trên sản phẩm mới hoặc ý kiến cộng đồng. hoặc Profiles của người dùng.
recommender systems)
Lọc dựa trên nội dung Gợi ý những sản phẩm khách hàng có thể thích dựa Đánh giá của User + Đánh giá của cộng
(Content-based filtering) trên hồ sơ cá nhân của người dùng và độ tương tự đồng
giữa các sản phẩm trong cơ sở dữ liệu với những sản Thuộc tính của sản phẩm+ đánh giá của
Lọc cộng tác (Collaborative phẩm mà khách hàng đã thích trong quá khứ. Users và cộng đồng.
Filtering)
Phương pháp kết hợp Gợi ý những sản phẩm mà người dùng có thể thích
(Hybrid method) dựa trên những người dùng có sở thích tương tự.

Gợi ý những sản phẩm mà người dùng có thể thích
dựa trên việc kết hợp Content-based filtering và
Collaborative Filtering.

3. VAI TRÒ CỦA HỆ GỢI Ý TRONG - Xây dăng lòng trung thành (Building
THƯƠNG MẠI ĐIỆN TỬ Loyalty): Trong chin lỵc kinh doanh, vic ọt
ỵc lũng trung thnh cỷa ngỵi tiờu dựng l
Trong thỵng mọi in t, h gi ý địng vai một điều cỉn thiết. Khi lịng trung thnh cỷa
trủ nhỵ mt chuyờn gia thụng minh h tr khách hàng tëng lên, lợi nhuên cüng sẽ tëng lên
khách hàng trong quá trình tìm và chọn mua (Reichheld & F., 1993). Các hệ thống gợi ý câi
sân phèm. Hệ gợi ý thúc đèy thỵng mọi in t tinlũng trung thành bìng cách tìm hiểu, thu
(Schafer & cs., 2001) theo các cách sau: thêp thơng tin, nhu cỉu, sć thích và các mối
quan tâm cûa khách. Tÿ đò, sā dýng các thuêt
- Chuyển khỏch vóng lai thnh ngỵi mua tốn thơng minh cá nhån hịa để gợi ý phù hợp
hàng (Converting Browsers into Buyers): Khách chotÿng khách hàng, giúp họ hài lịng, có nim
vóng lai thỵng ghộ thởm website xem trang tin quay läi trang web để mua hàng.
web mà không mua hàng. Các hệ thống gợi ý sẽ
hiểu nhu cæu cûa khách, hiển thð nhĂng sân VĆi nhĂng khâ nëng trên, hệ gợi ý mang läi
phèm mà khách thích, hoặc đang muốn tìm trâi nghiệm tốt cho khách hàng, giúp khách

mua. Bìng cách này, hệ thống sẽ chuyển nhĂng hàng giâm thąi gian tìm kiếm sân phèm, nâng
khách vãng lai thành khách mua hàng. cao tỷ lệ chuyển đổi mua hàng, câi thiện việc bó
gió hàng và giĂ khách quay trć läi mua hàng.
- Tởng cỵng bỏn chộo (Increasing Cross- T ũ, h gi ý giỳp cỏc thỵng nhồn tởng giá
sell): Các hệ thống gợi ý câi thiện bán chéo bìng trð đĄn hàng trung bình, tëng doanh thu
cách xuỗt cỏc mt hng liờn quan n sõn bán hàng (Dias & cs., 2008; Jordan, 2016;
phèm, các sân phèm phý kiện bổ sung cho Stephan, 2019).
khách mua hàng.

524

Hồng Thị Hà, Ngơ Nguyễn Thức

4. THÁCH THỨC CỦA HỆ GỢI Ý TRONG website, lỵng khỏch hng ỏnh giỏ trờnsõn
THNG MI ĐIỆN TỬ VÀ GIẢI PHÁP phốm rỗt ớt, nờn cỏc thuờt tốn gợi ý khị đốn
KHẮC PHỤC ỵc s thớch cỷa ngỵi dựng. ồy cỹng l mt
vỗn ln cûa các hệ gợi ý (Sharma & Gera,
4.1. Vấn đề khách hàng mới, sân phẩm mới 2013). Bći dĂ liệu phâi đû lĆn các thuêt toán gợi
(Cold-startproblem) ý mĆi có nhĂng gợi ý chính xác. Các nhà khoa học
đã và đang cố gíng nghiên cĀu để làm giâm vỗn
Mt trong nhng thỏch thc i vi bỗt k ny, nhỵng hin vộn cũn l mt bi toỏn khú
h thng gi ý no l vỗn ngỵi dựng mi (new cổn ỵc nghiờn cu nhiu hn. Dỵi ồy là một
user) hoặc sân phèm mĆi (new item). Hồ sĄ cỷa s giõi phỏp ỵc xuỗt (Khusro & cs., 2016):
ngỵi dựng rng v h chỵa xp họng bỗt k sõn
phốm no. Vỡ vờy, cỏc giâi thuêt gợi ý không thể Giâi pháp 1: Sā dýng mô hỡnh gi ý a
hiu ỵc khỏch hng v khụng d oỏn ỵc s chiu (Adomavicius & cs., 2005) và sā dýng các
thích, nhu cỉu cûa họ (Sharma & Gera, 2013). kỹ thuêt hiệu quâ giâi quyết bài toán dă oỏn
Vỗn ny gi l Cold start problem v cú th i vi ma trờn thỵa nhỵ giõi phỏp cỷa Xue &
ỵc giõi quyt bỡng cỏch s dýng hệ gợi ý không cs. (2015), giâi pháp cûa Lei & cs. (2019).
cá nhån hòa để gợi ý nhĂng sân phèm mĆi,

nhĂng sân phèm bán chäy, nhĂng sân phèm Giâi pháp 2: Da trờn nhng phõn hi tim
ỵc nhiu ngỵi ỏnh giỏ cao,... (Schafer & cs., ốn cỷa ngỵi dựng (implicit feedback) nhỵ: lch
2007; Mohamed & cs., 2019). sā xem hàng, mua hàng„ để bổ sung dĂ liệu vào
ma trờn ngỵi dựng - sõn phốm nhỡm hän chế
4.2. Vấn đề khâ năng mở rộng và hiệu suất mc thỵa cỷa ma trờn ớt ngỵi dựng ỏnh giá.
thời gian thực
Giâi phỏp 3: Chia s thụng tin ngỵi dựng
Khi lỵng d liu ngy cng ln dæn lên, giĂa các trang web khơng có cänh tranh, đặc
làm thế nào để các hệ gợi ý làm việc hiệu quâ biệt có thể khai thác thêm dĂ liệu tÿ các trang
đang là mối quan tâm cûa các nhà khoa học và mäng xã hi. Thụng tin ngỵi dựng cng nhiu,
cỷa doanh nhõn s dýng h thng thỵng mọi càng đæy đû sẽ giúp các thuêt toán gợi ý hiểu
điện tā. VĆi website lĆn, hệ thống phâi täo ra khách hàng hĄn v tỵ vỗn chớnh xỏc hn. Lỵu ý,
cỏc gi ý trong vñng đĄn vð giây trong khi phýc cỏc bờn khi chia s d liu ngỵi dựng phõi cam
vý hng trởm hoc hng ngn ngỵi tiờu dựng kết chỵ dùng d liu ỵc chia s phýc vý tỵ
cựng mt lỳc. S lỵng yờu cổu gi ý ng thi vỗn tt hn v cú trỏch nhim bõo v thụng tin
ngy cng ln, s lỵng sõn phốm ngày càng ngỵi dựng.
tởng, hnh vi tỵng tỏc cỷa ngỵi dựng trờn các
sân phèm ngày càng nhiều. Hiện täi, để giâi 5. ĐÁNH GIÁ CÁC PHNG PHP GI í
quyt phổn no vỗn ny ngoi vic ổu tỵ ln
hn cho cỏc h thng tớnh toỏn mänh cæn phâi 5.1. Điểm mänh và điểm yếu của các
áp dýng thêm các thuêt toán giâm chiều, xā lý phương pháp hệ gợi ý
song song và đặc biệt nên chäy các tht tốn
offline để có thể gợi ý online nhanh hĄn (Khusro Bâng 3 là kết luên cûa chúng tôi v nhng
& cs., 2016). Tuy nhiờn, ồy l vỗn khú v ỵu im v họn ch cỷa cỏc phỵng phỏp h
ang l mt thỏch thĀc cûa các hệ thống gợi ý. gợi ý.

4.3. Vấn đề thưa thớt của dữ liệu đánh giá 5.2. Đánh giá độ chính xác của các phương
(Sparsity) pháp gợi ý

Một thách thĀc nĂa đối vĆi hệ gợi ý täi các 5.2.1. D liu thc nghim

trang thỵng mọi in t l s thỵa tht v d Chúng tôi đánh giá hiệu quâ thc hin cỷa
liu khỏch hng ỏnh giỏ sõn phốm. Rỗt nhiều
các thuêt toán content-based, user-based, item
based ó ỵc giĆi thiệu ć trên bìng cách chäy
thā nghiệm trên 4 têp dĂ liệu chuèn: Movielens

525

Một số phương pháp gợi ý và ứng dụng trong thương mại điện tử

(GroupLens, 1998), Epinions (Trademark NRMSE  RMSE
Notice, 2003), BookCrossing (University of
Freiburg, 2004), LastFM (GroupLens, 2011). Ratingmax  Ratingmin

5.2.2. Phương pháp đánh giá và môi trường Trong đò:
thử nghiệm
RMSE  1 n pi  ri 2
a. Phương pháp đánh giá
Chúng tôi chia têp dĂ liệu ra làm 2 phæn, n1

lỗy ngộu nhiờn 70% tờp d liu để training và vĆi n là số quan sát, pi là giá trð dă đốn
30% dĂ liệu cịn läi để testing. Chúng tôi thăc đánh giá cûa sân phèm i và ri là giá trð đánh giá
hiện 5 læn lặp trên các têp dĂ liệu.Độ đo thăc tế cûa sân phèm i.
NRMSE (Normalized Root Mean Square Error)
v thi gian thc hin (time) ỵc chỳng tụi sā Ratingmax, Ratingmin læn lỵt l im ln nhỗt
dýng ỏnh giỏ hiu quõ cûa các thuêt toán. v nhú nhỗt cho phộp ngỵi dựng ỏnh giỏ.

Độ đo NRMSE dùng để xác đðnh sai số b. Môi trường thử nghiệm
chuèn húa cỷa cỏc thuờt toỏn v ỵc xỏc nh
bỡng cụng thĀc: Môi trỵng ỵc s dýng th nghim l

máy tính Intel(R) Corei5-6300U, CPU @
2.5GHz, RAM 8GB và ngôn ngĂ Python trên hệ
điều hành Microsoft Window 10.

Bâng 3. Điểm mänh và điểm yếu của các phương pháp gợi ý

STT Phương pháp Điểm mạnh Điểm yếu

1 Gợi ý không cá nhân 1. Đơn giản 1. Gợi ý chung chung, không cá nhân hóa
đến từng khách hàng. Vì vậy mọi khách đều
hóa (Non-personalized 2. Gợi ý không phụ thuộc vào dữ liệu của có kết quả gợi ý giống nhau.
recommender khách hàng trên hệ thống nên áp dụng được
systems) cho mọi khách hàng, giúp tăng cơ hội chuyển

đổi khách hàng.

2 Lọc dựa trên nội dung 1. Hệ thống không sử dụng dữ liệu của người 1. Hệ thống phải phân tích và dị tìm tất cả

(Content-based dùng khác mà vẫn gợi ý được những sản các đặc trưng của sản phẩm để tạo ra danh

filtering) phẩm phù hợp với sở thích của từng khác sách gợi ý, nên có thể chậm hoặc nếu hồ sơ

hhàng riêng biệt. về sản phẩm khơng đúng có thể dẫn đến

2. Có khả năng gợi ý được cả những sản gợi ý sai.

phẩm mới cho người dùng. 2. Không thể gợi ý nếu khách hàng không

có lịch sử đánh giá xem/thích các sản phẩm


trên hệ thống.Với khách hàng mới, hệ thống

không thể cung cấp gợi ý phù hợp.

3. Khơng gợi ý được thêm các sở thích mới
của khách.

4 Lọc cộng tác 1. Hệ thống không cần sử dụng đến hồ sơ 1. Không thể gợi ý nếu khách hàng chưa
(Collaborative nhân khẩu học của người dùng để gợi ý từng tương tác với các mặt hàng.
Filtering) sản phẩm.
2. Không thể gợi ý được các sản phẩm mới
2. Có khả năng dự đốn được sở thích và nhu hoặc sản phẩm chưa được ai đánh giá.
cầu của người dùng mà không cần hiểu sản
phẩm. 3. Khi lượng sản phẩm lớn nhưng số lượng
khách hàng đánh giá không nhiều thì
3. Có thể gợi ý tới người dùng những sản phương pháp này không hiệu quả.
phẩm bên ngồi sở thích đang có.
Nhữngnhững sản phẩm này có thể phù hợp sở
thích mới của họ.

5 Phương pháp tổng 1. Kết hợp tất cả các ưu điểm của phương 1. Không thể gợi ý cho người dùng mới
hợp (Hybrid method) pháp Content-based filtering và Collaborative
Filtering. 2. Khi lượng sản phẩm lớn nhưng số lượng
khách hàng đánh giá khơng nhiều thì
phương pháp này không hiệu quả.

526

Hồng Thị Hà, Ngơ Nguyễn Thức


Bâng 4. Thông tin các tập dữ liệu thử nghiệm

Datasets #Items #Users # Rating Range Rating Mô tả
Movielens 100K 1,700 1,000 100,000 1÷5
Chứa đánh giá của người dùng trên các các
Epinion 138,738 49,290 139,738 1÷5 bộ phim. Mỗi bộ phim có các đặc trưng (id,
BookCrossing 271,379 278,858 1,149,780 title, realise date, type, rating, time )
LastFM 17,632 1÷10
1,892 92,834 Số lần các bài hát Chứa quan điểm của người dùng về các
được bật bởi sản phẩm thương mại
users
Chứa đánh giá của người dùng về sách.

Chứa danh sách top những bài hát được
người dùng nghe nhiều nhất (2100 users
and 18,745)

5.2.3. Kết quâ thử nghiệm thuờt gi ý cỏ nhồn hũa nhỵ: phỵng pháp gợi ý
da trờn ni dung, phỵng pháp gợi ý lọc cộng
Kt quõ bõng 5 cho thỗy, thuờt toỏn tác để thơng báo cho khách hàng nhĂng sân
Content - based có thąi gian chäy nhanh hĄn phèm họ có thể thích, hỗ tr khỏch hng trong
User-based v Item-based, nhỵng chớnh xỏc quá trình tìm mua sân phèm.
khơng cao. GiĂa tht tốn User-based và
Item-based, nếu xét về sai số cûa dă đoán 6.1. Tổng quan về cách tiếp cận
thìtiếp cên lọc cộng tác da trờn sõn phốm
(Item-based) cho sai s thỗp hn (hay cho độ Cách tiếp cên tổng quan cỷa chỳng tụi ỵc
chớnh xỏc cao hn) tip cờn lọc cộng tác dăa th hin trong hỡnh 5.
trờnngỵi dựng (User - based) vĆi tỷ lệ 3/4 têp
dĂ liệu. Tuy nhiên, xét về thąi gian thăc hiện 6.2. Lung x lý chớnh trong h thng
thỡ phỵng phỏp lc cng tỏc da trờn ngỵi

dựng thc hin nhanh hn nhiu so vi phỵng Luồng x lý chớnh trong h thng ỵc th
phỏp lc cng tác dăa trên sân phèm câ giai hiện trong hình 6.
độn huỗn luyn (training) v giai oọn kim
th (testing) cõ 4 têp dĂ liệu. Do đị, cị thể nói Giâi thích: Hệ thống s kim tra xem khỏch
phỵng phỏp lc cng tỏc da trên User - based hàng cị đëng nhêp hay khơng. Nếu khách hàng
sẽ có khâ nëng mć rộng (scability) tốt hĄn cò đëng nhêp, h thng s kim tra xem khỏch
phỵng phỏp Item - based. Vì vêy, khó có tht hng ó cũ tỵngt vi ngỵi khỏc hay chỵa,
toỏn no l tt nhỗt trờn mi tiờu chớ. Tùy theo nếu có thì sẽ sā dýng mơ hình lọc cộng tác để
mýc đích gợi ý và Āng dýng thăc tế để chọn hiển thð thụng tin gi ý, ngỵc lọi h thng s
phỵng phỏp gợi ý phù hợp. kiểm tra xem khách hàng có thơng tin cá nhân
để quyết đðnh lăa chọn mơ hình nhân khèu học
6. TÍCH HỢP HỆ GỢI Ý TRONG HỆ THỐNG hoặc không cá nhồn ỵa ra gi ý cho khỏch
BN HNG TRC TUYẾN hng. Trỵng hp gi ý da trên mơ hình khơng
cá nhân thì sẽ ỵa ra nhng sõn phốm mi, sõn
Để thā nghiệm trăc quan hệ gợi ý Āng dýng phèm bán chäy, sõn phốm ỵc nhiu khỏch
trong thỵng mọi in t, chỳng tôi tiến hành hàng quan tâm.
xây dăng hệ thống bán sách trăc tuyến tích hợp
vĆi các tht tốn gợi ý đã trình bày ć trên. Trong trỵng hp khỏch hng không đëng
nhêp, hệ thống sẽ kiểm tra lðch sā khách hàng
Hệ thống sā dýng tht tốn gợi ý khơng cá đã tÿng truy cêp vào trang web dăa vào IP
nhån hòa để hiển thð các sân phèm mĆi, sân máy tính mà khách hàng truy cêp, hệ thng s
phốm bỏn chọy nhỗt, sõn phốm ỵc ỵa thớch lỵu vt lọi lch s quỏ trỡnh truy cờp. Nu cú
nhỗt. c bit, h thng tớch hp mt s k thông tin da theo a chợ IP, h thng s ỵa
ra gợi ý về nhĂng sân phèm mà khách hàng đã
tÿng xem.

527

Một số phương pháp gợi ý và ứng dụng trong thương mại điện tử


Bâng 5. Sai số dự đoán và thời gian thực hiện trung bình 5 lần chäy
của các phương pháp lọc cộng tác

Dataset Thuật toán NRMSE Thời gian(sec)
Movielens (100K)
Content - based 0,317 Training testing
Epinion User - based 0,280
BookCrossing Item - based 0,288 0,093 0,027
LastFM User - based 0,285
Item - based 0,254 1,126 3,107
User - based 0,248
Item - based 0,282 0,147 7,793
User - based 0,0131
Item - based 0,0103 6,515 158,91

7,518 3869,7

9,126 171,73

20,142 4030,5

4,313 165,398

39,326 4431,387

Ghi chú: giá trị tốt nhất của các tiêu chí trên mỗi tập dữ liệu được tơ đậm.

Thông tin về sản phẩm Thông tin Tương tác của User-item
(products cataluge) về Users (User product interactions)
(products cataluge)

(Peocduct (products cataluge)
Recommender System
(peocduct

Danh sách các sản phẩm
gợi ý cho khách

Hình 5. Tổng quan về cách tiếp cận

6.3. Tiến trình gợi ý trong hệ thống website sân phèm mĆi, sân phèm bán chäy, sân phèm
thương mäi ỵc nhiu ngỵi ỏnh giỏ.

Tiến trình gợi ý sân phèm trong hệ thống - Nhóm 2: S dýng nhúm thuờt toỏn cỏ
thỵng mọi in t ỵc th hin trong hỡnh 7. nhồn hịa đã trình bày ć mýc 2.2 để gợi ý cho
khách hàng: thuêt toán nhân khèu học, thuêt
Tiến trình này bao gồm 3 giai độn: tốn gợi ý dăa trên nội dung (content - based),
Giai độn 1: Thu thêp thơng tin ngỵi dựng thuờt toỏn lc cng tỏc (Collaborative filtering)
Để có thể dă oỏn ỵc s thớch cỷa ngỵi oỏn các sân phèm phù hợp vĆi khách hàng.
dùng, hệ thống phõi hc mt mụ hỡnh ngỵi
dựng (User model). Mụ hỡnh ngỵi dựng m Giai đoän 3: Gợi ý: Giai độn này, cën cĀ
chúng tơi thu thờp l cỏc d liu cỷa ngỵi dựng vo tng c im cỷa khỏch hng, h thng s
nhỵ: thụng tin cỏ nhồn, thụng tin lch s tỵng dă đoán và gợi ý nhĂng sân phèm mà khách
tác cỷa ngỵi dựng trờn sõn phốm. hàng có thể thích.
Giai độn 2: Sā dýng các tht tốn gợi ý:
Giai độn này, chúng tơi sā dýng dĂ liệu thu 6.4. Một số giao diện kt quõ chớnh ng vi
thờp ỵc giai oọn 1 và dĂ liệu sân phèm để 3 giai độn gợi ý của hệ thống
chäy 2 nhóm tht tốn:
- Nhóm 1: Sā dýng tht tốn gợi ý khơng 6.4.1. Trang đánh giá sản phẩm
cá nhân hóa (Non - personalized) để gợi ý các
Giao din ỏnh giỏ sõn phốm ỵc th hin

528 trong hình 8.

Hồng Thị Hà, Ngơ Nguyễn Thức

Hình 6. Luồng xử lý chính trong hệ thống

Thu thập thơng tin Phản hồi
(Information collection) (Feedback)

Học
(Learning)

Dự đốn/Gợi ý
(Recommender System)

Hình 7. Tiến trình gợi ý trong hệ thống

6.4.2. Một số trang huấn luyện mơ hình kiếm một sân phèm, hệ thống sẽ hiển thð danh
- Trang thống kê đánh giá sân phèm cûa sách nhĂng sân phèm mĆi và nhĂng sân phèm
tỵng t m nhiu ngỵi quan tồm gi ý cho
ngỵi dựng ỵc th hin trong hình hình 9. khách hàng.
- Trang đo lỵng tỵng t gia cỏc ngỵi
b. Đối với khỏch hng thnh viờn
dựng ỵc th hin trong hỡnh 10. Nếu khách hàng là thành viên cûa hệ

6.4.3. Các kết quả gợi ý sản phẩm thống, tÿng cò đánh giá sân phèm, website sẽ
gợi ý nhĂng sân phèm mĆi, sân phèm nhiều
a. Đối với khách hàng mới ngỵi quan tõm, sõn phốm tỵng t. Ngoài ra,
Nếu là khách hng mi (khỏch hng chỵa h thng cũn da vo tỵng t gia cỏc ngỵi


ỏnh giỏ bỗt k sõn phốm no), khi h tìm 529

Một số phương pháp gợi ý và ứng dụng trong thương mại điện tử

dùng để hiển thð nhĂng sân phèm mà khách Nhỵ vờy, bỡng vic xõy dng mt ng dýng
hng chỵa ỵc trõi nghim nhỵng ó ỵc cỏc thỵng mọi in t cú tớch hp a dọng cỏc
khỏch hng tỵng t khỏc ỏnh giỏ cao. phỵng phỏp h gi ý, website ó t ng ỵa ra
cho khách hàng các gợi ý khá thông minh, đa
- Trang gi ý nhng sõn phốm ngỵi dựng däng, trăc quan, phù hợp vĆi tÿng cá nhân khách
có th thớch ỵc th hin trong hỡnh 12. hng v ó khớc phýc ỵc vỗn ngỵi dựng
mĆi, sân phèm mĆi. VĆi nhĂng khâ nëng trên cho
- Trang hiển thð nhĂng sân phốm khỏch thỗy, h gi ý mang läi trâi nghiệm tốt chokhách
hàng đã xem hoặc đã mua ỵc th hin trong hng, giỳp khỏch hàng giâm thąi gian tìm kiếm
hình 13. sân phèm, tëng độ hài lñng, tëng cĄ hội mua
hàng và nâng cao tỷ lệ chuyển đổi mua hàng.
- Trang gợi ý sõn phốm cú th ỵc mua
cựng nhau ỵc th hin trong hình 14.

Hình 8. Giao diện đánh giá sân phẩm của người dùng

Hình 9. Giao diện kết quâ đánh giá sân phẩm của người dùng

530

Hồng Thị Hà, Ngơ Nguyễn Thức

Hình 10. Giao diện đo lường độ tương tự giữa các người dùng

Hình 11. Giao diện gợi ý cho người dùng mới


531

Một số phương pháp gợi ý và ứng dụng trong thương mại điện tử
Hình 12. Giao diện gợi ý các sân phẩm người dùng có thể thích

Hình 13. Giao diện hiển thị những sân phẩm người dùng đã xem/mua

Hình 14. Giao diện gợi ý các sân phẩm hay mua cùng nhau

532

Hồng Thị Hà, Ngơ Nguyễn Thức

7. KẾT LUẬN TÀI LIỆU THAM KHẢO

H gi ý cú vai trũ rỗt quan trọng trong Adomavicius G., Sankaranarayanan R., Sen S. &
thỵng mọi in t. Nú l mt trong nhng vü Tuzhilin A. (2005). Incorporating contextual
khí mänh mẽ giúp nhiều doanh nghiệp tëng information in recommender systems using a
doanh số bán hàng, là một trong nhĂng nhân tố multidimensional approach.. ACM Transactions on
täo nên să thành công cỷa cỏc trang thỵng mọi Information Systems (TOIS). pp. 103-145.
điện tā và s ỵc ng dýng rng rói trong
tỵng lai. Dias M.B., Locher D., Li M., El-Deredy W. & Lisboa
P.J. (2008). The value of personalised
Trong nghiên cĀu này, chúng tơi đã trình recommender systems to e-business: a case study.
bày tổng quan về hệ gợi ý, khám phá nhĂng tác Proceedings of the 2008 ACM conference on
ng cỷa h gi ý i vi thỵng mọi in tā. Recommender systems. pp. 291-294.
Bìng thăc nghiệm, chúng tơi đã so sỏnh ỵc
hiu quõ thc hin cỷa cỏc phỵng phỏp gi ý GroupLens (1998). MovieLens 100K Dataset,
Content-based, User-based và Item-based, Retrieved from />ỏnh giỏ ỵc nhng im mọnh, im yu cỷa movielens/ on October 03, 2020.
mi phỵng phỏp gi ý. Ngoi ra, chỳng tụi bỏo

cỏo thỏch thc cỷa cỏc phỵng phỏp gợi ý khi áp Grouplens (2011). Last.FM. Retrieved from
dýng trong thỵng mọi in t v chợ ra giõi
phỏp khíc phýc. Cuối cùng, chúng tơi đã xåy on
dăng thành công hệ thng bỏn hng trc tuyn
cú tớch hp cỏc phỵng phỏp gợi ý khác nhau, October 03, 2020.
bao gồm kỹ thuêt gợi ý không cá nhân hóa
(Non-personalized) và các kỹ thuêt gợi ý cá Google & Temasek (2018). Báo cáoReport e-Conomy
nhõn húa hiu quõ nhỵ: gi ý da trờn ni dung
(Content-based filtering), lọc cộng tác (User- SEA 2018, Retrieved from .
based, Item-based). Qua đò, ngỵi c hiu ỵc
nn tõng lý thuyt h gi ý, điểm mänh, điểm />yếu cûa cỏc h gi ý cỹng nhỵ quy trỡnh xồy
dng mt ng dýng thỵng mọi in t cú tớch 6730/Report_e-Conomy_SEA_2018_by_Google_
hp cỏc phỵng phỏp gi ý trong thăc tế.
Temasek_v.pdf on March 20, 2020.
Hỵng nghiờn cu trong tỵng lai cỷa lùnh
vc ny còn khá rộng mć, đặc biệt là các kỹ Ionos (2017). Recommendation systems in e-
tht gợi ý cá nhân hóa. Chúng tơi sẽ tiếp týc commerce. US: IONOS Inc. Retrieved from
nghiên cĀu, câi tiến Āng dýng các thuêt toán gợi />ý trong lïnh văc e-commerce, lïnh văc eting/online-sales/how-to-use-recommendation-
e-learning tr giỳp ngỵi dựng trong quá systems-in-e-commerce on May 15, 2020.
trình mua hàng, tỡm kim ti liu cỹng nhỵ h
tr quỏ trỡnh hc têp trăc tuyến. Jordan T. (2016). New insight from Experian
Marketing Services helps brands prepare for the
LỜI CẢM ƠN holiday season. .

Chúng tôi câm Ąn Khoa Công nghệ thông Khusro S., Ali Z. & Ullah I. (2016). Recommender
tin, Học viện Nông nghiệp Việt Nam đã täo systems: issues, challenges, and research
điều kin tt nhỗt chỳng tụi thc hin opportunities. In Information Science and
nghiên cĀu này. Applications (ICISA) 2016. Springer. In
Information Science and Applications (ICISA).


Lei Tang, Zongtao Duan, Yishui Zhu, Junchi Ma &
Zihang Liu (2019). Recommendation for
Ridesharing Groups Through Destination
Prediction on Trajectory Data. IEEE Transactions
on Intelligent Transportation Systems. 99: 14.

Mohamed M.H., Khafagy M.H. & Ibrahim M.H. (2019).
Recommender Systems Challenges and Solutions
survey. International Conference on Innovative
Trends in Computer Engineering (ITCE)

Nguyễn Hùng Dũng & Nguyễn Thái Nghe (2013). Hệ
thống gợi ý sản phẩm trong bán hàng trực tuyến sử
dụng kỹ thuật lọc cộng tác Tạp chí Khoa học,
Trường Đại học Cần Thơ. 31: 15.

Nguyễn Thanh Hưng (2019). Báo cáo chỉ số thương
mại điện tử 2019. Hiệp hội thương mại điện tử
Việt Nam.

Reichheld & F.F. (1993). Loyalty-based management.
Harvard business review. 71(2): 64-73.

533

Một số phương pháp gợi ý và ứng dụng trong thương mại điện tử

Schafer Ben J., Joseph Konstan & John Riedl (2001). International Conference Proceeding Series. ACM
E-commence Recommendation Applications. press. New York, USA. 8.
Data Mining and Knowledge Discovery.

5(1-2): 115-153. Trademark Notice (2003). Epinions dataset. Retrieved
from on
Sharma L. & Gera A. (2013). A survey of October 03, 2020.
recommendation system: Research challenges.
International Journal of Engineering Trends and University of Freiburg (2004). BookCrossing,
Technology (IJETT). 4(5): 1989-1992. Retrieved from -
freiburg.de/~cziegler/BX/ on October 03, 2020
Singh P. (2019). A Survey of Recommendation
Systems in Electronic Commerce. Apress, Viễn Thông (2020). Thương mại điện tử Việt Nam
Berkeley, CA. pp. 123-157. 2020 sẽ ra sao? Truy cập từ
/>Stephan S. (2019). Personalized Product tu-viet-nam-2020-se-ra-sao-4045309.html, ngày10
Recommendation Tips and Stats. Retrieved tháng 3 năm 2020.
from /> product-recommendations-stats/ on Feb 25, 2020. Xue A.Y., Qi J., Xie X., Zhang R., Huang J. & Li Y.
(2015). Solving the data sparsity problem in
Thomas T. (2006). Designing recommender systems destination prediction. The VLDB Journal.
for e-commerce: an integration approach. ACM 24(2): 219-243.

534


×