Tải bản đầy đủ (.pdf) (65 trang)

Đồ án cuối kì môn HTTTQL UEH hệ thống khuyến nghị RS

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.43 MB, 65 trang )

ĐẠI HỌC UEH
TRƯỜNG CÔNG NGHỆ VÀ THIẾT KẾ
KHOA CÔNG NGHỆ THÔNG TIN KINH DOANH
BỘ MÔN CÔNG NGHỆ THÔNG TIN

BÁO CÁO ĐỒ ÁN
MÔN HỌC HỆ THỐNG THÔNG TIN QUẢN LÝ
Đề tài: Tìm hiểu Hệ thống khuyến nghị
(Recommender Systems) ứng dụng trong kinh doanh điện tử

GVHD: TS.GVC Nguyễn Quốc Hùng
Nhóm thực hiện: Nhóm 9
Họ tên sinh viên:
1. Bùi Xuân Mai (31201025291) (Nhóm trưởng)
2. Khách Đô Quang (31201023112)
3. Nguyễn Thị Thùy Trân (31201024065)
4. Chung Thúy Vy (31201024090)
5. Lê Thị Ngọc Ý (31201024092)


TP. Hồ Chí Minh, Tháng 10/2021

2
Đề tài “Tìm hiểu Hệ thống khuyến nghị (Recommender Systems) ứng dụng trong kinh
doanh điện tử”


MỤC LỤC
DANH MỤC HÌNH ẢNH

4



DANH MỤC BẢNG BIỂU

4

DANH MỤC TỪ VIẾT TẮT

5

LỜI MỞ ĐẦU

6

LỜI CẢM ƠN

7

BẢNG PHÂN CÔNG CÁC THÀNH VIÊN

8

CHƯƠNG 1: TỔNG QUAN VỀ HỌC PHẦN HTTTQL

9

1.1

Khái niệm về Hệ thống thông tin quản lý (MIS)

9


1.2

Mục tiêu của học phần HTTTQL

9

1.3

Các thành phần của Hệ thống thông tin và vai trị của nó trong tổ chức

9

CHƯƠNG 2: TỔNG QUAN VỀ HỆ THỐNG KHUYẾN NGHỊ
VÀ CÁC PHƯƠNG PHÁP TIẾP CẬN

11

2.1

Giới thiệu hệ thống khuyến nghị (Recommender Systems)

11

2.2

Các thành phần cơ bản của một Hệ thống khuyến nghị

12


2.3

Các lĩnh vực ứng dụng chính của Hệ thống khuyến nghị

13

2.4

Các phương pháp khuyến nghị

13

2.5

Các bước xây dựng một hệ thống khuyến nghị

14

CHƯƠNG 3: CÁC PHƯƠNG PHÁP KHUYẾN NGHỊ

16

3.1

Hệ thống khuyến nghị cá nhân hóa

16

3.2


Hệ thống khuyến nghị khơng cá nhân hóa

22

CHƯƠNG 4: ỨNG DỤNG HỆ THỐNG KHUYẾN NGHỊ TRONG
THƯƠNG MẠI ĐIỆN TỬ

24

4.1

Giới thiệu hệ thống gợi ý trong thương mại điện tử

24

4.2

Xây dựng hệ thống gợi ý sản phẩm

26

4.3

Hình thức gợi ý sản phẩm

30

4.4

Ứng dụng hệ thống gợi ý sản phẩm trong thương mại điện tử


34

CHƯƠNG 5: ĐÁNH GIÁ TÍNH HIỆU QUẢ CỦA HỆ THỐNG
KHUYẾN NGHỊ TRONG GỢI Ý SẢN PHẨM

47

5.1

Xu hướng khách hàng trong xã hội hiện đại

47

5.2

Vấn đề đặt ra

47

5.3

Hệ thống khuyến nghị - một giải pháp hoàn hảo

48

5.4

Sự phổ biến của hệ thống khuyến nghị và những số liệu tích cực


48
3

Đề tài “Tìm hiểu Hệ thống khuyến nghị (Recommender Systems) ứng dụng trong kinh
doanh điện tử”


5.5

Những thuận lợi và bất cập khi áp dụng hệ thống khuyến nghị

trong gợi ý sản phẩm
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

49
53

1.

Kết luận

53

2.

Dự đoán trong tương lai

53

3.


Đề xuất hướng phát triển

55

TÀI LIỆU THAM KHẢO

57

4
Đề tài “Tìm hiểu Hệ thống khuyến nghị (Recommender Systems) ứng dụng trong kinh
doanh điện tử”


DANH MỤC HÌNH ẢNH
Hình 2.1: Sơ đồ tổng qt của một hệ thống khuyến nghị………………………… 13
Hình 3.1: Mơ hình phương pháp Lọc cộng tác……………………………………... 18
Hình 3.2: Mơ hình phương pháp Lọc dựa trên người dùng và sản phẩm…………... 20
Hình 3.3: Mơ hình phương pháp Lọc dựa trên nội dung…………………………… 22
Hình 3.4: Mơ hình phương pháp Khuyến nghị lai (Hybrid)……… ………………... 24
Hình 4.1: Đề xuất sản phẩm cá nhân hóa trên Amazon.com……………………….. 38
Hình 4.2: Đề xuất sản phẩm thường được mua cùng nhau trên Amazon.com……... 39
Hình 4.3: Đề xuất sản phẩm nổi bật dựa trên lịch sử duyệt web trên Amazon.com... 39
Hình 4.4: Đề xuất sản phẩm đã xem trên Amazon.com…………………………….. 40
Hình 4.5: Đề xuất sản phẩm có liên quan đến sản phẩm đã xem trên Amazon.com.. 41
Hình 4.6: Đề xuất sản phẩm khách hàng thường mua cùng nhau trên Amazon.com. 41
Hình 4.7: Đề xuất sản phẩm có liên quan đến sản phẩm đã mua trên Amazon.com.. 42
Hình 4.8: Đề xuất phiên bản mới hơn của sản phẩm trên Amazon.com…………… 42
Hình 4.9: Đề xuất sản phẩm bán chạy nhất trên Amazon.com……………………... 43
Hình 4.10: Đề xuất sản phẩm bán chạy nhất cùng thương hiệu qua email…………. 44

Hình 4.11: Đề xuất sản phẩm bán chạy nhất khác thương hiệu qua email…………. 44
Hình 4.12: Đề xuất sản phẩm thường được mua cùng nhau qua email…………….. 45
Hình 4.13: Đề xuất sản phẩm bán chạy nhất trên toàn bộ danh mục qua email……. 45

DANH MỤC BẢNG BIỂU
5
Đề tài “Tìm hiểu Hệ thống khuyến nghị (Recommender Systems) ứng dụng trong kinh
doanh điện tử”


Bảng 3.1: Ma trận người dùng x sản phẩm…………………………………………. 18

6
Đề tài “Tìm hiểu Hệ thống khuyến nghị (Recommender Systems) ứng dụng trong kinh
doanh điện tử”


DANH MỤC TỪ VIẾT TẮT
Từ viết tắt

Tên đầy đủ

HTTT

Hệ thống thông tin

TMĐT

Thương mại điện tử


HTTTQL

Hệ thống thông tin quản lý

HTKN

Hệ thống khuyến nghị

7
Đề tài “Tìm hiểu Hệ thống khuyến nghị (Recommender Systems) ứng dụng trong kinh
doanh điện tử”


LỜI MỞ ĐẦU
Những năm gần đây, các thuật ngữ như kinh doanh điện tử hay thương mại điện tử trở
thành xu hướng phát triển mới của thế giới và nhận rất nhiều sự quan tâm. Bởi lẽ, đại
dịch Covid-19 xảy ra đã dẫn đến sự bùng nổ của các trang thương mại điện tử
(TMĐT), điều ấy đã định hình lại thói quen mua sắm của người dùng và ngày càng có
nhiều người dùng thích dành thời gian mua sắm trực tuyến hơn.
Kinh doanh điện tử (E-Business) là thuật ngữ mang ý nghĩa rộng hơn của TMĐT. Nó
khơng chỉ bao gồm hai hoạt động chính là mua và bán mà nó cịn là q trình phục vụ
khách hàng. Để tối ưu hóa trải nghiệm của khách hàng và làm tăng hiệu quả kinh
doanh, nhiều doanh nghiệp đã chọn sử dụng Hệ thống khuyến nghị (Recommender
Systems). Đây là hệ thống thông minh, hỗ trợ người dùng đưa ra quyết định mà không
phải trải qua quá trình tìm kiếm phức tạp. Hệ thống này được xây dựng dựa trên cơ sở
thu thập và phân tích những thơng tin về các sản phẩm, khách hàng để dự đoán mức độ
quan tâm của họ đối với từng sản phẩm và gợi ý khách hàng mua những sản phẩm đó.
Việc tư vấn, giới thiệu sản phẩm và đồng hành cùng khách hàng trong quá trình mua
hàng là rất quan trọng vì chúng ảnh hưởng trực tiếp đến lợi nhuận và thu nhập của
doanh nghiệp. Nhận thấy điều này, các công ty TMĐT lớn trên thế giới như Amazon,

eBay, ... đều đã tích hợp hệ thống khuyến nghị (HTKN) vào website bán hàng của
mình và thu được kết quả kinh doanh rất khổng lồ. Mặc dù vậy, hệ thống khuyến nghị
vẫn chưa được áp dụng nhiều tại các doanh nghiệp TMĐT ở Việt Nam.
Bài tiểu luận: “Tìm hiểu Hệ thống khuyến nghị (Recommender Systems) ứng dụng
trong kinh doanh điện tử” được chia thành 5 chương:
Chương 1: Tổng quan về học phần HTTTQL
Chương 2: Tổng quan về hệ thống khuyến nghị và các phương pháp tiếp cận
Chương 3: Các phương pháp khuyến nghị
Chương 4: Ứng dụng hệ thống khuyến nghị trong TMĐT
Chương 5: Đánh giá tính hiệu quả của hệ thống khuyến nghị trong gợi ý sản phẩm
8
Đề tài “Tìm hiểu Hệ thống khuyến nghị (Recommender Systems) ứng dụng trong kinh
doanh điện tử”


LỜI CẢM ƠN
Nhóm chúng em xin gửi lời cảm ơn chân thành và sự tri ân sâu sắc đến thầy Nguyễn
Quốc Hùng, giảng viên bộ môn Hệ thống thông tin quản lý thuộc Trường Công nghệ
và Thiết kế, Đại học UEH, đã truyền đạt vốn kiến thức quý báu về mơn học này cho
chúng em. Cảm ơn thầy vì đã giúp đỡ và hướng dẫn của chúng em trong tư duy và làm
việc khoa học. Đây là những ý kiến ​đóng góp vơ cùng q báu khơng chỉ cho q trình
thực hiện những bài nghiên cứu khoa học sau này mà cịn là bước đệm cho chúng em
trong q trình học tập và tự giới thiệu công việc sau khi ra trường.
Trong q trình làm đề tài tiểu luận khó tránh khỏi sai sót bởi trình độ lý luận cũng
như kinh nghiệm thực tiễn cịn hạn chế, nhóm chúng em rất mong nhận được ý kiến
đóng góp của thầy để mỗi thành viên có thể học thêm được nhiều kinh nghiệm và sẽ
hoàn thành tốt hơn trong các bài tiểu luận sắp tới.

9
Đề tài “Tìm hiểu Hệ thống khuyến nghị (Recommender Systems) ứng dụng trong kinh

doanh điện tử”


BẢNG PHÂN CƠNG CÁC THÀNH VIÊN
THÀNH VIÊN
Bùi Xn Mai (Nhóm trưởng)

CÔNG VIỆC
-

Viết lời mở đầu, lời cảm ơn, chương 1 và
hướng phát triển.

-

Chỉnh sửa tổng thể nội dung và hình thức tiểu
luận.

Khách Đô Quang

Nguyễn Thị Thùy Trân

Chung Thúy Vy

Lê Thị Ngọc Ý

-

Phân công công việc.


-

Làm Powerpoint.

-

Viết chương 5.

-

Làm Powerpoint.

-

Chỉnh sửa tổng thể nội dung tiểu luận.

-

Viết chương 3.

-

Làm Powerpoint.

-

Chỉnh sửa tổng thể nội dung tiểu luận.

-


Viết chương 4.

-

Làm Powerpoint.

-

Chỉnh sửa tổng thể nội dung tiểu luận.

-

Viết chương 2 và phần kết luận.

-

Làm Powerpoint.

-

Chỉnh sửa tổng thể nội dung tiểu luận.

10
Đề tài “Tìm hiểu Hệ thống khuyến nghị (Recommender Systems) ứng dụng trong kinh
doanh điện tử”


CHƯƠNG 1: TỔNG QUAN VỀ HỌC PHẦN HTTTQL
1.1


Khái niệm về Hệ thống thông tin quản lý (MIS)

Hệ thống thông tin quản lý (MIS - Management Information System) là hệ thống ứng
dụng công nghệ nhằm giải quyết các vấn đề trong kinh doanh. Đối tượng sử dụng MIS
khá đa dạng, từ người công nhân phân xưởng đến người quản lý cấp cao. Họ áp dụng
hệ thống thông tin quản lý (HTTTQL) vào cơng việc để hệ thống hóa quy trình làm
việc, phân tích, đánh giá và trao đổi những thơng tin chính xác, đem lại hiệu quả và
năng suất cao nhất.
Học phần Hệ thống thông tin quản lý cung cấp cho sinh viên tri thức về tham gia phân
tích, thiết kế, phát triển và quản lý HTTT trong doanh nghiệp. Đồng thời giúp sinh
viên nhận thức được tầm quan trọng của các HTTT quản lý trong hoạt động sản xuất
kinh doanh bằng cách hỗ trợ doanh nghiệp đưa ra những quyết định hiệu quả mang
tầm chiến lược, tạo ra lợi thế cạnh tranh của mình.

1.2

Mục tiêu của học phần HTTTQL

Học phần HTTTQL cung cấp tri thức thực tiễn giúp sinh viên:


Hiểu và mô tả các khái niệm và thuật ngữ cơ bản liên quan đến HTTT và các
công nghệ liên quan.



Nhận thức vai trò chiến lược của HTTTQL trong hoạt động sản xuất kinh doanh




Hỗ trợ ra quyết định và tạo lợi thế cạnh tranh đối với tổ chức



Hiểu cơ sở hạ tầng của hệ thống thông tin



Nhận thức được vai trò của hoạt động quản trị và quản trị HTTT



Xác định các tác động xã hội, luật pháp và đạo đức của khi sử dụng các hệ
thống thông tin hiện đại.

11
Đề tài “Tìm hiểu Hệ thống khuyến nghị (Recommender Systems) ứng dụng trong kinh
doanh điện tử”


1.3

Các thành phần của Hệ thống thông tin và vai trị của nó trong tổ

chức
❖Một HTTTQL được cấu tạo bởi 5 thành phần chính


Phần cứng: là cơng cụ kỹ thuật để xử lý và truyền tải thông tin như cáp mạng,
card mạng, wifi, ...




Phần mềm: là những chương trình cho phép phần cứng xử lý dữ liệu để tự động
thực hiện các chức năng nhất định hoặc giải quyết các vấn đề nhất định.



Nguồn nhân lực: là thành phần quyết định của hệ thống thơng tin vì con người
là chủ thể vận hành và quản lý hệ thống, con người tạo ra và duy trì hệ thống
nhằm phục vụ mục đích của chính con người.



Cơ sở dữ liệu: là tập hợp dữ liệu có tổ chức được lưu trữ trên các thiết bị lưu trữ
thứ cấp nhằm đáp ứng nhu cầu trích xuất thơng tin của người sử dụng. Dữ liệu
là vật trung gian giữa vật chất và con người, chỉ khi có sự tác động của con
người thì dữ liệu mới có giá trị và trở thành thơng tin hữu ích.



Hệ thống truyền thơng: bao gồm 3 yếu tố: thiết bị truyền dẫn, kênh truyền dẫn
và thiết bị truyền dẫn giúp các thành viên tham gia hệ thống trao đổi thơng tin
với tổ chức.

❖Vai trị của hệ thống thơng tin trong tổ chức
Hệ thống thơng tin quản lý có thể cung cấp cho các cơng ty các lợi ích sau:


Hỗ trợ các hoạt động tác nghiệp của tổ chức




Hỗ trợ hoạt động quản lý của tổ chức



Hỗ trợ tạo ra các lợi thế cạnh tranh của tổ chức

12
Đề tài “Tìm hiểu Hệ thống khuyến nghị (Recommender Systems) ứng dụng trong kinh
doanh điện tử”


CHƯƠNG 2: TỔNG QUAN VỀ HỆ THỐNG KHUYẾN NGHỊ
VÀ CÁC PHƯƠNG PHÁP TIẾP CẬN
2.1

Giới thiệu hệ thống khuyến nghị (Recommender Systems)

Hệ thống khuyến nghị (Recommender Systems): là một hệ thống nhằm hỗ trợ đưa ra
quyết định, giúp sàng lọc và đưa ra các thông tin phù hợp, phổ biến với người dùng,
cung cấp giải pháp mang tính cá nhân hóa mà khơng phải trải qua q trình tìm kiếm
phức tạp. Hệ thống sử dụng tri thức về sản phẩm, của chuyên gia hay tri thức học được
từ hành vi con người dùng để đưa ra các gợi ý về sản phẩm mà họ thích trong rất nhiều
sản phẩm có trong hệ thống. Các loại gợi ý bao gồm: giới thiệu sản phẩm cho người
tiêu dùng, cá nhân hóa thơng tin sản phẩm, tổng hợp ý kiến ​cộng đồng, cung cấp chia
sẻ, phản biện và đánh giá liên quan đến các yêu cầu và mục tiêu của người dùng.

Hình 2.1: Sơ đồ tổng quát của một hệ thống khuyến nghị

Ví dụ: Amazon.com là một trong những trang TMĐT nổi tiếng nhất, khi người dùng
truy cập vào trang sẽ giới thiệu những sản phẩm có triển vọng nhất trong số hàng triệu
sản phẩm trong hệ thống. Hệ thống khuyến nghị là một cơng cụ cung cấp thơng tin
hữu ích và được cá nhân hóa trên một hệ thống chứa nhiều thơng tin. Hệ thống đề xuất
được thiết kế để cung cấp cho người dùng các đề xuất có liên quan, có thể là đề xuất

13
Đề tài “Tìm hiểu Hệ thống khuyến nghị (Recommender Systems) ứng dụng trong kinh
doanh điện tử”


hiệu quả nhất từ ​thông tin về các mục dữ liệu, hồ sơ người dùng và mối quan hệ giữa
các đối tượng này.
Cụ thể, hệ thống khuyến nghị có thể được thể hiện trong Hình 2.1. Nhóm người dùng
này có thể là phụ nữ, nam giới hoặc trẻ em. Người dùng có thể mua, xem, chọn, đọc
hoặc đánh giá các mục dữ liệu. “Người dùng” được coi là những người tham gia vào
hệ thống hành động trên “các mục dữ liệu”. “Mục dữ liệu” có thể là: quần áo, phim,
sách, bài báo, bài hát, CD, trang web, rượu, ... Mối quan hệ giữa người dùng và mục
dữ liệu có thể là: lượt thích, mối quan hệ mong muốn, mua hàng, đọc, ... Khi đó, hệ
thống sẽ cung cấp cho người dùng danh sách các mục dữ liệu được đề xuất. Các mục
dữ liệu được đề xuất phải dựa trên các tiêu chuẩn phù hợp với sở thích và thói quen
của người dùng. Mục tiêu cuối cùng của hệ thống khuyến nghị là tạo ra một danh sách
các mục dữ liệu tiềm năng đáp ứng nhu cầu và mong muốn của người dùng.
Hệ thống khuyến nghị sử dụng thông tin của người dùng và chia thành 2 loại: thông tin
ẩn và thông tin hiện.
Thông tin ẩn bao gồm: các thông tin như thời điểm người mua xem sản phẩm, cách
người dùng duyệt qua sản phẩm, quá trình chọn sản phẩm cuối cùng để xem và nguồn
trang hiện tại của người dùng. Bộ sưu tập, nhưng thường có độ ồn cao và khơng có sự
tương tác trực tiếp của người dùng (hệ thống tự động ghi lại lịch sử). Thông tin hiện
là: kết quả thu được khi người dùng hiện tại bình luận trực tiếp về sản phẩm, chẳng

hạn như lượt thích/khơng thích, xếp hạng, bình luận, v.v. Thơng tin này thường khó thu
thập hơn thơng tin ẩn, nhưng chính xác hơn, rất hữu ích cho các đề xuất.
Với mục đích chính là hỗ trợ người dùng. Một hệ thống khuyến nghị sẽ giúp người
dùng dễ dàng tìm kiếm sản phẩm phổ biến, phù hợp với một khả năng truy vấn rộng
rãi, đồng thời tiết kiệm rất nhiều thời gian cho người dùng. Ví dụ khi mua hàng online,
sẽ có một loạt các danh sách sản phẩm khiến người dùng mất nhiều thời gian để tìm
kiếm, lựa chọn và so sánh, nhưng nhờ có hệ thống khuyến nghị thì sẽ gợi ý cho người

14
Đề tài “Tìm hiểu Hệ thống khuyến nghị (Recommender Systems) ứng dụng trong kinh
doanh điện tử”


dùng những sản phẩm nổi bật, phổ biến nên số lượng sản phẩm vì thế giảm xuống và
dễ dàng mua hơn.

2.2

Các thành phần cơ bản của một Hệ thống khuyến nghị

Một hệ thống khuyến nghị bao gồm 3 thành phần cơ bản:


User: là người sử dụng (người dùng), là đối tượng mà hệ thống khuyến nghị
hướng đến.



Item: là mục tin (các sản phẩm, bài hát, bài báo hay các bộ phim, ...), ví dụ như
các mặt hàng trên các trang thương mại điện tử, hay các bài hát trong bảng xếp

hạng âm nhạc, …



Feedback: là phản hồi, là các phê bình, đánh giá, bình luận của người dùng về
sản phẩm từ đó cho hệ thống có được những cơ sở, thông tin để đưa ra gợi ý.

2.3

Các lĩnh vực ứng dụng chính của Hệ thống khuyến nghị

Ngày nay, với sự phát triển triển của cơng nghệ thì hệ thống khuyến nghị ngày càng
phổ biến ở rất nhiều lĩnh vực đời sống bởi cơng dụng, lợi ích mà nó mang lại. Một số
lĩnh vực ví dụ điển hình của hệ thống khuyến nghị trong đời sống:


Trong TMĐT: Recommender Systems hỗ trợ việc buôn bán trực tuyến gợi ý sản
phẩm: shopee giới thiệu các sản phẩm liên quan cần mua...



Trong giải trí: các bảng xếp hạng âm nhạc, gợi ý các bộ phim phổ biến, gợi ý
kết bạn trên mạng xã hội facebook hay gợi ý người theo dõi trên instagram, ...



Trong giáo dục: danh sách gợi ý nguồn tài liệu học tập, các đầu sách phổ biến
cho người đọc...

2.4


Các phương pháp khuyến nghị

Bao gồm có 2 nhóm chính:
❖Hệ thống khuyến nghị cá nhân hóa bao gồm:

15
Đề tài “Tìm hiểu Hệ thống khuyến nghị (Recommender Systems) ứng dụng trong kinh
doanh điện tử”




Lọc cộng tác (Collaborative filtering): Là phương pháp được sử dụng rộng rãi
và thành công nhất trong thực tế, lọc cơng tác dựa trên việc thu thập và phân
tích một lượng lớn thông tin về hành vi, hoạt động hoặc sở thích của người
dùng và dự đốn những gì người dùng sẽ thích dựa trên sự giống nhau giữa
người dùng và những người dùng khác.



Lọc dựa trên nội dung (Content-based): Dựa trên mô tả của người dùng về dự
án và các tệp cấu hình, thơng tin về sở thích của người dùng.



Hệ thống khuyến nghị lai (Hybrid recommender systems): Đó là một phương
pháp đề xuất kết hợp giữa lọc công tác và lọc dựa trên nội dung. Hệ thống
khuyến nghị lai là một phương pháp chính xác hơn so với các phương pháp
khác.


❖ Hệ thống khuyến nghị không cá nhân hóa (non-personalization)

2.5


Các bước xây dựng một hệ thống khuyến nghị
Thu thập dữ liệu

Nếu chúng ta chỉ quan tâm đến đánh giá của người dùng với bài viết, thì vấn đề trở nên
khá đơn giản, dữ liệu của chúng ta đã có sẵn trong cơ sở dữ liệu. Tuy nhiên, tùy thuộc
vào từng vấn đề cụ thể, trường hợp này không phải lúc nào cũng xảy ra. vì vậy trước
tiên chúng ta cần có kế hoạch thu thập các chỉ số thể hiện mối tương quan này trước
khi muốn xây dựng một hệ thống khuyến nghị. Một số chỉ số có thể được sử dụng để
ghi đè điểm đánh giá như sau:
-

Số lần nhấp vào mục

-

Thời gian trung bình để thao tác với các mặt hàng

-



Sau quá trình thu thập thì sẽ có rất nhiều dữ liệu trong các phiên khác nhau tương ứng
với các thao tác khác không giống như một người dùng trên một mặt hàng. Sau khi xử
lý nó bằng các phép tốn mà chúng ta khơng đề cập ở đây, chúng ta sẽ nhận được một


16
Đề tài “Tìm hiểu Hệ thống khuyến nghị (Recommender Systems) ứng dụng trong kinh
doanh điện tử”


chỉ mục duy nhất giữa một cặp mục người dùng. Điều tiếp theo cần làm là chuẩn hóa
dữ liệu.


Chuẩn hóa dữ liệu

Ma trận dữ liệu của chúng ta chủ yếu là ma trận thưa thớt, tức là lượng dữ liệu trống
lớn, do đó chúng ta cần chuẩn hóa đống dữ liệu. Chỉ khi đó, chúng ta mới có thể áp
dụng các thuật tốn học máy vào nó, và sau khi chuẩn hóa dữ liệu, chúng ta sẽ xây
dựng một mơ hình học máy để tính tốn sự tương đồng giữa những người dùng.


Chạy mơ hình, lọc ra top các mặt hàng phù hợp

Sau khi chọn ra được mơ hình phù hợp nhất chúng ta sẽ tiến hành vận hành mô hình
đó rồi chọn lọc ra top các mặt hàng phù hợp sử dụng để gợi ý cho người dùng.


Đánh giá mơ hình

Như với các vấn đề học máy khác, chúng ta cũng cần đánh giá mơ hình dựa trên tập dữ
liệu thử nghiệm. Tuy nhiên, do đặc thù của vấn đề nên sẽ có một số vấn đề khác nhau
về phương pháp đánh giá.


17
Đề tài “Tìm hiểu Hệ thống khuyến nghị (Recommender Systems) ứng dụng trong kinh
doanh điện tử”


CHƯƠNG 3: CÁC PHƯƠNG PHÁP KHUYẾN NGHỊ
Dựa trên cơ sở dữ liệu và kỹ thuật để đưa ra các phương pháp khuyến nghị. Hệ thống
khuyến nghị sẽ được chia thành 2 nhóm chính là hệ thống khuyến nghị cá nhân hóa và
hệ thống khuyến nghị khơng cá nhân hóa. Trong hệ thống khuyến nghị cá nhân hóa
chúng ta sẽ có 3 phương pháp khuyến nghị chính là: phương pháp lọc cộng tác
(collaborative filtering), phương pháp lọc theo nội dung (content-based filtering), hệ
thống khuyến nghị lai (hybrid - filtering).

3.1

Hệ thống khuyến nghị cá nhân hóa

3.1.1 Lọc cộng tác (Collaborative-filtering)
Lọc cộng tác là phương pháp sử dụng các hoạt động, hành vi hay sở thích của người
dùng để đưa ra gợi ý, đề xuất cho người dùng. Trong phương pháp này, hệ thống sẽ tự
động thu thập một lượng lớn thông tin và sau đó so sánh, tính tốn và phân tích mức
độ tương tự nhau giữa những người dùng hay sản phẩm. Người dùng sẽ được hệ thống
gợi ý những thông tin, mặt hàng được yêu thích nhất bởi những người dùng có cùng sở
thích, thị hiếu với mình.

18
Đề tài “Tìm hiểu Hệ thống khuyến nghị (Recommender Systems) ứng dụng trong kinh
doanh điện tử”



Hình 3.1: Mơ hình phương pháp Lọc cộng tác
Cách hoạt động của hệ thống khuyến nghị theo phương pháp lọc cộng tác là xây dựng
một cơ sở dữ liệu, lưu trữ dưới dạng ma trận Người dùng - Sản phẩm (Users - Items).
Hàng là người dùng, cột là sản phẩm, giá trị mỗi ô là đánh giá của người dùng lên sản
phẩm đó.
Tùy vào từng hệ thống mà mức độ đánh giá của người dùng được quy ước với những
giá trị khác nhau.
Ví dụ về ma trận Người dùng x Sản phẩm, các đánh giá có giá trị từ 1-> 4 thể hiện từ
khơng thích đến rất thích.
Sản phẩm A

Sản phẩm B

Sản phẩm C

Người dùng thứ 1

2

0

4

Người dùng thứ 2

4

2

2


Người dùng thứ 3

0

2

1

Người dùng thứ 4

0

0

0

Bảng 3.1: Ma trận người dùng x sản phẩm
Kết quả của bài toán này là hệ thống sẽ dự đoán đánh giá của người dùng lên những
sản phẩm mà họ chưa đánh giá và từ đó xếp hạng cho các sản phẩm và đưa ra đề xuất
cho người dùng đó.
Ở ví dụ trên, hệ thống khuyến nghị sẽ dự đoán người dùng 2 đánh giá sản phẩm B như
thế nào, người dùng 3 sẽ đánh giá hai sản phẩm A bao nhiêu, người dùng 4 đánh giá cả
3 sản phẩm mức độ bao nhiêu.
Phương pháp lọc cộng tác được chia thành hai loại: lọc cộng tác dựa trên người dùng
(user-based filtering) và lọc cộng tác dựa trên sản phẩm (item-based filtering).

19
Đề tài “Tìm hiểu Hệ thống khuyến nghị (Recommender Systems) ứng dụng trong kinh
doanh điện tử”



Hình 3.2: Mơ hình Lọc cộng tác dựa trên người dùng (bên trái) và dựa trên
sản phẩm (bên phải)


Lọc cộng tác dựa trên người dùng: hệ thống dự đoán đánh giá của người dùng
này dựa trên người dùng tương tự sau đó hệ thống đề xuất sản phẩm tương tự
với người dùng đó.



Lọc cộng tác dựa trên sản phẩm: hệ thống dự đoán các đánh giá của người dùng
cho sản phẩm dựa trên xếp hạng của những sản phẩm tương tự cũng được đánh
giá bởi người dùng đó.

Hiện nay, có rất nhiều hệ thống khuyến nghị theo phương pháp này như Grundy, Ringo
(âm nhạc), Phoaks (web), GroupLens (tin tức), …
Ba vấn đề thường gặp của phương pháp lọc cộng tác đó là:


Cold Start: Vấn đề là hệ thống sẽ yêu cầu người dùng cung cấp lượng thông tin
rất lớn hiện có của người dùng để đưa ra gợi ý chính xác cho họ.



Khả năng mở rộng: Bởi vì có nhiều môi trường mà hệ thống đưa ra khuyến nghị
nên sẽ cần số lượng lớn cơng suất tính tốn để tính toán các gợi ý đưa đến người
dùng.




Sự thưa thớt (Sparsity): Thực tế, sẽ có rất nhiều các sản phẩm được bán rộng rãi
trên các sàn thương mại điện tử nhưng những người dùng tích cực tương tác,

20
Đề tài “Tìm hiểu Hệ thống khuyến nghị (Recommender Systems) ứng dụng trong kinh
doanh điện tử”


đánh giá lại là một tập dữ liệu rất nhỏ trong tổng thể đó. Nên rất khó để đưa ra
chính xác 100% cho người dùng.
❖ Ưu điểm:


Phương pháp này có thể dự đốn được sở thích và nhu cầu của người dùng đối
với sản phẩm để đề xuất cho từng đối từng khách hàng mà không cần phải hiểu
sản phẩm đó.



Hệ thống khuyến nghị theo phương pháp lọc cộng tác rất đa dạng và có thể áp
dụng lên nhiều hệ thống khác nhau như âm nhạc, hình ảnh, …

❖ Nhược điểm:


Nếu khách hàng khơng có lịch sử tương tác về các sản phẩm thì hệ thống sẽ
khơng thể gợi ý được.




Thực tế nếu lượng sản phẩm nhiều nhưng lượng khách hàng đánh giá ít thì
phương pháp này chưa hiệu quả.



Nếu sở thích của người dùng thay đổi, phương pháp này sẽ khơng cịn chính xác
với họ nữa.



Khơng thể gợi ý cho người dùng các mặt hàng mới ra hoặc là những mặt hàng
chưa có ai đánh giá.

3.1.2 Lọc dựa trên nội dung (Content-based)
Phương pháp lọc dựa trên nội dung là kỹ thuật dựa trên cơ sở dữ liệu về các mặt hàng
mà người dùng đã thích, quan tâm trong quá khứ để tính tốn, so sánh mức độ tương
tự với các mặt hàng trong hệ thống. Khi đó, hệ thống sẽ đề xuất cho người dùng những
sản phẩm tương tự mà khách hàng đã thích, quan tâm, xem hay mua trước đó.
Phương pháp này sẽ quan tâm đến hai yếu tố là tính năng của sản phẩm và sở thích
riêng của người dùng. Phương pháp lọc dựa trên nội dung sẽ so sánh nội dung của sản
phẩm với sở thích của người dùng, chẳng hạn người dùng 1 thích sản phẩm A sẽ thích
sản phẩm B tương tự với sản phẩm A.

21
Đề tài “Tìm hiểu Hệ thống khuyến nghị (Recommender Systems) ứng dụng trong kinh
doanh điện tử”



Hình 3.3: Mơ hình phương pháp Lọc dựa trên nội dung
Nguồn gốc của phương pháp này là từ những nghiên cứu về thu thập thông tin
(Information Retrieval) và lọc thông tin (Information Filtering). Vì vậy, hiện nay có
nhiều hệ thống dựa trên nội dung nhắm vào các đối tượng chứa những dữ liệu văn bản
như website, tin tức, …
Ví dụ trong hệ thống khuyến nghị âm nhạc lọc dựa trên nội dung là Pandora Music. Để
đưa ra các gợi ý cho người dùng, hệ thống này cố gắng tìm hiểu sở thích người đó
bằng cách phát nhạc có các đặc điểm tương tự với những bài hát do người dùng cung
cấp ban đầu. Thực tế có rất nhiều hệ thống khuyến nghị dựa trên nội dung như bên
phim ảnh có Jinni, Internet Movie Database, RottenTomatoes, Rovi Corporation và
Jaman…hay bên y học, các chuyên gia sức khỏe đang nghiên cứu các hệ thống khuyến
nghị để từ đó đưa ra các phương pháp giáo dục sức khỏe.
Vấn đề gặp phải của phương pháp này là liệu rằng hệ thống khi tìm hiểu sở thích của
người nào đó từ hành động của họ liên quan đến nguồn nội dung và sẽ lấy chúng để sử
dụng cho các mảng khác được hay không. Khi này, hệ thống bị gặp vấn đề mâu thuẫn

22
Đề tài “Tìm hiểu Hệ thống khuyến nghị (Recommender Systems) ứng dụng trong kinh
doanh điện tử”


giữa nhu cầu người dùng và các đề xuất mà hệ thống đưa ra không trùng khớp vi giá
trị của hệ thống thấp hơn đáng kể so khi áp dụng cho các loại nội dung khác.
Ví dụ: chúng ta sử dụng hệ thống để gợi ý các bài báo dựa trên việc duyệt qua tin tức,
nhưng thực tế thì sẽ hữu ích hơn nếu ta dùng để gợi ý video, nhạc, sản phẩm, thảo
luận, ...từ các dịch vụ khác nhau dựa trên việc duyệt tin tức.
❖ Ưu điểm


Phương pháp này không yêu cầu lượng thông tin rất lớn mới cho ra gợi ý chính

xác được.



Khi có các mặt hàng mới, chúng có thể sẽ được gợi ý ngay dựa trên các thuộc
tính, tính năng có sẵn.

❖ Hạn chế:


Trong một số trường hợp, hệ thống gợi ý cho người dùng những gợi ý có độ
tương tự nhau gần như tuyệt đối, tức là chúng gần giống i hệt nhau trên cùng
một mục. Ví dụ như những mục tin tức khác nhau nói về một ca sĩ, đơi lúc hệ
thống sẽ gợi ý một tin tức liên quan đến ca sĩ đó nhưng lại gần như giống hoàn
toàn với tin tức mà người xem đã đọc trước đó rồi.



Hệ thống sẽ bất cập với người dùng mới sử dụng khi họ chưa được cung cấp
hoặc cung cấp rất ít thơng tin, chỉ số dự đốn và lúc đó hệ thống khơng có đủ dữ
liệu của ban đầu của người dùng để đề xuất những gợi ý chính xác.

3.1.3 Hệ thống khuyến nghị lai (Hybrid)
Hệ thống khuyến nghị lai là sự kết hợp của các kỹ thuật là lọc cộng tác và dựa theo nội
dung. Lúc này, hệ thống sẽ sử dụng các ưu điểm của hai kỹ thuật để hạn chế nhược
điểm của từng phương pháp trên. Phương pháp lọc cộng tác có vấn đề của phương
pháp này là các mặt hàng mới sẽ không được hệ thống đề xuất nhưng phương pháp
dựa trên nội dung lại xử lý được vấn đề này. Việc dự đốn các sản phẩm dựa trên mơ
tả của người dùng là tính năng khá dễ dàng và có sẵn với phương pháp lọc dựa trên nội
dung.


23
Đề tài “Tìm hiểu Hệ thống khuyến nghị (Recommender Systems) ứng dụng trong kinh
doanh điện tử”


Hình 3.4: Mơ hình phương pháp Khuyến nghị lai (Hybrid)
Ví dụ: Trang web Netflix sẽ gợi ý cho người dùng bằng cách là hệ thống này sẽ so
sánh 2 yếu tố: thói quen xem phim và tìm kiếm của những người sử dụng tương tự (lọc
cộng tác) và đưa ra các bộ phim có chung đặc điểm với những bộ mà người dùng quan
tâm và xếp hạng cao (lọc dựa trên nội dung).
Phương pháp lai giữa lọc cộng tác và lọc dựa trên nội dung sẽ đạt được hiệu suất cao
hơn so với từng kỹ thuật riêng lẻ. Một số cách kết hợp như sau:


Hệ thống sẽ thực hiện các dự đoán dựa trên lọc cộng tác và lọc dựa trên nội
dung riêng biệt. Sau khi có kết quả sẽ đưa ra quyết định:
- Kết hợp cả hai kết quả.
- Sử dụng phương pháp có kết quả tốt hơn tùy từng thời điểm.



Thống nhất các kỹ thuật lại thành một mơ hình.



Thêm các đặc trưng theo phương pháp lọc dựa trên nội dung vào lọc cộng tác
và ngược lại.

3.2


Hệ thống khuyến nghị khơng cá nhân hóa

Trong nhóm cơng nghệ này, do rất đơn giản và dễ cài đặt nên chúng thường được tích
hợp bởi các trang web/hệ thống, bao gồm trang web thương mại, trang web tin tức
hoặc trang web giải trí.

24
Đề tài “Tìm hiểu Hệ thống khuyến nghị (Recommender Systems) ứng dụng trong kinh
doanh điện tử”


Ba phương pháp khuyến nghị thuộc vào loại không cá nhân hóa:


Khuyến nghị các sản phẩm bán chạy nhất (Popular products): Một đội ngũ xây
dựng các website sẽ liệt kê các sản phẩm được ưa chuộng dựa trên những dữ
liệu bán hàng trong cơ sở dữ liệu. Sau đó sẽ đưa lên bản tin trên website để giới
thiệu, gợi ý cho người dùng xem, hiểu và mua sản phẩm.



Khuyến nghị các sản phẩm bán chậm (Slowly products): Một đội ngũ xây dựng
các website sẽ thống kê hàng tồn kho dựa trên dữ liệu bán hàng, sau đó xây
dựng chính sách giảm giá, thông báo bản tin trên website và gửi email cho
khách hàng để họ biết thông tin giảm giá của cửa hàng sẽ giúp giảm lượng hàng
tồn kho.




Khuyến nghị các sản phẩm mới (New products): Nhóm xây dựng trang web sẽ
xây dựng một mô-đun giới thiệu sản phẩm mới dựa trên các đặc tính của mặt
hàng mà khơng có dữ liệu người dùng hoặc dữ liệu bán hàng.

❖ Ưu điểm: Đơn giản và dễ thực hiện. Các đề xuất không phụ thuộc vào dữ liệu của
khách hàng trên hệ thống, nên có thể áp dụng được cho mọi khách hàng để giúp
tăng cơ hội chuyển đổi khách hàng.
❖ Hạn chế: Khơng có tính cá nhân hóa đối với từng khách hàng. Vì vậy, mọi khách
đều gợi ý giống nhau.

25
Đề tài “Tìm hiểu Hệ thống khuyến nghị (Recommender Systems) ứng dụng trong kinh
doanh điện tử”


×