Content-Based
Recommendation System
(Hệ thống tư vấn nội dung)
GVHD: Thầy Nguyễn Văn Đoàn
Thân Thị Ngọc Huyền 11320966
Võ Thị Thu Hà 11320957
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
Content-Based Recommendation System
I. Khái quát Recommendation System
II. Phân loại Recommendation System
III. Content-Based Recommendation System
IV. Xây dựng Content-Based Recommendation System
V. Ứng dụng Content-Based Recommendation System
VI. Xu hướng
VII.Kết luận
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
1. Recommendation System là gì?
Recommendation System là một thành phần
trong hệ thống thông tin nhằm mục đích hỗ trợ
người dùng tìm kiếm được đúng thông tin cần
thiết
Bài toán tư vấn chính là bài toán prediction
một kiểu của bài toán machine learning và
datamining
I. Khái quát Recommendation System
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
I. Khái quát Recommendation System
2. Mục đích:
• “Ghi nhận thông tin” nhằm hỗ trợ người dùng
tìm kiếm được nguồn tài nguyên (thông tin) phù
hợp.
• Là một trong những ứng dụng thiết yếu trong E-
Commerce, cung cấp những đề xuất được cho là
phù hợp, nhằm lược bỏ không gian thông tin
khổng lồ, tạo khả năng điều hướng trực tiếp
người dùng đến những sản phẩm phù hợp nhất
với nhu cầu và sở thích của họ
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
I. Khái quát Recommendation System
3. Một số hệ tư vấn nổi tiếng hiện nay như
- Phim / TV/ âm nhạc: MovieLens, EachMovie, Morse,
Firefly, Flycasting
- Tin tức / báo chí: Tapestry, GroupLens, Lotus Notes,
Anatagonomy…
- Sách / Tài liệu: Amazon.com, Foxtrot, InfoFinder,
Vinabook…
- Web: Phoaks, Gab, Fab, IfWeb, Let's Browse …
- Nhà hàng: Adaptive Place Advisor, Polylens, Pocket
restaurent finder…
- Du lịch: Dietorecs, LifestyleFinder …
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
4. Lợi ích Recommendation System
• Trợ giúp hữu ích cho việc tìm kiếm thông tin
• Tiết kiệm thời gian tìm kiếm
• Tăng hiệu suất và tăng độ tin cậy
• Tăng khả năng mua hàng
Doanh thu tăng nhờ hiệu ứng cross-sell và thu
được sự gắn bó của người dùng
I. Khái quát Recommendation System
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
Content-based: "Show me more of the
same what I've liked
"
II. Phân loại Recommendation System
Tham khảo: Tutorial: Recommender Systems
International Joint Conference on Artificial Intelligence
Barcelona, July 17, 2011
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
Knowledge-based: "Tell me what fits
based on my needs"
II. Phân loại Recommendation System
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
Collaborative: "Tell me what's popular
among my peers"
II. Phân loại Recommendation System
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
Hybrid: combinations of various inputs
and/or composition of different mechanism
II. Phân loại Recommendation System
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
III. Content-based Recommendation System
1. Khái niệm
• Là hệ thống tư vấn cho khách hàng một cách
tự động dựa trên việc đối sánh những sở
thích phù hợp với nội dung sản phẩm
• Sản phẩm của hệ tư vấn lọc nội dung thường
mang tính chất “textual”. Vd: thông tin
Website hay các tin tức, văn bản keyword
được coi là rất quan trọng
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
III. Content-based Recommendation System
2. Ưu điểm Content-based Recommendation System
• Không cần thông tin của người dùng khác
• Có thể tư vấn cho những người dùng có sở thích
khác biệt
• Có thể tư vấn những sản phẩm mới và không phổ
biến
• Cung cấp cho người dùng các giải thích về sản phẩm
tư vấn
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
III. Content-based Recommendation System
2. Nhược điểm Content-based Recommendation
System
• Sự phân tích nội dung bị hạn chế
• Khó có thể tạo ra được sự bất ngờ trong tư vấn/ tư vấn
trùng
• Vấn đề người dùng mới: Người dùng cần đánh giá một
lượng sản phẩm đủ lớn (độ lớn dữ liệu)
• Không khai thác được sự tương đồng với những người
dùng khác
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
Sơ đồ các thành phần chính của một
Recommendation System
IV. Xây dựng Content-based Recommendation System
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
Kiến trúc Content-based Recommendation System
IV. Xây dựng Content-based Recommendation System
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
1. Thu thập thông tin người dùng
Các dạng thông tin VD
Thông tin cá nhân Họ tên, tuổi , giới tính, nghề
nghiệp
Đánh giá/xếp hạng của người
dùng trên sản phẩm
Sản phẩm A: rất tốt, tốt, chưa tốt,
xấu
Hành vi của người dùng Thời gian duyệt site, số lần click
Giao dịch Ngày mua, giá mua, số lượng
mua, giá giảm…
Thông tin về sản phẩm Màu sắc, chủng loại…
IV. Xây dựng Content-based Recommendation System
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
1. Thu thập thông tin người dùng (tt)
IV. Xây dựng Content-based Recommendation System
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
• Heuristic-based: cơ sở dựa trên các hàm
heuristic truyền thống
• Model-based: dựa trên các model (mô hình)
được biết từ dữ liệu phía dưới nhờ sử dụng
các kỹ thuật máy học và thống kê
2. Các Kỹ thuật
IV. Xây dựng Content-based Recommendation System
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
IV. Xây dựng Content-based Recommendation System
2. Các kỹ thuật
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
• IR: dựa trên từ khóa của đoạn văn bản
Tính toán độ tương đồng giữa các item và profile của
người dùng dựa trên các keyword chồng lên nhau.
IV. Xây dựng Content-based Recommendation System
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
• IR: dựa trên từ khóa của đoạn văn bản .
Lọc bộ từ khóa của văn bản: Xác định mức độ
quan trọng của từ khóa k
i
w(i,j) = TF(i,j) * IDF(i)
TF: đo tần số xuất hiện của từ i trong văn bản j
, =
(, )
ℎ(, )
IDF: giảm trọng số của từ trong tất cả các văn bản
() =
()
IV. Xây dựng Content-based Recommendation System
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
• IR: dựa trên từ khóa của đoạn văn bản
Các hàm Heuristic
sim(b
i
, b
j
) =
∗|
∩
|
|
Hàm cosin
IV. Xây dựng Content-based Recommendation System
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
• Phân lớp Bayesian:
• Dự đoán lớp của mẫu cần kiểm tra dựa trên những
thông tin từ tập huấn luyện ban đầu (đã được gán
nhãn lớp)
• Là phương pháp phân loại sử dụng tri thức các xác
suất đã qua huấn luyện
• Gom nhóm
Mô hình gom cụm dữ liệu (không có nhãn) sao cho
các dữ liệu cùng nhóm có các tính chất tương tự
nhau và dữ liệu của 2 nhóm khác nhau sẽ có các tính
chất khác nhau
Giải
thuật
: K
-
Means
,
Dendrogram
,
SOM
,
EM
IV. Xây dựng Content-based Recommendation System
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.
4. Các vấn đề
• Phức tạp
• Đầu tư tốn kém: chi phí, thời gian
VD: pandora: 5 năm
• Vận hành:
• Thiếu dữ liệu
• Các thay đổi
IV. Xây dựng Content-based Recommendation System
Generated by Foxit PDF Creator © Foxit Software
For evaluation only.