Tải bản đầy đủ (.docx) (84 trang)

Xây dựng mô hình hệ tư vấn dựa trên tiếp cận không tương tác giữa các tiêu chí trong lĩnh vực y tế

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (712.2 KB, 84 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC QUY NHƠN

VÕ HÀ PHƯƠNG

XÂY DỰNG MƠ HÌNH HỆ TƯ VẤN DỰA TRÊN TIẾP CẬN
KHƠNG TƯƠNG TÁC GIỮA CÁC TIÊU CHÍ TRONG LĨNH
VỰC Y TẾ

Chuyên ngành

Mã số

: Khoa học máy tính

: 8.48.01.01

Người hướng dẫn: TS. LÊ XUÂN VIỆT


LỜI CAM ĐOAN
Tơi cam đoan đây là cơng trình nghiên cứu của riêng tôi.
Các số liệu, kết quả nêu trong luận văn là trung thực và chưa từng được
ai công bố trong bất kì tài liệu nào khác.

Bình Định, ngày …. tháng ….năm 2019
Học viên thực hiện luận văn

Võ Hà Phương



LỜI CẢM ƠN
Với tình cảm chân thành và lịng biết ơn sâu sắc, cho phép tôi gửi lời
cảm ơn chân thành nhất tới:
Trường Đại học Quy Nhơn, Khoa Công nghệ thông tin, các giảng viên,
các nhà sư phạm đã tận tình giảng dạy và tạo mọi điều kiện giúp đỡ, nhiệt tình
đóng góp ý kiến cho tơi trong q trình học tập, nghiên cứu và hoàn thành bản
luận văn.
Đặc biệt tơi xin bày tỏ lịng biết ơn sâu sắc đến thầy hướng dẫn khoa
học, TS. Lê Xuân Việt, người đã tận tình hướng dẫn, chỉ bảo và giúp đỡ,
động viên tơi trong suốt q trình nghiên cứu và hồn thành luận văn.
Cảm ơn các bạn đồng nghiệp, bạn bè, gia đình đã động viên, khích lệ
và giúp đỡ tơi trong quá trình học tập và nghiên cứu khoa học.
Mặc dù đã cố gắng rất nhiều, nhưng luận văn không tránh khỏi những
thiếu sót; tác giả rất mong nhận được sự thơng cảm, chỉ dẫn, giúp đỡ và đóng
góp ý kiến của các nhà khoa học, của quý thầy cô, các cán bộ quản lý và các
bạn đồng nghiệp.
Xin chân thành cảm ơn!

Bình Định, ngày … tháng …. năm 2019
Học viên thực hiện luận văn

Võ Hà Phương


1

MỞ ĐẦU
1. Lý do chọn đề tài
Hệ tư vấn (Recommender Systems hoặc Recommendation Systems) là
công cụ phần mềm trong các ứng dụng hoặc trang web mà nó sử dụng các loại

tri thức và dữ liệu khác nhau để: (1) dự đốn sở thích (phản hồi) của một cá
nhân hay nhóm người cho một sản phẩm hoặc dịch vụ cụ thể; (2) và/hoặc gợi
ý (đề xuất) các sản phẩm hoặc dịch vụ cho một cá nhân hay nhóm. Hệ tư vấn
đã trở thành một lĩnh vực nghiên cứu quan trọng kể từ giữa những năm
90.

Trải qua hai mươi năm phát triển, hệ tư vấn được ứng dụng vào nhiều lĩnh

vực của cuộc sống như: thương mại điện tử, du lịch điện tử, học tập điện tử,
dịch vụ điện tử, v.v [8]. Một số lĩnh vực như thương mại điện tử được xếp vào
nhóm “truyền thống” vì chúng đã ứng dụng hệ tư vấn vào trong nghiệp vụ của
mình từ rất sớm và vẫn tiếp tục khai thác cho đến hiện nay. Bên cạnh đó, cùng
với sự phát triển của cơng nghệ web, internet, các thiết bị cảm biến, các thiết
bị di động và việc đáp ứng các nhu cầu tư vấn của người dùng cũng như nhu
cầu kinh doanh hay hỗ trợ của các nhà cung cấp, hệ tư vấn đã được triển khai
ở nhiều lĩnh vực khác. Một số ứng dụng nổi tiếng của hệ tư vấn như: hệ tư
vấn của Amazon.com [24] đề xuất cho người dùng các mặt hàng mà họ có thể
thích, hệ tư vấn phim điện ảnh của Netflix [25] gợi ý cho người dùng các
phim mà họ nên xem, hay hệ gợi ý bạn bè của Facebook. Dữ liệu đầu vào của
các hệ tư vấn có thể ở nhiều dạng khác nhau [10] như: thơng tin về sản phẩm
hay dịch vụ, thông tin người dùng, thông tin giao dịch ghi lại sự tương tác của
người dùng và hệ thống, cơ sở tri thức được lấy từ các nguồn thông tin công
khai hay từ chuyên gia, thông tin ngữ cảnh, hay các đặc tả của người dùng.
Các kỹ thuật tư vấn được xây dựng dựa trên nhiều kỹ thuật dùng trong khai
phá dữ liệu và học máy [10]. Các kỹ thuật đó là sự phân lớp, sự phân cụm,
khai phá luật kết hợp, mơ hình hồi quy, hay một số phương pháp học máy có
giám sát và không được giám sát. Dựa trên kỹ thuật tư vấn, các hệ tư vấn


2


được phân thành nhiều nhóm [10][18]: hệ tư vấn dựa trên nội dung (contentbased recommender systems), hệ tư vấn lọc cộng tác (collaborative filtering
recommender systems), hệ tư vấn dựa trên nhân khẩu học học (demographic
recommender systems), hệ tư vấn dựa trên tri thức (knowledge-based
recommender systems), hệ tư vấn lai ghép (hybrid recommender systems), hệ
tư vấn dựa trên ngữ cảnh (context-based or context-aware recommender
systems), hệ tư vấn mạng xã hội (social network recommender systems), và
hệ tư vấn nhóm (group recommender systems). Mỗi loại hệ tư vấn đều có
những ưu thế và nhược điểm cũng như phù hợp với một số loại dữ liệu đầu
vào và lĩnh vực ứng dụng cụ thể. Hệ tư vấn lọc cộng tác thường được sử dụng
trong lĩnh vực thương mại. Hệ tư vấn dựa trên ngữ cảnh được sử dụng trong
những lĩnh vực mà thông tin ngữ cảnh (ví dụ: thời gian, trạng thái cảm xúc)
giữa vai trị quan trọng. Hệ tư vấn nhóm được sử dụng trong những lĩnh vực
mà việc gợi ý các sản phẩm hay dịch vụ cho nhóm là cần thiết hơn cho cá
nhân. Hệ tư vấn dựa trên tri thức là rất phù hợp để gợi ý các mặt hàng không
được mua thường xuyên. Hệ thống tư vấn lai ghép được sử dụng khi muốn
hợp sức mạnh của các thuật toán và mơ hình khác nhau để khắc phục một số
những thiếu sót trong từng thuật tốn hay mơ hình đó… Mặc dù hệ tư vấn đã
đạt được nhiều thành công nhưng việc đề xuất các mơ hình tư vấn mới hay cải
tiến các phương pháp tư vấn hiện tại vẫn là một hướng nghiên cứu chủ đạo.
Trong thời đại bùng nổ thơng tin, ngày càng có nhiều kho dữ liệu lớn
(BigData), nhu cầu tìm kiếm khai thác thơng tin ngày càng cao với nhiều hình
thức đa dạng, phong phú. Đặc biệt là cơng nghệ internet phát triển nhanh
chóng, nhu cầu xử lý thông tin trên hệ thống mạng là vấn đề tất yếu. Cùng với
đó các hệ thống thương mại điện tử, giao dịch khách hàng, tra cứu thông tin
trên nhiều lĩnh vực khác nhau: google, amazon, facebook... đã phát triển
nhanh chóng mở rộng tồn thế giới.


3


Hệ tư vấn (recommender system) được nghiên cứu giúp cho người
dùng (user) khai thác các mục dữ liệu (items) hay sản phẩm (product) mà họ
quan tâm hoặc có thể hấp dẫn với họ đáp ứng các yêu cầu một cách dễ dàng
và nhanh chóng. Mặc dù lượng thơng tin hiện nay rất đa dạng và được tìm
kiếm, khai thác với nhiều hình thức, nhưng hệ tư vấn hỗ trợ người dùng dễ
dàng chọn lọc các mục dữ liệu có thể thõa mãn được nhu cầu người dùng thay
vì phải tìm kiếm trong khối dữ liệu lớn hoặc các khối dữ liệu có liên quan
theo những cách nào đó ln phức tạp, tốn thời gian và chi phí... Hệ tư vấn hỗ
trợ rất tích cực cho người dùng vì khó mà tìm kiếm thơng tin mong muốn
trong khối dữ liệu lớn.
Hầu như các nghiên cứu của hệ tư vấn chủ yếu tập trung vào hai loại cơ
bản: tư vấn dựa trên nội dung và tư vấn lọc cộng tác. Tư vấn dựa trên nội
dung đề xuất các mục tương tự với những mục mà người dùng đã thích, trong
khi tư vấn lọc cộng tác cố tìm một số người dùng chia sẻ sở thích tương tự với
người dùng nhất định và giới thiệu các mục họ thích cho người dùng đó hoặc
tìm kiếm xem xét các đánh giá trên tập mục để từ đó giới thiệu các mục mong
muốn nhất. Tư vấn dựa trên nội dung và tư vấn lọc cộng tác đều có lợi thế và
hạn chế riêng của chúng. Tuy nhiên, tư vấn lọc cộng tác phổ biến hơn là tư
vấn dựa trên nội dung, chủ yếu bởi vì trong nhiều lĩnh vực (chẳng hạn như âm
nhạc, nhà hàng) rất khó để trích xuất các tính năng hữu ích từ các mục, mà nói
chung là một bước cần thiết cho việc tư vấn dựa trên nội dung. Ngoài ra cịn
một số mơ hình hệ tư vấn khác như: hỗn hợp, tri thức, luật kết hợp... cũng
được dùng tùy theo ngữ cảnh thích hợp. Tuy nhiên hiện nay với sự bùng nổ
dữ liệu, dữ liệu liên kết nên việc tư vấn xu thế hướng về sự phổ biến của
người dùng để làm cơ sở cho việc tư vấn. Mặt khác, dữ liệu lưu trữ ngày càng
lớn, để việc tư vấn tốt cần phải dựa vào nhiều thông tin, nhiều tiêu chí để xem
xét ra quyết định cho tư vấn. Thơng qua nghiên cứu phân tích và thử nghiệm



4

tơi nhận thấy rằng xây dựng các mơ hình ra quyết định dựa trên các tiêu chí
có thể sẽ hiệu quả hơn các giải pháp truyền thống, cho kết quả khả thi hơn và
khá thích hợp cho nhiệm vụ này, chúng có thể đưa ra các thơng tin tư vấn tin
cậy hơn.
Hệ tư vấn đa tiêu chí chủ yếu khai thác dữ liệu dạng bảng (ma trận m
dòng x n cột). Khi đó, mỗi dịng hoặc mỗi cột được xem là một tiêu chí. Hệ tư
vấn đa tiêu chí xây dựng các quyết định dựa trên thông tin của một tập hợp
các dòng hoặc một tập hợp các cột với nhiều giải pháp khác nhau để cho kết
quả khuyến nghị phù hợp với yêu cầu ngữ cảnh và đặc tính của dữ liệu nhằm
mang lại hiệu quả cao nhất thay vì sử dụng đơn tiêu chí (chỉ dựa vào một
người dùng hoặc một sản phẩm nào đó) để khuyến nghị như đã từng làm
trước kia, kết quả rất đơn điệu, chưa thể hiện tích bao hàm trong dữ liệu với
nhiều khả năng tự có trong hệ thống nhằm khuyến nghị đa dạng hơn thông
qua những thông tin của nhiều tiêu chí.
Theo nhiều cách khác nhau, hệ tư vấn ln mong muốn có kết quả
khuyến nghị thõa mãn nhiều hơn nhu cầu người dùng. Mặt khác dữ liệu của
hệ thống thì rất đa dạng, phong phú, các dữ liệu này nội tại có những tác
động, quan hệ với nhau về mặt tương đồng nào đó nên cần có những giải pháp
khai thác triệt để mối quan hệ tương tác này để xây dựng mơ hình ra quyết
định thì kết quả khuyến nghị sẽ như mong đợi hơn. Đã có nhiều nghiên cứu
hệ tư vấn đa tiêu chí cũng như những thuật tốn ra quyết định dựa trên tương
tác đa tiêu chí nhưng vẫn chưa đáp ứng được yêu cầu hiện nay.
Chính vì những lý do trên tơi muốn tìm hiểu một hướng tiếp cận mới
dựa trên cơ sở lý thuyết các thuật toán ra quyết định thường dùng trong bài
toán tư vấn lọc cộng tác để khai thác giá trị thông tin trên các tiêu chí, đó là
“Xây dựng mơ hình hệ tư vấn dựa trên tiếp cận không tương tác giữa các tiêu
chí trong lĩnh vực y tế”.



5

2. Mục tiêu nghiên cứu
Mục tiêu chính: Xây dựng mơ hình hệ tư vấn dựa trên tiếp cận khơng
tương tác giữa các tiêu chí và ứng dụng trong bài tốn tư vấn trong lĩnh vực y
tế.
Mục tiêu cụ thể:
-

Xây dựng được một hệ tư vấn về lĩnh vực y tế.

-

Tìm hiểu các phương pháp tư vấn khách hàng (Lọc dựa trên nội dung

(Content-base filter) và lọc cộng tác (Collabroration filter)).
-

Thu thập, tìm hiểu, phân tích các tài liệu liên quan đến luận văn.

-

Áp dụng một số công nghệ mới nhằm đem lại hiệu quả cao cho một

hệ tư vấn.
3.

Xây dựng chương trình, thử nghiệm và đánh giá kết quả.


Đối tượng và phạm vi nghiên cứu

3.1. Đối tượng nghiên cứu
Nghiên cứu các phương pháp để xây dựng một hệ thống tư vấn.
3.2. Phạm vi nghiên cứu
-

Nghiên cứu mơ hình hệ tư vấn dựa trên tiếp cận không tương tác giữa các

tiêu chí.
Ứng dụng mơ hình hệ tư vấn dựa trên tiếp cận khơng tương tác giữa các

-

tiêu chí và ứng dụng trong bài toán tư vấn trong lĩnh vực y tế.
4.

Phương pháp nghiên cứu

4.1. Phương pháp nghiên cứu lý thuyết
- Thu thập tìm hiểu, phân tích các tài liệu và thơng tin có liên quan đến luận
văn.
-

Kiểm thử, đưa ra nhận xét và đánh giá kết quả.

4.2. Phương pháp nghiên cứu thực nghiệm
Nghiên cứu xây dựng được một hệ tư vấn về lĩnh vực y tế.



6
5.

Ý nghĩa khoa học và thực tiễn
Mở rộng ứng dụng của tiếp cận khơng tương tác giữa các tiêu chí.

6. Cấu trúc luận văn
Luận văn được trình bày trong 3 chương. Chương 1 là phần cơ sở lý
thuyết. Nội dung chủ yếu là tóm tắt, phân loại các hệ tư vấn. Trong Chương 2,
chúng tơi trình bày về mơ hình tư vấn khơng tương tác giữa các tiêu chí. Cuối
cùng là phần thử nghiệm cho dữ liệu y tế được trình bày trong Chương 3.


7

CHƯƠNG 1. CƠ SỞ LÝ THUYẾT
1.1. Định nghĩa và mục tiêu của hệ tư vấn
1.1.1 Định nghĩa
Hệ tư vấn là công cụ phần mềm trong các ứng dụng hoặc trang web mà
nó sử dụng các loại tri thức và dữ liệu khác nhau (ví dụ: sở thích, hành động
của người dùng và thông tin theo ngữ cảnh) để đề xuất các mục (ví dụ: sản
phẩm, dịch vụ) có thể hữu ích cho người dùng cuối [13].
1.1.2. Mục tiêu của hệ tư vấn
Sự tăng trưởng nhanh và đa dạng của các thơng tin có sẵn trên Internet
cũng như sự phát triển của nhiều dịch vụ thương mại điện tử thường khiến cho
người dùng bị quá tải, dẫn đến họ có thể không đưa ra các quyết định đúng đắn.
Hệ tư vấn đã trở thành một lĩnh vực nghiên cứu quan trọng kể từ khi xuất hiện
những bài báo đầu tiên về lọc cộng tác vào giữa những năm 90. Mục tiêu của
việc phát triển hệ tư vấn là giảm tình trạng q tải thơng tin bằng cách truy tìm
thơng tin và dịch vụ có liên quan nhất từ một lượng lớn dữ liệu để dự đoán các

giá trị xếp hạng của một cá nhân hay nhóm cho một mục cụ thể và/hoặc đưa ra
gợi ý (đề xuất) các mục được xếp hạng cao nhất cho cá nhân hay nhóm. Bên
cạnh đó, hệ tư vấn cũng quan tâm đến các yếu tố như tính có liên quan, tính mới
lạ, tính đa dạng, tính may mắn khi thực hiện đề xuất.


Tính có liên quan: các mục gợi ý có liên quan đến người dùng.



Tính mới lạ: các mục gợi ý khác với những mục mà người dùng đã

đánh giá hay mua trong quá khứ.


Tính may mắn (serendipity): các mục gợi ý thực sự gây ngạc nhiên

cho người dùng chứ không chỉ đơn giản là một điều mà họ khơng biết trước
đây.
− Tính đa dạng: danh sách gợi ý chứa các mục khác nhau để đảm bảo


8

rằng người dùng không bị chán bởi sự gợi ý lặp lại các mục tương tự.
1.2. Mơ hình hệ tư vấn
Dữ liệu đầu vào của một hệ tư vấn có thể ở nhiều dạng khác nhau như:
dữ liệu người dùng, dữ liệu mục (ví dụ: dữ liệu sản phẩm), dữ liệu giao dịch,
dữ liệu ngữ cảnh, v.v. Với hai mục tiêu chính như đã trình bày ở trên và tùy
thuộc vào loại dữ liệu, hệ thống sẽ sử dụng một kỹ thuật phù hợp để đưa ra

kết quả tư vấn. Các kỹ thuật được sử dụng có thể là: lọc cộng tác, dựa trên nội
dung, dựa trên tri thức, v.v.
Mô hình cơ bản của các hệ tư vấn thường sử dụng dữ liệu giao dịch,
(chẳng hạn như các hành vi mua hàng hóa hay xếp hạng cho một sản phẩm),
và các thuộc tính về người dùng và mục. Bài tốn tư vấn cơ bản có thể được
hình thức hóa như sau [13]:


Gọi

là tập hợp tất cả người dùng.



Gọi là tập hợp tất cả các mục.



Gọi

(với

là một tập hợp có thứ tự hồn tồn) là một

hàm tiện ích đo tính hữu dụng của một mục cụ thể

cho một người dùng

.
Sau đó, với từng người dùng


, ta cần chọn một mục

sao cho tối

đa hóa tiện ích của người dùng.
Bài tốn tư vấn hai chiều truyền thống trên được mở rộng thành bài
toán tư vấn nhiều chiều nếu có thêm các loại dữ liệu đầu vào khác. Ví dụ, với
các hệ tư vấn dựa trên ngữ cảnh thì hàm tiện ích sẽ có dạng:
trong đó

là tập các tình trạng ngữ cảnh.

1.2.1. Dữ liệu đầu vào của hệ tư vấn
Hệ tư vấn sử dụng các dữ liệu như: xếp hạng/đánh giá của người dùng
cho các mục, mô tả người dùng, mô tả mục, các ràng buộc, hoặc các mối quan


9

hệ xã hội hay các hoạt động của người dùng, v.v. Từ sự tham khảo các tài liệu
[10], luận văn này phân các dữ liệu đầu vào thành những nhóm sau:


Dữ liệu mục. Các mục có thể được đặc trưng bởi tính phức tạp và giá

trị hoặc tiện ích của chúng. Ví dụ, mục "sách" được mơ tả bằng các thuộc tính
như tiêu đề, thể loại, tác giả, giá và từ khố. Mục có thể được biểu diễn bằng
nhiều cách khác nhau chẳng hạn như dùng một tập các thuộc tính giống ví dụ
trên hay đơn giản chỉ dùng một mã nhận dạng mục.



Dữ liệu người dùng. Thông tin người dùng có thể được biểu diễn chỉ

bằng một mã nhận dạng hoặc một tập các thuộc tính, ví dụ như tập các thuộc
tính nhân khẩu học gồm tuổi tác, giới tính, nghề nghiệp và nền tảng giáo dục.
Thơng tin về người dùng có thể được cấu trúc theo nhiều cách. Việc sử dụng
thông tin nào của người dùng phụ thuộc vào kỹ thuật đề xuất.


Dữ liệu giao dịch (các tương tác giữa người dùng và hệ thống được

ghi lại). Các giao dịch lưu trữ những thông tin quan trọng được tạo ra trong
quá trình tương tác giữa người dùng và máy tính. Trong đó, các xếp hạng
(những phản hồi của người dùng cho các mục đã chọn) là dạng dữ liệu giao
dịch phổ biến nhất mà hệ tư vấn thu thập và sử dụng. Các xếp hạng này có thể
được thu thập tường minh hoặc khơng tường minh. Chúng có thể có nhiều
dạng khác nhau như: số, thứ tự, nhị phân, hoặc đơn (nhất phân).


Cơ sở tri thức. Các cơ sở tri thức có thể được lấy từ thơng tin có sẵn

cơng khai, các chun gia lĩnh vực, kinh nghiệm trong quá khứ, hoặc việc
khai phá dữ liệu các tập giao dịch lịch sử.


Thông tin ngữ cảnh. Đây là các thơng tin bổ sung nhằm xác định tình

huống cụ thể (mơ tả hồn cảnh của một thực thể) mà theo đó các đề xuất được
đưa ra. Chúng có thể là thơng tin vị trí, thơng tin về thời gian hoặc thơng tin

xã hội.
− Đặc tả của người dùng. Thay vì sử dụng lịch sử của người dùng, một


10

số kỹ thuật tư vấn cho phép họ tương tác với hệ thống qua việc xác định và
điều chỉnh các yêu cầu.
Lưu ý rằng, với từng cách tiếp cận tư vấn, một số nhóm dữ liệu chứ
khơng phải tất cả các nhóm sẽ được sử dụng. Ví dụ: hệ tư vấn lọc cộng tác sử
dụng dữ liệu giao dịch; hệ tư vấn dựa trên tri thức sử dụng đặc tả của người
dùng, dữ liệu mục và cơ sở tri thức.
1.2.2. Dữ liệu đầu ra của hệ tư vấn
Dữ liệu đầu ra của một hệ tư vấn có thể ở những dạng sau:


Các xếp hạng được dự đoán. Hệ thống dự đốn giá trị xếp hạng của

một người dùng (hoặc nhóm người dùng) cho một mục cụ thể.


Danh sách những mục (hoặc những người) được gợi ý. Hệ thống đề

xuất những mục được xếp hạng cao nhất cho một người dùng cụ thể (hoặc xác
định những người dùng được xếp hạng cao nhất cho một mục cụ thể).
1.2.3. Quy trình phát triển hệ tư vấn
Quy trình phát triển một hệ tư vấn gồm các bước chính sau:


Thu thập dữ liệu.




Lọc dữ liệu bằng một kỹ thuật lọc phù hợp, ví dụ: dựa trên cộng tác,

dựa trên nội dung, dựa trên tri thức, v.v. Kỹ thuật lọc phụ thuộc vào loại dữ
liệu mà hệ tư vấn đang xử lý và loại gợi ý mà nó dự định sinh ra.


Xếp hạng các mục được gợi ý.



Trình bày tập các gợi ý được xếp hạng cao nhất cho người dùng.

Ngồi ra, sau khi có được phản hồi của người dùng về các gợi ý trước
đó, hệ tư vấn cịn cho phép lặp lại những bước trên nhằm tìm ra các gợi ý mới
hoặc tốt hơn.
1.3. Phân loại hệ tư vấn
Các hệ tư vấn có thể được phân loại theo kỹ thuật (phương pháp) tư
vấn, tính chất của dữ liệu, hoặc lĩnh vực ứng dụng. Bảng 1.1 trình bày các


11

cách phân loại và các tiêu chí của từng cách.
Nhìn chung, các kỹ thuật tư vấn có thể chia thành hai lớp chính: lớp các
phương pháp cơ bản (hay truyền thống) như dựa trên nội dung, lọc cộng tác,
và dạng lai; và lớp các phương pháp phát triển gần đây (hay tiên tiến) như dựa
trên ngữ cảnh hay dựa trên nhóm [10][18].

Rất nhiều nghiên cứu đã phân loại các hệ tư vấn theo kỹ thuật tư vấn.
Ví dụ: phân loại các hệ tư vấn thành các nhóm: dựa trên nội dung, lọc cộng
tác, và dạng lai; [9] phân loại các hệ tư vấn thành các nhóm: dựa trên nội
dung, lọc cộng tác, nhân khẩu học, dựa trên tri thức, và dạng lai; phân loại các
hệ tư vấn thành các nhóm: dựa trên nội dung, lọc cộng tác, nhân khẩu học,
dựa trên tri thức, dựa trên cộng đồng, và dạng lai; phân loại các hệ tư vấn
thành các nhóm: dựa trên nội dung, lọc cộng tác, dựa trên tri thức, dựa trên
niềm tin, và dựa trên nhận thức bối cảnh (ngữ cảnh); [18] phân loại các hệ tư
vấn thành các nhóm: dựa trên nội dung, lọc cộng tác, dựa trên tri thức, dạng
lai, dựa trên tập mờ, dựa trên mạng xã hội, dựa trên nhận thức bối cảnh, và
gợi ý nhóm. Cùng với sự phát triển của công nghệ, các hệ tư vấn cũng tiến
hóa theo, từ đó dẫn đến số nhóm phân loại cũng được cập nhật. Lớp các kỹ
thuật cơ bản cơ bản được sử dụng để xây dựng các nhóm hệ tư vấn: dựa trên
nội dung, lọc cộng tác, nhân khẩu học, dựa trên tri thức và dạng lai. Lớp các
kỹ thuật phát triển gần đây được sử dụng để xây dựng các nhóm hệ tư vấn:
dựa trên xã hội, dựa trên ngữ cảnh, và gợi ý nhóm.


cách phân loại theo tính chất dữ liệu, hạt nhân của sự phân loại tập

trung vào ba yếu tố: (1) mục tiêu của dữ liệu: người dùng hoặc mục; (2)
phương thức thu thập: tường minh (những đánh giá cho các mục được thực
hiện bởi người dùng) hoặc khơng tường minh (ví dụ: số lần người dùng đã
xem một bộ phim); và (3) mức thông tin: bộ nhớ, nội dung hoặc ngữ cảnh xã
hội [16]. Sau khi xác định dữ liệu của một hệ tư vấn theo ba yếu tố trên và tùy


12

thuộc vào sự kết hợp của những yếu tố này mà kỹ thuật tư vấn phù hợp sẽ

được sử dụng. Ví dụ, nếu mục tiêu dữ liệu là người dùng, phương pháp thu
thập là tường minh và mức thông tin là xã hội (như bạn bè, những người theo
dõi, được theo dõi) thì kỹ thuật tư vấn lọc cộng tác có thể được sử dụng.
Ngồi ra, các hệ tư vấn cịn có thể được phân loại theo lĩnh vực ứng
dụng. 8 lĩnh vực chính được đề xuất trong [18] là: chính phủ điện tử, kinh
doanh điện tử, thương mại (mua sắm) điện tử, thư viện điện tử, học tập điện
tử, du lịch điện tử, dịch vụ điện tử và các hoạt động nhóm điện tử. Mỗi lĩnh
vực ứng dụng có những điểm đặc trưng phù hợp với một số kỹ thuật tư vấn.
Ví dụ, trong lĩnh vực thư viện điện tử, các kỹ thuật tư vấn được sử dụng gồm
dựa trên lọc công tác, dựa trên nội dung và dạng lai.
Bảng 1.1. Các cách phân loại hệ tư vấn.

Cách
loại

Theo kỹ thuật
tư vấn

Theo tính chất
của dữ liệu

Theo
ứng dụng


13

1.4. Phát triển hệ tư vấn
Trong luận văn này, các hệ tư vấn sẽ được trình bày theo cách phân loại
kỹ thuật. Các nhóm hệ tư vấn gồm: hệ tư vấn dựa trên nội dung, hệ tư vấn lọc

cộng tác, hệ tư vấn dựa trên nhân khẩu học học, hệ tư vấn dựa trên tri thức, hệ
tư vấn lai ghép, hệ tư vấn mạng xã hội, và hệ tư vấn nhóm. Mỗi nhóm sẽ được
lần lượt trình bày theo các nội dung: các bước chính để phát triển hệ tư vấn,
các kỹ thuật được sử dụng, và những lợi thế và nhược điểm của nhóm hệ tư
vấn đó.
1.4.1. Hệ tư vấn dựa trên nội dung
Sự tư vấn dựa trên nội dung có nguồn gốc từ nghiên cứu về lọc thơng
tin và truy hồi thông tin [13]. Hệ tư vấn dựa trên nội dung sử dụng các thuộc
tính mơ tả (được gọi là nội dung) của các mục để đưa ra những gợi ý, nó cố
gắng đề xuất các mục tương tự như các mục mà người dùng đã yêu thích
trong quá khứ [10]. Trong phương pháp tư vấn này, các đánh giá (xếp hạng)
hay hành vi mua sắm của người dùng được kết hợp với thơng tin nội dung có
trong các mục.
1.4.1.1. Các bước phát triển hệ tư vấn

Từ sự tổng hợp các bài viết về tư vấn dựa nội dung [8][10], một quy
trình chung được đơn giản hóa để phát triển các hệ thống loại này là như sau.
Hai bước đầu của quy trình được sử dụng để tạo ra một mơ hình tóm tắt,
thường là một mơ hình phân lớp hoặc hồi quy. Sau đó, mơ hình này được sử
dụng ở bước cuối cùng để tạo ra các gợi ý cho người dùng.


Tiền xử lý và trích xuất đặc trưng: trích xuất các đặc trưng phân biệt

(những đặc trưng có tính dự đốn cao về sở thích của người dùng) để biểu
diễn cho các mục.


Học hồ sơ người dùng dựa trên nội dung: học (dựa vào lịch sử mua


sắm hoặc đánh giá của người dùng) để xây dựng một mơ hình người dùng cụ


14

thể nhằm dự đốn sở thích của họ đối với các mục. Mơ hình kết quả được gọi
là hồ sơ người dùng (user profile) vì nó được tạo ra từ sự kết hợp của các
thuộc tính mơ tả mục với đánh giá của người dùng.


Lọc và gợi ý các mục: khai thác hồ sơ người dùng để đề xuất các mục

có liên quan bằng cách so khớp sự biểu diễn của hồ sơ với sự biểu diễn của
các mục. Việc so khớp này được tính theo một độ đo tương tự nào đó và cho
kết quả ở dạng nhị phân hoặc số liên tục. Kết quả cuối cùng là một danh sách
xếp hạng các mục hấp dẫn tiềm năng.
1.4.1.2. Các kỹ thuật được sử dụng

Việc chọn và đánh trọng số các đặc trưng là một bước quan trọng trong
biểu diễn mục. Một số phép đo thường được sử dụng là: chỉ số Gini, Entropy
và thống kê χ2 trong lựa chọn đặc trưng [10]; tần suất (Term Frequency - TF)
và tần suất ngược (Inverse Document Frequency - IDF) trong xác định trọng
số của từ khoá. Một số phương pháp được sử dụng để biểu diễn mục là: không
gian vector dựa trên từ khóa, khơng gian vector dựa trên synset, và dựa trên
bản thể học. Trong hầu hết các trường hợp, các đặc trưng được trích từ nhiều
nguồn khác nhau để chuyển đổi chúng thành một biểu diễn không gian vector
dựa trên từ khóa.
Để học hồ sơ người dùng và lọc các gợi ý, hệ tư vấn dựa trên nội dung
đã sử dụng các mơ hình phân lớp, mơ hình hồi quy, mơ hình cây quyết định,
hay máy vector hỗ trợ [10]. Các mơ hình phân lớp được sử dụng là: láng

giềng gần nhất, Bayes, xác suất, hay dựa trên luật. Các mơ hình hồi quy được
sử dụng như: hồi quy tuyến tính, hồi quy logic. Trong đó, phương pháp Bayes
đã thành cơng lớn trong nhiều tình huống do khả năng xử lý các loại nội dung
khác nhau. Một số độ đo tương tự được sử dụng trong việc tính tốn và đưa ra
danh sách các gợi ý như Cosine, Jaccard, và Dice.


15

1.4.1.3. Các lợi thế và nhược điểm của hệ tư vấn

Hệ tư vấn dựa trên nội dung có một số lợi thế:


Không gặp phải vấn đề mục mới. Các mục mới có thể được gợi ý cho

một người dùng mặc dù khơng có dữ liệu đánh giá cho mục này. Nguyên nhân
là vì hệ thống sẽ dựa vào các mục khác có thuộc tính tương tự đã được
đánh giá bởi người dùng này.


Sự độc lập của người dùng. Hệ tư vấn dựa trên nội dung chỉ khai thác

các đánh giá được cung cấp bởi người dùng để xây dựng hồ sơ của chính họ
mà khơng cần đến các đánh giá của những người dùng khác như các hệ tư vấn
lọc cộng tác.


Trong suốt (transparency). Cách thức hệ tư vấn hoạt động có thể được


giải thích bằng việc liệt kê một cách rõ ràng những đặc trưng hoặc bằng sự
mô tả nội dung giúp cho một mục xuất hiện trong danh sách gợi ý.
Tuy nhiên, hệ tư vấn dựa trên nội dung vẫn còn những nhược điểm sau:


Vấn đề người dùng mới. Vì mơ hình huấn luyện của người dùng cần

sử dụng lịch sử đánh giá của người đó nên hệ tư vấn dựa trên nội dung là
không hiệu quả trong việc cung cấp các gợi ý cho người dùng mới.


Vấn đề chun mơn hóa thái q (overspecialization). Hệ tư vấn dựa

trên nội dung có xu hướng gợi ý các mục tương tự như những mục mà người
dùng đã đánh giá hay mua trước đó. Vì thế, tính đa dạng của danh sách các
gợi ý, tính mới lạ, tính may mắn bị hạn chế.
1.4.2. Hệ tư vấn lọc cộng tác
Các hệ tư vấn cộng tác (hoặc hệ thống lọc cộng tác) cố gắng dự đốn
tính tiện ích của các mục cho một người dùng cụ thể dựa trên các mục đã
được xếp hạng trước đó bởi những người dùng khác. Phương pháp lọc cộng
tác được dựa trên giả định rằng những người dùng tương tự thích các mục
tương tự hoặc một người dùng có các sở thích tương tự cho các mục tương tự.


16

Hệ tư vấn cộng tác hoàn toàn dựa vào các xếp hạng từ các thành viên của
cộng đồng. Các xếp hạng có thể ở nhiều dạng: xếp hạng số, xếp hạng thứ tự,
xếp hạng nhị phân (đồng ý/không đồng ý, tốt/xấu), và xếp hạng nhất phân (chỉ
có một cơ chế cho người dùng chỉ ra họ mua hoặc thích một mục và khơng có

cơ chế cho chiều ngược lại).
1.4.2.1. Các bước phát triển hệ tư vấn

Dưới đây là các bước chính của một hệ tư vấn lọc cộng tác:


Lấy thơng tin về sở thích của một người dùng cần được tư vấn. Người

dùng thể hiện sở thích của mình bằng cách xếp hạng các mục.


So khớp các xếp hạng của người dùng này với những người dùng khác

và tìm ra những người có cùng sở thích giống nhất.


Gợi ý cho người dùng cần được tư vấn các mục mà những người dùng

tương tự đánh giá cao nhưng chưa được đánh giá bởi người dùng này.
1.4.2.2. Các kỹ thuật được sử dụng

Các giải thuật tư vấn cộng tác có thể được nhóm thành hai lớp chung:
dựa trên bộ nhớ và dựa trên mơ hình. Ngồi ra, cịn đề xuất một cách phân
nhóm khác là: xác suất (nếu giải thuật diễn tả sự phân bố xác suất khi tính
tốn các xếp hạng hay danh sách các gợi ý) và phi xác suất. Báo cáo tổng
quan này trình bày theo cách phân loại thứ nhất, cách thường được trích dẫn
nhất [9][10][13].
Phương pháp dựa trên bộ nhớ
Phương pháp dựa trên bộ nhớ lưu các thơng tin sở thích vào trong bộ
nhớ máy tính và truy cập nó khi cần thiết để tìm những người dùng hoặc

những mục tương tự và đưa ra dự đoán. Phương pháp dựa trên bộ nhớ còn
được gọi là phương pháp lọc cộng tác dựa trên láng giềng vì chúng dựa trên
thực tế: người dùng tương tự có xếp hạng tương tự trên cùng một mục; các
mục tương tự cũng được đánh giá tương tự bởi cùng một người dùng.


17

Phương pháp dựa trên bộ nhớ có hai loại chính: lọc cộng tác dựa trên
người dùng và lọc cộng tác dựa trên mục. Cách tiếp cận dựa trên người dùng
tìm kiếm người dùng (láng giềng) tương tự như người dùng đang hoạt động
và tính tốn xếp hạng dự đốn cho mục qua việc sử dụng các xếp hạng của
láng giềng. Cách tiếp cận dựa trên mục tìm các mục tương tự cho người dùng
đang hoạt động. Tóm lại, cả hai cách tiếp cận này đều thực hiện các bước:
biểu diễn dữ liệu đầu vào (ma trận xếp hạng), hình thành quan hệ láng giềng
(tính tốn sự tương tự giữa những người dùng hay giữa các mục), và sinh ra
các gợi ý (dự đoán xếp hạng và đưa ra gợi ý) [9]. Một số kỹ thuật đã được đề
xuất để giảm tính thưa của ma trận xếp hạng như: Default Voting, User
Average Scheme. Một số đo đo được sử dụng để hình thành quan hệ láng
giềng như: Cosine, Pearson, Jaccard [10][13]. Bên cạnh đó, để tăng tốc độ cho
các phương pháp dựa trên láng giềng, các kỹ thuật phân cụm cũng thường
được sử dụng [10]; để tăng tính hiệu quả và chất lượng cho các phương pháp
dựa trên láng giềng, các kỹ thuật thu giảm chiều đã được sử dụng [10].
Phương pháp dựa trên mơ hình
Các hoạt động chính của phương pháp này là: xây dựng một mơ hình
dựa trên dữ liệu cơ sở bằng các phương pháp học máy có giám sát hoặc khơng
giám sát; thực hiện sự dự đốn cho dữ liệu thực tế dựa trên mơ hình đã học.
Như vậy, giai đoạn huấn luyện (giai đoạn xây dựng mơ hình) là tách biệt với
giai đoạn dự đốn. Vì bài toán lọc cộng tác được xem như sự tổng qt hóa
của bài tốn phân lớp nên nhiều mơ hình áp dụng cho bài toán phân lớp được

áp dụng cho lọc cộng tác với một số điều chỉnh, chẳng hạn như cây quyết
định và hồi quy [19] , luật kết hợp Bayes ngây thơ, mạng nơ ron. Bên cạnh
đó, các mơ hình nhân tố tiềm ẩn sử dụng các kiểu phân loại khác nhau để dự
đoán xếp hạng. Những kiểu phân loại này khác về tính chất của hàm mục tiêu
và các ràng buộc trên ma trận cơ sở của chúng.


18

1.4.2.3. Các lợi thế và nhược điểm của hệ tư vấn

Các hệ tư vấn lọc cộng tác thuần túy không có những nhược điểm như
các hệ tư vấn dựa trên nội dung. Tuy nhiên, chúng vẫn có một số nhược điểm
sau:


Vấn đề người dùng mới.



Vấn đề mục mới.



Tính thưa của dữ liệu.

1.4.3. Hệ tư vấn dựa trên nhân khẩu học
Hệ tư vấn dựa trên nhân khẩu học đề xuất các mục cho người dùng dựa
trên hồ sơ nhân khẩu học của họ. Dữ liệu nhân khẩu học có thể là độ tuổi, giới
tính, tầng lớp xã hội, v.v.

1.4.3.1. Các bước phát triển hệ tư vấn

Các bước phát triển một hệ tư vấn dựa trên nhân khẩu học là:


Thu thập dữ liệu nhân khẩu học cá nhân.



Phân người dùng thành các nhóm theo dữ liệu nhân khẩu học cá nhân.



Phân các mục vào các nhóm người dùng.



Gợi ý cho người dùng các mục mà chúng được yêu thích bởi những

người cùng nhóm.
1.4.3.2. Các kỹ thuật được sử dụng

Một số nghiên cứu về hệ tư vấn dựa trên nhân khẩu học như hệ thống
tư vấn sách, hệ tư vấn trang Web. Nhiều trang Web sử dụng các giải pháp cá
nhân hóa dựa trên nhân khẩu học, chẳng hạn như người dùng sẽ được tự động
chuyển tới các trang web cụ thể dựa trên ngôn ngữ hoặc quốc gia của họ.
Tương tự như lọc cộng tác, các kỹ thuật nhân khẩu học cũng sử dụng
mối tương quan giữa người dùng với người dùng, nhưng khác ở chỗ chúng
không yêu cầu lịch sử xếp hạng. Mặc dù các phương pháp tiếp cận dựa trên
nhân khẩu học là khá phổ biến trong tiếp thị nhưng các nghiên cứu về hệ tư



19

vấn dạng này cịn tương đối ít.
1.4.3.3. Các lợi thế và nhược điểm của hệ tư vấn

Hệ tư vấn dựa trên nhân khẩu học có một số lợi thế như sau:


Không gặp phải vấn đề người dùng mới như hệ tư vấn lọc cộng tác vì

các xếp hạng của người dùng cho các mục không được sử dụng. Dựa trên
thông tin nhân khẩu học của người dùng mới, hệ thống sẽ xếp người này vào
một nhóm người dùng có cùng đặc điểm. Sau đó, dựa trên hồ sơ giao dịch của
những người cùng nhóm, hệ thống sẽ gợi ý cho người dùng mới một danh
sách các mục.


Khi hoạt động độc lập, hệ tư vấn dựa trên nhân khẩu học thường

không cho kết quả tốt nhất nhưng khi được kết hợp với hệ tư vấn loại khác
(mơ hình lai) thì hệ tư vấn dựa trên nhân khẩu học lại làm tăng sức mạnh của
hệ tư vấn kết hợp.
Một số nhược điểm của hệ tư vấn dựa trên nhân khẩu học là:


Việc thu thập các dữ liệu nhân khẩu học cần cho hệ tư vấn có thể dẫn

đến các vấn đề về tính riêng tư.



Nếu thơng tin nhân khẩu học là khơng đủ hoặc khơng chính xác thì

kết quả tư vấn sẽ khơng chính xác.


Cách thức phân lớp người dùng dựa trên thơng tin nhân khẩu học.

Việc phân nhóm người dùng sai sẽ dẫn đến kết quả gợi ý khơng chính xác và
khó có thể được người dùng chấp nhận.
1.4.4. Hệ tư vấn dựa trên tri thức
Các hệ tư vấn dựa trên tri thức là rất phù hợp để gợi ý các mặt hàng
không được mua thường xuyên. Các gợi ý của hệ tư vấn loại này chủ yếu dựa
vào những yêu cầu trực tiếp của người dùng về cái mà họ mong muốn thay vì
dựa vào dữ liệu lịch sử như các hệ tư vấn lọc cộng tác và nội dung. Nhìn
chung, các hệ tư vấn dựa trên tri thức là thích hợp trong các tình huống: (1)


20

khách hàng muốn nêu rõ yêu cầu của họ; (2) rất khó để có được các xếp hạng
cho một loại mục cụ thể vì tính phức tạp của phạm vi sản phẩm trong các loại
mục và các tùy chọn sẵn có; (3) trong một số lĩnh vực mà các xếp hạng là
nhạy cảm với thời gian (ví dụ: các xếp hạng về một model xe hơi cũ là không
thực sự hữu ích cho việc gợi ý vì chúng tiến hóa theo tính sẵn có của sản
phẩm và tương ứng với các yêu cầu người dùng).
Các hệ tư vấn dựa trên tri thức có thể được phân thành hai loại: dựa trên
ràng buộc (constraint-based recommender systems) và dựa trên trường hợp
(case-based recommender systems) [10].

1.4.4.1. Các bước phát triển hệ tư vấn

Từ sự tổng hợp các bài viết về tư vấn dựa trên tri thức [10], quy trình
thực hiện chung của một hệ tư vấn loại này được xác định như sau:


Cho phép người dùng xác định các ràng buộc (những yêu cầu lên các

thuộc tính của mục) hoặc các trường hợp (những mục tiêu) thơng qua một
giao diện nào đó - ví dụ như một biểu mẫu dạng web.


So khớp các ràng buộc đã xác định ở bước trên với các thuộc tính của

mục hoặc các trường hợp với các mục dựa trên tri thức lĩnh vực, và sau đó
đưa ra các gợi ý. Tri thức lĩnh vực được biểu diễn bởi các luật (những ràng
buộc giữa các thuộc tính của mục) nếu thông tin cung cấp ở bước 1 là các yêu
cầu; hoặc bởi các độ đo nếu thông tin cung cấp ở bước 1 là các trường hợp.
Dựa trên danh sách các gợi ý nhận được, người dùng có thể: (1) dừng q
trình tư vấn nếu thấy hài lịng với kết quả tư vấn; (2) quay lại bước 1 để tìm sự
tư vấn cho một ràng buộc hay trường hợp khác; hoặc (3) tiếp tục cải thiện kết
quả tư vấn bằng cách chuyển sang bước kế tiếp.


Xác định những điều chỉnh đối với ràng buộc trên các thuộc tính hoặc

những điều chỉnh đối với các mục.


Lặp lại việc tìm kiếm (quay lại bước thứ hai) để có được kết quả tư


vấn tốt hơn.


21

Sự tương tác với người dùng là một phần quan trọng của các hệ tư vấn
dựa trên tri thức vì qua đó người dùng có thể nhập các ràng buộc hay trường
hợp, xem xét kết quả gợi ý, điều chỉnh các ràng buộc hay trường hợp để lặp
lại việc tìm kiếm nhằm thu được các gợi ý tốt hơn. Các giao diện tìm kiếm
thường được sử dụng trong hệ tư vấn dựa trên ràng buộc trong khi các giao
diện dựa trên điều hướng (giao diện phản biện) thường được sử dụng trong
các hệ tư vấn dựa trên trường hợp.
1.4.4.2. Các kỹ thuật được sử dụng

Tư vấn dựa trên ràng buộc
Để hỗ trợ người dùng tại bước xác định các ràng buộc (các yêu cầu trên
thuộc tính mục), một số phương pháp tìm giá trị mặc nhiên đã được đề xuất
như tính giá trị trung bình [10], tìm một láng giềng gần nhất hoặc bầu cử đa số
có trọng số (weighted mojority voter). Để xếp hạng các mục được so khớp,
một số cách tiếp cận đã được đề xuất. Cách đơn giản nhất là xếp hạng các
mục theo một thuộc tính (có giá trị số) được xác định bởi người dùng. Những
cách làm phổ biến hơn là sử dụng hàm tiện ích (utility function) hoặc sử dụng
phương pháp phân tích kết hợp [11]. Sau quá trình so khớp, kết quả trả về có
thể là một tập rỗng (khơng có gợi ý nào) hoặc một danh sách các gợi ý chưa
đáp ứng được yêu cầu của người dùng. Một số phương pháp đã được đề xuất
để xử lý những tình huống này như Quickxplain and Minrelax. Các phương
này thường xác định các nhóm nhỏ gồm những ràng buộc vi phạm, sau đó đề
xuất những điều chỉnh thích hợp nhất dựa trên một số tiêu chí được xác định
trước.

Tư vấn dựa trên trường hợp
Độ đo tương tự là rất quan trọng trong việc tìm kiếm các mục có ý
nghĩa cho một truy vấn cụ thể. Việc phát triển một hàm tương tự dạng đóng
với các tham số được thiết lập bởi chuyên gia lĩnh vực hoặc có thể được tinh


22

chỉnh bởi quá trình học là rất cần thiết. Một số hàm tương tự đã được đề xuất
như hàm tương tự cục bộ, các hàm tương tự đối xứng và không đối xứng [10].
Khi thiết kế hàm tương tự, các loại thuộc tính (định danh hay số, đối xứng hay
khơng đối xứng) và tầm quan trọng tương đối (trọng số) của các thuộc tính
khác nhau phải được quan tâm. Các mơ hình hồi quy tuyến tính hoặc các
phương pháp học khác đã được sử dụng trong việc học giá trị trọng số của các
thuộc tính. Ngồi độ đo tương tự, hệ tư vấn dựa trên trường hợp còn sử dụng
phương pháp phản biện/phê bình (critique method) để hỗ trợ các mục tiêu
thăm dò khác nhau. Các phản biện được thiết kế để cung cấp cho người dùng
khả năng viết câu truy vấn khác đi một chút (thay đổi các yêu cầu lên một
hoặc nhiều thuộc tính của mục mà người đó thích) sau khi xem kết quả truy
vấn.
1.4.4.3. Các lợi thế và nhược điểm của hệ tư vấn

Hệ tư vấn dựa trên tri thức có một số lợi thế:


Thường hiệu quả khi xử lý các vấn đề người dùng mới và mục mới vì

hầu hết các hệ tư vấn dựa loại này chủ yếu dựa vào yêu cầu của người dùng
và chỉ kết hợp với một số lượng nhỏ dữ liệu lịch sử.



Rất phù hợp để gợi ý các mặt hàng không được mua thường xuyên.

Tuy nhiên, hệ tư vấn dựa trên tri thức vẫn còn những nhược điểm sau:


Dữ liệu lịch sử bị bỏ qua. Do đặc điểm của hệ tư vấn dựa trên tri thức

mà dữ liệu lịch sử ít được sử dụng, điều này gây “lãng phí”, đặc biệt là trong
trường hợp mà dữ liệu này là có sẵn.


Việc xây dựng cơ sở tri thức mất nhiều cơng sức vì cơ sở tri thức được

lấy từ các thông tin công khai, các chuyên gia về lĩnh vực, những kinh nghiệm
trong quá khứ hoặc từ việc khai phá các tập dữ liệu lịch sử.


Sự tương tác giữa người dùng và hệ thống có thể phát sinh nhiều vấn

đề. Sự tương tác là một phần quan trọng của các hệ tư vấn dựa trên tri thức.


×