Tải bản đầy đủ (.pdf) (96 trang)

Nghiên cứu và ứng dụng kỹ thuật SVD vào hệ thống gợi ý

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.05 MB, 96 trang )

ĐẠI HỌC ĐÀ NẴNG
TRƢỜNG ĐẠI HỌC BÁCH KHOA
-----  -----

PHẠM HOÀNG TRƢƠNG

NGHIÊN CỨU VÀ ỨNG DỤNG
KỸ THUẬT SVD VÀO HỆ THỐNG GỢI Ý

LUẬN VĂN THẠC SĨ
KHOA HỌC MÁY TÍNH

Đà Nẵng - Năm 2018


ĐẠI HỌC ĐÀ NẴNG
TRƢỜNG ĐẠI HỌC BÁCH KHOA
-----  -----

PHẠM HOÀNG TRƢƠNG

NGHIÊN CỨU VÀ ỨNG DỤNG
KỸ THUẬT SVD VÀO HỆ THỐNG GỢI Ý

Chuyên ngành: KHOA HỌC MÁY TÍNH
Mã số: 60.48.01.01

LUẬN VĂN THẠC SĨ

Ngƣời hƣớng dẫn khoa học:
TS. NGUYỄN VĂN HIỆU



Đà Nẵng - Năm 2018


LỜI CAM ĐOAN
Tôi xin cam đoan:
Những nội dung trong luận văn này là do tôi thực hiện dưới sự hướng dẫn
trực tiếp của TS. Nguyễn Văn Hiệu.
Mọi tham khảo dùng trong luận văn đều được trích dẫn rõ ràng tên tác giả,
tên công trình, thời gian, địa điểm công bố.
Mọi sao chép không hợp lệ, vi phạm quy chế đào tạo, hay gian trá, tôi xin
chịu hoàn toàn trách nhiệm.
Tác giả luận văn

Phạm Hoàng Trƣơng


MỤC LỤC
LỜI CAM ĐOAN
MỤC LỤC
ANH MỤC C C TỪ VI T TẮT
DANH MỤC CÁC CÁC BẢNG
DANH MỤC CÁC HÌNH
MỞ ĐẦU .............................................................................................................. 1
1. Lý do chọn đề tài ............................................................................................... 1
2. Mục tiêu và nhiệm vụ của đề tài ....................................................................... 2
3. Đối tƣợng và phạm vi nghiên cứu ..................................................................... 3
4. Phƣơng pháp nghiên cứu ................................................................................... 3
5. Ý nghĩa khoa học và thực tiễn của đề tài .......................................................... 3
6. Bố cục luận văn ................................................................................................. 3

Chƣơng 1 - TỔNG QUAN DU LỊCH QUẢNG NGÃI VÀ HỆ THỐNG GỢI
Ý……. ................................................................................................................... 4
1.1 TỔNG QUAN VỀ DU LỊCH QUẢNG NGÃI .........................................................4
1.2. CÁC PHƢƠNG PHÁP GỢI Ý .................................................................................8
1.2.1. Phƣơng pháp gợi ý dựa trên nội dung ...................................................................8
1.2.2. Phƣơng pháp gợi ý dựa trên lọc cộng tác .............................................................. 9
1.2.3. Phƣơng pháp gợi ý lai .......................................................................................... 11
1.3 HỆ THỐNG GỢI Ý .................................................................................................11
1.3.1. Giới thiệu .............................................................................................................11
1.3.2. Bài toán tổng quát của hệ thống gợi ý .................................................................14
1.3.3. Chức năng hệ thống gợi ý ....................................................................................15
1.3.4 Dữ liệu và các nguồn tri thức ...............................................................................18
1.3.4.1. Sản phẩm ..........................................................................................................18
1.3.4.2. Ngƣời dùng .......................................................................................................19
1.3.4.3. Giao dịch...........................................................................................................19


KẾT LUẬN CHƢƠNG 1 .............................................................................................. 20
Chƣơng 2 – CÁC KỸ THUẬT PHÂN RÃ ................................................................ 21
2.1 KỸ THUẬT SVD ....................................................................................................21
2.1.1. Giới thiệu .............................................................................................................21
2.1.2. Phát biểu bài toán ................................................................................................ 22
2.1.3. Ý tƣởng thực hiện ................................................................................................ 22
2.1.4. Hƣớng tiếp cận Truncated SVD ..........................................................................23
2.1.5. Thuật toán SVD ...................................................................................................25
2.2 KỸ THUẬT PHÂN RÃ MA TRẬN-MF ................................................................ 27
2.2.1 Giới thiệu ..............................................................................................................27
2.2.2 Ý tƣởng thực hiện .................................................................................................28
2.2.3 Thuật toán MF ......................................................................................................31
2.3. KỸ THUẬT NN-MF .............................................................................................. 31

2.3.1 Giới thiệu ..............................................................................................................31
2.3.2 Thuật toán về NN-MF .......................................................................................... 32
KẾT LUẬN CHƢƠNG 2 .............................................................................................. 33
Chƣơng 3 - XÂY DỰNG HỆ THỐNG GỢI Ý VÀ Đ NH GI ................................ 34
3.1 MÔ TẢ HỆ THỐNG ............................................................................................... 34
3.2 PHÂN TÍCH, THIẾT KẾ VÀ XÂY DỰNG HỆ THỐNG .....................................37
3.2.1 Sơ đồ ca sử dụng ..................................................................................................38
3.2.2 Sơ đồ hoạt động và sơ đồ tuần tự .........................................................................40
3.2.3 Cơ sở dữ liệu ........................................................................................................43
3.2.4 Một số giao diện minh họa của hệ thống ............................................................. 46
3.3 ĐÁNH GIÁ KẾT QUẢ THỬ NGHIỆM ............................................................... 50
3.3.1 Phƣơng pháp Truncated SVD..............................................................................50
3.3.2 Phƣơng pháp MF .................................................................................................51
3.3.3 Phƣơng pháp NN-MF .......................................................................................... 52
KẾT LUẬN CHƢƠNG 3 .............................................................................................. 54
K T LUẬN VÀ HƢỚNG PHÁT TRIỂN ................................................................. 55
1. Kết luận......................................................................................................................55


2. Hƣớng phát triển ........................................................................................................ 56
TÀI LIỆU THAM KHẢO
PHỤ LỤC


TÓM TẮT LUẬN VĂN

NGHIÊN CỨU VÀ ỨNG DỤNG KỸ THUẬT SVD
VÀO HỆ THỐNG GỢI Ý
Học viên:Phạm Hoàng Trƣơng
Mã số: 60.48.01

Khóa: K33

Chuyên ngành: Khoa học máy tính
Trƣờng Đại học Bách khoa - ĐHĐN

Tóm tắt - Hệ thống gợi ý (Recommender Systems - RS) đang đƣợc ứng dụng
rộng rãi trong nhiều lĩnh vực (nhƣ thƣơng mại điện tử, giải trí, giáo dục,...) nhằm dự
đoán sở thích của ngƣời dùng nhờ vào thông tin cá nhân hoặc những phản hồi (đánh
giá) của họ. Luận văn tập trung nghiên cứu hệ thống gợi ý theo ngữ cảnh, áp dụng cho
gợi ý các địa điểm du lịch phù hợp nhất với ngƣời dùng. Hệ thống kết hợp phƣơng
pháp SVD (Singular Value Decomposition), phƣơng pháp phân rã ma trận MF (matrix
factorization), phƣơng pháp phân rã ma trận không âm NN-MF (Nonnegative Matrix
Factorization) nhằm tăng độ chính xác cho hệ thống. Sau khi xây dựng hệ thống và
tích hợp các giải thuật gợi ý, tôi thu thập thông tin từ ngƣời dùng thực nhằm đánh giá
hiệu quả của hệ thống đã đề xuất. Thực nghiệm cho thấy việc ứng dụng giải pháp này
trong hỗ trợ phát triển du lịch là hoàn toàn khả thi.
Từ khóa - Hệ thống gợi ý, kỹ thuật SVD, kỹ thuật phân rã ma trận MF, kỹ
thuật NN-MF.

RESEARCH AND APPLICATION SVD RECOMMENDATION
SYSTEMS
Abstract - Recommender Systems are widely used in many areas, such as in ecommerce (for online shopping), in entertainments (for movie recommendation, music
recommendation, etc) and so on, to predict users‟ preference based on their past
preferences/behaviors. In this work, propose an approach for Research Recommender
Systems. Then applying this approach for a recommendation system so that the system
can recommend appropriate places to tourists. This system combines several
approaches such as Singular Value Decomposition, matrix factorization, Nonnegative
Matrix Factorization to improve the prediction accuracy of the model. Experimental
results show that this is a promising approach for building Tourist Recommender
Systems.

Key words - Recommender Systems, Singular Value Decomposition, matrix
factorization, Nonnegative Matrix Factorization.


ANH MỤC C C TỪ VI T TẮT
CF
SVD
MF
RS
NN-MF

Collaborative filtering (Lọc cộng tác)
Singular Value Decomposition (Kỹ thuật phân rã giá trị
đơn)
Matrix Factorization (Kỹ thuật phân rã ma trận)
Recommender Systems (Hệ thống gợi ý)
Nonnegative Matrix Factorization (Kỹ thuật phân rã ma
trận không âm)


DANH MỤC CÁC BẢNG
Số hiệu
bảng
3.1.
3.2.
3.3.
3.4.
3.5.
3.6.
3.7.

3.8.
3.9.
3.10.
3.11.
3.12
3.13
3.14
3.15
3.16
3.17

Tên bảng
Bảng khách hàng
Bảng loại tin
Bảng địa điểm
Bảng quảng cáo
Bảng đánh giá
Bảng loại hình
Bảng đặt lịch tham quan
Bảng quản trị
Bảng Menu
Bảng liên hệ
Bảng tin tức

Trang
44

Tập dữ liệu thử nghiệm

45

45
45
46
46
46
46
46
47
47
49

Kết quả chạy thực thi
Kết quả chạy thực thi với cùng bộ dữ liệu input2.txt
Kết quả chạy thực thi
Mức độ cải thiện
Kết quả thử nghiệm tổng quát trên độ đo RMSE

50
50
51
52
52


DANH MỤC CÁC HÌNH

Số hiệu
hình
1.1.
1.2

2.1.

Tên hình

Trang
10
15
24

2.3.
2.4.
3.1.
3.2.
3.3.
3.4.
3.5.
3.6.
3.7.
3.8.
3.9.
3.10.
3.11.
3.12.
3.13.
3.14.
3.15.

Minh hoạ hệ thống gợi ý
Ma trận đánh giá ngƣời dùng
SVD cho ma trận a khi: m<n (hình trên), và m>n (hình dƣới).

Biểu diễn svd dạng thu gọn và biểu diễn ma trận dƣới dạng
tổng các ma trận có rank bằng 1
Minh họa kỹ thuật phân rã ma trận
Minh hoạ dự đoán ngƣời dùng thứ 3 cho item thứ 3
Quy trình sử dụng website
Sơ đồ kiến trúc tổng thể của hệ thống
Sơ đồ ca sử dụng tổng quát của hệ thống
Sơ đồ ca sử dụng khách hàng
Sơ đồ ca sử dụng ngƣời quản trị
Sơ đồ hoạt động chức năng gợi ý
Sơ đồ tuần tự chức năng gợi ý
Sơ đồ hoạt động chức năng cập nhật nội dung
Sơ đồ tuần tự chức năng cập nhật nội dung
Sơ đồ hoạt động chức năng đánh giá
Sơ đồ tuần tự chức năng đánh giá
Sơ đồ quan hệ cơ sở dữ liệu
Giao diện liên hệ
Giao diện đăng nhập
Giao diện đăng ký

3.16.

Giao diện chính hệ thống

49

3.17.

Giao diện gợi ý địa điểm du lịch


49

3.18.

Giao diện thu thập thông tin đánh giá ngƣời dùng

50

3.19.

Giao diện tiện ích

50

3.20.

Biểu đồ đƣờng so sánh 3 nghiên cứu với 5 kịch bản thử nghiệm

53

3.21.

Biểu đồ cột so sánh 3 nghiên cứu với 5 kịch bản thử nghiệm

53

2.2.

25
29

31
36
38
39
40
40
41
41
42
42
43
43
44
47
48
48


1

MỞ ĐẦU
1. Lý do chọn đề tài
Du lịch từ lâu đã đƣợc ghi nhận nhƣ một sở thích, một hoạt động nghỉ
ngơi tích cực của con ngƣời. Ngày nay, du lịch đã trở thành một hiện tƣợng kinh
tế - xã hội phổ biến trên toàn thế giới, nó đƣợc xem nhƣ là một nhu cầu không
thể thiếu của con ngƣời và đƣợc coi là một tiêu chuẩn để đánh giá chất lƣợng
cuộc sống. Nhận thức đƣợc xu thế trên, ngành du lịch Quảng Ngãi với nhiều cố
gắng và thành quả góp phần đáng kể vào sự nghiệp phát triển du lịch chung của
quốc gia. Đến với Quảng Ngãi, chúng ta sẽ cảm nhận cái nắng gió của vùng đất
miền Trung với những bờ biển dài tuyệt đẹp và một chiều dài lịch sử với các di

tích lịch sử khá nổi tiếng. Hình ảnh ấy đã thu hút không ít du khách trong và
ngoài nƣớc phải một lần đặt chân đến mảnh đất này. Vì vậy, để tìm cho mình
một điểm du lịch phù hợp du khách cần lời khuyên trong trƣờng hợp này.
May thay, hệ thống gợi ý (Recommender system - RS) có thể chỉ ra các
thông tin phù hợp trong số thông tin khổng lồ chƣa có trật tự, nó sử dụng các kỹ
thuật lọc để chọn ra những loại thông tin đặc trƣng nhằm hiển thị các phần tử
phù hợp với sở thích ngƣời dùng, hệ thống có tích hợp tính năng gợi ý sẽ thu hút
đƣợc ngƣời dùng cả về sự hài lòng và tin cậy. Một số hệ thống gợi ý nhƣ
Amazon, Netflix, IDMb, Youtube, Last.fm, MovieLens,… đã tăng đƣợc số
lƣợng khách truy cập nhờ vào tính năng hỗ trợ quyết định này của hệ thống.
Các kĩ thuật lọc trong RS thƣờng đƣợc phân thành các nhóm: lọc dựa trên
nội dung (content - based filtering, dựa trên user profile), lọc cộng tác
(collaborative filtering – CF, dựa trên dữ liệu đánh giá trong quá khứ của user),
lai ghép (hybrid, kết hợp của hai phƣơng pháp trên) và lọc không cá nhân hóa
(non-personalization). Trong đó, nổi bật và đƣợc sử dụng nhiều nhất là kỹ thuật
lọc cộng tác bởi sự đơn giản trong việc thu thập thông tin (user, item và
feedback) của nó. Ƣu điểm của lọc cộng tác là nó có thể hoạt động tốt trong
trƣờng hợp thiếu hụt thông tin của đối tƣợng, có thể đƣa ra gợi ý mà không cần
thông tin hồ sơ ngƣời dùng (user profile). Chất lƣợng của hệ thống gợi ý cộng


2

tác phụ thuộc vào độ đo tƣơng tự và việc lựa chọn tập láng giềng. Tuy nhiên hạn
chế chính của CF là vấn đề dữ liệu thƣa, khả năng mở rộng và thiếu dữ liệu đánh
giá, vì vậy hệ thống chƣa đƣa ra đƣợc gợi ý tốt nhất.
Để hệ thống gợi ý có thể đƣa ra những dự đoán chính xác hơn ngƣời ta sử
dụng phƣơng pháp phân tích giá trị đơn SVD (Singular Value Decomposition)
vào hệ thống gợi ý. Giải thuật SVD đƣợc Golub và Kahan giới thiệu năm 1965,
đó là một công cụ phân rã ma trận hiệu quả đƣợc sử dụng để giảm hạng (hay số

chiều) của ma trận. Kỹ thuật này đƣợc áp dụng vào nhiều bài toán xử lý văn bản
khác nhau nhƣ tóm tắt văn bản, phát hiện sao chép, lập chỉ mục và truy vấn.
SVD cho phép phân tích một ma trận phức tạp thành ba ma trận thành phần.
Mục đích nhằm đƣa việc giải quyết bài toán liên quan đến ma trận lớn, phức tạp
về những bài toán nhỏ hơn. Vì vậy, ta áp dụng kỹ thuật SVD vào hệ thống gợi ý
để hệ thống gợi ý có thể dự đoán chính xác, phục vụ tốt một số bài toán gợi ý
thực tế, giúp ngƣời dùng đƣa ra quyết định chính xác hơn.
Với những lý do đó, tôi đã quyết định lựa chọn luận văn tốt nghiệp với đề
tài “Nghiên cứu và ứng dụng kỹ thuật SVD vào hệ thống gợi ý” để hệ thống
gợi ý có thể hỗ trợ ngƣời dùng dễ dàng tìm thấy những địa điểm du lịch phù hợp
với họ, giúp ngƣời dùng đƣa ra quyết định chính xác hơn.
2. Mục tiêu và nhiệm vụ của đề tài
2.1. Mục tiêu
- Xây dựng mô hình gợi ý mới sử dụng phƣơng pháp SVD.
- Ứng dụng mô hình đề xuất để xây dựng hệ thống gợi ý.
2.2. Nhiệm vụ
Để hệ thống đạt đƣợc mục tiêu đề ra, đề tài tiến hành giải quyết các nhiệm
vụ sau:
- Tìm hiểu về hệ thống du lịch Quảng Ngãi.
- Nghiên cứu, tìm hiểu kỹ thuật SVD.
- Đề xuất mô hình gợi ý sử dụng kỹ thuật SVD.
- Phân tích và thiết kế hệ thống gợi ý địa điểm du lịch sử dụng kỹ thuật SVD.


3

- Xây dựng và đánh giá hệ thống gợi ý.
3. Đối tƣợng và phạm vi nghiên cứu
3.1. Đối tượng nghiên cứu
- Kỹ thuật SVD (Singular Value Decomposition).

- Hệ thống gợi ý (Recommender system - RS).
- Hệ thống Du lịch Quảng Ngãi
3.2. Phạm vi nghiên cứu
- Tập trung vào phƣơng pháp SVD và các hƣớng cải tiến chúng.
- Ứng dụng cho hệ thống gợi ý tra cứu các địa điểm du lịch trong phạm vi
tỉnh Quảng Ngãi và đƣợc đƣa lên Internet.
4. Phƣơng pháp nghiên cứu
Trong luận văn đã sử dụng các phƣơng pháp sau:
- Tìm hiểu thực tế, tổng hợp thống kê dữ liệu về du lịch Quảng Ngãi.
- Kỹ thuật phân rã ma trận (matrix factorization – MF).
- Kỹ thuật SVD (Singular Value Decomposition).
- Phƣơng pháp đánh giá.
5. Ý nghĩa khoa học và thực tiễn của đề tài
- Ý nghĩa khoa học:
 Đề xuất đƣợc mô hình gợi ý mới sử dụng kỹ thuật SVD.
 Đề tài nghiên cứu trƣờng hợp riêng của kỹ thuật SVD.
 Góp phần vào công cuộc nghiên cứu và phát triển ứng dụng thông minh.
- Ý nghĩa thực tiễn:
 Ứng dụng triển khai tới ngƣời dùng, giúp tiết kiệm thời gian, chi phí
và tạo sự tiện dụng tối đa cho ngƣời dùng.
6. Bố cục luận văn
Ngoài phần mở đầu và kết luận, nội dung đề tài đƣợc chia thành 03 chƣơng:
Chƣơng 1 – Tổng quan du lịch Quảng Ngãi và hệ thống gợi ý
Chƣơng 2 – Các kỹ thuật phân rã
Chƣơng 3 – Xây dựng hệ thống gợi ý và đánh giá


4

Chƣơng 1 - TỔNG QUAN DU LỊCH QUẢNG NGÃI VÀ HỆ

THỐNG GỢI Ý
Trong chƣơng này, trình bày các lý thuyết về du lịch, điểm du lịch, giới
thiệu về du lịch Quảng Ngãi, khái niệm về hệ thống gợi ý, nêu bật tầm quan
trọng của điểm du lịch và giá trị của cơ sở dữ liệu đối với hệ thống gợi ý, đồng
thời phân tích một số website có chức năng tƣơng tự. Chƣơng này là cơ sở lý
luận cho các chƣơng tiếp theo.
1.1 TỔNG QUAN VỀ U LỊCH QUẢNG NGÃI
Du lịch là hành động rời khỏi nơi cƣ trú để đi đến một nơi khác, một môi
trƣờng khác trong một thời gian ngắn nhằm mục đích tìm hiểu, khám phá, vui
chơi, giải trí, nghỉ dƣỡng. Du lịch bao gồm mọi hoạt động của những ngƣời du
hành, tạm trú trong mục đích tham quan, khám phá và tìm hiểu, trải nghiệm
hoặc trong mục đích nghỉ ngơi, giải trí, thƣ giãn cũng nhƣ mục đích hành nghề
và những mục đích khác nữa trong thời gian liên tục nhƣng không vƣợt quá một
năm, ở bên ngoài môi trƣờng sống định cƣ, ngoại trừ mục đích thu lợi nhuận.
Nhƣ vậy, ta có thể hiểu du lịch là sự khởi hành và lƣu trú tạm thời của con ngƣời
ngoài nơi cƣ trú thƣờng xuyên của họ nhằm thỏa mãn những nhu cầu nhƣ giải
trí, nghỉ ngơi…
Điểm du lịch là một phạm vi cụ thể chứa đựng một nguồn lực tự nhiên hay
nhân tạo với mục đích thu hút và thỏa mãn một hoặc nhiều nhu cầu nhƣ nghỉ
ngơi, vui chơi, tham quan … của khách du lịch. Điểm du lịch là trung tâm chú ý
của du khách, là động lực ban đầu thúc đẩy du khách thực hiện quyết định du
lịch và đến với điểm đến có điểm du lịch mà họ mong muốn, nó cũng là nơi trực
tiếp thỏa mãn cũng nhƣ giải quyết nhu cầu du lịch của du khách.
Tỉnh Quảng Ngãi tựa vào dãy núi Trƣờng Sơn hƣớng ra Biển Đông với
chiều dài bờ biển 144 km, phía Bắc giáp tỉnh Quảng Nam với chiều dài đƣờng
địa giới 98 km, phía Nam giáp tỉnh Bình Định với chiều dài đƣờng địa giới
83 km, phía Tây giáp tỉnh Kon Tum với chiều dài đƣờng địa giới 79 km, phía


5


Đông giáp Biển Đông. Nằm ở vị trí trung độ của cả nƣớc, Quảng Ngãi cách thủ
đô Hà Nội 890 km về phía Bắc và cách Thành phố Hồ Chí Minh 824 km về phía
Nam theo đƣờng Quốc lộ 1A, giao thoa 2 miền khí hậu Bắc - Nam, địa hình da
dạng với núi, trung du, đồng bằng ven biển cùng với những ƣu thế về bề dày lịch
sử, văn hóa, con ngƣời, danh lam thắng cảnh... tạo cho Quảng Ngãi tiềm năng
lớn để phát triển du lịch.
Tỉnh Quảng Ngãi có đƣờng bờ biển kéo dài từ An Tân đến Sa Huỳnh nên
có nhiều bãi tắm đẹp nhƣ Mỹ Khê, Sa Huỳnh Khe Hai, Lệ Thủy, Minh Tân.
Quảng Ngãi có các di chỉ văn hóa Sa Huỳnh, Chùa Ông với kiến trúc là sự kết
hợp giữa văn hóa Trung Hoa và văn hóa Việt, Văn hóa ChămPa với Thành cổ
Châu Sa, ngoài khơi có đảo Lý Sơn với các di chỉ văn hóa Sa Huỳnh nhƣ Xóm
Ốc, suối Chình, văn hóa Chămpa. Quảng Ngãi có khu kinh tế Dung Quất, nhà
máy lọc dầu đầu tiên của cả nƣớc, góp phần đẩy mạnh tăng trƣởng kinh tế và
chuyển dịch nhanh cơ cấu kinh tế tỉnh theo hƣớng công nghiệp hoá, hiện đại
hoá. Với 23 di tích lịch sử văn hóa và 2 di tích danh nhân quốc gia hiện có
Quảng Ngãi còn có hơn 100 di tích cấp tỉnh và đang từng bƣớc lập hồ sơ đề nghị
Bộ Văn hóa thông tin công nhận nhằm bảo tồn và phát huy giá trị.
Có lẽ không có tỉnh nào, ngoài các di tích cách mạng, di tích danh nhân, di
tích thắng cảnh, hội đủ các loại hình du lịch: du lịch tâm linh, du lịch di tích lịch
sử cách mạng, du lịch nghỉ dƣỡng biển và du lịch sinh thái, Quảng Ngãi còn có
các di tích căm thù và qua 2 cuộc kháng chiến, Quảng Ngãi cũng là nơi có các
cuộc đấu tranh đi vào lịch sử: Ba Tơ, Trà Bồng, Ba Gia, Vạn Tƣờng, khu chứng
tích Sơn Mỹ. Ngoài ra, tinh hoa văn hóa của cộng đồng các dân tộc anh em: Hrê,
Co, Xơ Ðăng, Thái, Nùng, Tày, Mƣờng, Dao, Ngái, Gia Rai, Êđê, Ba Na, Chăm,
Răglay, Tà Ôi, SiLa, Chứt cũng góp phần tạo nên sự đa dạng, phong phú và hấp
dẫn của du lịch Quảng Ngãi.
Các yếu tố tự nhiên kết hợp với các di sản văn hóa, truyền thống lịch sử của
Quảng Ngãi là nguồn tài nguyên vô cùng quý giá, tạo điều kiện thuận lợi cho
việc phát triển mạnh ngành du lịch. Quảng Ngãi với con ngƣời hiền hòa, thân



6

thiện và hiếu khách, luôn mong đƣợc chào đón du khách từ mọi nơi đến với
Quảng Ngãi.
Hệ thống thông tin Quảng Ngãi đã có các trang Website hỗ trợ đạt tour,
các hệ thống tra cứu trực tuyến. Các hệ thống này đã góp phần quảng bá, cung
cấp thông tin đến với du khách gần xa. Tuy nhiên các hệ thống này thiếu hỗ trợ,
cung cấp đánh giá và giới thiệu quảng bá còn nhiều hạn chế. Ngành du lịch còn
non trẻ, xuất phát điểm rất thấp; công tác thu hút đầu tƣ còn rất hạn chế; hệ
thống các doanh nghiệp hoạt động kinh doanh du lịch trong tỉnh còn hạn chế,
quy mô nhỏ, tính liên kết còn thấp; công tác quảng bá, xúc tiến du lịch và hạ
tầng kỹ thuật du lịch tại các khu du lịch, điểm du lịch còn nhiều hạn chế. Với
những lí do trên ta có thể sử dụng hệ thống gợi ý để du khách có thể đƣa ra
những lựa chọn tốt nhất.
Hiện nay, ở Việt Nam, có rất nhiều website cung cấp thông tin về du lịch.
Tuy nhiên, hầu hết các website đều thuộc vào hai dạng chính dƣới đây:
Các trang bán tour trực tuyến:
Các website này cung cấp các thông tin về giá tour, giá vé, giá khách sạn,
hành trình tour… và các dịch vụ liên quan, tập trung quảng cáo và thúc đẩy việc
bán tour cho đơn vị lữ hành là chính.
Website tiêu biểu ở dạng này là travel.com.vn là trang mạng bán tour trực
tuyến của đơn vị lữ hành Vietravel. Trang này cho phép ngƣời dùng tìm tour
theo một số thông tin nhƣ : nơi đến, thời gian khởi hành, giá tour, khuyến mãi…
sau đó đặt tour và thanh toán trực tuyến ngay trên website. Trong thông tin về
tour du lịch, ngoài các vấn đề về giá cả hay khuyến mãi thì website cũng đƣa ra
thông tin tại các điểm du lịch nhƣ đến điểm du lịch nào, làm gì, xem gì, mua gì ở
đó… Bên cạnh đó, website cũng cho phép ngƣời dùng viết lại ý kiến hay thắc
mắc của mình tại mỗi tour để đƣợc giải đáp.

Các website này có thiết kế giao diện đẹp mắt, thuận tiện cho ngƣời dùng,
nội dung về các tour du lịch khá đầy đủ, chi tiết, phạm vi các điểm du lịch rộng
lớn cả trong và ngoài nƣớc.


7

Tuy nhiên, thông tin về các điểm du lịch còn sơ sài, chỉ thấy đƣợc tour giá
rẻ mà không thấy đƣợc tour đƣợc ƣa chuộng, không thấy đƣợc thái độ của khách
đối với các điểm du lịch trong mỗi tour.
Cẩm nang du lịch:
So với các trang bán tour trực tuyến thì những website này tập trung trình
bày nhiều hơn về điểm đến và điểm du lịch, nó cung cấp những thông tin về
chùm điểm du lịch, ẩm thực, văn hóa…tại mỗi điểm đến, có thu thập ý kiến
đánh giá của ngƣời dùng. Tuy nhiên, các trang web dạng này vẫn mang tính
quảng bá và thúc đẩy tăng doanh thu cho nhà cung cấp, chứ chƣa tập trung vào
tƣ vấn cho ngƣời dùng.
Điểm mạnh là blog có giao diện đơn giản nhƣng thể hiện đƣợc đầy đủ nội
dung, blog cũng giới thiệu, miêu tả về một số điểm du lịch khá đầy đủ và hấp
dẫn, đƣa thêm thông tin về các điểm ăn uống, phƣơng tiện đi lại, khách sạn gần
các điểm du lịch. Các điểm du lịch đƣợc phân loại theo điểm đến một cách chi
tiết, cho phép ngƣời dùng đánh giá, like và chia sẻ qua facebook. Nhƣng số
lƣợng và phạm vi các điểm du lịch đƣợc giới thiệu là quá lớn nên blog chỉ đƣa
nội dung chi tiết tại một số điểm du lịch còn lại hầu nhƣ mang tính chất giới
thiệu, không có nhiều hình ảnh cũng nhƣ các thông tin về địa chỉ cũng nhƣ cách
thức liên hệ vì thế sẽ gây khó khăn cho những khách du lịch cá nhân hoặc tự túc.
Tuy có phần đánh giá của ngƣời dùng nhƣng không có phần tạo tài khoản ngƣời
dùng nên cũng khó sử dụng đƣợc dữ liệu này cho hệ thống gợi ý du lịch.
Nhƣ vậy, các website du lịch ở Việt Nam hiện nay chủ yếu tập trung hỗ
trợ công việc đặt tour, bán tour cho các đơn vị lữ hành. Mặc dù thông tin ngƣời

dùng cùng với đánh giá của họ là nguồn CSDL quan trọng cho hệ thống gợi ý
du lịch, song trên thực tế các hệ thống gợi ý du lịch ở những website này vẫn
còn nghiêng về phục vụ lợi ích của các nhà cung cấp nên không chú trọng việc
thu thập thông tin cá nhân của ngƣời dùng và cũng không có một nguồn CSDL
nào phù hợp để sử dụng. Dữ liệu đánh giá của ngƣời dùng tại các website này là
không đầy đủ dẫn đến việc gây khó khăn cho các thống kê, hoặc làm giảm chất


8

lƣợng của kết quả gợi ý. Một đặc điểm khác đó là phạm vi điểm đến và điểm du
lịch đƣợc giới thiệu tại các website du lịch hiện nay quá rộng lớn, cả trong
nƣớc, ngoài nƣớc và ở các châu lục khác nhau, đây là thế mạnh trong du lịch
tuy nhiên nó cũng tạo ra một nhƣợc điểm lớn: dữ liệu, thông tin cho mỗi điểm
đến hay điểm du lịch thƣờng ít đƣợc đầy đủ và hoàn thiện. Do đó, luận văn đã
đề xuất phạm vi nội dung tập trung vào một khu vực cụ thể đó là Quảng Ngãi,
vùng đất du lịch tiềm năng chƣa đƣợc khai thác hiệu quả. Từ đây, việc xây
dựng một website nhằm thu thập thông tin đánh giá về một số địa điểm du lịch
ở Quảng Ngãi làm CSDL cho hệ thống gợi ý địa điểm du lịch là vô cùng cần
thiết.
1.2. C C PHƢƠNG PH P GỢI Ý
Có rất nhiều cách để gợi ý, ƣớc lƣợng hạng/điểm cho các sản phẩm nhƣ sử
dụng học máy, lý thuyết xấp xỉ, các thuật toán dựa trên kinh nghiệm… Theo
[10], các hệ thống gợi ý thƣờng đƣợc phân ba loại dựa trên cách nó dùng để ƣớc
lƣợng hạng của sản phẩm:
- Dựa trên nội dung (content-based): ngƣời dùng đƣợc gợi ý những sản
phẩm tƣơng tự nhƣ các sản phẩm từng đƣợc họ đánh giá cao.
- Cộng tác (collaborative): ngƣời dùng đƣợc gợi ý những sản phẩm mà
những ngƣời cùng sở thích với họ đánh giá cao.
- Lai ghép (hybrid): kết hợp cả phƣơng pháp dựa trên.

1.2.1. Phƣơng pháp gợi ý dựa trên nội dung
Hệ tƣ vấn dựa trên lọc nội dung là mô hình tƣ vấn thực hiện dựa trên việc
so sánh nội dung thông tin mô tả sản phẩm, nhằm tìm ra các sản phẩm tƣơng tự
với những sản phẩm mà ngƣời dùng đã từng quan tâm để giới thiệu cho họ
những sản phẩm này [2]. Ví dụ, trong hệ tƣ vấn phim, hệ thống sẽ tìm ra các đặc
tính chung của các phim nhƣ diễn viên, đạo diễn, thể loại mà ngƣời đã đánh giá
cao trong quá khứ để giới thiệu các phim có đặc tính tƣơng tự mà ngƣời dùng
chƣa xem. Các phƣơng pháp tiếp cận cho mô hình tƣ vấn dựa trên lọc nội dung
có nguồn gốc từ lĩnh vực truy vấn thông tin, trong đó mỗi sản phẩm đƣợc biểu


9

diễn bằng một hồ sơ sản phẩm, mỗi ngƣời dùng đƣợc biểu diễn bằng một hồ sơ
ngƣời dùng. Các phƣơng pháp dự đoán của mô hình này thực hiện dựa vào việc
xem xét các hồ sơ sản phẩm có mức độ phù hợp cao với hồ sơ ngƣời dùng.
Phƣơng pháp gợi ý dựa vào nội có một điểm mạnh sau: phƣơng pháp
không yêu cầu số lƣợng ngƣời dùng lớn; dự vào thông tin có sẵn để thực hiện
gợi ý các sản phẩm mới. Tuy nhiên, phƣơng pháp này còn chứa một dãy nhƣợc
điểm sau: Quá tập trung chuyên ngành - hệ tƣ vấn dựa trên lọc nội dung có
khuynh hƣớng giới thiệu các sản phẩm có sự tƣơng đồng với các sản phẩm mà
ngƣời dùng đã mua hoặc xếp hạng cao.Ví dụ, một độc giả quan tâm đến các bài
báo thuộc lĩnh vực kinh tế sẽ rất khó nhận đƣợc giới thiệu các bài báo thuộc lĩnh
vực thể thao hoặc công nghệ; Vấn đề trích chọn đặc trưng - hệ tƣ vấn dựa trên
lọc nội dung kế thừa và phát triển chủ yếu dựa vào các phƣơng pháp trích chọn
đặc trƣng trong lĩnh vực truy vấn thông tin. Để có một tập các đặc trƣng đầy đủ,
các thuộc tính sản phẩm và hồ sơ ngƣời dùng phải đƣợc biểu diễn dƣới dạng phù
hợp để máy tính có thể tự động phân tích, tính toán trọng số các đặc trƣng nội
dung. Vấn đề này sẽ càng khó khăn hơn khi phải trích chọn các đặc trƣng nội
dung cho các đối tƣợng dữ liệu đa phƣơng tiện nhƣ hình ảnh, âm thanh hay dịch

vụ.
1.2.2. Phƣơng pháp gợi ý dựa trên lọc cộng tác
Hệ tƣ vấn dựa trên lọc cộng tác (collaborative filtering) [5], [6] đã đƣợc
ứng dụng thành công trong nhiều ứng dụng thƣơng mại điện tử nhƣ Amazon [4],
Netflix [3]. Nó là một trong những giải pháp hiệu quả để giải quyết vấn đề bùng
nổ thông tin cho các hệ thống trực tuyến nơi mà số lƣợng ngƣời dùng tăng lên
rất nhanh [2]. Hệ tƣ vấn dựa trên lọc cộng tác giới thiệu các sản phẩm cho ngƣời
dùng cụ thể dựa trên sự tƣơng đồng của các sản phẩm đã đƣợc xếp hạng bởi các
ngƣời dùng khác. Hệ thống tìm các sản phẩm cho các ngƣời dùng khác mà họ có
cùng sở thích với ngƣời dùng cần tƣ vấn. Ví dụ, trong hệ thống lọc cộng tác giới
thiệu phim cho ngƣời dùng, hệ thống tìm nhóm ngƣời dùng trong quá khứ có
cùng sở thích với ngƣời dùng cần tƣ vấn. Sau đó, hệ thống giới thiệu các phim


10

đƣợc đánh giá cao bởi nhóm ngƣời dùng này cho ngƣời dùng cần tƣ vấn. Hệ tƣ
vấn dựa trên lọc cộng tác đƣợc phân chia thành hai nhóm:
- Nhóm dựa trên bộ nhớ [6]: Các hệ tƣ vấn thuộc nhóm này sử dụng toàn
bộ các sản phẩm đƣợc xếp hạng để sinh ra kết quả tƣ vấn hoặc dự đoán.
- Nhóm dựa trên mô hình [6]: Các hệ tƣ vấn thuộc nhóm này cho phép hệ
thống học cách nhận dạng mẫu trong tập dữ liệu để sinh ra kết quả tƣ vấn hoặc
dự đoán.
Phƣơng pháp gợi ý dựa vào lọc cộng tác có ƣu điểm: việc tính toán tƣơng
đối đơn giản, nhanh chóng và hiệu quả trong quá trình gợi ý. Bởi vì hệ này
không yêu cầu mô tả nội dung một cách tƣờng minh mà chỉ dựa vào sự đánh giá
của ngƣời dùng để ƣớc lƣợng xem có bao nhiêu ngƣời dùng đồng ý và không
đồng ý. Tuy nhiên, phƣơng pháp này tồn tại các nhƣợc điểm sau [2]: Vấn đề
người dùng mới (New User Problem)- Giống nhƣ hệ tƣ vấn dựa trên lọc nội
dung, để tìm chính xác các sản phẩm ngƣời dùng quan tâm, hệ tƣ vấn dựa trên

lọc cộng tác phải ƣớc lƣợng đƣợc sở thích của ngƣời dùng đối với các sản phẩm
mới thông qua những đánh giá của họ trong quá khứ. Trong trƣờng hợp một
ngƣời dùng mới, chƣa có bất cứ đánh giá nào cho các sản phẩm, khi đó hệ thống
không thể đƣa ra những kết quả tƣ vấn chính xác cho ngƣời dùng này; Vấn đề
sản phẩm mới (New Item Problem)- trong hệ thống thƣơng mại điện tử, các sản
phẩm thƣờng xuyên đƣợc bổ sung mới. Một sản phẩm mới sẽ không có bất cứ
đánh giá nào của ngƣời dung cho sản phẩm này. Do đó, hệ thống không thể tƣ
vấn sản phẩm này cho bất kỳ ngƣời dùng nào trong hệ thống; Vấn đề dữ liệu
thưa (Sparsity Data Problem)- kết quả dự đoán của hệ tƣ vấn dựa trên lọc cộng
tác phụ thuộc chủ yếu vào các đánh giá của ngƣời dùng đối với các sản phẩm
trong quá khứ (ma trận xếp hạng của ngƣời dùng cho các sản phẩm). Tuy nhiên,
trong các hệ thống thực tế, số lƣợng ngƣời dùng và số lƣợng sản phẩm là rất lớn
(hàng triệu ngƣời dùng và hàng nghìn sản phẩm), nhƣng mỗi ngƣời dùng chỉ
đánh giá trên một số sản phẩm mà họ quan tâm và mỗi sản phẩm chỉ đƣợc đánh


11

giá bởi một nhóm ngƣời dùng. Vì thế ma trận xếp hạng của ngƣời dùng cho các
sản phẩm luôn là một ma trận dữ liệu thƣa.
1.2.3. Phƣơng pháp gợi ý lai
Một hệ thống lai là sự kết hợp kỹ thuật lọc nội dung và lọc cộng tác cố gắng
sử dụng ƣu điểm của mỗi kỹ thuật. Ví dụ, phƣơng pháp lọc cộng tác gặp vấn đề
với các sản phẩm mới, nó không có thể gợi ý đối với các sản phẩm mà không có
xếp hạng. Điều này lại đơn giản đối với phƣơng pháp tiếp cận dựa trên nội dung
khi việc dự đoán cho các sản phẩm mới dựa trên mô tả của ngƣời dùng là tính
năng có sẵn và khá dễ dàng.
Với hai (hoặc hơn) kỹ thuật gợi ý cơ bản, một số cách đã đƣợc đề xuất cho
việc kết hợp chúng để tạo ra một hệ thống lai mới.
1.3 HỆ THỐNG GỢI Ý

1.3.1. Giới thiệu
Hệ thống gợi ý là hệ thống hỗ trợ ra quyết định nhằm gợi ý các thông tin
liên quan đến ngƣời dùng một cách dễ dàng và nhanh chóng, phù hợp với từng
ngƣời dùng. Hệ thống bao gồm các kỹ thuật và công cụ phần mềm nhằm đƣa ra
những gợi ý cho ngƣời dùng, đáp ứng nhu cầu của họ về một sản phẩm, dịch vụ
nào đó trên Internet. Những gợi ý đƣợc cung cấp nhằm hỗ trợ ngƣời dùng đƣa ra
quyết định lựa chọn những sản phẩm, dịch vụ phù hợp với nhu cầu và thị hiếu
của mình, chẳng hạn nhƣ: mua sản phẩm nào, nghe thể loại nhạc gì hay tin tức
trực tuyến nào nên đọc, ...
Hệ thống gợi ý thông thƣờng sẽ tập trung vào một mục tin hay sản phẩm
(item) cụ thể nào đó (CD, tin tức) theo thiết kế và giao diện đồ họa ngƣời dùng
kết hợp với kỹ thuật, thuật toán gợi ý nhằm sinh ra các gợi ý tuỳ chỉnh, cung cấp
những gợi ý có ích và hiệu quả cho sản phẩm đó .
Hệ thống gợi ý nhằm hƣớng dẫn những ngƣời dùng thiếu kinh nghiệm hoặc
chƣa đủ thẩm quyền để đánh giá số lƣợng áp đảo các item thay thế. Ví dụ, hệ
thống gợi ý giúp ngƣời dùng lựa chọn sách trên trang web của Amazon đã sử
dụng hệ thống gợi ý để cá nhân hoá các cửa hàng trực tuyến cho từng ngƣời


12

dùng (user). Khi hệ thống gợi ý đƣợc cá nhân hoá thì mọi ngƣời dùng hay nhóm
ngƣời dùng sẽ nhận đƣợc các gợi ý khác nhau từ những cá nhân khác.
Mô hình đơn giản nhất của hệ thống gợi ý khi đƣợc cá nhân hoá là danh
sách xếp hạng các sản phẩm. Khi thực hiện bảng xếp hạng này, hệ thống gợi ý
sẽ thử dự đoán những sản phẩm hoặc dịch vụ phù hợp nhất với ngƣời dùng dựa
trên sở thích và nhu cầu của họ. Để thực hiện đƣợc nhiệm vụ đó, hệ thống gợi ý
thu thập sở thích của ngƣời dùng đƣợc thể hiện qua hệ thống (xếp hạng cho các
sản phẩm) hoặc suy ra từ cách giải thích hành động của ngƣời dùng - là một tính
năng ẩn có ƣu tiên cho phần hiển thị của trang hoặc xem xét chuyển hƣớng đến

một trang khác.
Ví dụ minh họa cho hệ thống gợi ý: Một ngƣời dùng đăng nhập vào một hệ
thống website đọc sách, ngƣời này cần xem một quyển sách về văn học nhƣng
không biết là nên xem quyển sách nào, hệ thống website cần gợi ý cho ngƣời đó
xem một hoặc vài quyển sách mà dự đoán rằng ngƣời này sẽ thích quyển sách
mà đƣợc hệ thống gợi ý. Để gợi ý đƣợc cho ngƣời dùng, hệ thống cần thu thập
các thông tin về ngƣời dùng và các ngƣời dùng khác, thông tin các quyển sách.
Có một vài cách gợi ý truyền thống đơn giản nhất nhƣ chọn những quyển sách
đƣợc nhiều ngƣời ƣa thích nhất hoặc chọn những quyển mới nhất để gợi ý. Tuy
nhiên để nâng cao chất lƣợng của gợi ý cho ngƣời dùng, hệ thống gợi ý cần sử
dụng các thông tin của tất cả những ngƣời dùng và thông tin của tất cả các sản
phẩm, sử dụng các thuật toán để đƣa ra gợi ý phù hợp nhất cho ngƣời dùng.


13

Hình 1.1 Minh hoạ hệ thống gợi ý
Trong hầu hết các trƣờng hợp, bài toán gợi ý đƣợc coi là bài toán ƣớc
lƣợng xếp hạng (rating) của các item chƣa đƣợc ngƣời dùng xem xét. Việc ƣớc
lƣợng này thƣờng dựa trên những đánh giá đã có của chính ngƣời dùng đó
hoặc từ những ngƣời dùng khác. Những item có xếp hạng cao nhất sẽ đƣợc
dùng để gợi ý. Từ đó ngƣời dùng có những lựa chọn thích hợp với nhu cầu và
thị hiếu của mình.
Hệ thống gợi ý không chỉ đơn thuần là một dạng Hệ thống thông tin mà nó
còn là cả một lĩnh vực nghiên cứu hiện đang rất đƣợc các nhà khoa học quan
tâm. Kể từ năm 2007 đến nay, hàng năm đều có hội thảo chuyên về hệ thống gợi
ý của ACM (ACM RecSys) cũng nhƣ các tiểu bang dành riêng cho RS trong các
hội nghị lớn khác nhƣ ACM KDD, ACM CIKM,..
Đã có rất nhiều ứng dụng liên quan đến tích hợp RS vào thực tế trong nhiều
lĩnh vực khác nhau nhƣ Thƣơng mại điện tử, giải trí, giáo dục, khoa học phải kể

đến Amazon, Ebay, YouTube, Netflix, LastFM,… Một số ứng dụng mà các
nhóm nghiên cứu đã thực hiện trong thời gian gần đây nhƣ: đề xuất xây dựng hệ
thống gợi ý cho bán hàng trực tuyến sử dụng kỹ thuật lọc cộng tác sử dụng phản
hồi tƣờng minh từ ngƣời dùng thông qua các đánh giá trên sản phẩm; đề xuất
một giải pháp xây dựng hệ thống gợi ý dành cho bán hàng trực tuyến sử dụng
phản hồi tiềm ẩn từ ngƣời dùng. Trong lĩnh vực giải trí đã giới thiệu một giải


14

pháp trong xây dựng Hệ thống gợi ý bài hát dựa vào phản hổi tiềm ẩn từ ngƣời
dùng; đề xuất xây dựng hệ thống gợi ý phim dựa trên mô hình.
Tuy vậy, du lịch Quảng Ngãi vẫn chƣa thấy xuất hiện các nghiên cứu về
RS. Trong luận văn này, tôi giới thiệu sơ lƣợc về hệ thống gợi ý, các phƣơng
pháp cơ bản đƣợc sử dụng phổ biến nhất trong RS, sau đó đi sâu vào tìm hiểu
chi tiết phƣơng pháp, kỹ thuật nổi trội nhất hiện nay trong RS là kỹ thật SVD
(Singular Value Decomposition), kỹ thuật phân rã ma trận (matrix factorization
– MF), kỹ thuật NN-MF (Nonnegative Matrix Factorization) và để xây dựng hệ
thống gợi ý địa điểm du lịch tại Quảng Ngãi.
1.3.2 . Bài toán tổng quát của hệ thống gợi ý
Bài toán tƣ vấn đƣợc coi là bài ƣớc lƣợng trƣớc hạng (rating) của các sản
phẩm chƣa đƣợc ngƣời dùng xem xét [9]. Việc ƣớc lƣợng này thƣờng đƣợc dựa
trên những đánh giá đã có của chính ngƣời dùng đó hoặc những ngƣời dùng
khác. Những sản phẩm có hạng cao nhất sẽ đƣợc dùng để tƣ vấn. Một cách hình
thức, bài toán tƣ vấn đƣợc mô tả nhƣ sau:
i1

i2

u1


r1,1

r1,2

u2

r2,1

r2, 2







um

rm ,1

rm , 2







in

r1,n
r2,n


rm,n

Hình 1.2. Ma trận đánh giá của ngƣời dùng
Gọi U là tập hợp tất cả ngƣời dùng, I là tập hợp tất cả các sản phẩm có thể
tƣ vấn. Tập I có giá trị trong khoảng {1,n}, tập U có giá trị trong khoảng {1,m}.
Hàm f(u,i) đo độ phù hợp (hay hạng) của sản phẩm I với ngƣời dùng u : f : U x I
→ R với R là tập đƣợc sắp thứ tự. Với mỗi ngƣời dùng u  U , cần tìm sản phẩm
i ,  I sao cho hàm f(i‟,u) đạt giá trị lớn nhất [9]:

u U , iu'  arg max f (u, i)
Trong hệ tƣ vấn, độ phù hợp của một sản phẩm thƣờng đƣợc cho bằng
điểm ví dụ ngƣời dùng A đánh giá bộ pham “Star war 3” là mức 7 trên 10 điểm.


15

Tuy nhiên, cách đo độ phù hợp trong các hệ thống tƣ vấn có thể làm một hàm
bất kỳ tùy thuộc vào lĩnh vực ứng dụng cụ thể. Giá trị của hàm f(u,i) có thể đƣợc
xác định bởi ngƣời dùng hoặc đƣợc tính toán bởi công thức nào đó. Mỗi ngƣời
dùng trong không gian U đƣợc xác định bởi một hồ sơ ngƣời dùng (user profile).
Hồ sơ ngƣời dùng này có thể chỉ gồm một trƣờng mã số ngƣời dùng (user id)
duy nhất. Tƣơng tự nhƣ thế, mỗi sản phẩm trong không gian I cũng đƣợc xác
định bởi một tập các đặc trƣng. Ví dụ, trong hệ thống tƣ vấn các phim cho ngƣời
xem, đặc trƣng của mỗi phim có thể là: thể loại, đạo diễn, diễn viên.
Vấn đề chính của hệ tƣ vấn là hàm f(u,i) không đƣợc xác định trên toàn
không gian U x I mà chỉ trên một miền nhỏ của không gian đó [9]. Điều này dẫn

tới việc hàm f(u,i) phải đƣợc ngoại suy trong không gian U x I. Thông thƣờng,
độ phù hợp đƣợc thể hiện bằng điểm và chỉ xác định trên tập các sản phẩm đã
từng đƣợc ngƣời dùng đánh giá từ trƣớc thƣờng rất nhỏ. Có rất nhiều cách để dự
đoán, ƣớc lƣợng hạng hoặc điểm cho các sản phẩm nhƣ sử dụng học máy, lý
thuyết xấp sỉ, các thuật toán dựa trên kinh nghiệm và các thuật toán khác. Các hệ
thống tƣ vấn thƣờng đƣợc phân thành nhiều loại dựa trên cách nó sử dụng các
thuật toán để ƣớc lƣợng hạng hoặc điểm của các sản phẩm.
1.3.3 . Chức năng hệ thống gợi ý
Trƣớc hết, chúng ta phải phân biệt giữa vai trò hệ gợi ý của nhà cung cấp
so với vai trò hệ gợi ý của ngƣời dùng. Ví dụ, một hệ thống gợi ý du lịch thƣờng
đƣợc giới thiệu bởi một trung gian du lịch hoặc một tổ chức quản lý để tăng
doanh thu của nó qua việc cho thuê phòng khách sạn nhiều hơn hoặc để tăng số
lƣợng khách du lịch. Trong khi đó, động cơ của ngƣời dùng khi truy cập vào hai
hệ thống là tìm một khách sạn phù hợp với nhu cầu, túi tiền cùng các sự kiện thú
vị, các điểm hấp dẫn khi đến thăm một điểm đến.
Dƣới đây là một số chức năng của hệ thống gợi ý.
Đối với nhà cung cấp:
- Tăng số lượng các sản phẩm bán ra cho các hệ thống thương mại điện tử:
Đây có lẽ là chức năng quan trọng nhất của hệ thống gợi ý. Thay vì ngƣời dùng


×