HỌC VIỆN CƠNG NGHỆ BƢU CHÍNH VIỄN THƠNG
---------------------------------------
NGUYỄN NGỌC TUN
NGHIÊN CỨU XÂY DỰNG HỆ THỐNG
KHUYẾN NGHỊ SẢN PHẨM TRONG
THƢƠNG MẠI ĐIỆN TỬ VỚI DEEP LEARNING
LUẬN VĂN THẠC SĨ KỸ THUẬT
(Theo định hướng ứng dụng)
TP.HỒ CHÍ MINH - 2017
HỌC VIỆN CƠNG NGHỆ BƢU CHÍNH VIỄN THƠNG
---------------------------------------
NGUYỄN NGỌC TUN
NGHIÊN CỨU XÂY DỰNG HỆ THỐNG
KHUYẾN NGHỊ SẢN PHẨM TRONG
THƢƠNG MẠI ĐIỆN TỬ VỚI DEEP LEARNING
Chuyên ngành:
Mã số:
HỆ THỐNG THÔNG TIN
60.48.01.04
LUẬN VĂN THẠC SĨ KỸ THUẬT
(Theo định hướng ứng dụng)
NGƢỜI HƢỚNG DẪN KHOA HỌC: TS. PHẠM TRẦN VŨ
TP.HỒ CHÍ MINH - 2017
i
LỜI CAM ĐOAN
Tôi xin cam đoan luận văn này là cơng trình nghiên cứu hồn tồn của bản
thân. Trong tồn bộ nội dung của luận văn, những điều đƣợc trình bày hoặc là của
cá nhân tôi hoặc là đƣợc tổng hợp từ nhiều nguồn tài liệu. Tất cả các tài liệu tham
khảo đều có xuất xứ rõ ràng và đƣợc trích dẫn hợp pháp. Các số liệu, kết quả nêu
trong luận văn là trung thực và chƣa từng đƣợc ai cơng bố trong bất kỳ cơng trình
nào khác.
Tơi xin chịu hồn tồn trách nhiệm và chịu mọi hình thức kỉ luật theo quy
định cho lời cam đoan của mình.
TP.Hồ Chí Minh, ngày 25 tháng 05 năm 2017
Học viên thực hiện luân văn
Nguyễn Ngọc Tuyên
ii
LỜI CẢM ƠN
Đầu tiên, tôi xin phép đƣợc gửi lời cảm ơn chân thành nhất đến thầy Phạm
Trần Vũ. Thầy là ngƣời đã hƣớng dẫn và luôn theo sát tôi trong q trình làm luận
văn. Thầy ln tận tình chỉ bảo, hƣớng dẫn và đƣa ra những vấn đề trọng tâm của
vấn đề cần giải quyết và giúp tôi cũng cố thêm những kiến thức quan trọng, đƣa ra
định hƣớng đúng đắn, và ln tạo điều kiện để tơi có thể hồn thành ln văn. Tơi
xin chúc Thầy ln thành công trên con đƣờng giảng dạy, và cùng với gia đình
đƣợc nhiều sức khỏe và hạnh phúc.
Tiếp đến, tơi xin đƣợc gửi lời cảm ơn đến tất cả các Thầy, Cô đã và đang
giảng dạy ở Trƣờng Học Viện Công Nghệ Bƣu Chính Viễn Thơng đã truyền đạt
cho tơi thêm những kiến thức mới để hoàn thành luận văn này. Tôi xin chúc quý
Thầy, Cô luôn nhiều sức khỏe, hạnh phúc và thành đạt.
Cuối cùng, tôi cũng xin cảm ơn gia đình, bạn bè, đồng nghiệp đã ln quan
tâm, giúp đỡ, động viên tôi thực hiện luận văn tốt nghiệp cao học này.
TP.Hồ Chí Minh, ngày 25 tháng 05 năm 2017
Học viên thực hiện luân văn
Nguyễn Ngọc Tuyên
iii
MỤC LỤC
LỜI CAM ĐOAN ........................................................................................................ i
LỜI CẢM ƠN .............................................................................................................ii
MỤC LỤC ................................................................................................................. iii
DANH SÁCH HÌNH VẼ ............................................................................................ v
MỞ ĐẦU ..................................................................................................................... 1
1.
Tính cấp thiết của đề tài .................................................................................1
2.
Tổng quan vấn đề nghiên cứu........................................................................3
3.
Mục tiêu và nhiệm vụ nghiên cứu .................................................................5
4.
Đối tƣợng và phạm vi nghiên cứu .................................................................5
5.
Phƣơng pháp nghiên cứu ...............................................................................6
6.
Bố cục của luận văn .......................................................................................6
CHƢƠNG 1 – TỔNG QUAN VỀ THƢƠNG MẠI ĐIỆN TỬ ..............................7
1.1.
Giới thiệu .............................................. Error! Bookmark not defined.
1.2.
Các đặc điểm và cơ sở phát triển ............................................................ 9
1.3.
Hệ thống khuyến nghị sản phẩm trong thƣơng mại điện tử ................... 9
1.4.
Kết luận chƣơng .................................................................................... 13
CHƢƠNG 2 – MƠ HÌNH HỌC SÂU – DEEP LEARNING ...............................15
2.1.
Giới thiệu .............................................................................................. 15
2.2.
Mạng nơ ron nhân tạo trong deep learning ........................................... 17
2.3.
Huấn luyện mạng nơ ron nhân tạo ........................................................ 23
2.5.
Một số mơ hình mạng học sâu .............................................................. 25
2.6.
Kết luận chƣơng .................................................................................... 33
CHƢƠNG 3 – XÂY DỰNG HỆ THỐNG KHUYẾN NGHỊ SẢN PHẨM VỚI
DEEP LEARNING ...............................................................................................34
3.1.
Giới thiệu bài toán và phƣơng pháp tiếp cận ........................................ 34
3.2.
Hệ thống khuyến nghị sản phẩm với deep learning ............................. 37
3.3.
Tiêu chuẩn và đánh giá ......................................................................... 45
iv
3.4.
Kết luận chƣơng .................................................................................... 47
CHƢƠNG 4 – XÂY DỰNG HỆ THỐNG VÀ THỬ NGHIỆM ..........................48
4.1.
Môi trƣờng thực nghiệm ....................................................................... 48
4.2.
Dữ liệu thực nghiệm ............................................................................. 48
4.3.
Cài đặt bài toán ..................................................................................... 49
4.4.
Kết luận chƣơng .................................................................................... 56
KẾT LUẬN ............................................................................................................... 57
1.
Kết quả đạt đƣợc ................................................................................... 57
2.
Hƣớng nghiên cứu tiếp theo của luận văn ............................................ 57
DANH MỤC CÁC TÀI LIỆU THAM KHẢO ......................................................... 58
v
DANH SÁCH HÌNH VẼ
Hình 1.1. Hệ thống khuyến nghị ngƣời dùng của Amazon.com ......................... 10
Hình 2.1. Minh họa nơ ron sinh học ..................................................................... 17
Hình 2.2. Mạng nơ ron sinh học và mạng nơ ron nhân tạo ................................. 18
Hình 2.3. Cấu tạo một nơ ron nhân tạo ................................................................ 19
Hình 2.4. Cấu tạo của một mạng nơ ron nhân tạo đơn giản ................................ 21
Hình 2.5. Kiến trúc mạng nơ ron truyền thẳng .................................................... 22
Hình 2.6. Kiến trúc mạng nơ ron phản hồi ........................................................... 23
Hình 2.7. Mơ hình mạng MPL 3 lớp ẩn và lớp output ........................................ 26
Hình 2.8. Cấu trúc mạng Hopfield....................................................................... 28
Hình 2.9. Mạng nơ - ron hồi quy một lớp ............................................................. 30
Hình 2.10. Một Boltzmann Machine .................................................................... 30
Hình 2.11. Một Restricted Boltzmann Machine .................................................. 32
Hình 3.1. Quy trình của hệ thống khuyến nghị sản phẩm cho ngƣời dùng ......... 34
Hình 3.2. Minh họa ma trận đánh giá R ( Rating maxtrix).................................. 35
Hình 3.3. Giảm số chiều của vector ..................................................................... 37
Hình 3.4. Một ví dụ giảm số chiều vector ............................................................ 38
Hình 3.5. Kiến trúc mạng của bài tốn ................................................................ 39
Hình 3.6. Lan truyền tín hiệu trong q trình học theo lan truyền ngƣợc ........... 41
Hình 3.7. Lƣu đồ hoạt động của hàm huấn luyện ................................................ 44
Hình 4.1. Kiến trúc mạng xây dựng cho bài tốn ................................................. 50
Hình 4.2. Bảng kết quả độ lỗi sau 20 epochs và biểu đồ ..................................... 54
Hình 4.3. MAE validation ................................................................................... 65
Hình 4.4. MAE training ....................................................................................... 65
Hình 4.5. RMSE training và validation ............................................................... 65
Hình 4.6. Kết quả của những phƣơng pháp khác ................................................ 56
1
MỞ ĐẦU
1.
Tính cấp thiết của đề tài
Trong những năm gần đây, thƣơng mại điện tử [1] phát triển nhanh theo xu
thế tồn cầu hố. Thơng qua thƣơng mại điện tử nhiều hình thức giao dịch kinh
doanh mới đƣợc hình thành. Với các hình thức này ngƣời dùng có thể tiếp cận với
hàng hóa, dịch vụ một cách dễ dàng và nhanh chóng hơn rất nhiều so với phƣơng
pháp giao dịch truyền thống.
Với những lợi ích thế mạnh của mình, những website mua bán hàng hóa,
dịch vụ sẽ dần thay thế các gian hàng hay các siêu thị truyền thống. Nhƣng trên thực
tế ngƣời tiêu dùng vẫn còn rất ƣa chuộng với phƣơng pháp mua bán cũ. Một phần vì
hình thức mua bán cũ đã dần dần từng bƣớc chuyển từ thói quen thành một nếp văn
hóa, đó là văn hóa mua sắm. Khi đó ngƣời tiêu dùng xem hoạt động mua sắm là
hoạt động không thể thiếu trong đời sống hằng ngày. Mặt khác các website thƣơng
mại điện tử hiện nay dù đã đƣợc phát triển rất nhiều nhƣng thực sự vẫn chƣa thể
thay thế đƣợc các gian hàng thực. Một trong những nguyên nhân dẫn đến sự thua
kém này là yếu tố con ngƣời, ngoài ra một yếu tố khác nữa dẫn tới sự thua kém này
nằm ở chính các hệ thống website thƣơng mại điện tử đó. Các hệ thống mua bán
trực tuyến này luôn muốn ngƣời dùng tiếp cận nhiều mặt hàng cùng một lúc. Tuy
nhiên với sự đa dạng hàng hóa hiện nay thì khả năng tiếp cận chọn mặt hàng của
ngƣời dùng sẽ bị hạn chế, họ phải xem qua nhiều sản phẩm, đi tới nhiều liên kết để
có thể tìm ra sản phẩm mong muốn. Vậy làm sao để hỗ trợ khách hàng trong việc
mua bán đƣợc thuận lợi hơn? Cụ thể hơn là sản phẩm nào đƣợc đề xuất tới khách
hàng tiếp theo sau khi khách hàng đã đặt mua hoặc đánh giá một sản phẩm trƣớc
đó? Nên đề xuất bao nhiêu sản phẩm là tốt nhất cho khác hàng?
Để hình thức mua bán qua mạng thực sự phát triển thì bên cạnh các lợi thế
vốn có của mình việc có thêm một hệ thống trợ giúp là hết sức cần thiết. Hệ thống
2
khuyến nghị sản phẩm (recommendation system [6]) đƣợc hình thành và phát triển
khơng nằm ngồi mục đích đáp ứng những yêu cầu trên. Một hệ thống tƣ vấn tốt có
thể đóng vai trị nhƣ ngƣời trung gian hỗ trợ khách hàng đƣa ra quyết định chọn
hàng. Tiện ích này đóng vai trị nhƣ một ngƣời bán hàng có khả năng thu thập thơng
tin về sở thích của khách hàng, sau đó tìm trong kho hàng vơ tận của mình những
mặt hàng thích hợp nhất với sở thích đó. Thực chất của một hệ thống khuyến nghị
sản phẩm là quá trình hỗ trợ khách hàng đƣa ra quyết định.
Các hệ thống khuyến nghị sản phẩm là một tính năng phổ biến của website
và ứng dụng di động nhằm mục đích tƣ vấn cho khách hàng những mặt hàng thích
hợp nhất. Những doanh nghiệp lớn nhƣ Netflix, Amazon, Google, Facebook, và
Twitter đã truy cập vào nguồn dữ liệu dồi dào do ngƣời dùng phát sinh ra. Việc truy
cập vào dữ liệu cho phép các doanh nghiệp này có thể triển khai những hệ thống
khuyến nghị nhằm cung cấp nhiều giá trị hơn cho cả ngƣời dùng và chính họ.
Theo các thống kê đƣợc cơng bố của một số cơng ty lớn thì hệ thống khuyến
nghị giúp tăng lƣợt giao dịch đáng kể. Ví dụ nhƣ cơng ty Netflix, 2/3 các bộ phim
mà ngƣời dùng xem trên Netflix là do đƣợc khuyến nghị. Hệ thống khuyến nghị của
Google News làm tăng số lƣợng kích chuột vào các đƣờng dẫn lên đến 38%, và
35% các mặt hàng trên Amazon đều do hệ thống khuyến nghị cung cấp.
Lọc cộng tác (Collaborative filtering [6]) và lọc dựa trên nội dung (contentbased filtering [6]) là hai hƣớng tiếp cận truyền thống để thiết kế các hệ thống
khuyến nghị. Những phƣơng pháp này thông thƣờng dựa vào các đánh giá của các
mục làm nguồn thơng tin chính để đƣa ra các khuyến nghị mà trong thực tế có rất
nhiều ứng dụng thì các đánh giá này rất ít, có thể khắc phục đƣợc điều này bằng
cách lấy nội dung thông tin của các mục để làm nguồn thông tin phụ trợ nhƣng khi
nguồn thông tin này không đủ lớn thì sẽ làm ảnh hƣởng tới kết quả mong muốn đạt
đƣợc.
Deep learning [10] là một trong những hƣớng nghiên cứu rất phát triển của
lĩnh vực trí tuệ nhân tạo trong những năm gần đây. Các mơ hình học sâu (Deep
3
learning) đã tạo nên những đột phá lớn trong việc giải quyết các bài tốn phức tạp.
Nó là thuật tốn dựa trên một số ý tƣởng từ não bộ với việc tiếp thu nhiều tầng biểu
đạt, cả cụ thể lẫn trừu tƣợng, qua đó làm rõ nghĩa của các loại dữ liệu. Điều đặc biệt
của công nghệ Deep Learning là sự chính xác cao của nguồn dữ liệu khổng lồ,
khơng bị hạn chế bởi sự quá tải của dữ liệu.
Chính vì vậy, chúng tơi đã chọn đề tài nghiên cứu là “ Nghiên cứu xây dựng
hệ thống khuyến nghị sản phẩm trong thƣơng mại điện tử với Deep learning” làm
đề tài nghiên cứu của mình.
2.
Tổng quan vấn đề nghiên cứu
Với tốc độ phát triển của thƣơng mại điện tử nhƣ ngày nay, để thúc đẩy các
giao dịch thông qua mạng máy tính thì việc xây dựng hệ thống khuyến nghị sản
phẩm là một cơng việc khơng thể thiếu. Đã có nhiều hệ thống khuyến nghị sản
phẩm đƣợc xây dựng. Tuy nhiên, để lựa chọn đƣợc phƣơng pháp phù hợp là một
cơng việc cần nghiên cứu.
Mơ hình xây dựng hệ thống khuyến nghị dựa trên sự tăng trƣởng của
Hotmail là mô hình tính tốn tốc độ tăng trƣởng của Email. Mơ hình có tác dụng dự
đốn xem có bao nhiêu cá nhân tại một thời điểm chấp nhận một sản phẩm nào đó
trong tổng số các cá nhân đƣợc mời sản phẩm.
Mơ hình xây dựng hệ thống khuyến nghị dựa trên phƣơng pháp lọc cộng tác
có thể hiểu một cách đơn giản là phƣơng pháp tập hợp các đánh giá của khách hàng,
phân biệt khách hàng trên cơ sở các đánh giá của họ và tƣ vấn các sản phẩm cho
khách hàng.
Báo cáo luận văn thạc sĩ “Movies recommendation system using
collaborative filtering technique supplemented by content with goal programming”
của tác giả Emrah İNAN, tháng 7, 2012. Nội dung tác giả nghiên cứu xây dựng hệ
4
thống khuyến nghị dành cho dữ liệu Movie sử dụng phƣơng pháp lọc cộng tác để
khai phá dữ liệu.
Bài báo khoa học “Restricted Boltzmann Machines for Collaborative
Filtering” của các tác giả Ruslan Salakhutdinov, Andriy Mnih, Geoffrey Hinton
2007. Nội dung các tác giả nghiên cứu phƣơng pháp lọc cộng tác với thuật toán
Restricted Boltzmann Machines.
Bài báo khoa học “Big Data Deep Learning: Challenges and Perspectives”
của tác giả X.-W. Chen, tháng 4, 2014. Nội dung tác giả phân tích những khó khăn
và triển vọng của Deep learning với thực trạng dữ liệu ngày càng lớn và phức tạp
ngày nay.
Trên đây là những nghiên cứu đã có liên quan tới hệ thống khuyến nghị sản
phẩm và tiềm năng của Deep learning khi áp dụng cho hệ thống khuyến nghị này.
Dựa vào những kiến thức tham khảo đƣợc từ những nguồn trên, luận văn của chúng
tôi tập trung nghiên cứu phƣơng pháp xây dựng hệ thống khuyến nghị sản phẩm với
Deep learning.
Khi xây dựng hệ thống khuyến nghị sản phẩm, việc đánh giá hiệu quả của
các phƣơng pháp có ý nghĩa quyết định. Để đánh giá khả năng của hệ thống khuyến
nghị sản phẩm phải áp dụng hệ thống đó vào thực tế. Đó là thuận lợi cho thí nghiệm
hệ thống khuyến nghị sản phẩm trên những khách hàng thực sự để đo đƣợc hiệu quả
của các phƣơng pháp. Tuy nhiên với các nhà nghiên cứu, thông thƣờng không thu
hút đƣợc số lƣợng khách hàng tới website để kiểm tra hiệu quả hoạt động. Với con
số khách hàng nhỏ, khơng thể đánh giá chính xác khả năng của hệ thống. Trong khi
đó, theo quan điểm cạnh tranh buôn bán trong thƣơng mại điện tử, các kết quả thí
nghiệm hệ thống ít khi đƣợc cơng bố. Đó là khó khăn cho việc xây dựng hệ thống
khuyến nghị sản phẩm, chỉ có thể đánh giá khả năng của hệ thống dựa vào dữ liệu
đã có dùng để nghiên cứu chứ chƣa áp dụng trong thực tế.
5
Trong phạm vi luận văn này, chúng tôi tập chung nghiên cứu chính vào các
vấn đề: thƣơng mại điện tử, hệ thống khuyến nghị sản phẩm trong thƣơng mại điện
tử, xây dựng hệ thống khuyến nghị sản phẩm với Deep learning. Bộ dữ liệu chúng
tôi dùng để cài đặt kiểm tra đánh giá là bộ dữ liệu dùng để nghiên cứu
Movielens[15] đƣợc tải trên website: />
3.
Mục tiêu và nhiệm vụ nghiên cứu
- Tìm hiểu lĩnh hệ thống khuyến nghị trong thƣơng mại điện tử.
- Nghiên cứu tìm hiểu về các mơ hình học sâu (deep learning).
- Thu thập, tìm hiểu, phân tích tài liệu, thơng tin liên quan đến luận văn.
- Đề xuất phƣơng pháp sử dụng mơ hình học sâu (deep learning) cho bài
toán hệ thống khuyến nghị sản phẩm trong thƣơng mại điện tử.
- Cài đặt thử nghiệm phƣơng pháp và đánh giá kết quả.
4.
Đối tƣợng và phạm vi nghiên cứu
Đối tƣợng nghiên cứu:
- Đối tƣợng nghiên cứu của đề tài là: bài toán hệ thống khuyến nghị sản
phẩm trong thƣơng mại điện tử, mơ hình học sâu deep learning.
Phạm vi nghiên cứu:
- Nghiên cứu lý thuyết về hệ thống khuyến nghị sản phẩm trong thƣơng mại
điện tử, mơ hình học sâu deep learning, giải quyết bài tốn hệ thống khuyến
nghị sản phẩm với mơ hình học sâu deep leaning.
- Thực hiện thử nghiệm với bộ dữ liệu nghiên cứu movielens đƣợc tải trên
website: />
6
5.
Phƣơng pháp nghiên cứu
Phƣơng pháp nghiên cứu lý thuyết:
- Nghiên cứu, thu thập thơng tin về mơ hình học sâu deep learning, hệ thống
khuyến nghị sản phẩm trong thƣơng mại điện tử.
- Nghiên cứu ứng dụng deep learning vào giải quyết các bài toán phức tạp.
- Nghiên cứu ứng dụng deep learning vào giải quyết bài toán hệ thống
khuyến nghị sản phẩm trong thƣơng mại điện tử.
- Xin ý kiến tƣ vấn từ các chuyên gia.
Phƣơng pháp nghiên cứu thực hành:
- Xây dựng mơ hình thử nghiệm phƣơng pháp trên một bộ dữ liệu sẵn
movielens đƣợc tải trên website: />dựa vào kết quả trực quan để phân tích, so sánh, đánh giá các phƣơng pháp.
6.
Bố cục của luận văn
Nội dung chính luân văn đƣợc chia làm ba chƣơng nhƣ sau:
- Chƣơng 1 - Hệ thống khuyến nghị sản phẩm trong thƣơng mại điện tử
- Chƣơng 2 - Mơ hình học sâu – Deep learning
- Chƣơng 3 - Xây dựng hệ thống khuyến nghị sản phẩm với deep learning
- Chƣơng 4 - Xây dựng hệ thống và thực nghiệm
Trong chƣơng 1, chúng tôi đi nghiên cứu chung về hệ thống khuyến nghị sản
phẩm trong thƣơng mại điện tử. Chƣơng 2, chúng tơi đi tìm hiểu về deep learning,
mạng nơ ron nhân tạo, ứng dụng của deep learning trong thời đại hiện nay. Chƣơng
3, chúng tôi tập trung nghiên cứu xây dựng hệ thống khuyến nghị sản phẩm với
deep learning nhƣ thế nào. Và cuối cùng, chƣơng 4 chúng tôi tiến hành cài đặt thử
nghiệm phƣơng pháp trong chƣơng 3 với bộ dữ liệu Movielens từ kết quả thu đƣợc
đƣa ra đánh giá và nhận xét.
7
CHƢƠNG 1 – HỆ THỐNG KHUYẾN NGHỊ SẢN PHẨM
TRONG THƢƠNG MẠI ĐIỆN TỬ
1.1.
Thƣơng mại điện tử
Thƣơng mại điện tử là một từ ngữ khơng cịn xa lạ với chúng ta trong bối
cảnh thời đại bùng nổ công nghệ nhƣ ngày nay. Thƣơng mại điện tử đƣợc biết đến
với nhiều tên gọi khác nhau, nhƣ “thƣơng mại điện tử” (Electronic commerce),
“thƣơng mại trực tuyến” (online trade), “thƣơng mại không giấy tờ” (paperless
commerce) hoặc “kinh doanh điện tử” (e- business).. Thƣơng mại điện tử là việc
mua bán hàng hóa và dịch vụ thông qua các phƣơng tiện điện tử và mạng viễn
thông. Các cá nhân, doanh nghiệp phát triển và ứng dụng công nghệ thông tin vào
mọi hoạt động kinh doanh của mình, từ bán hàng, marketing, thanh tốn đến mua
sắm, sản xuất, đào tạo, phối hợp hoạt động với nhà cung cấp, đối tác, khách hàng...
Với sự phát triển của thời đại công nghệ ngày nay, thƣơng mại điện tử sẽ dần
thay thế phƣơng thức thƣơng mại truyền thống bởi lợi ích mà nó đem lại rất lớn.
Đầu tiên phải nói đến sự thuận tiện của thƣơng mại điện tử đem lại. Thay vì phải đi
tìm tới tận nhƣng của hàng, những cơng ty để tìm sản phẩm, dịch vụ phù hợp cho
mình thì giờ đây chỉ cần một chiếc máy tính, một chiếc laptop, một chiếc tablet
hoặc chỉ một chiếc smartphone có kết nối mạng ngƣời dùng có thể thoải mái chọn
lựa hàng hóa, sản phẩm cho mình cho dù đang ở bất cứ nơi đâu, thời gian nào đều
có thể mua bán, giao dịch đƣợc.
Thƣơng mại điện tử có khả năng tiếp cận tới nhiều thị trƣờng, thị trƣờng
không bị giới hạn bởi vị trí địa lý bởi chi phí đầu tƣ quảng bá thƣơng hiệu nhỏ hơn
rất nhiều phƣơng pháp thƣơng mại truyền thống. Thƣơng mại điện tử có thể mở
rộng, tìm kiếm, tiếp cận khác hàng, dịch vụ, đối tác trên khắp thế giới nhờ mạng
lƣới Internet phát triển nhƣ ngày nay. Việc mở rộng mạng lƣới nhà cung cấp, khách
8
hàng cũng cho phép các tổ chức có thể mua với giá thấp hơn và bán đƣợc nhiêu sản
phẩm hơn, lợi nhuận cao hơn.
Tiếp theo, loại hình kinh doanh này giúp giảm chi phí rất nhiều nhƣ chi phí
về mặt giấy tờ, chi phí chia sẻ thơng tin quảng cáo, chi phí in ấn và gửi văn bản
thơng tin sản phẩm, chi phí mặt bằng cửa hàng, chi phí kho hàng …
Với việc thay thế cửa hàng giới thiệu sản phẩm bằng các gian hàng trên
mạng, website giới thiệu, siêu thị online giúp cải thiện hệ thống phân phối hàng hóa
rất nhiều. Tiết kiệm chi phí hàng hóa lƣu kho.
Thƣơng mại điện tử vƣợt giới hạn về thời gian và khơng gian. Việc tự động
hóa các giao dịch thơng qua website, gian hàng online, siêu thị online giúp hoạt
động kinh doanh đƣợc thực hiện cả ngày, cả tháng, cả năm mà khơng mất thêm
nhiều chi phí.
Tiếp đến, hình thức này cịn có thể đáp ứng mọi nhu cầu từ phía khách hàng.
Khách hàng có thể trực tiếp yêu cầu sản phẩm theo ý mình. Hoặc các doanh nghiệp
có thể mở ra các điều tra lấy ý kiến phản hồi từ khách hàng từ đó sản xuất các sản
phẩm của mình.
Thƣơng mại điện tử phát triển kéo theo nhiều mơ hình kinh doanh mới. Với
thƣơng mại điện tử cái gì ngƣời ta cũng có thể đem ra để kinh doanh mua bán trao
đổi đƣợc nhƣ: đồ cũ, thông tin khách hàng, quảng cáo, các dịch vụ trung gian…
hoặc khách hàng cũng có thể mua hàng theo nhóm nghĩa là cùng nhau mua một sản
phẩm nào đó để đƣợc hƣởng khuyến mại giá rẻ. Ví dụ nhƣ hình thức kinh doanh
website là một điển hình của sự thành cơng của hình thức này.
Với lợi thế về thơng tin nhanh chóng và khả năng phối hợp giữa các doanh
nghiệp thƣơng mại điện tử làm tăng tốc độ tung sản phẩm ra thị trƣờng giúp tăng
tốc sự phát triển của doanh nghiệp.
9
Thƣơng mại điện tử tạo điều kiện cho việc thiết lập và củng cố mối quan hệ
giữa các thành viên tham gia vào q trình thƣơng mại. Thơng qua mạng Internet,
các ngƣời dùng tham gia (cá nhân, doanh nghiệp, các cơ quan chính phủ...) có thể
giao tiếp trực tuyến và liên tục với nhau, làm cho có cảm giác nhƣ khơng có khoảng
cách về địa lý và thời gian nữa, nhờ đó sự hợp tác và sự quản lý đều đƣợc tiến hành
nhanh chóng một cách liên tục. Các khách hàng mới, các cơ hội, hình thức kinh
doanh mới đƣợc phát hiện nhanh chóng trên phạm vi tồn quốc, tồn khu vực, tồn
thế giới, và có nhiều cơ hội để lựa chọn hơn.
Ngồi ra, thƣơng mại điện tử cịn có các lợi ích khác nhƣ nâng cao uy tín,
hình ảnh doanh nghiệp, cải thiện chất lƣợng dịch vụ khách hàng. Đối tác kinh doanh
mới thì đơn giản hóa và chuẩn hóa các quy trình giao dịch, tăng năng suất, giảm chi
phí giấy tờ, tăng khả năng tiếp cận thơng tin và giảm chi phí vận chuyển, tăng sự
linh hoạt trong giao dịch và hoạt động kinh doanh.
Trên đây là những lợi ích mà thƣơng mại điện tử đem lại. Nhƣng với sự phát
triển bùng nổ nhƣ vậy, thì rõ ràng sẽ kéo theo sự cạnh tranh gay gắt trong thƣơng
mại điện tử. Khách hàng phải tìm đến những dịch vụ tốt cho họ nhất. Những
website, những gian hàng mua bán, những siêu thị online…ln nỗ lực hết mình để
phục vụ khách hàng. Mục tiêu của họ khơng gì ngồi tăng lƣợng giao dịch của
ngƣời dùng trên dịch vụ. Vậy câu hỏi lớn đặt ra: với bối cảnh hiện nay, làm sao để
tăng lƣợng giao dịch điện tử trong thƣơng mại điện tử? Đó là một vấn đề cần phải
đƣợc nghiên cứu.
1.2.
Hệ thống khuyến nghị sản phẩm trong thƣơng mại điện tử
1.2.1. Giới thiệu
Hệ thống khuyến nghị (Recommender Systems) là công cụ hoặc phần mềm
trong thƣơng mại điện tử cung cấp các gợi ý, khuyến nghị về các sản phẩm cho
ngƣời dùng. Các khuyến nghị này rất quan trọng bởi nó liên quan đến quá trình ra
10
quyết định về loại sản phẩm cần mua, loại âm nhạc cần nghe, hoặc tin tức cần
đọc,...đến với ngƣời dùng. Các hệ thống khuyến nghị là một tính năng phổ biến của
hệ thống các website, application, gian hàng online, siêu thị online nhằm mục đích
khuyến nghị tƣ vấn cho khách hàng những mặt hàng thích hợp nhất. Những doanh
nghiệp lớn nổi tiếng nhƣ Netflix, Amazon, Google, Facebook, và Twitter đã phát
triển hệ thống khuyến nghị sản phẩm nhờ vào truy cập vào nguồn dữ liệu dồi dào do
ngƣời dùng phát sinh ra. Từ đó khai thác những dữ liệu bổ ích này xây dựng các hệ
thống khuyến nghị chính xác, hiệu quả thúc đẩy lƣợng giao dịch với ngƣời dùng.
Dƣới đây là một hình ảnh chụp lại hoạt động của hệ thống khuyến nghị sản
phẩm của Amazon giúp ngƣời dùng tiếp cận đƣợc những sản phẩm tốt hơn.
Hình 1.1: Hệ thống khuyến nghị ngƣời dùng của Amazon.com
(Nguồn: website Amazon.com - Internet)
1.2.2. Ứng dụng
Phạm vi ứng dụng của hệ thống khuyến nghị sản phẩm là rất rộng. Trong
thƣơng mại điện tử, hầu hết các hệ thống khuyến nghị này là các hệ thống bán hàng,
giới thiệu phim, tin tức, ca nhạc, các website, và các dịch vụ. Điển hình nhƣ:
11
- Hệ thống khuyến nghị phim: Netflix, Firefly, MovieCritic, MovieLens,
Mangarate, Morse.
- Hệ thống khuyến nghị âm nhạc: Firefly, CdNow.
- Hệ thống khuyến nghị bán hàng: Amazon, Barnes&Noble, TripMatcher,
ShopMatcher, E-Markets.
- Hệ thống khuyến nghị các website: Websitewatcher, Websitefilter,
Websitewasher, Select, Websitedoggie, Gustos.
- Hệ thống khuyến nghị tin tức: Shift, Infoscan, NewsSieve, Borger, RAMA,
GroupLens.
1.3.
Một số kỹ thuật xây dựng hệ thống khuyến nghị
1.3.1. Mơ hình tăng trưởng email
Có nhiều kỹ thuật xây dựng hệ thống khuyên nghị sản phẩm. Đầu tiên phải
kể đến mơ hình dựa vào sự tăng trƣởng của email. Chúng ta biết rằng, email của
ngƣời dùng đƣợc lƣu trữ trên máy chủ và mọi ngƣời gửi email cho nhau bằng trang
web. Mỗi khi chúng ta sử dụng email, hiển nhiên có một lƣợng khá lớn thƣ quảng
cáo sản phẩm trong hòm thƣ của chúng ta. Những sản phẩm này lại liên kết với
trang web thƣơng mại điện tử nào đó. Các trang web căn cứ vào những ngƣời sử
dụng email để gửi thơng tin quảng cáo tới các hịm thƣ. Điển hình cho phƣơng pháp
này đó chính là hệ thống khuyến nghị của Hotmail. Hotmail thu hút ngƣời dùng
bằng cách sau mỗi một email thì có một liên kết tới trang chủ của hotmail để cho
ngƣời dùng đăng ký mới. Với tốc độ lan truyền của mạng Internet, hiệu ứng dây
chuyền phát huy tác dụng khủng khiếp. Mỗi một email gửi đi đƣợc coi nhƣ một
khuyến nghị tới ngƣời nhận email. Nó nhƣ đánh vào tâm lý ngƣời nhận email: “bạn
tơi sử dụng hotmail thì tơi cũng sử dụng xem như thế nào?”. Theo thống kê, hotmail
bắt đầu hoạt động tháng 7 năm 1996, tới cuối tháng 7 thì có 20000 ngƣời dùng, tới
tháng 9 số ngƣời dùng là 100000, tháng 1 năm 1997 có khoảng 1 triệu thuê bao.
12
Hiện nay hotmail thuộc tập đoàn Microsoft và số ngƣời dùng vào khoảng 120 triệu.
Tuy nhiên hình thức này khơng còn phù hợp với thời đại ngày nay. Các thƣ gửi
quảng cáo sản phẩm ngƣời dùng thƣờng cho là thƣ rác. Các sản phẩm giới thiệu tới
ngƣời dùng cũng không đƣợc chính xác do lƣợng thƣ giới thiệu sản phẩm quá
nhiều. Xuất hiện nhiều hình thức lừa đảo, cấy virus qua email dẫn tới sự tin tƣởng
sản phẩm quảng cáo qua email giảm sút.
1.3.2. Tư vấn dựa trên việc khai phá dữ liệu
Để chính xác hơn trong việc quảng cáo, khuyến nghị sản phẩm tới
ngƣời dùng. Thì khai thác dữ liệu của ngƣời dùng trên website, application, gian
hàng online là hƣớng đi đúng đắn. Dựa vào nguồn dữ liệu rất lớn và hữu ích này hệ
thống có thể phân tích, tính tốn và đƣa ra dự đốn xem ngƣời dùng có thích sản
phẩm nào đó hay khơng? Mức độ thích là nhƣ thế nào? Từ đó đƣa ra khuyến nghị
tới ngƣời dùng.
Có rất nhiều cách để đƣa ra các dự đốn, ví dụ nhƣ:
- Khuyến nghị dựa trên nội dung: là phƣơng pháp phân tích nội dung của sản
phẩm từ dữ liệu từ đó đƣa ra khuyến những sản phẩm tƣơng tự với những
sản phẩm đã từng yêu thích trƣớc đây tới ngƣời dùng. Phƣơng pháp này có
nhƣợc điểm chính là những khách hàng mới chƣa có dữ liệu trƣớc đây hoặc
khuyến nghị khơng chính xác vì sở thích của mỗi ngƣời có thể thay đổi theo
thời gian.
- Khuyến nghị dựa trên cộng tác: là phƣơng pháp khuyến nghị sản phẩm u
thích xuất phát từ ngƣời dùng có cùng sở thích và thị hiếu trƣớc đây. Ví dụ
nhƣ bạn bè thân thiết thƣờng sẽ có những sở thích về màu sắc, kiểu dáng, đặc
điểm tƣơng tự nhau, ngƣời này thích xem phim hoạt hình thì ngƣời kia có lẽ
cũng nhƣ vậy. Hệ thống sẽ dựa vào điều này để đƣa ra khuyến nghị tới ngƣời
dùng.
13
- Khuyến nghị dựa trên việc kết hợp khuyến nghị dựa trên nội dung và lọc
cộng tác: là phƣơng pháp kết hợp hai phƣơng pháp trên nhằm bổ sung những
nhƣợc điểm cho nhau.
Những phƣơng pháp xây dựng hệ thống khuyến nghị sản phẩm truyền thống
này thƣờng dựa vào các đánh giá của các mục sản phẩm làm nguồn thông tin chính
để đƣa ra các khuyến nghị trong khi đó trên thực tế trên nhiều hệ thống nguồn thông
tin này lại rất ít, cũng có thể lấy thơng tin từ nội dung chính các mục sản phẩm làm
thơng tin bổ sung cho hệ thống nhƣng khi nguồn thông tin này quá ít, không đủ
cũng sẽ ảnh hƣởng tới kết quả đƣa ra. Chính vì vậy, nghiên cứu tìm một phƣơng
pháp mới là rất cần thiết.
Deep learning là một trong những hƣớng nghiên cứu rất phát triển của lĩnh
vực trí tuệ nhân tạo trong những năm gần đây. Các mơ hình Deep learning đã tạo
nên những đột phá lớn trong việc giải quyết các bài tốn phức tạp. Nó là thuật tốn
dựa trên một số ý tƣởng từ não bộ với việc tiếp thu nhiều tầng biểu diễn, cả cụ thể
lẫn trừu tƣợng, qua đó làm rõ nghĩa của các loại dữ liệu. Điều đặc biệt thực tế đã
chứng minh công nghệ deep learning đạt đƣợc sự chính xác cao khi phải xử lý
nguồn dữ liệu khổng lồ, nó ít bị hạn chế bởi sự quá tải của dữ liệu. Với sự phát triển
của thƣơng mại điện tử sẽ tạo ra nguồn dữ liệu rất lớn gây khó khăn trong việc phân
tích dữ liệu để xây dựng hệ thống khuyến nghị sản phẩm nên việc áp dụng deep
learning vào xây dựng hệ thống khuyến nghị sản phẩm trong thƣơng mại điện tử là
một hƣớng nghiên cứu đúng đắn thời điểm này.
1.4.
Kết luận chƣơng
Ở chƣơng 1 đã giới thiệu tổng quan hệ thống khuyến nghị trong thƣơng mại
điện tử, các đặc điểm và ứng dụng của nó. Để thúc đẩy lƣợng giao dịch trong
thƣơng mại điện tử thì hệ thống khuyến nghị sản phẩm tới ngƣời dùng là không thể
thiếu. Tuy nhiên việc giao dịch thông qua các website thƣơng mại điện tử tạo ra
lƣợng dữ liệu vô cùng lớn và phức tạp. Dữ liệu này chính là thơng tin về khách hàng
14
cũng nhƣ các sản phẩm giao dịch rất hữu ích cho việc xây dựng một hệ thống
khuyến nghị sản phẩm. Trong bối cảnh lƣợng dữ liệu thu thập đƣợc ngày càng
nhiều nhƣ vậy việc sử dụng các mơ hình deep learning để phân tích nguồn dữ liệu
khổng lồ này là một hƣớng đi đúng. Chƣơng tiếp theo, chúng tôi sẽ trình bày những
nghiên cứu của mình về deep learning.
15
CHƢƠNG 2 – MƠ HÌNH HỌC SÂU – DEEP LEARNING
2.1.
Giới thiệu
Vài năm gần đây, thuật ngữ deep learning hay mô hình học sâu khơng cịn xa
lạ với những ngƣời quan tâm tới cơng nghệ tự động hóa hay cơng nghệ thông tin.
Deep learning là một lĩnh vực chuyên sâu của máy học (Machine learning [3]) trong
trí tuệ nhân tạo. Trong máy học ngun tắc chính của nó là các máy tiếp nhận dữ
liệu đƣa vào và máy sẽ tự học. Máy học sẽ học dữ liệu bằng cách sử dụng các thuật
tốn lặp nhiều lần. Nó là một phƣơng pháp phân tích dữ liệu mà nó sẽ tự động hóa
việc xây dựng mơ hình phân tích cho mình. Chính nhờ cách sử dựng các thuật toán
lặp nhiều lần để học dữ liệu mà máy học có thể tìm thấy những thơng tin giá trị ở rất
sâu bên trong mà nó khơng đƣợc lập trình rõ ràng có thể tìm kiếm những thơng tin
ấy ở đâu.
Deep learning hay mơ hình học sâu lại là một lĩnh vực chuyên sâu hơn. Với
mong muốn những cỗ máy có thể ghi nhớ, xử lý thông tin linh hoạt nhƣ con ngƣời.
Dựa trên ý tƣởng bộ não nhân tạo, các mạng thần kinh hay mạng nơ ron nhân tạo
[4] ra đời dựa trên cơ sở là cấu tạo nơ ron sinh học. Mơ hình học sâu học tập dựa
trên khai thác các mạng thần kinh nhân tạo này nhằm mô phỏng việc đƣa ra quyết
định nhƣ của con ngƣời. Deep learning kế thừa và sử dụng các kỹ thuật của máy
học để giải quyết các vấn đề thực tế và nó địi hỏi các bộ dữ liệu lớn để tự tập luyện,
bởi vì có một số lƣợng lớn các tham số ban đầu đƣa vào là giả khơng chính xác, các
tham số này sẽ đƣợc điều chỉnh dần trong q trình học của mơ hình.
Mới đây thành tựu nổi bật của deep learning chính là siêu máy tính đánh bại
những ngƣời chơi bài poker chuyên nghiệp trên thế giới. Điều này chứng minh cho
chúng ta thấy những tiềm năng rất lớn của deep learning trong tƣơng lai. Ngoài ra
sự phát triển một cách đột phá của các công nghệ học sâu đƣợc ứng dụng ngày càng
nhiều trong các doanh nghiệp, các mơ hình kinh doanh và xây dựng các ứng dụng
16
mới để giải quyết các bài toán trong thực tế cuộc sống con ngƣời, trong đó phải kể
đến những ứng dụng có tiềm năng trong thƣơng mại nhƣ sau:
Ứng dụng trợ lý bằng giọng nói : Ứng dụng này là một trong những ứng
dụng rất nổi tiếng và thông dụng của cơng nghệ deep learning. Nó là tính năng
chúng ta có thể tìm thấy hầu hết ở các smartphone, tablet. Điển hình nhƣ ứng dụng
Siri của Apple đƣợc giới thiệu vào 10/2011, ứng dụng Google Now trợ lý giọng nói
cho hệ điều hành Android hay Microsoft Cortana dành cho hệ điều hành Windows
hay ứng dụng tìm kiếm bằng giọng nói trên Xbox One của Microsoft. Sử dụng ứng
dụng trợ lý bằng giọng nói ngƣời dùng có thể dễ dàng tìm kiếm phim, âm nhạc và
những nội dung khác bằng chính ngơn ngữ tự nhiên của mình. Ứng dụng này sử
dụng công nghệ xử lý ngôn ngữ tự nhiên (Natural Language Processing _NPL [16])
dựa trên deep learning.
Nhận diện hình ảnh: cơng nghệ nhận diện ảnh nhằm mục đích phân tích
nhận diện và xác định đối tƣợng có trong một bức ảnh cũng nhƣ hiểu đƣợc ngữ
cảnh và nội dung trong đó. Khơng xa lạ với ứng dụng này, chúng ta có thể tìm thấy
nó trên mạng xã hội Facebook, nó giúp gợi ý tag bạn bè trong một bức ảnh. Điều
này giúp hiệu ứng lan truyền trên mạng xã hội phát huy tác dụng rất nhiều. Ngồi ra
cơng nghệ này cịn áp dụng trong khoa học tội phạm.
Quảng cáo: Nhận thấy hiệu quả deep learning mạng lại, rất nhiều doanh
nghiệp đƣa deep learning ứng dụng vào marketing, quảng bá thƣơng hiệu, sản
phẩm, và dịch vụ. Cơng nghệ deep learning có thể tính tốn đƣa ra các dự đốn về
quảng cáo, hiển thị quảng cáo tới mục tiêu là ngƣời dùng một cách chính xác hơn
rất nhiều. Ví dụ điển hình là công ty Baidu của Trung Quốc một phiên bản tƣơng tự
nhƣ Google đang nghiên cứu và sử dụng deep learning để dự đốn và quảng cáo
một cách chính xác đến ngƣời dùng đem lại nguồn lợi nhuận doanh thu lớn cho
công ty này.
17
Hệ thống khuyến nghị: Nhƣ đã phân tích ở phần trên ứng dụng deep learning
vào trong xây dựng hệ thống khuyến nghị sản phẩm cải thiện hiệu quả giúp tăng
lƣợng giao dịch, tƣơng tác của ngƣời dùng. Các nền tảng lớn hiện nay nhƣ
Facebook, Amazon, Netflix,... đều có hệ thống khuyến nghị rất mạnh giúp tăng
đáng kể độ tƣơng tác của ngƣời dùng.
2.2.
Mạng nơ ron nhân tạo trong deep learning
2.2.1. Nơ ron sinh học
Qua nghiên cứu, ngƣời ta phát hiện ra não bộ - cơ quan suy nghĩ và điều
khiển của con ngƣời chứa tế bào khác với những tế bào bình thƣờng trong cơ thể đó
là khả năng tiếp nhận tín hiệu và xử lý các tín hiệu. Các tế bào này đƣợc gọi là nơ
ron thần kinh. Các nơ ron thần kinh đƣợc kết nối với nhau đƣợc gọi là các đƣờng
truyền n hàm truyền. Tƣơng tự các trọng số, giá trị ngƣỡng tại mỗi nơ ron cũng
đƣợc cập nhật trong q trình huấn luyện của mạng.
Tín hiệu đầu ra sau khi qua xử lý thơng thƣờng có tối đa một đầu ra. Gọi Y là
giá trị của tín hiệu đầu ra. Tham khảo [3] Giá trị Y đƣợc tính theo cơng thức:
Y = f (T+ b) với T
∑
(2.1)
(T là tổng các tích tín hiệu đầu vào x và trọng số tương ứng w)
Một mạng nơ ron nhân tạo là một mạng lƣới gồm các nơ ron nhân tạo liên
kết với nhau. Một mạng nơ ron có thể có một lớp mạng (còn đƣợc gọi là tầng mạng)
hoặc nhiều lớp mạng, lớp input khơng đƣợc tính là một lớp mạng. Mỗi lớp mạng có
21
chứa một hoặc nhiều nơ ron. Hình vẽ minh họa một mạng nơ ron đơn giản có 2 lớp
mạng lớp ẩn và Output, có nhiều hơn 2 lớp mạng thì có nhiều lớp ẩn hơn.
Input
Output
Lớp ẩn
Hình 2.4: Cấu tạo của một mạng nơ ron nhân tạo đơn giản [3]
2.2.3. Kiến trúc mạng nơ ron
Một nơ ron trong mạng có thể thực hiện đƣợc chức năng xử lý thông tin nhất
định, nhƣng tiêu điểm chính trong xây dựng và tính tốn trong mạng lƣới nơ ron
thần kinh nhân tạo là sự phối hợp giữa các nơ ron nhƣ thế nào trong một mơ hình
kiến trúc thống nhất. Các tính tốn trên một mạng nơ ron đƣợc xác định qua các yếu
tố: kiểu nơ ron nhƣ thế nào? Kiến trúc kết nối các nơ ron ra làm sao? Và sử dụng
thuật toán nào để huấn luyện cho mạng học tập?
Về bản chất chức năng và nhiệm vụ của một mạng nơ ron giống nhƣ một
hàm số ánh xạ.
F: X → Y
Trong đó: F là hàm ánh xạ, X là tập tín hiệu đầu vào và Y là tập các tín hiệu đầu ra.