--------------------
Chuyên ngành : Khoa
8480101
01
2022
-HCM
PGS.TS.
TS.
TS.
ngày 12 tháng 1
2021
1. TS.
-
2. TS.
...............-
3. TS.
....-
4. TS.
...................-
5. TS. LÊ THANH VÂN ..........................-
Khoa
KHOA
TS.
TÍNH
-
BÁCH KHOA
-
.................................... MSHV:1870579
06/02/1992 ...........................................
Chuyên ngành: Khoa
.........................................
Tre
: 8480101
I.
SÂU
(MOVIE RECOMMENDATION SYSTEM USING DEEP LEARNING)
II.
Kh o sát
h c sâu.
t khuy n ngh và h
xu t mơ hình khuy n ngh b ng
Ki m th mơ hình v i d li u MovieLens.
t qu .
III.
: 06/09/2021.
IV.
V.
12/12/2021
: PGS
Tp. HCM, ngày 12 . . . tháng 12
PGS
KHOA
21....
cho tôi
Tôi
K
TP
K T
12 Tháng 12
i
2021
theo
H
(RS)
mơ hình
.
vì
gian.
Lens
Trong
so sánh
gian
ii
ABSTRACT
At present, with the impetuous development of BigData along with data of millions of
huge movies, finding some movies according to hobby of users is really difficult.
Recommendation System (RS) is a tool that helps users to make a decision, brings about
many big benefits for many kinds of fields: Ecommerce, music, movies,... In this topic,
students apply in the model of recommending movies. Traditional methods
collaborative filtering and content filtering have plenty of limitations for missing shortterm preferences that change over time of users, and that makes the results of
recommendation not good. To triumph over the limitations of this topic, students use
interaction history with the movies and have a time factor. Students use the model LSTM
and the dataset has been selected based on the best ratings.
Movie Recommendation System using Deep Learning
students compare model has a time factor and does not have a time factor and compare
the results achieved.
iii
.
này.
TP
iv
................................................................................................................... i
.........................................................................................................ii
.......................................................................................................... iii
...................................................................................................................... iv
........................................................................................................ v
...................................................................................................... vi
...............................................................................................vii
1
1.1
1.2
1.3
1.4
1.5
1.6
1.7
2
2.1
2.2
2.3
3 CÔNG
4
4.1
4.2
4.3
4.4
5
5.1
5.2
5.3
5.4 Ph
6
6.1
6.2
6.3
6.4
......................................................................................................... 1
.................................................................................................................... 1
............................................................................................................. 4
............................................................................................................ 4
.............................................................................................................. 4
.................................................................................................. 4
..................................................................................................... 5
...................................................................................... 5
......................................................................................................... 6
RNN ....................................................................................................... 6
LSTM.......................................................................................................... 8
- CBOW..................................................................................... 10
................................................................. 11
.................................................................................... 17
.................................................................................................... 17
......................................................................................................... 18
.............................................................................................................. 24
.......................................................................................................................... 25
....................................................................................... 27
................................................................................................................. 27
.......................................................................................................... 28
.......................................................................................... 28
................................................................................... 29
...................................................................................................................... 30
........................................................................................................ 30
...................................................................................................................... 30
................................................................................................... 30
....................................................................................................... 30
.......................................................................................................................... 32
v
Danh
Hình 1Hình 1-2
Hình 1Hình 2-1
................................................................................1
.........................................3
item .........................................................................3
.............................................................. 6
Hình 2...............................................7
Hình 2..............................................................................8
Hình 2...................................................................11
Hình 3-1
............................................................... 12
Hình 3-2
-based cho RS .......................................................15
Hình 3-3
-based ..................................................................16
Hình 4-1
.....................................................................................17
Hình 4-2
............................................................................................ 18
Hình 4-3
.................................................19
Hình 4-4
quá
......................................................................20
Hình 4-5
.................................20
Hình 4-6 Cross Entropy .................................................................................................24
Hình 4-7
............................................................................................. 25
Hình 4-8 M
.......................................................................................25
Hình 5.............................................................................27
Hình 5-2
......................................................................................28
Hình 5-3 Cross Entropy Loss ........................................................................................29
vi
Danh
-1
....10
-1
-based ....................................................................16
-2
......................................................16
-1
.................................................18
-2
......................................................................................22
4-3 Nhúng interval 3 ngày ...................................................................................23
-4
...........................................................................................23
-5
............................................................................................... 24
-6
.......................................................................24
-1
................................................................................28
mơ hình
......................................29
vii
Danh
RS
MRR
LSTM
RNN
Recommender System
Mean Reciprocal Rank
Long Short-Term Memory
Recurrent Neural Network
viii
1
1.1
tìm
Hình 1-1
Hình 1-1 M
.
Amazon.com, Yout
ng
i dùng c
1
ý.
dùng,
M c d li u (Item) là thu t ng
ch nh
trong h th ng khuy n ngh . Item có th là sách, phim, truy n, tin t c...
i dùng (User): là t p h p nh
M i quan h gi
th ng.
i dùng và m c d li u có th là quan h
giá, yêu thích,
c,...
Sessions: là nh ng l ch s
i dùng trên nh ng m t hàng, s n
ph m. (ví d nh
.
(collaborative filtering - CF)
[1].
,t
[2]
hai
. Hình 1-2
2
Hình 1-2
Hình 1-3
item
tác
ơ,
(data sparsity) [3].
dùng
cold-start problem) [3].
giá
viên
session-based.
này
H
3
cho
quanh, d
trên
1.2
H
sâu .
Nghiên c u lý thuy
pháp xây d ng h khuy n ngh d a trên
chu i th i gian.
Xây d ng h khuy n ngh
i dùng xem phim b ng s d ng công ngh
h c sâu.
Ki m th mơ hình v i d li
k t qu .
1.3
n t i.
Thi t k và xây d ng h th ng khuy n ngh v
l ch s
xu t LSTM d a trên
i dùng có y u t th i gian.
t qu và so sánh.
1.4
Vì th i gian nghiên c
tài có h n nên ph m vi nghiên c u
c gi i h
sau:
D
li u là nh ng b phim th
(t p d
MovieLens)
mơ hình
1.5
:
4
li u
T p d li u MovieLens c a GroupLens [4]
Word2vec
Mô hình LSTM
1.6
gian và
1.7
-
tiêu
-
li
này
Word2vec.
tài. T
- Trình bày mơ hình
-
-
5
-ron, RNN,
2
2.1
RNN
Learning internal representations by error propagation [5]. Trong nghiên
-ron
.
-
-
. [6]. Hình 2-1 là
-ron truy
.
Hình 2-1
-
-
-
(hi
-ron
6
Hình 2-2
Hình 2-2
-
-
-
,
-
là
7
Tính tốn tu n t : K t qu c a l n tính tốn hi n t i d a vào k t qu c a l n tính
c. Vì v y, d li u t các l n truy n khơng th
d
n vi c khơng t n d
Có kh
2.2
c th c hi n song song,
c GPU
"quên" d li u.
LSTM
i
chain-
vanishing và exploding gradient
[7].
dài
. LSTM
[6] [8] (Long Short-Term Memory)
vanishing/exploding gradient
[6].
LSTM
(hidden layer)
(memory cell) thay vì
recurrent cell) Hình 2-3
Hình 2-3
8
khi các mô-
:
C ng vào (Input)
C ng ra (Output)
C ng quên (Forget)
sau (1a) - (1e).
(1a)
(1b)
(1c)
(1d)
(1e)
1a) - (
internal state và
i.
hidden layer). Và
và
H
sigmoid
tin
sigmoid
wise
elementinternal state
tanh. Vì LSTM
memory cell.
9
L
2.3
Word2vec - CBOW
Word2v
lý
Word2vec
Word2vec
-
Encoder [9]
vào
.
(window)
(context
word). Ta nói
Ví
G
D1:
D2:
D3:
}.
hơm_qua
tơi
tơi
2-1
10
Word2vec có 2 mơ hình:
Skip-gram
CBOW
CBOW (Continuous Bag of Words)
.
) xung
Hình 2-4
3 CÔNG
11
Hình 3-1
(Collaborative filtering - CF) [10]
Các
.
L
(content-based) [11] [12]
mà
i dùng này thích. C
.
khác nhau
nào phù
thơng tin và
12
L
n
(hybrid) [1]
và
dùng
là mơ mình
.
Tuy
users
items
timestamps
sau: [13]
Tính phù h p (Relevance): M c tiêu l n nh t c a h th ng là khuy n ngh nh ng
b phim phù h p v i t
i dùng c th .
ng (Diversity): H th ng g i ý phim c g
nhi u lo i khác nhau, kh
, gi m
vi c g i ý l
i ý các b phim
i dùng thích ít nh t m t b phim s
c r i ro trong vi c gây nhàm chán cho
p l i nh ng phim quá gi ng nhau.
13
i dùng b i
(ratings
liên quan
Long Short-Term Memory Based Movie
Recommendation [14]. Tác
GroupLens.
MovieLens 1M [4]
n
N
phim
UserId c
Tensor t p các vector c a phim mà
dài t
a sequence.
Mơ hình LSTM-based
14