Tải bản đầy đủ (.pdf) (24 trang)

Báo Cáo Hệ Gợi Ý Đề Tài Movies Recommendaions System.pdf

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.58 MB, 24 trang )

<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">

<b>ĐẠI HỌC BÁCH KHOA HÀ NỘI</b>

<b>TRƯỜNG CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG---oOo---</b>

<b>BÁO CÁO HỆ GỢI Ý</b>

</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4">

<b>Chương 1 Mô tả đề tài</b>

<small>1.</small>

<b>Giới thiệu</b>

Đềtài"HệthốngGợiÝPhim"khơngchỉđặtracâuhỏivềcáchcáccơngtyphânphốinộidungtrựctuyếnquảnlývàphânloạihàngngh6nbộphimmộtcách  hiệu  quả,  mà  cịn  khám  phá  các  thuật  toán  và  phương  pháp  machinelearningđểtốiưuhóatrảinghiệmxemphimcánhâncủangườidùng.Bằngcáchsửdụngdữliệulịchsửxem,đánhgiá,vàthơngtincánhân,hệthốngnàyđưaracácgợiýchínhxác,tăngcườngkhảnăngkhámphávàđồngthờitốiưuhóasựhàilịngcủangườixem.

<small>2.</small>

<b>Mục tiêu</b>

Xâydựnghệthốnggợiýdựatrêncácđánhgiácủangườidùngchocácphimvàdựatrênnộidungphim.

</div><span class="text_page_counter">Trang 5</span><div class="page_container" data-page="5">

<b>Chương 2 Cơ sở lý thuyết1.</b>

<b>Graph Neural Networks(GNNs)</b>

<small>a.</small> <b>Giới thiê Vu về Graph Neural Networks(GNNs):</b>

Đồthịđầuvàođượcđiquamộtloạtmạngneural.Cấutrúcđồthịđầuvàođượcchuyểnđổithànhnhúngđồthị,chophépchúngtaduytr6thơngtinvềcácnút,cạnhvàngữcảnhtồncục.Sauđó,vectơđặctrưngcủacácnútAvàCđược

</div><span class="text_page_counter">Trang 6</span><div class="page_container" data-page="6">

<small>b.</small> <b>Mô hWnh LightGCN:</b>

<b>c. Kết hợp lớp và dự đốn mơ hWnh</b>

CácthamsốcóthểhuấnluyệnduynhấtcủaLightGCNlàcácphầnnhúnglớp0e(0)uvàe(0)ichomỗingườixemvàphim.Chúngđượckếthợpcácphầnnhúngthuđượcởmỗilớptruyềnđểtạothànhcácphầnnhúngcuốicùngchotấtcảngườixemvàphim,euvàeithơngquaphươngtr6nhsau:

</div><span class="text_page_counter">Trang 7</span><div class="page_container" data-page="7">

A~=D AD<small>−1/2−1/2:</small>:matrậnkềcậnchuẩnhóađốixứng.<small>d.</small> <b>TF-IDF</b>

Hàm  TD-IDF  (Term  Frequency-Inverse  Document  Frequency)  là  mộtphươngphápchuyểnđổidữliệuvănbảnthànhcácvectorsốhọc.Nóđượcsửdụngđểđánhgiátầmquantrọngcủamộttừtrongmộttàiliệuhoặcbộvănbản.DướiđâylàmơtảlýthuyếtcơbảncủahàmTD-IDF:

- TermFrequency(TF-Tầnsuấtcủatừ)

- InverseDocumentFrequency(IDF-Nghịchđảotầnsuấtcủatàiliệu)

</div><span class="text_page_counter">Trang 8</span><div class="page_container" data-page="8">

- TF-IDFScore

<b>e. Ridge Regression</b>

MụctiêucủaRidgeRegressionlàt6mgiátrịcủa‘W’bà‘b’saochohàmmấtmátlànhỏnhất,đồngthờicũnggiữchogiátrịcủacáchệsố‘wj’khôngquá

</div><span class="text_page_counter">Trang 9</span><div class="page_container" data-page="9">

<b>f. Hàm Bayesian Personalized Ranking (BPR) loss</b>

<b>2. Collaborative Filtering Neural Network</b>

Làmộtmơh6nhmạngneuralđơngiảnsửdụngvectorembeddingcủauservàitemlàmđầuvàovàđầuralàđánhgiádựđốn

</div><span class="text_page_counter">Trang 10</span><div class="page_container" data-page="10">

<b>a. Embedding Layers</b>

<b>b. Concatenated Vector</b>

<b>c. MLP layer</b>

ĐượcthiếtkếvớicáclớpDensevàhàmkíchhoạt"elu"đểhọccácmốiquanhệphituyếntínhgiữacácđặctrưng.Cáclớpnàytạorakhảnănghọccácđặcđiểmphứctạpvàtươngtácgiữangườidùngvàsảnphẩm.

</div><span class="text_page_counter">Trang 11</span><div class="page_container" data-page="11">

<b>3. Matrix Factorization</b>

<b>a. Giới thiệu</b>

Ma  trận  user  (UM:  User  Matix)  cáchàngđạidiệncho  uservàcáccộtlàm k yếu tố tiềm ẩn (latent factors), mỗihànglàmộtvectorW cókchiều<small>i</small>

MatrậnItem(IM:ItemMatix)trongđócáchànglà  hệsốtiềmẩnvàcáccộtkbiểuthị item,mỗicộtlàmộtvectorHn <small>j</small>

<b>b. Hàm mục tiêu</b>

Hàm mất mát được tính như sau:

</div><span class="text_page_counter">Trang 12</span><div class="page_container" data-page="12">

<small>w , h</small>

<small>(u ,i)∈ Z</small>

<small>(vui−WuTh</small><sub>i</sub><small>)2+λ¿ ¿</small>

<small>¿∨ ∨hu¿2</small>

<b>4. Hàm đánh giá</b>

<b>a. RMSE</b>

MatrậnđánhgiáYtrongđómỗiphầntửY thểhiệnđánhgiácủangười<small>ij</small>

dùngchosảnphẩm.Mụctiêulàxâydựngmơh6nhdựđốnYsaochoY gần<small>ij</small>

với nhấtcóthể.HàmRMSEcódạng:

 và   lầnlượtlàđánhgiádựthựctếtrêntậpkiểmthửvàđánhgiádựđoán

</div><span class="text_page_counter">Trang 13</span><div class="page_container" data-page="13">

<b>b. Recall và Precision</b>

<b>Chương 3 Trực quan hố dữ liệu</b>

Cácbộphimcó18thểloạivàcóphânphốicácthểloạinhưsau:

</div><span class="text_page_counter">Trang 14</span><div class="page_container" data-page="14">

<small>Trung bình mỗi người dùng đánh giá: 96 phim, người đánh giá nhiềunhất là 727 phim, người ít nhất là 10 phim.</small>

Sốlượngđánhgiácủamỗingườidung:

</div><span class="text_page_counter">Trang 15</span><div class="page_container" data-page="15">

Số  lượng  đánh  giá  của  mỗi  bộ  phim

</div><span class="text_page_counter">Trang 16</span><div class="page_container" data-page="16">

<b>Chương 4 Cài đặt1. Content-base</b>

a. Đầuvào

- Numberofusers:943–u.user

- Numberoftraingrates:90570–ua.base- Numberoftestrates:9430–ua.test- Numberofitems:1682–u.item

b. MaTrậnĐặcTrưng(X_train_countsvàtfidf)

X_train_counts:Matrậnnàyđạidiệnchothơngtinthểloạinhịphânchomỗibộphim.Đâylàmộtmatrậnnhịphântrongđómỗihàngtươngứngvớimộtbộphimvàmỗicộtbiểuthịmộtthểloại.

</div><span class="text_page_counter">Trang 17</span><div class="page_container" data-page="17">

c. RidgeRegression

d. DữLiệuHuấnLuyệnvàKiểmTra(rate_trainvàrate_test)

Dữliệuhuấnluyệnvàkiểmtrachứathơngtinvềđánhgiácủangườidùngđốivớicácbộphim.Mỗihàngtươngứngvớimộtđánhgiácủangườidùngcho

</div><span class="text_page_counter">Trang 18</span><div class="page_container" data-page="18">

e. DựĐốncủaMơH6nh(Yhat)

Saukhihuấnluyệnmơh6nhhồiquytuyếntính,cácdựđốn(Yhat)đượcthựchiệnchotấtcảcácngườidùngvàbộphimtrongbộdữliệu.Cácdựđốnnàyđạidiệnchocácđánhgiáướctínhcủamơh6nhchomỗicặpngườidùng-bộphim.

</div><span class="text_page_counter">Trang 19</span><div class="page_container" data-page="19">

<b>2. LightGCN:</b>

a. Tảidữliê 4u:Dữliê 4uđượclấytừfileml-100kcủamovielens.

Tổchứcdữliê 4u:dofiledữliê 4uchưacótêncơ 4tnêncầntổchứclại.SauđóchỉnhlạiphạmvigiátrịcủaIdđểphùhợpvớixâydựngmatrâ 4nkềvềsau.

b. Tạocạnhđồthị:tạocạnhđồthịvớingư‹ngđánhgiátốtlà>=4sao.

</div><span class="text_page_counter">Trang 21</span><div class="page_container" data-page="21">

f. KếthừamodelLightGCN:ĐểnhúngngườidùngvàphimquaKtầng,cùngvớiđósửdụngmatrâ 4nchuẩnhóađốixứng.

•đâychúngemhuấnlu 4nqua4tầng:

g. PhươngthứcmessagetronglớpLightGCNlàmộtphầnquantrọngcủacơchếtruyềnthơngđiệp(messagepassing)trongmơh6nhcủabạn.Đâylàmộtphầncủaqtr6nhlantruyềnthơngđiệptrênđồthị,nơimỗinútsẽcậpnhậtthơngtincủam6nhdựatrênthơngtintừcácnútlánggiềng.

</div><span class="text_page_counter">Trang 22</span><div class="page_container" data-page="22">

h. SửdụnghàmBayesianPersonalizedRanking(BPR)loss:nhắmkhuyếnkhíchdựđốnmẫudươngcaohơnmẫuâmđóivớimỗingườidùng.

i. Tạodanhsáchphimđượcđánhgiátốtbởimỗingườidùng:

j. Tínhtốnđơ 4chínhxácRecall,Precision,ndcg:

</div><span class="text_page_counter">Trang 23</span><div class="page_container" data-page="23">

k. Truyềnthamsố:

l. Kếtquả:

</div><span class="text_page_counter">Trang 24</span><div class="page_container" data-page="24">

<b>Chương 5 Đánh giá mô hWnh và kết luận1. Đánh giá mô hWnh</b>

<b>2. Kết luận</b>

</div>

×