Khoa CNTT – TRƯỜNG ÐẠI HỌC KHOA HỌC TỰ NHIÊN
Tìm hiểu về hệ thống tư vấn thông tin di
động
Đồ Án Môn Phương Pháp Nghiên Cứu Khoa Học
TP.HCM 2012
ng dn: GS.TSKH Hoàng Kim
Sinh viên thc hin: Nguyn Th Ngc Hoa
Mã s sinh viên: 1112011
Mobile Location-Based Recommender System
2
Lời mở đầu
tin.
(Recommender Systems - RSs)
.
,
không dây, ,
ng (Mobile
Recommender Systems MRSs)
"location-awareness" [Ricci,
2011].
,
,
(Location Based Services)
.
Tài liu này
, ,
(MRSs)
Foursquare
cùng vi các nguyên tc sáng tc vn dc vn d xây dng h thng này.
Mobile Location-Based Recommender System
3
Contents
1. Tng quan v u khoa hc 4
1.1 1. Gii Thin Sáng To Khoa Hc 4
1.2 n Sáng To Trong Tin Hc 5
1.3 Gii thiu 40 Nguyên tc sáng to trong khoa hc k thut 5
2. Tng quan v các h thng 11
2.1 Location Based Services (LBSs) ? 11
2.1.1
11
2.1.2
(Geographic Information Systems) 12
2.1.3
(Location-Based Services Infrastructure) 12
2.1.4
(Types of Location-Based Services) 13
2.2 Recommender System 14
2.2.1
? 14
2.2.2
thn 15
2.2.3 18
3. Mobile Location Based Recommender System - FourSquare 19
3.1 Gii thiu 19
3.2 Mng xã hng FourSquare 20
3.2.1 Gii thiu chung 20
3.2.2 20
3.2.3 Các thách thc và gii pháp ca Foursquare khi xây dng Recommender Engine 21
3.3 LARS: A Location-Aware Recommender System 23
3.3.1 Tng quan v LARS 23
3.3.2 SPATIAL RATINGS FOR NON-SPATIAL ITEMS 24
3.3.3 NON-SPATIAL USER RATINGS FOR SPATIAL ITEMS 25
3.3.4 SPATIAL USER RATINGS FOR SPATIAL ITEMS 25
3.4 25
3.5
26
4. Các nguyên tc sáng tc vn dng trong xây dng FourSquare 28
Mobile Location-Based Recommender System
4
1.
1.1
Nói mt cách ngn gN SÁNG TO" (Creativity Methodologies) là b môn
khoa hc có mc ng và trang b cho mi h th c
hành tiên tin v gii quyt v và ra quynh mt cách sáng to, v lâu dài, tin ti
u khi
N SÁNG TO" là phn ng dng ca khoa hc rng li hình thành
và phát trin trong thi gian gC SÁNG TO (Creatology).
Theo các nhà nghiên cu sau nông nghip, công nghip và tin hc. Làn sóng ng vi Creatology (hay
còn gi là thi hu tin hc) chính là s nhn mnh vai trò ch th to ci
trong th k XXI.
Mi làm vic, không th i ci tin công vic ph cho mi suy
a chúng ta. Nói cách khác, mu c sáng to là
tài nn nht ca mi. Chúng ta cn sáng to vì chúng ta cm thy rng, mi vic
cc thc hi nào, chúng ta vn
luôn mong mun ta.
Sáng to gn lin vi s i mi), sáng chng m
la chn mi. S sáng to thuc v c ra quynh, thuc v s kt hc liên
c kt qu mi và ích li. Mi có th dùng tính sáng to ca
t v mt cách bao quát, phát tria chn, làm phong phú các kh
ng các hu qu có th ny sinh. Tóm li, bc gì mi, khác và có ích ly là
sáng to. S sáng to ny sinh mi tng lp và mn trong cuc sng ca chúng ta.
Ði vi mt công ty hay t chc, tài nguyên quan trng nht chính là ngun nhân lc, tc là nhng
i làm vic cho công ty, t chc. H gm các th bo trì, nhi bán hàng, các công nhân
trong dây chuyn sn xut, nh qun lý mi cp bc. Ngun nhân
lc ca công ty làm cho các tài nguyên khác hong, mang li hiu qu cao. Thiu nhân s tt, mt
công ty, t chc trang b máy móc hoàn ho nhc tài tr tt nht, s hong kém hiu
qu.
Vì vy, m i trong m u t chc cn h n (các th thu n, các
t) v o. Ðiu t chc ca bn mnh lên rt
nhiu. Trong mu t chc, càng nhii hn v o, t chc
hong càng có hiu qu.
Mobile Location-Based Recommender System
5
1.2
Tin hc là mt ngành hii, t khi có tin hc cuc sng ca con nguc nâng cao, th
gii bii i s duy, cht xám, mt sn phm tin hc
n pht xám cao. Mt công ty thuc tin
hc không cn phi có din tích to l h tng hoành tráng, ngun nhân lc o, mà cn
ch yt xám, cn s sáng to ra cái mi, cái khác hu dng, tn ph
sn phm tin hc không cu thit b cho sn ph cht xám càng
nhiu thì sn phm càng p, s dng trên th ng.
1.3
(01)
-
.
- .
-
.
(02)
- ( )
( )
.
(03)
-
g (
, )
.
- .
-
.
(04)
-
(
).
(05)
-
.
-
.
(06)
- ,
.
(07)
-
Mobile Location-Based Recommender System
6
-
.
(08)
- B
.
-
,
(09)
- Gâ
(
).
(10)
-
, ,
.
-
,
,
.
(11)
-
, ,
.
(12)
-
.
(13)
-
, ( , không
)
- (
)
,
.
(14)
( )
-
,
,
.
-
, viên bi, .
-
,
.
(15)
-
.
-
, .
(16)
Mobile Location-Based Recommender System
7
-
100%
,
. n.
(17)
-
( )
(
)
( ).
,
( )
().
-
.
- .
- S.
-
.
(18)
- .
,
(
).
-
.
-
, .
-
.
(19)
- Chuy(xung).
-
, .
-
.
(20)
-
(
).
-
.
-
y.
(21)
-
.
-
.
(22)
-
( )
.
-
.
-
.
Mobile Location-Based Recommender System
8
(23)
- Th
-
, .
(24)
-
,
.
(25)
-
,
.
-
, ,
.
(26)
(copy)
-
,
, ,
,
.
-
(,
)
.
-
(
),
.
(27)
-
(
).
(28)
-
, quang,
,
.
-
,
.
-
,
gian, .
-
.
(29)
-
,
:
, , , , .
(30)
-
.
- .
(31)
- (
,
)
-
,
.
Mobile Location-Based Recommender System
9
(32)
-
-
.
-
,
c
, .
-
, .
-
, .
(33)
-
,
c,
(
)
.
(34)
-
( , )
.
-
.
(35)
-
.
-
.
-
-
,
.
(36)
-
:
,
(37)
-
( hay co)
.
-
,
.
(38)
- Thay không kh.
-
.
- .
-
(
)
.
(39)
-
.
-
, , .
Mobile Location-Based Recommender System
10
-
.
(40)
( composite )
-
(
composite).
,
.
Mobile Location-Based Recommender System
11
2. các
,
?
,
ngay
(Location Based Services).
2.1 Location Based Services (LBSs) ?
2.1.1
.
,
,
,
I’am here, take
care of me.”
“Where are you? Can I join?”,
.
Location Based Services (LBSs)
.
LBSs are information services accessible with mobile devices through the mobile network and utilizing
the ability to make use of the location of the mobile device. [Virrantaus et al. 2001]
Mt s LBS ph bin hin nay có th k
Mobile Location-Based Recommender System
12
2.1.2
(Geographic Information Systems)
GIS và LBS có mt s c bit.
c x lý d li
(LBS-services), cung cp cho câu tr li cho nhng câu hi
"?"
"Làm th nào có th
?".
n gc mô t bi Virrantaus
et al. (2001). H phân tích rng các h thc phát trin trong nhiu thp k
ca các ng dng d lia lý chuyên nghip. ,
i s
tin trin ca dch v ng công cng.
H tha lý (Geographical information system) là mt h thng , phân tích, qun
lý và trình bày d liu liên quan ti v a lý. Theo cách hiu hin nay, GIS còn bao
gm các công c truy vn thông tin, phân tích và kt hp các thông tin ri rc, b c
ng dng trong khá nhiu ngànng sn, y t, an ninh quc phòng hay quy ho.
t quan trng trong các LBS, vì nu thi d liu thông tin v các v trí do GIS
cung cp, LBS không th thông tin v c
2.1.3
a LBS (Location-Based Services Infrastructure)
,
(5):
Mobile devices (user): Thit b c dùng gi i yêu cu và nhn v kt qu áp
ng, nó có th là in thoi di ng, thit b tr giúp s cá nhân (PDA), máy tính xách tay, các
thit b dn ng t trên xe, các trm cung cp thông tin t ti các im công cng.
Communication networks: Mng truyn thông t ni thit b ng và nhà
cung cp dch vng hp nhà cung cp dch v trin khai ng dng ca h trên
Internet, mng truyc hiu là mng và mng Internet. Trong quá
trình hong, yêu cc gi t
n giao din gia mng di
ng và mng Internet, t c chuyn tin nhà cung cp dch v.
Positioning: H thnh v có nhim v cung cp d liu v v trí ct
tham s u vào cho quá trình x lý yêu cu. C th, nu là yêu cu ch
nhà cung cp dch v cn bit v trí hin ti ca khách hàng. Còn nu khách hàng yêu cu tr
giúp v mt k thut, y t, nhân lc thì thông tin v trí gi kèm yêu cu s giúp nhà cung cp
dch v tip c Trong mt s ng hp khác thì v trí ca khách hàng
Mobile Location-Based Recommender System
13
c nhà cung c c cho dch v ca mình. Trong thc t, h thng
nh v toàn cu GPS là la chn s mng các h thng LBS. Vì
nhin tích ph sóng bao ph toàn b b m chính xác cao, cho
phép s dng tín hiu min phí mà hin tt hing tích hp chnh v
bng GPS vào các thit b c bin tho
Service and application Provider: Nhà cung cp ng dng và dch v nhn yêu cu t khách
nh v trí ca h thông qua d linh v c gi kèm yêu c
cung cp s tr giúp hong vi v trí và yêu cu ca khách hàng. Các ng
dng và dch v c nhà cung cp trinh v dng, tra ca
lý, cu h cu nn, qu
Hình 1. (component) .
2.1.4
(Types of Location-Based Services)
,
.
.
Pull Services:
.
,
.
Push Services:
,
. ,
Mobile Location-Based Recommender System
14
.
.
,
.
2.2 Recommender System
2.2.1
?
H thn (Recommeder System - RS) ,
.
Nh y có th ng thông tin
khng l v mt sn phm, bài báng khác cn tìm ki
. ng dng ph bin
nht có th thy ca h thn t (Amazon, Netflix), qung cáo
(Google Adsensen)
RS are software agents that elicit the interests and preferences of individual consumers […] and make
recommendations accordingly. They have the potential to support and improve the quality of the
decisions consumers make while searching for and selecting products online. [Xiao & Benbasat, MISQ,
2007]
(
, ),
(,
, ), quá trình
(ratings, tags,
.
Mobile Location-Based Recommender System
15
Hình 2.
Amazon.com
2.2.2
thn
(item).
.
(evaluations)
(rating)
()
/
.
, [Burke,
2007]:
(collaborative-based),
(content-based),
(knowledge-based), (hybrid).
2.2.2.1 Collaborative-based Recommender Systems
Các hệ thống tư vấn cộng tác s tính toán mối g quan gia nhi s d
.
i dc cung cp bi dùng khác
Mobile Location-Based Recommender System
16
(
thích liên quan cht ch vi s dng hin t
,
Amazon.com
(people who buy x also buy y).
Hình 3.
.
(Collaborative filtering)
,
(i,j) .
p cn m
a trên k thut
(matrix decomposition techniques). g
user-
item
a hai ma trn nh ren, 2008]. ,
.
:
,
,
(cold
start problems).
2.2.2.2 Content-based Recommender Systems
H th
s d
i s dng hin ti,
ca nó
(ni dung)
[Pazzani và Billsus, 2007].
Hình 4.
.
Mobile Location-Based Recommender System
17
Nh
(Information retrieval) [Manning, 2008]
(text) (
)
.
(IR system).
:
,
,
(cold start problem).
2.2.2.3 Knowledge-based Recommender Systems
c s dng mt c
tri th
các nhu c
.
Hình 5.
.
n da trên
ng hp (case-based reasoning CBR) [Bridge et al., 2006],
,
(case-base) (
)
.
:
,
, không
(not react to short-term trends).
2.2.2.4 Hybrid Recommender Systems
:
,
.
Mobile Location-Based Recommender System
18
Hình 6.
lai.
2.2.3
. :
phim, .
, , trang web,
.
(e-commerce) , , PC
: ,
,
,
,
.
Foursquare
.
,
,
.
Mobile Location-Based Recommender System
19
3. Mobile Location Based Recommender System -
FourSquare
3.1
Các h thn s da c nh sn phm hu
ích trong không gian tìm kim rng ln (ví d: Ac s dng ph bin
t lc cn ca c
tìm ra s ng gia nhi s dng và gia các sn phm, t xut k sn phm phù
hp nht vc hin truy vn. Ý kin ca cc th hi
ng minh, biu din bi b ba (user, rating, item).
Vi s phát trin ca các thit b ng có tích hp GPS, hin ti có rt nhiu ng dng có th to ra
a lí (location-based ratings), t v
trí ci dùng (user) hoc sn phm (item). Ví d, các mng xã hi dm (Foursquare
và Face-k-i mt v
t hp thông tin v trí ca c i s dng
và sn phm.
y s i ca các h thn da trên v trí (Location Based Recommender
System)nh c(spatial aspect of ratings) s c khai thác
n theo v trí (location-aware recommendations). Mt ví d cho loi hình này là
trong mng xã hi Foursquare. Các h thng này hong ch yu trên môi
ng,
"location-awareness"
Hai v cn phi gii quyt khi xây dng mt h thn da trên v trí là:
Khai thác thông tin v v nào cho hiu qu?
Làm th nào t truy vn trên d li tr kt qu
trong khong thi gian chp nhc? c bit vi nhng ng dng d liu ln
ng hn).
Ta s lt xem xét cách gii quyt v qua:
Cách các nhà phát trin Foursquare xây dng recommender engine cho h thng ca h.
xut trong h thng LARS (Location-Aware Recommender System) do
ng s xut.[Levandoski et al. 2012]
Mobile Location-Based Recommender System
20
3.2
3.2.1 Gii thiu chung
Foursquare là mng xã hi da trên v trí (location-based social
network) có tích hp các yu t ca trò i vào tháng 3/2009.
ng dng s dng chnh v v tinh (GPS), chy trên nn các
smartphone.
i dùng thc hi-m khác nhau mà h n,
ghi chú, nhn xét v nh vi bn bè và nhn phn
ng, gim giá ca các doanh nghip dành cho các thành viên ca
- nhiu nht ti m m nht nh s c min "Th
ng" t n khi b t qua. i nhn s nhc
chc bit ca các doanh nghip tng.
S hp dn vn có ca các mng xã hi cng vng và yu t
thành mt trong nhng mng xã hng ln nht (sau Instagram) vi s n
triu và hàng tri-i ngày. [Fousquare, 2012]
3.2.2
Explore, i cùng vi phiên bn Foursquare 3.0 vào cui s dng khám phá
nhanh chóng nhm thú v trên hành trình
tip theo ca mình.
i dùng s la chn lo m h
mun, chng h
ng dng s xum tt nht
theo mt vài tiêu chí (Hình 5). Kt qu tr v là mt
c xp hng vi các
thi tng
n xét ca h
Hình 7. a FourSquare.
V t Recommender Engine, n
c rút trích t hong ci dùng, bn bè ca h, v a lí da trên GPS, và nhng
nhân t khác.
Vi Explore, Foursquare không ch i dùng thì hin ti theo kiu
mà còn c n n d t sc
Mobile Location-Based Recommender System
21
thú v, tiêu biu cho s kt hp gia mng xã hng và các h thn thông tin s dng v
trí (Location-Aware Recommender System) .
3.2.3 Các thách thc và gii pháp ca Foursquare khi xây dng Recommender Engine
Ngoi tr nc, tt c các khâu khác ca h th
vn (retrieval), xp hng (ranking), và tr v kt qu c thc hin online vi thi
gian phn ng trung bình ct bài toán khó vì phi truy lc trên
a lí khng l m xung quanh và rt nhi-
Hai v chính cn gii quyt là:
la chn và xp hng các kt qu tr v
Nâng cao t thc thi ca h thng (truy vn, tính )
3.2.3.1
Thut toán chính c s d cá nhân hóa ni dung cung ci dùng c s dng
trong recommender engine ca Foursquare là lc cng tác (collaborative filtering), thut toán này khai
thác thông tin t -a b i dùng và nh
Moore, 2011]
Tuy nhiên vic xp hy s gp nhi
Nu ch n sp xp da và s l- có nhng kt qu ht sc thú v,
li b sót mt s c ng hn mt nhà hàng có công sut
ln, và thi gian phc v kéo dài s ng nhà hàng khác, mc dù
trên thc t nó ch có sc hút cao vi s dng trung bình.
y, xp hng da vào thông tin phn hi ci s dng (xp hng ngôi sao
chng hn nhng v i gia các bng xp
hng. Mi dùng có th xp hng c và i h
thm này có tc gii quyt các thut
toán này là mt thách thc li nhng nghiên cu nhnh c ng
kê ph bin và bí truyn.
Mt s ng ln cám khác nhau cn phc khng thi, phi cân bng các thông
tin gây nhiu.
n thng khác khi s dng lc cp v khi
u lh ng mt thu gii quyt v này.
Mobile Location-Based Recommender System
22
Mt v c quan tâm là vic gii thích kt qu i s dng. “Tại sao” h nên
c gii quy coi trng và khuyn khích
các mi liên kt xã h (loyalty) ci s dng.
H thng s i dùng bit nhn bè ca h n ma
m h t l-a h ti m
Nhng thông tin này không ch n kt qu xp hng mà còn b sung kinh nghim, gi lên
mt cuc trò chuyn vi bn bè, hoc gi nh i dùng ti mm mà h
trong mt khong thi gian. [ Moore, 2011]
3.2.3.2
Sự chậm trễ lớn nhất đến từ việc truy vấn cơ s dữ liệu, bao gồm:
Truy vn d li xp hng
o Yêu cu: ly tp hnh (tuy
nhiên b li mt s vì lí do hiu sut). Cn có mt cách truy v ly
c top N giá tr t s
o Gii pháp: Hu ht các CSDL hin tc yêu cu này vi quy mô d
liu cu tiên ph mc (indexing) v ma lí,
p nht các ch m a lý này. Mongo (open source document-
oriented NoSQL database system) c la chn. MongoDB có th thc hin truy vn
trên vi thi gian 30ms cho mt bán kính 10 dm thành ph New
York (hàng m). [ Moore, 2011]
Nhn?
o Yêu cu: lc li lch s -a nhi bn ti tt c nhm là mt
nhim v khó kh thi vi s m hin có ca FourSquare.
Chng hi s dng có 50 bn bè, và ng lim, mi
b-ng 2 ln thì có kh ng s phi thc hin truy vn trên
-
o Gii pháp: Xây dc bi các d lic tính toán v mi
m, bao gm c s l - Moore,
2011]
Vi , tuy là thc hii thc hin mt khng tính toán
khng lìn t phép tính vi s ng 10 trim. Mt s
c các nhà phát trin thc hi x lí khng tính toán trên.
Mobile Location-Based Recommender System
23
3.3 LARS: A Location-Aware Recommender System
LARS là mt h thn nhn din v trí s d trí (location-based ratings)
i dùng. Các h RS truyn thng, không quan tâm ti v a lí ci dùng/sn
ph c LARS li h tr mô hình ba lo -
trí ca
trí ca sn phm s d
t này có th áp dc lp, hoc kt hp tùy theo lo c
thc hin. Kt qu thc nghim trên d liu thc ca Foursquare và Movilens cho thy LARS hiu qu,
uyn chuyn và có kh n chính xác gp hai ln hin có. [Levandoski et al.
2012]
3.3.1 Tng quan v LARS
t quan trng nh khai thác thông tin v v c xây dng trên mô hình
ba lo kho sát hai tp d liu ln ca
Foursquare và Movilens. [Levandoski et al. 2012]
3.3.1.1 Mô
Trong các RS truyn thng không quan tâm ti v c biu din bi b ba
c chia làm ba loi:
“spatial ratings for non-spatial items”, biu din bi b bn (user, ulocation, rating, item),
ulocation” là v trí ci dùng.
“nonspatial ratings for spatial items” , biu din bi b bn (user, rating, item, ilocation)
“spatial ratings for spatial items”, biu din bi b cation, rating, item,
ilocation)
Mobile Location-Based Recommender System
24
3.3.1.2
Hình 8. trí [Levandoski et al. 2012]
Hai tính chc bic rút ra khi kho sát tp d liu ca Foursquare và
Movilens [Levandoski et al. 2012] là:
Preference locality (tm d thích cc bt này ch ra ri dùng trong
mt khu va lí s có s thích (phim, hom) rt khác vi nhi khu vc
khác, thm chí là nhng khu vc lân cn cho mi dùng u phi
khai thác da trên các rating r gn v ma lí vi u nht.
Travel locality ( tm dn cc bn mang yu t không
ng la chm nm trong mt khong cách gii
hn nhnh (limited distance). Trong bng phân tích d liu ci ta nhn
thy ri dùng di chuyn trong 10 dm hoi ch di
chuyn trong vòng bán kính 50 dm. Quan sát này ch ra rng các khong cách
ga chn.
3.3.2 SPATIAL RATINGS FOR NON-SPATIAL ITEMS
n cho loi hình - (vi b bn (user,
ulocation, rating, item)) bng cách s dt i dùng t
này s khai thác s thích cc b (preference locality) ci dùng.
dng mt cu trúc kim t tháp thích nghi (adaptive pyramid
trí ci s dng vào các vùng không gian
i các cp bc khác nhau. Vi s dc hin truy vn ti khu
vt lc cng tác (CF) s ch c thc hin trong khu vc R
n.
Mobile Location-Based Recommender System
25
Tuy nhiên thách thc c quynh xem có phi duy trì tt c các vùng (regions) trong kim
t m bo cân bng gia hai yêu ci lp nhau: tính cc b (locality) và kh rng
(scalability). Duy trì mt s ng ln khu vc (regions) s (locality) (tc là,
n duy nht cho các khu va lí nh ng xn kh rng h
thng (scalability) bi vì mi khu vc cn phi và duy trì ca mt cu trúc d liu lc cng tác
cn thi có th n. Kim t tháp LARS có th t ng thích ng, tìm ra hình dng
phù h cân bng kh rn. [Levandoski et al. 2012]
3.3.3 NON-SPATIAL USER RATINGS FOR SPATIAL ITEMS
n cho loi hình biu din bi b bn
(user, rating, item, ilocation) bng cách s dt này khai thác thuc
i s dng, tc là các n có khong cách càng xa vi
V t ra là phi tránh vic tính toán khong cách cho tt c các a ra
danh sách k n, vì vic này s tiêu tn rt nhiu tài nguyên h thng. LARS gii quyt v này
bng cách s du truy vn hiu qu, có kh t thúc ngay khi phát hin ra danh sách k
câu tr li không th ta (tc là không th i dù có x lí thêm các ng viên khác).
[Levandoski et al. 2012]
3.3.4 SPATIAL USER RATINGS FOR SPATIAL ITEMS
n cho hình thc biu din bi b
ulocation, rating, item, ilocation), LARS s dng c t và
khai thác c v trí cng tích hc
tính ni bt ca LARS, c t có th c s dng riêng r, hoc kt hp tùy vào lo
theo v trí (location-based ratings) mà h thng h tr. [Levandoski et al. 2012]
3.4
Cùng mp cn gii quyt v khá khác nhau.
V vic khai thác v t qu vn, Foursquare, vi nhng yêu cu ca mt ng
dng thc t gt nh thc hin vic xp hn trong phm vi
c th ca ng dng. Trái li, các tác gi c
giá theo v xut khai thác mt
cách hiu qu thông tin v v n.
V v t truy vn trên d lic Foursquare gii quyt bng nh
mc l xut ra mt truy vn hiu qu da trên Tng v