Tải bản đầy đủ (.pdf) (80 trang)

Hệ thống tự động tổng hợp ý kiến góp ý trong hội nghị

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.23 MB, 80 trang )









































I HC QUC GIA HÀ NI
I HC CÔNG NGH

PH

H THNG T NG TNG HP Ý KIN GÓP Ý
TRONG HI NGH






LUCÔNG NGH THÔNG TIN







HÀ NI - 2014






I HC QUC GIA HÀ NI
I HC CÔNG NGH

PH

H THNG T NG TNG HP Ý KIN GÓP Ý
TRONG HI NGH

Ngành: Công ngh thông tin
Chuyên ngành: H thng thông tin
Mã s: 60480104


LUCÔNG NGH THÔNG TIN


NG DN KHOA H
I


HÀ NI - 2014

1




t qu c trong lun phm nghiên cu, tìm
hiu ca riêng cá nhân tôi. Trong toàn b ni dung ca luc
trình bày hoc là ca cá nhân tôi hoc tng hp t nhiu ngun tài liu. Tt c
các tài liu tham khu có xut x c trích dn hp pháp.
Tôi xin hoàn toàn chu trách nhim và chu mi hình thc k lut theo quy nh
cho la mình.



Hà Ni, ngày 10 tháng 06 



Phm 








2



c tiên, tôi xin gi li cchân thành và s bic ti TS. Bùi
      i      tôi v c chuyên môn,
nghiên cng phát trin trong sut quá trình làm lu

i li các Thy, Cô giáo ca Khoa Công ngh thông
tt nhng kin thc b ích, hii v c H thng thông tin
mà tôi hc tp. Tôi xin bày t s bic ti ThS. Tr 
ti Phòng thí nghim Công ngh tri thc (KTLab) , h tr tôi trong quá trình
nghiên c tài này.
Cui cùng, vin gi li bic vì gia  bên
cnh tôi, mang li cho tôi ngung viên tinh thn to ln và to mu kin thun
li cho tôi trong quá trình hc tp và hoàn thành lu
Mt c g không tránh khi nhng thiu sót. Rt
mong nhc ý kia Thy, Cô giáo và các b lu
c hoàn thi
Xin trân trng c

Hà Ni, Tháng 06  



Phm 

3

C
L 1
LI C 2
MC LC 3
BNG CÁC KÝ HIU VÀ CH VIT TT 6
DANH MC CÁC HÌNH V 7
DANH MC CÁC BNG BIU 8
M U 9
 TNG QUAN V M 11

1.1. Gii thiu 11
1.2. Các khái nim 11
1.2.1. ng 12
1.2.2.  13
1.2.3.  13
1.2.4. m 13
1.2.5. m 13
1.3. Các thách thm 14
1.3.1. Phong cách vit khác nhau 14
1.3.2. i theo thi gian 14
1.3.3.  mnh cm 14
1.3.4. Các câu vn 14
1.4.  15
1.4.1.  15
1.4.2. m so sánh 15
1.4.3. Khai phá và tng hp ý kin d 15
1.5. ng dng cm 16
1.5.1. ng d 16
1.5.2. ng dt công ngh thành phn 16
1.5.3. ng dng trong kinh doanh thông minh và chính ph thông minh 17
4

1.5.4. ng dc khác 18
1.6. Tóm tt 18
 NG HP Ý KIN 19
2.1. Gii thiu 19
2.2. Các nghiên cn tng hp ý kin 19
2.3. Phân loi tng hp ý kin 20
2.4. Tng hp ý kin d 21
2.4.1. Nhn di 23

2.4.2. D m 25
2.4.3. Sinh bn tng hp 27
2.5. Tng hp ý kin không d 30
2.5.1. Tng hn 30
2.5.2. Tng hn 31
2.5.3. Mô hình hóa 34
2.5.4. Tng hp da trên thc th 34
2.6. Tóm t 35
 BÀI TOÁN TNG HP Ý KIN GÓP Ý TRONG HI NGH 36
3.1. Bài toán 36
3.2. Chn ca h thng 37
Thu thp ý kin 37 3.2.1.
Tng hp ý kin 38 3.2.2.
G 39 3.2.3.
3.3.  xut 39
3.3.1. Pha thu thp d liu 41
3.3.2. Pha tin x lý d liu 45
3.3.3. nh ch  ca ý kin 46
3.3.4. Pha gom nhóm ý kin 49
3.3.5. Pha phân lp ý kin 50
3.3.6. Pha sinh bn tóm tt 54
5

3.4.  55
3.4.1. nh ch  55
3.4.2. p ý kin 55
3.5. Tóm t 56
 THC NGHI 57
4.1. ng thc nghim 57
4.2. Công c phn mm 57

4.3. D liu thc nghim 58
4.4. c nghim 58
4.5. Kt qu thc nghim 59
4.5.1. Kt qu nh ch  59
4.5.2. Kt qu  phân lp NaiveBayes t xây dng 60
4.5.3. Kt qu  phân lp s dng mã ngun m Weka 60
4.6. Mt s giao din minh ha 66
4.6.1. Giao din chính 66
4.6.2. Giao din thêm mi ý kin 66
4.6.3. Giao din tng hp ý kin 67
KT LUNG 68
TÀI LIU THAM KHO 69
PH LC 1
6


Ký hiu
Din gii
Ting Vit
COS
Contrastive Opinion Summarization
Tng hn
CSDL
Database System
 d liu h thng


i biu quc hi
HTML
Hyper Text Markup Laguage

Ngôn ng n
IDE
Integrated Development
Environment
ng phát trin tích hp
IDF
Inverse Document Frequency
Tn s nghch ca mt t trong
n
JSON
JavaScript Object Notation
Ký hing JavaScript
Neg
Negative
Ph nh
NLP
Natural Language Processing
X lý ngôn ng t nhiên
PLSA
Probabilistic Latent Semantic
Analysis
Phân tích xác sut ng n
PMI
Pointwise Mutual Infomation
 m
Pos
Positive
Tích cc
POS
Part of speech

Gán nhãn t loi
SMO
Sequential Minimal Optimization
Ti thiu tun t
SVM
Support Vector Machine
Máy vector h tr
TF
Term Frequency
Tn s t
XML
eXtensible Markup Language
Ngôn ng u m rng

7


 12
Hình 2. 20
 22
 27
 28
 28
 29
 30
 31
 35
 36
 37
 38

 39
 40
 41
 43
 44
 50
 59
 60
 61
 62
 62
 63
 64
- 64
 65
 66
 67
 67
8



 43
 44
 45
 46
 46
 47
 48
 49

 49
 55
 57
 57
 59
9


1. t v, nh ng nghiên cu
ng Web 2.0 ng xã hi 
khác giúp cho nm v
Ý kin hàng
và ng ti chính sách
.
n nay Kmn và nhc
nhiu s quan tâm trong thi gian g   n không ch
dng li  vic phân tích câu ch cn, giúp máy tính thc s i dung
n nói gì, mà còn cho bii vi 
Tng hp ý kin (Opinion summarization) là bài toán quan trng trong khai phá
m, c s quan tâm ca cng nghiên cu khai phá d liu,
hc máy, truy hi thông tin, và x lý ngôn ng t nhiên. Ma tng hp
ý kin [2,3,5,9] là t ng tng hp các ý kin v mng hay v thành mt
bn tng hp ý kin ngn g    ng hp ý ki c gii thiu
[3,5,9] da trên các mô hình thng kt qu rt kh quan và m 
hi ng dng cho nhiu bài toán thc t.
quy mô ln có các ch  l bàn lun. Vì s
i biu tham gia hi ngh là rt ln nên rng
hp ý kin v các ch  da trên b c ca tng ch . Chính vì vy,
 gii quyt tình trng  trong các hi ngh n nay, lu  xut
xây dng mH thng t ng tng hp ý kin trong hi ngh. H thng này s

giúp ích trong vic thu thp ý kin t i biu, t ng tng hp các ý kin, làm
gim thiu gánh nng cc xây dng bn tng hp ý kin hi
nght khi công vic ln, cn nhiu thi gian và công s tài này là
c khu cho công vic này.
2. Mc tiêu ca lu
Mc tiêu chung ca lu ng ti xây dng mt h thng cho phép t
ng tng hp các ý kit hi ngh vi s i tham d ln (hàng
i). H thng này s t ng thu thp, tng hp ý kiu to ra
mt bng hi ngh s da trên bn tng h
tip tc tng hp tip thành bn tng hp ý kin hoàn chnh.
10

 tài khó cn nhiu thi gian và công sc thc hi m bo
chng và trong kh  tài ch gii hn  nhng phn và ban
u v h thng t ng tng hp ý kin trong hi ngh, bao gm:
 Tìm hia bài toán tng hp ý kin.
  xut mô hình cho bài toán tng hp ý kin trong hi ngh.
 Thc nghi
 Xây dng th nghim mt h th phc v công vic tng hp ý kin
góp ý trong hi ngh.
3. Ni dung ca lu
Luc hin xuyên sut trong quá trình t khi hình thành các khái nim, ý
ng nghiên c  n khi xây dng mô hình tng h  xu   
áp tng hp ý kin. Ni dung chính bao gm các phn sau:
 M ut ra v, mc tiêu và gii pháp cho bài toán tng hp ý
kii ngh.
 Gii thiu tng quan - các khái nin v khai phá quan
m và bài toán tng hp quam.
           ng hp ý kin
chung.

  xut mô hình cho bài toán tng hp ý kin trong hi ngh.
 Thc nghing demo
cho vic x lý và phân lp các ý kin mi.
 Kt lung: Tng kt li nhng kin th
nghi c áp dng trong sut quá trình thc hin lu   
ng phát tri.

11

 KHAI PHÁ 
1.1. 
 N
. Khi bn mun mua mt chic máy tính xách tay HP Pavilon DV6
bt ra các câu ht không? Dòng Pavilon ca HP dùng th nào? Pin
dùng cChính nhn xét ca nh là
câu tr li cho các câu hi mà bn thc mc [5].

Internet (              
thông qua I
 [5]y,
m ci khác giúp chúng ta có thêm thông tin khi quynh mt v,
nó ng rt ln hành vi ca chúng ta. Bt c khi nào chúng ta ph
mt quyng phi tham kho nhng ý kin ca nhi khác.
Vi cá nhân, chúng ta tham kho t n bè. Vi t chc, h t chc các
cu nm bc ý kin.
      
d dàng

, vic
i là mi và thách thc rt ln.

m c nghiên cu mà c g làm cho h thng t
m ci t c vit bng ngôn ng t nhiên.
Km nghiên cu v ý kin, tình cm, quan nim ch 
, thnh, cc th hin. Nhc th
hin qua các nhn xét, blog, các cuc tho lun, tin tc, bình lun, phn h
tài liu khác [5]. m da trên ngôn ng tính toán, truy vn thông tin,
n, x lý ngôn ng t nhiên, hc máy, thng kê và phân tích d 
1.2. Các  
Liu [4m: Mm bao gm 5 yu t (e
i
, a
ij
,
s
ijkl
, h
k
, t
l
) 
i
là tên ca ch th, a
ij
a e
i
, s
ijkl
m v c

ij

ca e
i
, h
k
là ngun cm và t
l
là thc
bit bi h
k
m s
ijkl
có th tích cc, tiêu cc, trung lp hoc biu din bi

12


Hình 1.1
Ví d: Mm v n tho.1 c
biu dii mt s b 
(iPhone, GENERAL , + , Abc123 , 5-1-2008)
(iPhone, touch_screen, +, Abc123, 5-1-2008)
(iPhone, voice_quality, +, Abc123, 5-1-2008)
(Blackberry, keys, -, Abc123, 5-1-2008)
Theo Bing Liu [2]m có th th hin v bt c u gì, ví d 
mt sn phm, mt cá nhân, mt t chc, mt ch Ông s dng thut ng i
 biu th các ch th  cp.t s khái
nim bao g

 1.2.1.
 ch thc th i, sn phm, s kin, ch ) i

 ng có mt tp các thành phn (components) hay thuc tính (attributes) gi
 (features). Mi thành phn hay thuc tính li có mt tp các
thành phn hay thuy, mng O c biu din bi mt cp
[T, A] T là mt cu trúc phân cp thành phn cha, thành phn con, A là tp
các thuc tính cng O [3].
Ví d: Máy nh có mt tp thành phân: ng kính, pin và các thuc tính: kích c,
kh ng, ch ng nh. Thành phn pin có các thuc tính con: kích c, thi

ng có th biu dit cây phân cp.
Gc ci node không phi gc là mt thành phn hoc
thành phn con cng, mi cnh ch mt quan h part-of. Mc gán
mt tp các thuc tính, mm có th biu din thông qua mt node bt k và
các thuc tính c
13

 1.2.2.
Gi mt tài lim là d, ng hp tng quát nht, d bao gm
mt tp các câu tun t d = {s
1
, s
2,

m
}. mf ci
ng O trong d là mt tp các câu liên tip trong d din t m tích cc hay tiêu
cc v fm ti thiu ít nht mt câu có th biu din
m v mng hoc thuc tính cng. Ngoài ra, m
 biu dim trên mt hoc nhi
Ví dChng âm thanh ca chin thoi này ti th pin
li ngn

 1.2.3.
Nu mt f hoc bt kì t i nó xut hin trong câu s,
thì f n (Explicit feature) trong sc li, ta nói f n
(Implicit feature) [3].
Ví d:
Máy n.
Màu sc ca chic n.
 1.2.4.
i hoc t chc th hin quan
m còn gi là ngun cm. ng hp
n phm, din i ng là các tác gi
c [3].
Ví d:  s bng ý kin ca mình v hi.
 John
 1.2.5.
Mm trên mf là mt nh, cm xúc hay s
c hoc tiêu cf t mm.
Ching ca mf có th là tích cc, tiêu cc
hoc trung lp. m hin (explicit opinion) là mt câu th him mang
tính ch quan, din tr trc tim tích cc hay tiêu cc ca tác gi. Quan
m n (implicit opinion) v mf là câu th him tích cc hay
tiêu cc mng minh [3].

14

1.3. Các ng 
Phong cách  khác nhau 1.3.1.
Thc t, các bình lun m nhp vào bi nhi khác nhau thì
h có cách vit khác nhau, t cách thc s dng ngôn ng, ch vit tt và kin thc
ca h là mt thách thc riêng ca mi. Mi u không bày t ý kin theo

cùng mi ta có th s dng các thut ng trong m xut hin
trên mt t báo trc tuyn và xut hin trong mt dic tuyn là rt khác nhau
u này ph thuc vào bi cc th hin). Trên thc t, hu
ht trong x n truyn thng thì s khác bit nh gia hai phn cn
m, "b phim hay" là
rt khác vi "b phim không hay" [22].
 1.3.2.
Mt thách thc khác cn phn là v làm th  có th theo dõi
m i theo thi gian. Tâm trng ca m i
t thit rm v mt sn phm hoc dch v nht
nh s i theo. Nu mt sn phm ci thin sau mt thi gian có th là vì nhiu
i nó và vì h có th b thuyt phc sau mt cuc tho lun dài
trong mt di sn phm [22].
  1.3.3.
nh  mnh ca mm là mt thách thc phi mt trong khai
m. Nhiu n lc thc hi nh các yu t quynh sc
mnh ca mt ý kin trong mt bi cnh. B sung thêm vic phân lp các t thành các
m ng m khác nhau, mt s t b   xác
 mnh ct sm t t hài
 c phân lp thành rt tích cc và kém tích cc n
c phân tích và s d nh m i lp [22].
 1.3.4.
Mt thách thc li vm xut hin khi mi th
hic và tiêu cc trong cùng mu này ch yu là kt qu khi
m tip n truyn thông không nghi th
blog và các di   i có nhiu ý kin khác nhau trong cùng mt câu.
Nh y có th   phân tích cú pháp hoc khai phá quan
m [22].
15


1.4. 
Theo Bing Liu [2]m n hình nh
 Bài toán phân lm
 Tng hp ý kim)
 m so sánh
 1.4.1.
Vi bài toán này có th toán phân ln.
Bài toán phân lp mc hay tiêu cc. Ví d: vi m
giá sn phm, h thng xác nh xem nhn xét v sn phm y là tt hay xu. Phân lp
này ng là phân lp  mc tài liu. Thông tin c phát hin không mô t chi tit
v nhng gì mi thích hay không thích.
Mô hình bài toán:
 T
i
}
 Hai l (Tích cc) và Neg (Tiêu cc)
 B phân lp s phân d
i
vào mt trong hai lp Pos/Neg
Ví d: Vi m n thoi Samsung galaxy S4, h thng s nh
m cchê (nên mua hay không nên mua).
 1.4.2.
Ngoài cách biu dim bng cách trc tip nhn xét v ng
còn có mng cách so sánh ng mun nhn xét vi mi
ng khác. Ví d, khi mi nói mt hay xng yêu
cso vi cái gì? Vì vy, mt trong nhng cách quan trng nht ci
ng là so sánh trc tip nó vi mng t khác.
Ví d:
Kin tho 
kiu dáng cc nhn xét.

 1.4.3.
Bài toán này t vào m 
ng   là sn phm, dch v, mt ch ,
mt cá nhân hay t chc.
Ví d    n ph        n tích
cc/tiêu cc v m ca sn phmtui th pin ca chic
16

camera này nn  tui th pin
m tiêu ct ra:
 Bài toán 1nh và trích chng mà i
hi lý ca chic laptop này rt cao
laptop hi lý
 Bài toán 2m c 
cc, tiêu cc, hay trung lp. Ví d: T
ci dùng v hi lý c
cc.
1.5. 
   1.5.1.
Rõ ràng, mt máy tìm kim có th phc v tt cho vic thu
thp và t ng tng hm, nhn xét. Thay vì có các trang web thu thp
nhn xét ca mwww.epinions.com ta có th hình dung ra mt trang web
t ng thu thp nhng thông tin trên mt cách nhanh chóng. Ch  không ch bó hp
 nhn phm mà còn có th bao gm các ý kin v v chính tr,
xã hi [5] 
Ngoài ra, các ng dng có th c xn nhng trang thu thp
các bài phê bình. Vic tóm tt nhng bài phê bình cc xem là
mt bài toán quan trng. Ta có th i dùng xp hng sn
phm s c sa cha: Nhii dùng vô tình xp hng sn phm quá thp
trong khi nhn xét ca h ln ph

 1.5.2.
Khai phá ng t công ngh kh dng
cho các h thng khác. Mt ti áp dng trong vic m rng các h
thng khuyn cáo, giúp cho h th    n phm nhc nhiu
phn hi tiêu c khuyi dùng [5].
Trong các h thng trc tuyn, các quc hin th  góc màn hình cn
c kim tra xem có phù hp vi ni dung trang web hay không. Ví d trong mt
trang web có ni dung chuyên v gan mà hin th các qung cáo v các sn phu
là không hp lý, nu hin th qung cáo v các loi thuc tr viêm gan s phù hp vi
n thng tinh vi, các qung cáo v sn phng s
c trong ni dung có nhng nhn xét tích cc v
17

sn ph tuyt va ni qung cáo khác khi sn phm có nhng
c.
H thng ht lnh vm có th chng t
s hu ích. Ví d, các câu hm có th yêu cu nhiu x lý khác nhau.
Lita và cng s [15]  ngh ri vi các câu hngoài vic cung cp
câu tr li, vic cung cp các thô  mt thc th c
hin th s rt t i dùng.
 kinh doanh thông minh và chính thông 1.5.3.
minh
 m rt thích hp cho các ng dng thông minh. Thc vy,
kinh doanh thông minh là yu t ng sau s quan tâm ca các công ty, doanh
nghip c này [5].
Ta xem xét mt ví d sau: Mt nhà sn xut máy vi tính lt vng v
doanh thu thp b ng c      i i sao khách hàng
không mua máy tính ca chúng ta?.     th   ng, giá
thành ci th là m kh quan v
thit k, dch v c xem xét.

Các công ngh phân tích cm ngh có kh trích nhng ý kin t các
n phi ci vit ra s là nhng công c tuyt v m
nhn nhng tác v x lý thông minh doanh nghing hp nói 
trên. S r trc tip khi tiêu dùng máy tính  tip xúc vi
 s dng mt h thng dò tìm các trang blog cá nhân,
các trang h tr www.epinions.com  thng s to ra bn tóm
tt nhng ý kin phê bình ca cá nhân hoc s lim có cùng chung mt
m. Vii phân tích không phc quá nhiu bài phê bình
có ni dung ging nhau. Bên cnh vic quu và quan h khách hàng,
các doanh nghimun theo dõi cám ca khách hàng,  có th thc
hin d ng ci dùng phc v cho vic bán bàng hoc các công vic
liên quan [5].
Chính ph thông minh là mt dng ng dt h t, ý
kin là th mà các chính tr gia rt quan tâm. Mt s công trình tp trung vào vic tìm
hiu các c c chính ph mun kho sát ý kin ci dân v
mt d lut mi [5].
18

 1.5.4.
Mi n m trong khoa hc máy tính t ln
n c khác. u bit, các ý kin rt quan trng trong chính tr.
Mt vài nghiên cu trng tâm vào vic nm ba nhi bu
c : C  s ng c tri ng h hay phi là bao nhiêu [5].
m có vai trò quan trt gii pháp công ngh chính
m mà m trình v các chính
sách hay d thu chnh ca chính ph [5].
i xã hi hc ha hn nhiu thành qu rc r. Ví d, v làm
th   ng hay c c nhân rn câu hi  là
i có ý kin tích cc hay tiêu ci v tip
thu ít hay nhiu t các thông tin truyn ti t mt ngu

1.6. 
i thim,
các khái ni thách
m, các bài toán và ng dm. Trong
p theo, lu trong bài toán tng
hp ý kin.
19

 CÁC 
2.1. 
Bài toán Tng hp ý kin (Tng hm) là mn hình trong
m. 
 . Do
có rt nhiu nhóm nghiên cm khác nhau v khái ning
hp ý kivì vy lu coi rng nhng nghiên cu nhm to ra mt bn tng hp
n, d hiu ca mng ln ý kim gng hp ý ki [9].

m
,t
nhing
gian. Các hình thc tng hp khác nhau ca tng hp ý kin b sung cho nhau bng
cách cung cp các m hiu khác khau. Ví d, d ng cm xúc các ý
kin ca mt sn phm có th m rt chung ci dùng cm
nhn v sn phm. Ni dùng cn chi ting hp ý kin dc
c tng hp nguyên bn s rt cn thit [9].
2.2. 
Nghiên cu c] bao gm các k thut khác nhau trong
khai m và tng hp ý kin. Trong cu
nigii thiu các khái nin
 các k thum bao

gm phân lp m, tng hp ý kin và phát him. Mt phn ln
trong cu mô t  thut phân lm và ch
mt phn nh ca cun sách tho lun v công vic sinh ra bn tông hp da trên phân
lm. na, phn ln các công vic tng hp ý kic tho lun là các
k thut da trên tp lu qua mt s 
suc xut b
Bing Liu vit m n ch 3].
Trng tâm c các k thut phân lm, không bao
gm các k thut v tng hp ý kin. Trong lu, lu tp trung vào các
k thut trong tng hp ý kit qua c v phân lm, hay s dng
phân lp ý kit thành phn trong tng hp ý kin.
Nghiên cu ca Pang và Lee  [5] v m và phân tích
ý kin cung cp m các nhim v n tng hp ý kin.
20

Nghiên cu này trm, rng tâm vào tng
hp ý kin. Trong nghiên cu ca Pang [5]c mô t  mt mc
rt cao, v phân lp và các công vic liên quan khác vi cách nhìn nhn ca Kim
và cng s [9]. Tng hp ý ki
pháp tip cn nguyên bn hay trc quan.
Trong báo cáo ca Kim và cng s [9], tng hp ý kin c phân chia các k
thuc riêng bit (trích xu m xúc, sinh bn tng
hp) và c gng phân chia các k thut s dng trong m to ra mt cái nhìn
va bao quát va chi tit v nhng k thut này. Vi vic tp trung vào mt phm vi
nh, Kim và cng s [9] có th s dng nhiu phân chia phc tp cho tng hp ý kin.
c so sánh giKim và cng s [9] 
cung cp nhi ng hp ý kin, v  cp trong các
nghiên cu khác.
2.3. 
Theo m vi nghiên cu, tng hp ý kin có th phân loi da

trên vic yêu cu mt tp các khía cu mt tp các khía
ci là tng hp dng hp không da
 [9]. Hình 2.1 mô t tng quan v c trong tng hp ý kin da


Hình 2.1

Tng hp ý kin dc
i là khía cnh hay ch  con, và sinh bn tng hp ca mi khía cnh
21

[9]. Ví d, tng hp ca sn pht k
B nh ng hp da trên
 hin th chi tit cách cc t
th hm tng th khác bit so vm ca tng khía cnh
bi vì tng hp d biu dim riêng bit cho mc
 [9]p cn dt ph bic nghiên
cu rt nhiu trong nh [12,13].
Tng hp ý kin không dm các loi tng hp khác mà
không chia d liu thành các ch  nh. Tng hp ý kin không d
gi s rn ý ki c hot
tng hn các khía cnh [9]. Cách tip c
cn nhiu khái ning t tng h trc quan hóa thông tin [8].
2.4.  
Kiu ph bin ca tng hp ý kin là tng hp d
n vic to ra bn tng hp ý kin da trên mt tp các ch  (gi là
ng là các ch  c xem là quan trong
i vn ý kin [9]. 

 nh , thuc tính

 
 Sinh bn tóm tt
nh 
 

          
 m [9].

. ,  

Trong Hình 2.2, trình bày 
[9].

22




Hình 2.2 

23

 2.4.1.

. 
 
 [9].
  
  
 2.4.1.1.

H trong [13, 17]  

(POS) và 
g.


T [14]  
cho các  . Trong các 
                
       
thành m
    . Các  
 k  [9].
VD: Fast
Popescu và Etzioni  , 


  
 
) và các  
các
k các
, 
 
PMI tí
và  liên   
  [9].

×