Tải bản đầy đủ (.pdf) (17 trang)

Tổng hợp quan điểm trực tuyến của người tiêu dùng theo tính năng của sản phẩm.

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (588.83 KB, 17 trang )

I H C QU C GIA HÀ N I
TR

NG

I H C CỌNG NGH

V TH NH N

T NG H P QUAN I M TR C TUY N C A
NG
I TIểU DÙNG THEO TệNH N NG C A
S N PH M

LU N V N TH C S CỌNG NGH THỌNG TIN

HẨ N I – 2016


I H C QU C GIA HÀ N I
TR

NG

I H C CỌNG NGH

V TH NH N

T NG H P QUAN I M TR C TUY N C A
NG
I TIểU DÙNG THEO TệNH N NG C A


S N PH M

Ngành:

Công ngh thông tin

Chuyên ngành: H th ng thông tin
Mã s :

60 48 01 04

LU N V N TH C S CỌNG NGH THỌNG TIN

NG

IH

NG D N KHOA H C: TS. NGUY N VI T ANH
TS. BÙI QUANG H NG

HẨ N I - 2016


1

M cl c
L i cam đoan ...................................................................... Error! Bookmark not defined.
M c l c ................................................................................................................................. 1
Danh m c hình v ............................................................... Error! Bookmark not defined.
Danh m c b ng bi u ........................................................... Error! Bookmark not defined.

L i c m n .......................................................................... Error! Bookmark not defined.
M đ u .................................................................................................................................. 3
Ch

ng 1.

1.1.

T ng quan v khai phá quan đi m ................................................................ 5

Gi i thi u ................................................................................................................ 5
it

1.1.1.

ng ............................................................................................................. 6

1.1.2.

Các đ c tr ng n và hi n ..................................................................................... 6

1.1.3.

o n đánh giá ...................................................................................................... 6

1.1.4.

Quan đi m n, hi n .............................................................................................. 7

1.1.5.


Ng

1.2.

i đánh giá .................................................................................................... 7

Các thách th c trong khai phá quan đi m ............................................................... 7

1.2.1.

Nh ng ng

1.2.2.

Quan đi m thay đ i theo th i gian ...................................................................... 7

1.2.3.

m nh c a quan đi m ...................................................................................... 8

1.2.4.

Quan đi m theo ng c nh .................................................................................... 8

1.2.5.

Các câu đánh giá có s pha tr n .......................................................................... 8

1.2.6.


Quan đi m mang tính châm bi m, m a mai ......................................................... 9

1.2.7.

X lỦ ngôn ng t nhiên trong câu quan đi m .................................................... 9

1.3.

i khác nhau có phong cách vi t khác nhau ...................................... 7

Các ng d ng trong khai phá quan đi m ................................................................ 9

1.3.1.

Nghiên c u th tr

1.3.2.

C i thi n ch t l

1.3.3.

H th ng g i Ủ ................................................................................................... 10

1.3.4.

H tr thông minh trong chính quy n ............................................................... 10

1.3.5.


H tr đ a ra quy t đ nh .................................................................................... 10

1.4.
1.4.1.

ng dành cho ng

i mua và bán ............................................ 9

ng c a s n ph m, d ch v ........................................................ 9

Các bài toán khai phá quan đi m .......................................................................... 10
Phân l p quan điêm ........................................................................................... 11


2

1.4.2.

Khai phá quan đi m so sánh .............................................................................. 11

1.4.3.

T ng h p quan đi m .......................................................................................... 11

Ch ng 2.
s n ph m

Các ph ng pháp ti p c n bài toán t ng h p quan đi m theo tính n ng c a

.................................................................... Error! Bookmark not defined.

2.1.

Xác đ nh đ i t

2.2.

Trích xu t khía c nh.............................................. Error! Bookmark not defined.

ng................................................ Error! Bookmark not defined.

S d ng danh t và c m danh t th

2.2.1.

ng xuyên Error! Bookmark not defined.

2.2.2. S d ng m i quan h c a t quan đi m và khía c nh ......Error! Bookmark not
defined.
Mô hình ch đ . ................................................. Error! Bookmark not defined.

2.2.3.
2.3.

Nhóm các t ch cùng m t khía c nh.................... Error! Bookmark not defined.

2.4.

Phân l p chi u h


2.5.

Lo i b quan đi m Spam ...................................... Error! Bookmark not defined.

ng quan đi m.......................... Error! Bookmark not defined.

Ch ng 3.
T ng h p quan đi m tr c tuy n c a ng i tiêu dùng Vi t Nam theo tính
n ng c a s n ph m.............................................................. Error! Bookmark not defined.
3.1.

Trích xu t tính n ng c a s n ph m ....................... Error! Bookmark not defined.

3.1.1.

Ti n x lỦ d li u .............................................. Error! Bookmark not defined.

3.1.2.

Tách câu quan đi m ........................................... Error! Bookmark not defined.

3.1.3.

Trích xu t tính n ng c a s n ph m .................... Error! Bookmark not defined.

3.2.

Nhóm các t nói v cùng m t tính n ng ............... Error! Bookmark not defined.


3.3.

T ng h p quan đi m ............................................. Error! Bookmark not defined.

3.4.

đo tính chính xác c a h th ng........................ Error! Bookmark not defined.

Ch

ng 4.

Th c nghi m và đánh giá............................ Error! Bookmark not defined.

4.1.

Chu n b d li u và cài đ t.................................... Error! Bookmark not defined.

4.2.

Ti n hành th c nghi m và đánh giá ...................... Error! Bookmark not defined.

Ch

ng 5.

K t lu n ....................................................... Error! Bookmark not defined.

5.1.


Nh ng v n đ đã gi i quy t trong lu n v n này ... Error! Bookmark not defined.

5.2.

H

ng nghiên c u ti p theo trong t

ng lai ......... Error! Bookmark not defined.

Các công trình đã công b .................................................. Error! Bookmark not defined.
TÀI LI U THAM KH O .................................................................................................. 13


3

M đ u
“Ng

i khác ngh gì” luôn là m t câu h i đ t ra cho m i chúng ta trong nh ng l n ra

quy t đ nh. Khi b n có nhu c u mua m t chi c tivi, b n s có xu h ng tìm hi u xem
ng i khác nói gì v s n ph m này. V i cùng m t s ti n b ra, b n s l a ch n đ c
nh ng s n ph m có nh ng ch c n ng đáp ng đ c yêu c u c a b n m t cách thích h p
nh t. Hay nh ch

ng trình Ai là tri u phú phát sóng trên truy n hình, có hai trong ba

quy n tr giúp là h i Ủ ki n c a ng


i khác.

Cùng v i s phát tri n c a kinh t xã h i, Internet ngày càng phát tri n. M i ng

id n

bi t đ n các trang blog, di n đàn hay các trang m ng xã h i khác. ó là n i h cùng bày
t quan đi m v m t v n đ , s ki n hay ch t l ng c a m t s n ph m. ó là ngu n
thông tin quan tr ng đ i v i m i ng i khi có nhu c u tìm hi u v v n đ nào đó.

Hình 1. Khai phá quan đi m ng
ng

i dùng

i v i doanh nghi p, khi h đ a b t k m t s n ph m nào ra th tr ng, h c n bi t
i tiêu dùng đánh giá nh th nào v s n ph m c a mình. T đó, h đ a ra đ c

nh ng chi n l c kinh doanh phù h p v i nhu c u c a ng i tiêu dùng. Theo nh cac
công ty l n nhân đinh , Ủ ki n cua khach hàn g là môt phân quan trong trong viêc hốnh
thành quan đi m Ủ ki n c a các khách hàng khác và s tin t ng vào th ng hi u , quyêt
đinh mua hang s liên quan đên các chính sách qu ng bá th ng hi u c a công ty h . V i
s phong phú c a các ngu n tài nguyên v quan đi m nh hi n nay, c h i va thach th c


4

là r t l n trong vi c s dung công nghê thông tin đê tốm kiêm va hiêu đ
ng


c y kiên cua

i khac [24]
Ng

i tiêu dùng khi đánh giá v m t s n ph m d ch v nào đó, h có th đ a ra Ủ ki n

t ng quan nh t v m t s n ph m. Ví d Chi c đi n tho i Iphone 6s là r t t t. Nh ng l i
có các Ủ ki n đ a ra đ đánh giá ch t l ng c a m t tính n ng (khía c nh, đ c tr ng) nào
đó c a s n ph m nh Màn hình c a chi c Iphone 6s là đ p ho c camera r t nét. Các Ủ
ki n ph n h i c a ng i tiêu dùng là đa d ng và phong phú. Vi c t ng h p các Ủ ki n th
công s m t nhi u th i gian và s c ng i. M t công c t ng h p Ủ ki n t đ ng c a ng i
tiêu dùng s làm gi m th i gian và công s c. Chính vì v y, tôi đã ch n h

ng nghiên c u

t ng h p quan đi m theo tính n ng c a s n ph m c a ng i tiêu dùng Vi t Nam v i d
li u ch y u đ c l y trên các di n đàn công ngh . Trong lu n v n c a mình, tôi trình bày
m t ph ng pháp t ng h p quan đi m, s d ng lu t lan truy n kép k t h p v i vi c tách
câu ghép và câu ph c thành các câu đ n (m i m t câu đ n ch a m t tính n ng c a s n
ph m) d a theo lu t đ trích xu t ra các tính n ng c a s n ph m c a ng i tiêu dùng Vi t
Nam. Ti p theo, tôi s d ng ki n th c v m u ph bi n đ lo i b các d li u nhi u. Và
cu i cùng, tôi s d ng ph ng pháp th ng kê đ t ng h p quan đi m đánh giá c a ng i
tiêu dùng v t ng tính n ng c a s n ph m.
Lu n v n c a tôi đ

c chia thành các ph n nh sau:

Ch ng 1: Trong ch ng này, tôi trình bày t ng quan v khai phá quan đi m và m t s
khái ni m liên quan.

ng th i, tôi trình bày nh ng khó kh n và thách th c c a khai phá
quan đi m và m t vài l nh v c ng d ng c a khai phá quan đi m đ c ng d ng trên th
gi i hi n nay
Ch

ng 2: Trình bày khái quát m t s ph

ng pháp v x lỦ ngôn ng t nhiên, h c

máy, th ng kê đ c các nhà nghiên c u trên th gi i nghiên c u và áp d ng vào vi c t ng
h p Ủ ki n theo tính n ng c a s n ph m trên th gi i c ng nh
Vi t Nam hi n nay
Ch ng 3: Trong ch ng này, tôi trình bày m t cách chi ti t m t ph ng pháp t ng
h p Ủ ki n theo tính n ng c a s n ph m đ c tôi nghiên c u và th nghi m v i d li u
ti ng Vi t
Ch

ng 4: K t qu th c nghi m và đánh giá đ

c trình bày trong ch

ng này.

Ch ng 5: Trình bày nh ng v n đ mà lu n v n đã và ch a th c hi n; đ nh h
s h ng phát tri n ti p theo c a lu n v n.

ng m t


5


Ch

ng 1. T ng quan v khai phá quan đi m

1.1. Gi i thi u
Chúng ta đã bi t, cùng v i s phát tri n c a Internet, các m ng xã h i, di n đàn, blog
nh Facebook, Twitter, Zing Me,… thu hút hàng tri u ng i Vi t Nam s d ng. T i đó
m i ng i th hi n quan đi m c a mình v r t nhi u v n đ , r t nhi u đ i t ng. t tình
hu ng ch ng h n m t ng i c n mua máy đi n tho i m i nh ng anh ta ch a bi t nên mua
lo i nào. Anh ta có th h i Ủ ki n c a b n bè, nh s t v n c a ng i bán hàng. M t
cách thông minh h n là anh ta có th tham kh o thông tin trên m ng, nh ng s ph i đ c
r t nhi u bài vi t. M t doanh nghi p khi đ a m t s n ph m ra th tr ng, h r t c n bi t
ng i tiêu dùng có ph n ng nh th nào v s n ph m c a h . H có th thuê nhân viên
tra c u các thông tin trên các trang m ng xã h i – n i mà ng

i tiêu dùng có th đ a ra
Chi
tho

n
t
t t

Q
N

i gi

Đ


m

m

ng

Hình 1.1. Mô hình khai phá quan đi m
các Ủ ki n v s n ph m đó sau khi h đã s d ng. Tuy nhiên, vi c th c hi n t ng h p các
Ủ ki n đánh giá đó thành m t b n t ng h p có th nhìn tr c quan nh t thì vi c t ng h p
th công m t r t nhi u th i gian. Vì v y, c n thi t ph i có m t công c th c hi n t ng h p
các Ủ ki n đó m t cách t đ ng. Vi c t đ ng t ng h p Ủ ki n, quan đi m v m t đ i
t ng hay v n đ c th nào đó g i là t ng h p quan đi m. Khi đó máy tính s tr giúp
ng i dùng b ng cách thu th p và phân tích v n b n ch a quan đi m và đ a ra k t qu
t ng h p.
Quan đi m là Ủ ki n c a cá nhân m t ng i v m t đ i t ng nào đó trong m t th i
gian nh t đ nh. Theo đ nh ngh a c a Liu [13], m t quan đi m bao g m 5 y u t (ei, a ij,


6

sijkl, hk, tl) trong đó ei là tên c a ch th , a ij là đ c tr ng c a ei, sijkl là quan đi m v đ c
tr ng a ij c a ei, hk là ng i gi quan đi m và tl là th i đi m mà quan đi m đó đ c đ a ra
b i hk. Quan đi m sijkl có th tích c c, tiêu c c, trung l p ho c có th bi u di n b i các
m c đ khác nhau.
Trong đ nh ngh a c a Liu có m t s khái ni m v đ i t
đi m đ c làm rõ nh sau:
it

1.1.1.

it

ng đ

giá. M i đ i t

ng, đ c tr ng, ng

i gi quan

ng
c dùng đ ch th c th (ng

i, s n ph m, s ki n, ch đ ,…) đ

c đánh

ng có m t t p các thành ph n (components) hay thu c tính (attributes) g i

chung là các đ c tr ng (tính n ng) (features) [12]. M i thành ph n hay thu c tính l i có
m t t p các thành ph n hay thu c tính con. Nh v y, m t đ i t ng O đ c bi u di n b i
m t c p [T, A] trong đó T là m t c u trúc phân c p g m các thành ph n cha và con; A là
t p các thu c tính c a đ i t ng O.
Ví d : Máy nh có m t t p thành ph n nh ng kính, pin và các thu c tính nh kích c ,
cân n ng, ch t l ng nh. Thành ph n pin có các thu c tính con nh kích c , th i gian,
dung l ng.
1.1.2. Các đ c tr ng n và hi n
V i m i đánh giá r bao g m t p các câu r = {s1, s2, … sm}. N u đ c tr ng f xu t hi n
trong r, ta nói f là đ c tr ng hi n (explicit feature). Ng c l i, ta nói f là đ c tr ng n
(implicit feature) [12].

Ví d :
Máy nh này đ t quá.

c tr ng giá là đ c tr ng n.

Màu s c này đ p ghê.

c tr ng màu s c là đ c tr ng hi n..

1.1.3.

o n đánh giá

o n đánh giá v m t đ c tr ng f c a đ i t

ng O trong r là m t t p các câu liên ti p

trong r di n t quan đi m tích c c hay tiêu c c v đ c tr ng f. o n đánh giá bao g m t i
thi u ít nh t m t câu [12].
Ví d :
B nh c a chi c đi n tho i này là nh .


7

Hôm qua, tôi mua m t chi c đi n tho i Iphone 5S siêu th đi n máy Tr n Anh. Tôi r t
thích nó. Kích th
c ng t t.

c c a nó phù h p v i tay tôi c m. Giá c ph i ch ng mà ch t l


ng

Hai ví d trên có s l ng câu và đ dài là khác nhau nh ng chúng đ u là các đo n
đánh giá cho s n ph m đi n tho i.
1.1.4. Quan đi m n, hi n
Quan đi m hi n (explicit opinion) v m t đ c tr ng f là quan đi m mang tính ch quan,
di n tr tr c ti p quan đi m tích c c hay tiêu c c c a tác gi . Quan đi m n (implicit
opinion) v m t đ c tr ng f là quan đi m tích c c hay tiêu c c đ
không t

c th hi n m t cách

ng minh [12].

Ví d :
i n tho i này đ p quá. Quan đi m hi n – khen chi c đi n tho i đ p.
Máy nh m i mua và đã h ng. Quan đi m n – chê chi c máy nh không t t.
1.1.5. Ng
Là ng
tr

i đánh giá

i hay t ch c c th đ a ra các Ủ ki n đánh giá c a cá nhân (t ch c). Trong

ng h p đánh giá các s n ph m trên các forum, blog thì ng

i đánh giá luôn là các tác


gi c a các đánh giá hay bài vi t đó [12].
1.2. Các thách th c trong khai phá quan đi m
1.2.1. Nh ng ng

i khác nhau có phong cách vi t khác nhau

Các Ủ ki n đánh giá đ c đ a ra b i nh ng ng i khác nhau thì h có các cách di n
đ t khác nhau, t cách th c s d ng ngôn t , ch vi t t t hay ng pháp trong câu là m t
thách th c riêng khi x lỦ.
1.2.2. Quan đi m thay đ i theo th i gian
M t thách th c khác c n ph i xét đ n là v n đ làm th nào đ có th theo dõi các quan
đi m thay đ i theo th i gian. M t s n ph m có th là t t nh t t i th i đi m này nh ng t i
th i đi m 2, 3 n m sau thì nó không ph i là t t nh t n a, ng i ta s có nhi u s l a ch n
h n khi các s n ph m m i t t h n v giá c và ch t l ng. Tuy nhiên, c ng có nh ng s n
ph m ban đ u đ a ra ngoài th tr ng ch a đ c t t nh ng qua quá trình c i thi n ch t
l ng c a s n ph m ho c d ch v thì l i đ c ng i tiêu dùng đánh giá cao h n.


8

Ví d : T i th i đi m n m 2012, dòng đi n tho i Iphone 4 đ

c ng

i tiêu dùng đánh

giá r t cao. Nh ng n m 2014, s n ph m Iphone 5 ra đ i thì m i ng i chuy n sang s
d ng Iphone 5. Lúc này, ch t l ng, t c đ x lỦ c a Iphone 4 đ c ng i tiêu dùng đánh
giá th p h n h n
1.2.3.


m nh c a quan đi m

Xác đ nh đ m nh c a m t quan đi m là m t thách th c ph i đ i m t trong khai phá
quan đi m. Nhi u n l c đã đ c th c hi n đ xác đ nh các y u t quy t đ nh s c m nh
c a m t Ủ ki n trong m t b i c nh nào đó. B sung thêm vi c phân l p các t thành các
m c đ xu h

ng quan đi m khác nhau, m t s t b ngh a có th đ

c dùng đ xác đ nh

đ m nh c a quan đi m(“r t”, “m t chút”, “h t s c”, “h i”,…). C m t “r t hài lòng”
và “h i hài lòng” s đ c phân l p thành r t tích c c và kém tích c c n u “r t” và “h i”
đ

c phân tích và s d ng đ xác đ nh m c đ đ i l p.
1.2.4. Quan đi m theo ng c nh

T ng t nh phân lo i m t quan đi m là tích c c, tiêu c c ho c trung l p có th là
m t nhi m v khó kh n trong khai phá quan đi m. M t t quan đi m có th đ c coi là
tích c c trong m t tình hu ng này nh ng nó l i mang tính tiêu c c trong tình hu ng khác.
M t quan đi m v m t s n ph m ho c m t tính n ng s n ph m c ng có th gây hi u
l m cho m t h th ng khai phá quan đi m đ đánh giá. Ví d t “dài” n u đ c s d ng
đ mô t tu i th c a pin c a máy tính xách tay theo m t cách đó là “tu i th pin c a
máy tính xách tay là dài”, nó s đ c coi là tích c c nh ng n u nó đ c s d ng theo m t
cách khác đó là “th i gian kh i đ ng c a máy tính xách tay dài”, nó s đ
ki n tiêu c c.

c coi là m t Ủ


1.2.5. Các câu đánh giá có s pha tr n
M t thách th c l n đ i v i khai phá quan đi m xu t hi n khi m i ng
giá tích c c và tiêu c c trong cùng m t câu. M i ng

i th hi n đánh

i có nhi u Ủ ki n khác nhau trong

cùng m t câu. Nh ng câu nh v y có th gây khó kh n đ phân tích cú pháp ho c khai
phá quan đi m.
Trong lu n v n c a mình, tôi đã c g ng đ gi i quy t v n đ này b ng vi c xây d ng
công c tách các Ủ quan đi m trong các câu có đánh giá v nhi u tính n ng thành các Ủ
nh . Trong đó, m i Ủ ch bao g m m t tính n ng và m t Ủ ki n đánh giá. (Chi ti t tôi xin
trình bày ch ng 3)


9

1.2.6. Quan đi m mang tính châm bi m, m a mai
Các quan đi m mang tính châm bi m, m a mai t n t i khá nhi u trong v n b n. Trong
đó m t quan đi m tiêu c c nh ng l i đ c ng i nêu quan đi m th hi n d i d ng quan
đi m tích c c. i u này gây khó kh n r t l n trong quá trình phân tích quan đi m. Ví d
B phim hay th này mà anh c ng r tôi đi xem khác v i B phim này r t hay
1.2.7. X lỦ ngôn ng t nhiên trong câu quan đi m
Các Ủ ki n mà m i ng i nêu lên trên các trang m ng xã h i th ng là h vi t theo
ngôn ng r t t nhiên c a h . H có th dùng ngôn ng , cách vi t t t hay các bi u t ng
c m xúc riêng. M i ng i khác nhau s có các phong cách vi t khác nhau. Vì th nên các
câu đánh giá th ng d ng bán c u trúc. Trong khi vi c c n thi t là t nh ng d li u bán
c u trúc, đ c vi t b ng ngôn ng r t t nhiên đó, chúng ta ph i đ a ra đ c các thông tin

h u ích. Tuy nhiên, trong đánh giá c a ng i tiêu dùng th ng, h th ng dùng các ngôn
ng v n b n là không chính th c và không theo quy t c ng pháp. Vì v y, v n đ x lỦ
ngôn ng t nhiên trong vi c x lỦ các Ủ ki n đánh giá là m t v n đ c c k khó kh n.
1.3. Các ng d ng trong khai phá quan đi m
1.3.1. Nghiên c u th tr

ng dành cho ng

i mua và bán

Khi chúng ta mu n mua m t s n ph m nào, chúng ta không bi t đ

c lo i s n ph m

này có phù h p hay không, c a hàng nào có d ch v khách hàng t t, giá bán đâu r h n,
ch t l ng đâu t t h n,… thì các quan đi m v s n ph m c a nh ng ng i dùng tr c
là m t kênh thông tin quan tr ng cho chúng ta.
Hay đ i v i nh ng ng i b t đ u kinh doanh, h ch a bi t kinh doanh m t hàng gì,
lo i s n ph m nào đang đ c ng i tiêu dùng a chu ng, hình th c kinh doanh nào là
h p lỦ, kinh doanh khu v c nào thu đ
khách hàng s h tr cho h .
1.3.2. C i thi n ch t l

c l i nhu n cao nh t. Khi đó, các hành vi c a

ng c a s n ph m, d ch v

Ta xem xét m t ví d sau: M t nhà s n xu t máy vi tính l n đang th t v ng v doanh
thu th p b t th ng c a mình. Lãnh đ o công ty đ a ra câu h i “T i sao khách hàng
không mua máy tính c a chúng ta?”. Nh ng thông tin c th nh giá thành, ch t l ng

s n ph m c a đ i th c nh tranh là m c tiêu chính đ kh o sát. Ngoài ra, các đánh giá ch
quan v thi t k , d ch v khách hàng,… c a khách hàng c ng là các y u t c n đ c xem
xét.


10

1.3.3. H th ng g i Ủ
Khai phá quan đi m c ng có vài trò quan tr ng nh m t công ngh h tr cho các h
th ng khác. M t ng d ng ti m n ng đó là ta có th áp d ng khai phá quan đi m trong
các h th ng khuy n cáo, giúp cho h th ng đ a ra các g i Ủ v các s n ph m cho ng i
dùng mà có kh n ng ng i dùng quan tâm là cao nh t, t ng l i nhu n cho doanh nghi p.
Trong các h th ng tr c tuy n, các qu ng cáo đ c hi n th góc màn hình c n đ c
ki m tra xem có phù h p v i n i dung trang web hay không. Ví d trong m t trang web
có n i dung chuyên v gan mà hi n th các qu ng cáo v các s n ph m r u là không h p
lỦ, n u hi n th qu ng cáo v các lo i thu c tr viêm gan s phù h p v i n i dung h n.
1.3.4. H tr thông minh trong chính quy n
Thông minh trong chính quy n là m t d ng ng d ng vô cùng h u ích đ i v i các
chính tr gia. Ch ng h n nh khi m t d lu t đ c đ a ra, qu c h i r t mu n l y Ủ ki n
c a nhân dân v d th o lu t, xem r ng nó có h p lỦ hay không, nhân dân có nh ng ph n
ng nh th nào v nó. Hay đ i v i nh ng cu c b u c t ng th ng, th t ng, nh ng Ủ
ki n đánh giá c a ng i dân gi m t vai trò quan tr ng đ i v i k t qu c a cu c b u c .
1.3.5. H tr đ a ra quy t đ nh
Khai phá quan đi m có vai trò to l n trong vi c h tr ra quy t đ nh. Ho c đ i v i
nh ng v n đ v kinh t xã h i khác.
i v i s ki n ch t 6700 cây xanh Hà N i, ph n
ng không đ ng tình c a ng i dân đã có tác đ ng to l n đ i v i chính quy n y ban
nhân dân thành ph Hà N i, Bí th thành y Hà N i ph i ra quy t đ nh xem xét và x lỦ
đ i v i s , ban ngành liên quan1. Hay đ i v i tin t c v v x ph t đ i v i quán café Xin
chào t i thành ph H Chí Minh đã bu c th t ng Nguy n Xuân Phúc ra ch đ o xem

xét, d ng kh i t v án2.
1.4. Các bài toán khai phá quan đi m
Khai phá quan đi m là m t l nh v c đ

c nghiên c u t nh ng n m 90, tuy nhiên v i

nh ng khó kh n và thách th c c a nó mà nó v n đ
và t i Vi t Nam nghiên c u.

c c ng đ ng nghiên c u trên th gi i

Theo nghiên c u c a Liu [7], khai phá quan đi m g m 3 bài toán chính nh sau:
 Phân l p quan đi m
1
2

/> />

11

 Khai phá quan đi m so sánh
 T ng h p quan đi m.
1.4.1. Phân l p quan điêm
V i bài toán này có th coi khai phá quan đi m nh bài toán phân l p v n b n. Bài
toán phân l p m t v n b n đánh giá là tích c c hay tiêu c c. Ví d : v i m t đánh giá s n
ph m, h th ng xác đ nh xem nh n xét v s n ph m y là t t hay x u. Phân l p này
th ng là phân l p m c tài li u. Thông tin đ c phát hi n không mô t chi ti t v
nh ng gì m i ng

i thích hay không thích.


Mô hình bài toán:
• T p đánh giá D = {di}
• Hai l p đánh giá Pos( tích c c) và Neg( Tiêu c c)
• B phân l p s phân di vào m t trong hai l p Pos/Neg
Ví d : Chúng ta có câu đánh giá

i n tho i này đ p quá. H th ng s th c hi n phân

l p câu quan đi m trên là tích c c hay tiêu c c
1.4.2. Khai phá quan đi m so sánh
Ngoài cách bi u di n các quan đi m b ng cách tr c ti p nh n xét v đ i t ng còn có
m t cách đánh giá là b ng cách so sánh đ i t ng mu n nh n xét v i m t đ i t ng khác.
Ví d , khi m t ng i nói m t cái gì đó là t t hay x u, ng i ta th ng yêu c u so v i cái
gì?. Vì v y, m t trong nh ng cách quan tr ng nh t c a đánh giá đ i t ng là so sánh tr c
ti p nó v i m t đ i t ng t ng t khác.
Ví d :
Ki u dáng đi n tho i Samsung galaxy S4 đ p h n galaxy S3
dáng c a đi n tho i Samsung galaxy S4 là đ i t

ng đ

đây đ c tr ng ki u

c nh n xét.

1.4.3. T ng h p quan đi m
 T ng h p quan đi m d a trên khía c nh
Bài toán này đi vào t ng h p quan đi m m c khía c nh đ làm rõ đ i t ng mà
ng i đ a ra quan đi m thích hay không thích.

i t ng đây có th là s n ph m, d ch
v , m t ch đ , m t cá nhân hay t ch c [22]. Chi ti t đ c trình bày trong ch ng 2


12

Ví d , trong m t câu đánh giá pin c a chi c đi n tho i Sony này là không t t thì quan
đi m đây phát bi u v tính n ng pin c a s n ph m chi c đi n tho i Sony. Yêu c u đ u
ra là m t b n t ng h p chi ti t các chi u h ng quan đi m theo các tính n ng c a s n
ph m.
 T ng h p quan đi m không d a trên khía c nh
Bài toán này đi vào t ng h p quan đi m c a đ i t ng. u vào là các Ủ ki n đánh giá
c a ng i dùng, đ u ra là m t b n t ng h p tóm t t chung chung v đ i t ng mà không
có các đánh giá c th v t ng khí c nh c a đ i t ng. Ví d nh Chi c đi n tho i Sony
này là ch a t t, khách hàng ch a hài lòng v nó, chúng ta c n ph i c i ti n thêm.


13

TẨI LI U THAM KH O
1.

Blair-Goldensohn, S.,Hannan, K., McDonald, R., Neylon, T., Reis,G.A., and Reyna,J.
(2008), Building a sentiment summarizer for local service reviews. In Proceedings of
International Conference on World Wide Web Workshop of NLPIX.

2.

Blei, D.M., Ng, A.Y., Jordan,M.I.(2003), Latent dirichlet allocation.The Journal of
Machine Learning Research. p. 993-1022


3.

Carenini, G., Ng, R., Pauls, A.. (2006), Multi-Document summarization of evaluative
text. In Proceeding of Conference of the European Chapter of the ACL(EACL-2006).

4.

Guo, H., Zhu, H., Guo, H., Zhang, X., Su, Z. (2009), Product feature categorization
with multilevel latent semantic association. In Proceedings of ACM International
Conference on Information and Knowledge Management.

5.

H Lee, A Chang, Y Peirsman, N Chambers, M Surdeanu, D Jurafsky Deterministic
Coreference Resolution Based on Entity-Centric, Precision-Ranked Rules. Journal
Computational Linguistics (4), December 2013 Pages 885-916).

6.

Hofmann, Thomas. (1999), Probabilistic latent semantic indexing. In Proceedings of
Conference on Uncertainty in Artificial Intelligence (UAI-1999).

7.

Hu, M., Liu, B. (2004), Mining and summarizing customer reviews. In Proceedings of
the tenth ACM SIGKDD international conference on Knowledge discovery and data
mining.

8.


Jin, Wei, Ho,H.H., (2009), A novel lexicalized HMM-based learning framework for
web opinion mining. In Proceedings of International Conference on Machine
Learning (ICML-2009).

9.

Kim, S., Zhang, J., Chen, Z., Oh, A.H., Liu, S. (2013), “A hierarchical aspect –
sentiment model for online reviews”, AAAI

10.

Lafferty, John, Andrew McCallum, and Fernando Pereira (2001), Conditional random
fields: Probabilistic models for segmenting and labeling sequence data. In Proceedings
of International Conference on Machine Learning (ICML-2001).

11.

Liu, B. (2009), Handbook Chapter: “Sentiment Analysis and Subjectivity”. Handbook
of Natural Language Processing. Marcel Dekker, Inc. New York, NY, USA.


14

12.

Liu, B. ( 2010), “Sentiment analysis and subjectivity”, In Handbook of Natural
Language Processing, Second Edition.

13.


Liu, B. ( 2012), “Sentiment analysis and Opinion mining”, University Of Illinois at
Chicago.

14.

Liu, B. (2012), Sentiment Analysis and Opinion Mining. Morgan & Claypool
Publishers.

15.

Moghaddam, S.,Ester, M. (2010), Opinion digger: an unsupervised opinion miner from
unstructured product reviews. In Proceedings of ACM International conference on
Information and Knowledge Management, 2010.

16.

Moghaddam, S.,Ester, M. (2011), ILDA: interdependent LDA model for learning latent
aspects and their ratings from online product reviews. In 46 Proceedings of ACM
SIGIR International Conference on Information Retrieval.

17.

Qiu, G., Liu, B., Bu, J., Chen, C. (2011), Opinion word expansion and target extraction
through double propagation. Computational Linguistics.

18.

Rabiner, Lawrence R. (1989), A tutorial on hidden Markov models and selected
applications in speech recognition. Proceedings of the IEEE, 77(2): pp. 257-286


19.

Titov, I., and McDonald, R.(2008a), Modeling online reviews with multi-grain topic
models. In Proceedings of International Conference on World Wide Web.

20.

Titov, I., and McDonald, R.(2008b), A joint model of text and aspect ratings for
sentiment summarization. In Proceedings of Annual Meeting of the Association for
Computational Linguistics.

21.

Yu, J., Zha, Z., Wang, M., Wang, K.,Chua, T (2011b). Domain-Assisted product aspect
hierarchy generation: towards hierarchical organization of unstructured consumer
reviews. In Proceedings of Conference on Empirical Methods in Natural Language
Processing.

22.

Zhang, L., Liu, B.(2014), "Aspect and Entity Extraction for Opinion Mining", book
chapter in Data Mining and Knowledge Discovery for Big Data: Methodologies,
Challenges, and Opportunities.

23.

Zhang, L., Liu, B., Lim, S., O’Brien-Strain, E., (2010), Extracting and ranking product
features in opinion documents. In Proceedings of International Conference on
Computational Linguistics (COLING-2010).



15

24.

Pang, B., Lee, B. (2008), Opinion mining and sentiment analysis, Found. Trends Inf.
Retr. 2, 1-2, 1–135

25.

Haseena,R.P. (2014) “Opinion Mining and Sentiment Analysis -Challenges and
Applications”, International Journal of Application or Innovation in Engineering &
Management (IJAIEM)

26.

Seerat, B., Azam, F. (2012), “Opinion Mining: Issues and Challenges”, International
Journal of Computer Applications.

27.

Thuy, H.Q. , Thanh, V.T., Trang, P.H., To,. L.C. (2011) An upgrading feature-based
opinion mining model on Vietnamese product reviews. In: Active Media Technology,
Lecture Notes in Computer Science, Springer Berlin Heidelberg, pp. 173–185.

28.

Jindal, Nitin, Liu, B.(2007) Review spam detection. In Proceedings of WWW (Poster
paper).


29.

Jindal, Nitin, Liu, B. (2008) Opinion spam and analysis. In Proceedings of the
Conference on Web Search and Web Data Mining (WSDM-2008).

30.

Mauge, K., Rohanimanesh, K., Ruvini, J.D. (2012) Structuring e-commerce inventory.
In Proceedings of Annual Meeting of the Association for Computational Linguistics
(ACL-2012).

31.

Zhai, Z., Liu, B., Xu, H., Jia, P. (2010) Grouping product features using
semisupervised learning with soft-constraints. In Proceedings of International
Conference on Computational Linguistics (COLING-2010).



×