Tải bản đầy đủ (.ppt) (10 trang)

Bài giảng Khai phá quan điểm và khai phá phương tiện xã hội: Chương 2 - PGS.TS. Hà Quang Thụy

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (75.33 KB, 10 trang )

BÀI GIẢNG KHAI PHÁ QUAN ĐIỂM
VÀ KHAI PHÁ PHƯƠNG TIỆN XÃ HỘI
CHƯƠNG 2. BÀI TỐN KHAI PHÁ QUAN ĐIỂM
(PHÂN TÍCH TÌNH CẢM)

PGS. TS. HÀ QUANG THỤY
HÀ NỘI 09-2013
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
ĐẠI HỌC QUỐC GIA HÀ NỘI

1


Nội dung
Định nghĩa bài tốn
2.
Tóm tắt quan điểm
Các kiểu khai phá quan điểm
4.
Chủ quan và cảm xúc
1.

3.

2


1. Định nghĩa bài tốn đánh giá QĐ


Ví dụ liên quan (Ví dụ 2.1)


Người đưa: John Smith
Ngày: 10 tháng chín năm 2011
"(1) Tôi mua một máy ảnh Canon G12 sáu tháng trước đây. (2) Tơi đơn giản chỉ là thích nó. (3) Chất lượng
hình ảnh là tuyệt vời. (4) Tuổi thọ pin cũng dài. (5) Tuy nhiên, vợ tôi nghĩ rằng nó là q nặng cho cơ ấy. “



Phân tích ví dụ
+ Đánh giá này có một số quan điểm tích cực (Câu 2, 3, 4) và tiêu cực (câu 5)
Nhận diện: Mỗi quan điểm có hai thành phần chính “(g, s): g là đối tượng và s là quan điểm tích cực tiêu chức”
Khai phá quan điểm ở đây có dạng (g, s): g là thực thể/khía cạnh, s là đánh giá tích cực, tiêu cực, trung tính:
định hướng phân cực (sentiment/opinion) orientations/polarities).
+ Đánh giá này có hai tác giả
+ Đánh giá này xẩy ra ngày 10/9/2011

3


Định nghĩa quan điểm


Định nghĩa quan điểm sơ bộ










Quan điểm: (g, s, h, t)
g: đối tượng quan điểm (hoặc tình cảm): opinion target,
s : đánh giá về đối tượng: sentiment,
h: người chủ quan điểm: opinion holder
t : thời gian bày tỏ quan điểm
Ví dụ: (Canon G12, thích, Smith, 10/9/2011)
(Hình ảnh Canon G12, tuyệt vời, Smith, 10/9/2011)

Định nghĩa thực thể






Thực thể: sản phẩm, dịch vụ, chủ đề, vấn đề, người, tổ chức, hoặc
sự kiện.
Mô tả bằng cặp e: (T, W), với T là một hệ phân cấp của các thành
phần, thành phần con v.v., và W là một tập các thuộc tính của e.
Phân biệt khía cạnh – thành phần: trọng lượng: đặc trưng, pin:
thành phần (tháo lắp được)

4


Định nghĩa quan điểm khái quát


Định nghĩa quan điểm khái quát

Một quan điểm p = (ei, aij, sijkl, hk, tl),
 ei : tên một thực thể,
 aij : một khía cạnh của ei,
 sijkl : quan điểm trên khía cạnh aij của thực thể ei,
 hk : người chủ quan điểm,
 tl : thời gian khi quan điểm được hk bày tỏ.
sijkl tình cảm tích cực, tiêu cực hoặc trung tính, hoặc thể hiện
với mức độ sức mạnh / cường độ khác nhau (1-5)




Nhận xét định nghĩa




quan điểm sijkl phải được người chủ quan điểm hk đưa ra về
khía cạnh aij của thực thể ei vào thời điểm tl.
Năm thành phần là rất cần thiết, thiếu bất kỳ thành phần nào
sẽ là vấn đề

5


Thể hiện khía cạnh và quan điểm


Thể hiện khía cạnh hiện/ẩn







Thể hiện hiện được biểu diễn bằng danh từ/cụm danh từ.
“Ảnh chụp của Canon rất tươi”
Thể hiện ẩn: khơng có danh từ/cụm danh từ biểu diễn.
“Canon nặng”. Khía cạnh “trọng lượng” ẩn. “Máy ảnh này
đắt”

Thể hiện tình cảm




Tình cảm/đánh giá sijkl thường là từ/cụm từ. Phổ biến hiện:
có từ tình cảm xuất hiện
Có thể có thêm trọng số: (1-5), hoặc như SentiWordNet.

6


MH thực thể và MH tài liệu quan điểm


Mơ hình thực thể









Biểu diễn ei một cách toàn bộ và một tập hữu hạn khía
cạnh Ai = {ai1, ai2,..., ain}.
ei được biểu diễn với bất kỳ một tập hữu hạn các thể hiện
thực thể của nó {eei1, eei2,..., eeis}.
Mỗi khía cạnh aij. của thực thể ei được thể hiện với bất kỳ
một tập hợp hữu hạn của các biểu diễn khía cạnh {aeij1,
aeij2,..., aeijm}

Mơ hình tài liệu quan điểm


Tài liệu d chứa quan điểm trên một tập thực thể {e1, e2,...,
er} và một tập con các khía cạnh của chúng từ một tập các
chủ sở hữu quan điểm {h1, h2,..., hp} vào một thời điểm cụ
thể

7


Bài Trích
tốn
trong phân tích quan điểm
xuất và phân lớp thực thể



Input: Tài liệu quan điểm d
Output: tập thực thể {e1, e2,..., er} xuất hiện trong d






Trích xuất và phân lớp khía cạnh





Trích xuất và phân lớp chủ của tình cảm







Input: Một quan điểm trong tài liệu d
Output: Thời gian phát biểu quan điểm

Phân lớp khía cạnh quan điểm






Input: tập thực thể {e1, e2,..., er} xuất hiện trong d
Output: Người nêu một quan điểm về một thực thể e

Trích xuất và chuẩn hóa thời gian




Input: Thực thể e trong tài liệu d
Output: Các nhóm cụm từ thể hiện các khía cạnh của e

Input: Cho một khía cạnh a và một nhận xét
Output: Nhận xét là tích cực/tiêu cực

Sinh bộ 5 quan điểm



Input: Tài liệu quan điểm d
Output: Mọi bộ năm quan điểm trong d

8


Ví dụ


Nhận xét
bigJohn ngày: 15 Tháng Chín, 2011

(1) Tơi mua một máy ảnh Samsung và bạn của tôi mua một máy
ảnh Canon hôm qua. (2) Tuần qua, hai chúng tôi sử dụng máy ảnh
rất nhiều. (3) Hình ảnh từ Samy của tôi là không tuyệt vời, và tuổi
thọ pin ngắn. (4) Bạn của tơi hài lịng với máy ảnh của mình và rất
hài lịng về chất lượng hình ảnh của nó. (5) Tơi muốn có một máy
ảnh có thể chụp ảnh tốt. (6) Tơi sẽ có nó vào ngày mai.
Chỉ có câu 3,4 là câu quan điểm



Kết quả





(Samsung, chất_lượng_ảnh, tiêu cực, bigJohn, Sept-15-2011)
(Samsung, tuổi_thọ_pin, tiêu cực, bigJohn, Sept-15-2011)
(Canon, GENERAL, tích cực, Bạn-bigJohn, Sept-15-2011)
(Canon, chất_lượng_ảnh, tích cực, Bạn-bigJohn, Sept-15-2011)

9


Tổng hợp quan điểm


Quan điểm cần được tổng hợp
Một người không cho ý kiến quyết định
Tập hợp quan điểm nhiều người

Phân tích quan điểm ~ Tóm tắt đa văn bản







Ví dụ
Máy ảnh số 1:
Khía cạnh: CHUNG
Tích cực: 105
<câu quan điểm cá nhân>
Phủ định: 12
<câu quan điểm cá nhân>
Khía cạnh: Chất lượng hình ảnh
Tích cực: 95
<câu quan điểm cá nhân>
Phủ định: 10
<câu quan điểm cá nhân>
Khía cạnh: Tuổi thọ pin
Tích cực: 50
<câu quan điểm cá nhân>
Phủ định: 9
<câu quan điểm cá nhân>




10




×