Tải bản đầy đủ (.pdf) (70 trang)

Hệ thống tự động phân luồng câu hỏi và giải đáp yêu cầu trực tuyến (Luận văn thạc sĩ)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (669.12 KB, 70 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

NGUYỄN ĐẮC NAM

HỆ THỐNG TỰ ĐỘNG PHÂN LUỒNG CÂU HỎI VÀ
GIẢI ĐÁP YÊU CẦU TRỰC TUYẾN

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

Hà Nội – 2017


ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

NGUYỄN ĐẮC NAM

HỆ THỐNG TỰ ĐỘNG PHÂN LUỒNG CÂU HỎI VÀ
GIẢI ĐÁP YÊU CẦU TRỰC TUYẾN

Ngành: Công nghệ thông tin
Chuyên ngành: Kỹ thuật phần mềm
Mã số: 60480103
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS. TS. Phạm Ngọc Hùng
TS. Trần Quốc Long


Hà Nội – 2017


1
LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi. Các số liệu,
kết quả nêu trong Luận văn là trung thực và chưa từng được ai công bố trong bất
kỳ công trình nào khác.
Tôi xin cam đoan rằng mọi sự giúp đỡ cho việc thực hiện Luận văn này đã
được cảm ơn và các thông tin trích dẫn trong Luận văn đã được chỉ rõ nguồn gốc.

Học viên thực hiện Luận văn
(Ký và ghi rõ họ tên)


2
LỜI CẢM ƠN
Lời cảm ơn trân trọng đầu tiên em muốn dành tới các thầy cô Trường Đại
học Công Nghệ, Đại học Quốc Gia Hà Nội đã tận tình giảng dạy và truyền đạt
kiến thức trong suốt khóa học cao học vừa qua. Em cũng xin gửi lời cảm ơn tới
các thầy cô trong bộ môn Kỹ thuật phần mềm cũng như khoa Công nghệ thông
tin.
Đặc biệt em xin chân thành cảm ơn hai thầy PGS. TS. Phạm Ngọc Hùng
và TS. Trần Quốc Long, đã dìu dắt và hướng dẫn em trong suốt quá trình làm
luận văn, sự chỉ bảo và định hướng của thầy giúp em tự tin nghiên cứu những vấn
đề mới và giải quyết bài toán một cách khoa học.
Em xin trân trọng cảm ơn Ban giám hiệu và các thầy cô Trường Đại học
Công nghệ, Đại học Quốc Gia Hà Nội đã tạo các điều kiện cho em được học tập
và làm khóa luận một cách thuận lợi.
Xin được cảm ơn Trung tâm Quản lý Chất lượng – Trường Đại học Công

nghiệp Hà Nội đã tạo mọi điều kiện để tôi được đi học và hoàn thành tốt khoá
học.
Mặc dù đã cố gắng rất nhiều, nhưng chắc chắn trong quá trình học tập cũng
như luận văn không khỏi những thiếu sót. Em rất mong được sự thông cảm và chỉ
bảo tận tình của các thầy cô và các bạn.
Hà Nội, Ngày tháng năm 2017

Nguyễn Đắc Nam


3
MỤC LỤC

LỜI CAM ĐOAN .............................................................................................. 1
LỜI CẢM ƠN .................................................................................................... 2
MỤC LỤC ......................................................................................................... 3
DANH MỤC KÝ HIỆU VÀ CÁC CHỮ VIẾT TẮT .......................................... 5
DANH MỤC HÌNH VẼ VÀ ĐỒ THỊ ................................................................ 6
GIỚI THIỆU CHUNG ....................................................................................... 7
CHƯƠNG 1: TỔNG QUAN VỀ HỆ THỐNG TRẢ LỜI TỰ ĐỘNG .............. 11
1.1 Hệ thống trả lời tự động .......................................................................... 11
1.2 Tình hình nghiên cứu trong và ngoài nước .............................................. 14
1.3 Phân loại các mô hình trả lời tự động ...................................................... 16
CHƯƠNG 2: CƠ SỞ MẠNG NƠ-RON NHÂN TẠO...................................... 22
2.1 Kiến trúc mạng nơ-ron nhân tạo .............................................................. 22
2.2 Hoạt động của mạng nơ-ron nhân tạo ...................................................... 24
2.3 Mạng nơ-ron tái phát và ứng dụng........................................................... 28
CHƯƠNG 3: ỨNG DỤNG MÔ HÌNH MẠNG NƠ-RON VÀO TRẢ LỜI TỰ
ĐỘNG .............................................................................................................. 33
3.1 Phát sinh ngôn ngữ trả lời tự động .............................................................. 33

3.2 Mô hình chuỗi tuần tự liên tiếp ................................................................... 35
3.3 Mô hình trả lời tự động............................................................................... 37
3.4 Một số đặc điểm khi xây dựng hệ thống trả lời tự động .............................. 38
3.4.1. Phụ thuộc bối cảnh .............................................................................. 38
3.4.2. Kết hợp tính cách ................................................................................ 39
3.5 Các vấn đề khó khăn khi trả lời tự động bằng Tiếng Việt ........................... 39
3.5.1 Đặc điểm ngữ âm ................................................................................. 39
3.5.2 Đặc điểm từ vựng: ................................................................................ 40
3.5.3 Đặc điểm ngữ pháp............................................................................... 40


4
CHƯƠNG 4: XÂY DỰNG HỆ THỐNG TRAO ĐỔI THÔNG TIN TRỰC
TUYẾN GIỮA SINH VIÊN VỚI NHÀ TRƯỜNG TẠI TRƯỜNG ĐẠI HỌC
CÔNG NGHIỆP HÀ NỘI ................................................................................ 42
4.1 Lựa chọn bài toán ....................................................................................... 42
4.2 Quy trình trao đổi thông tin (hỏi đáp trực tuyến) giữa HSSV với Nhà trường
tại Trường Đại học Công nghiệp Hà Nội .......................................................... 43
4.2.1 Quy trình áp dụng................................................................................. 43
4.2.2 Mô tả quy trình áp dụng ....................................................................... 44
4.3 Kiến trúc ứng dụng ..................................................................................... 48
4.4 Cài đặt hệ thống ......................................................................................... 50
4.4.1 Mô hình cài đặt..................................................................................... 50
4.4.2 Môi trường cài đặt ................................................................................ 52
4.4.3 Công cụ cài đặt ..................................................................................... 54
4.5 Kết quả đạt được ........................................................................................ 54
4.5.1 Một số kết quả ...................................................................................... 54
4.5.2 Hiệu năng ............................................................................................. 56
KẾT LUẬN...................................................................................................... 58
TÀI LIỆU THAM KHẢO ................................................................................ 60



5
DANH MỤC KÝ HIỆU VÀ CÁC CHỮ VIẾT TẮT
STT Ký

hiệu, Tiếng anh

Chú giải

viết tắt
1

AI

Artificial Intelligence

Trí tuệ nhân tạo

2

ANN

Artificial Neural Network

Mạng

Nơ-ron

nhân tạo

3

ML

Machine Learning

Học máy

4

LSTM

Long short-term memory network

5

QA

Question answering system

Hệ thống hỏi đáp

6

RNN

Recurrent Neural Network

Mạng nơ-ron tái
phát


7

SVM

Support Vector Machine

Máy vecto hỗ trợ


6
DANH MỤC HÌNH VẼ VÀ ĐỒ THỊ
Hình 1.1: Mô hình chuỗi sinh
Hình 1.2. Các bước chung của hệ thống trả lời tự động
Hình 2.1: Kiến trúc mạng nơ-ron nhân tạo
Hình 2.2: Quá trình xử lý thông tin của một mạng nơ-ron nhân tạo.
Hình 2.3: Ứng dụng RNN trong máy dịch.
Hình 2.4: Ứng dụng RNN phát sinh mô tả cho ảnh.
Hình 2.5: Mạng RNN hai chiều.
Hình 2.6: Mạng RNN nhiều tầng.
Hình 3.1: Mô hình phát sinh văn bản
Hình 3.2: Quá trình huấn luyện và phát sinh văn bản
Hình 3.3: Mô hình chuỗi liên tiếp (chuỗi sang chuỗi) seq2seq.
Hình 3.4: Mô hình đối thoại seq2seq.
Hình 4.1. Quy trình áp dụng hệ thống hỏi đáp
Bảng 4.2 Mô tả quy trình áp dụng
Hình 4.3: Kiến trúc mô hình đối thoại cho tiếng Việt
Bảng 4.4: Thông tin phần cứng
Bảng 4.5: Các công cụ phần mềm được sử dụng



7
GIỚI THIỆU CHUNG
Hiện tại việc tiếp nhận, giải quyết và trả lời câu hỏi thắc mắc hoặc yêu cầu
của người dùng như (Hệ thống hỏi đáp Q&A và giải quyết thắc mắc): của khách
hàng trong hoạt động thương mại, của người dân trong thủ tục hành chính, của
học sinh - sinh viên trong hoạt động đào tạo của các trường đại học - cao đẳng ...
là rất lớn. Các hoạt động tiếp nhận câu hỏi và trả lời câu hỏi hiện nay đều là hoạt
động mang tính thủ công mà chưa có công cụ nào trợ giúp. Việc tiếp nhận và xử
lý còn chậm, thiếu chính xác và chưa công khai minh bạch. Các câu hỏi và yêu
cầu của người dùng thì đi vào nhiều lĩnh vực và thuộc nhiều đối tượng trả lời khác
nhau, việc lựa chọn đúng đối tượng trả lời gây khó khăn và hiểu nhầm cho người
dùng dẫn đến các câu hỏi và yêu cầu thường không được trả lời thỏa đáng.
Cho đến nay các hệ thống trực tuyến đã giải quyết được những yêu cầu tiện
lợi hơn. Ví dụ như mua sắm trên mạng: người sử dụng có thể truy cập vào một
địa chỉ và có thể mua sắm được nhiều mặt hàng của nhiều đơn vị sản xuất (Ví dụ
amazon, lazada). Yêu cầu của người mua hàng được các website này phân tích và
đưa ra các đề nghị sản phẩm hợp lý với người mua hàng nhờ vào các hệ thống trí
tuệ nhân tạo (AI) và học máy (ML) giúp cải thiện doanh thu bán hàng đáng kể và
là thành phần không thể thiếu trong các website bán hàng ngày nay.
Do vậy hệ thống phân luồng và trả lời tự động rất thiết thực trong bối cảnh
hiện nay.
1. Tính cấp thiết của bài toán trả lời tự động
Trong bối cảnh mạng xã hội và các website mua sắm đang ngày càng trở
nên rất phổ biến như hiện nay, con người cũng tăng nhu cầu kết nối với con người
thông qua mạng xã hội, vào bất kỳ thời gian nào và ở bất cứ nơi đâu. Sẽ thật tốt
hơn nếu có một hệ thống tự động thông minh hỗ trợ con người bằng cách trò
chuyện, có khả năng nhắc nhở, có thể giải đáp mọi thắc mắc chỉ trong thời gian
ngắn nhất.



8
Khái niệm về trợ lý ảo, chatbot, hay hệ thống trả lời tự động đang là chủ đề
nóng, khi các công ty lớn như Microsoft (Cortana), Google (Google Assistant),
Facebook (M), Apple (Siri), Samsung (Viv) đã giới thiệu các trợ lý ảo của mình,
là các hệ thống trả lời tự động. Chính thức vào cuộc chơi chatbot, với mong muốn
tạo ra một trợ lý ảo thực sự thông minh tồn tại trong hệ sinh thái trong các sản
phẩm của mình. Gần đây nhất Microsoft đã tạo ra Microsoft Chat Framework cho
phép các nhà phát triển tạo ra các chatbot trên nền tảng Web và Skype, hay
Facebook cũng phát hành F8 SDK cho phép nhà phát triển tích hợp vào
Messenger.
Và không chỉ các ông lớn trong giới công nghệ, các công ty khởi nghiệp
mới cũng đang cố gắng tạo ra các dịch vụ nhằm thay đổi cách khách hàng tương
tác bằng các giải pháp trợ lý ảo. Nhằm trợ giúp người dùng, khách hàng của mình
có những trải nghiệm tốt nhất về sản phẩm và cách cung cấp dịch vụ. Nổi bật nhất
trong đó phải kể đến các ứng dụng tích hợp trợ lý ảo như wit.ai, x.ai, reply.ai trên
nền tảng Messenger của Facebook.
Ở trong nước, một số công ty như Quản lý Hồ sơ y tế điện tử ERM.,JSC và
Vietcare đã phát triển tạo ra hệ thống trả lời tự động về kiến thức y khoa, hỏi đáp
về sức khỏe thông tin y tế, hay RiveHub, Subiz, … cũng đang cố gắng tạo ra cho
mình một hệ thống hỗ trợ, chăm sóc khách hàng và bán hàng tự động.
Rất nhiều công ty khác đang có hi vọng phát triển các trợ lý ảo có thể hiểu
được ngôn ngữ tự nhiên của con người, có thể trả lời tự động và tương tác được
với con người một cách tự nhiên. Nhiều người cho rằng việc sử dụng kỹ thuật xử
lý ngôn ngữ tự nhiên NLP và các kỹ thuật học sâu Deep Learning để làm tăng
được chất lượng và hiệu quả của hệ thống. Nhưng từ lý thuyết đến thực tế là cả
một chặng đường dài, bằng cách nào đó, con người có thể tích hợp trí tuệ nhân
tạo (AI) vào các sản phẩm công nghiệp của mình.
Như vậy, hệ thống trả lời tự động có những nhiệm vụ và vai trò quan trọng,
có thể trợ giúp được con người rất nhiều trong rất nhiều lĩnh vực: y tế, giáo dục,



Luận văn đầy đủ ở file: Luận văn full
















×