Tải bản đầy đủ (.docx) (116 trang)

Giải pháp chuyển đổi số nhằm tối ưu công việc tại vnpt quảng trị thạc sĩ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.18 MB, 116 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC DUY TÂN

NGUYỄN THANH TÙNG

GIẢI PHÁP CHUYỂN ĐỔI SỐ NHẰM TỐI ƯU CÔNG VIỆC TẠI
VNPT QUẢNG TRỊ

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

ĐÀ NẴNG – 2022


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC DUY TÂN

NGUYỄN THANH TÙNG

GIẢI PHÁP CHUYỂN ĐỔI SỐ NHẰM TỐI ƯU CÔNG VIỆC TẠI
VNPT QUẢNG TRỊ

Chuyên ngành: Khoa học máy tính
Mã số: 8480101

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Người hướng dẫn khoa học: PGS. TS. Nguyễn Gia Như

ĐÀ NẴNG – 2022



i

LỜI CAM ĐOAN
Tôi xin cam đoan bài luận văn này là cơng trình nghiên cứu của tơi. Được dẫn
dắt và hướng dẫn bởi PGS. TS Nguyễn Gia Như. Các nhận định nêu ra trong luận
văn là kết quả nghiên cứu nghiêm túc, độc lập của bản thân tôi tạo nên luận văn trên
cơ sở tìm hiểu, nghiên cứu các tài liệu khoa học và bản dịch tác phẩm đã được cơng
bố. Luận văn đảm bảo tính khách quan, trung thực và khoa học. Lĩnh vực nghiên
cứu ChatBot, chuyển về ứng dụng VNPT Samrtbot giải quyết các vấn đề chuyển
đổi số nhằm tối ưu công việc tại VNPT Quảng trị, tối ưu nhân lực, chăm sóc khách
hàng tốt hơn, tìm kiếm nhiều đối tượng khách hàng, ứng dụng này hướng đến sự hài
lòng của khách hàng là thước đo của thương hiệu. Luận văn mang tính khoa học để
giải bài tốn về ngơn ngữ, kết hợp tìm thơng tin diện rộng một cách thông minh.
Việc giao tiếp người – máy trở nên dể dàng hơn bao giờ hết. Các bài toán tự học của
máy, cũng như trí tuệ nhân tạo được ứng dụng triệt để giúp việc tương quan người –
máy được thân thiện với đời sống con người. Mang đến cho người dùng giải pháp
kinh tế số của thời đại.


ii

LỜI CẢM ƠN
Để hoàn thành luận văn, cùng với những nỗ lực của bản thân, Tôi đã nhận
được sự động viên, giúp đỡ của rất nhiều người. Tôi xin chân thành bày tỏ lòng biết
ơn sâu sắc đến PGS-TS Nguyễn Gia Như Trường Đại học Duy Tân. Thầy đã tận
tình chỉ bảo và hướng dẫn Tơi trong suốt q trình học tập, nghiên cứu và hoàn
thành luận văn tốt nghiệp.
Xin chân thành cảm ơn thầy cô giáo trong Ban chủ nhiệm nhà Trường, Khoa
sau Đại học, đã hướng dẫn và tạo điều kiện thuận lợi để Tơi hồn thành luận văn
đúng thời hạn.

Đặc biệt, tôi xin trân trọng cảm ơn Lãnh đạo, các đồng nghiệp của tôi đang
công tác tại VNPT - Quảng Trị đã nhiệt tình ủng hộ, động viên, giúp đỡ tơi trong
q trình học tập và cung cấp những thông tin, số liệu cần thiết để tôi thực hiện luận
văn.
Xin gửi lời cảm ơn đến gia đình, anh chị em, bạn bè đã động viên, giúp đỡ tơi
trong suốt q trình hồn thành luận văn này.
Tơi xin chân thành cảm ơn!

Tác giả luận văn

Nguyễn Thanh Tùng


iii

MỤC LỤC

LỜI CAM ĐOAN.....................................................................................................i
LỜI CẢM ƠN..........................................................................................................ii
MỤC LỤC............................................................................................................... iii
DANH MỤC KÝ HIỆU, CÁC CHỮ VIẾT TẮT.................................................iv
DANH MỤC CÁC BẢNG.......................................................................................v
DANH MỤC HÌNH VẼ..........................................................................................vi
MỞ ĐẦU..................................................................................................................1
1. Đặt vấn đề..............................................................................................................1
2. Phương pháp đề xuất.............................................................................................3
3. Mục tiêu của nghiên cứu........................................................................................5
4. Bố cục luận văn.....................................................................................................6
Chương 1: KIẾN THỨC TỔNG QUAN................................................................7
1.1 Tổng quan về Chatbot..........................................................................................7

1.1.1 Giới thiệu về chatbot.........................................................................................7
1.1.2 Sự phát triển của chatbot..................................................................................8
1.1.3 Phân loại chatbot............................................................................................10
1.1.4 Cấu trúc của một chương trình chatbot..........................................................14
1.1.5 Các tính năng cơ bản của chatbot..................................................................15
1.2 Các kỹ thuật ứng dụng trong chatbot.................................................................18
1.2.1 Xử lý ngôn ngữ tự nhiên (NLP/NLU)..............................................................18
1.2.2 Sinh ngôn ngữ tự nhiên (NLG)........................................................................27
1.2.3 Các kỹ thuật học máy (Machine learning)......................................................29
1.2.4 Mạng nơ ron nhân tạo (Neural network)........................................................31
1.3 Các dịch vụ tư vấn bán hàng trực tiếp................................................................33
1.3.1 Tổng quan dịch vụ ineternet, Mytv, Vinaphone của VNPT.............................33
1.3.2 Marketing trong lĩnh vực Data.......................................................................35
1.3.3 Ứng dụng công nghệ trong lĩnh vực dịch vụ công nghệ..................................35


iv

1.4 Một số công việc liên quan đến đề tài................................................................36
Chương 2: XÂY DỰNG CHATBOT TƯ VẤN DỊCH VỤ VNPT THEO TIẾP
CẬN HỌC MÁY....................................................................................................38
2.1 Mơ tả bài tốn....................................................................................................38
2.2 Thiết kế VNPT Smartbot...................................................................................39
2.2.1 Phương thức hoạt động của Chatbot – Chatterbot.........................................39
2.2.2. Long Short Term Memory (LSTM) trí nhớ ngắn/dài hạn...............................40
2.2.3. Recurrent Neural Network (RNN) mạng thần kinh tái diễn giải quyết
mỏ/đóng cuộn ngữ cảnh phù hợp (LSTM)...............................................................43
2.2.4. Sơ lược về Artificial Neural Network (ANN).................................................44
2.3 Mơ hình hệ thống...............................................................................................49
2.3.1. Tiền xử lý dữ liệu...........................................................................................51

2.3.2. Trích x́t đặc trưng......................................................................................52
2.3.3. H́n luyện mơ hình.......................................................................................53
2.3.4. Quản lý hội thoại...........................................................................................55
Chương 3: KẾT QUẢ VÀ THỰC NGHIỆM......................................................58
3.1 Công nghệ và nền tảng sử dụng.........................................................................58
3.1.1 Ngơn ngữ lập trình..........................................................................................58
3.1.2 Thư viện và môi trường sử dụng.....................................................................58
3.1.3 Độ đo của mơ hình..........................................................................................59
3.2 Các tiêu chí đánh giá..........................................................................................62
3.3 Cài đặt và kết quả thử nghiệm...........................................................................62
3.3.1 Xây dựng dữ liệu.............................................................................................62
3.3.2 Cài đặt thử nghiệm trích chọn đặc trưng........................................................66
3.3.3 Cài đặt và thử nghiệm h́n luyện mơ hình.....................................................68
3.3.4 Ảo hóa quản lý hội thoại.................................................................................74
3.3.5 Tích hợp lên mơi trường website của VNPT...................................................76
3.4 Nhận xét chung..................................................................................................79
KẾT LUẬN............................................................................................................81


v

1. Tổng kết............................................................................................................... 81
2. Hướng phát triển..................................................................................................82
TÀI LIỆU THAM KHẢO
PHỤ LỤC


vi

DANH MỤC KÝ HIỆU, CÁC CHỮ VIẾT TẮT


Từ viết tắt

Nghĩa tiếng Anh

Nghĩa tiếng Việt

NLP

Natural Language Process

Xử lý ngôn ngữ tự nhiên

NLU

Natural language understanding

Hiểu ngôn ngữ tự nhiên

NLG

Natural language generation

Sinh ngôn ngữ tự nhiên

FSM

Finite state machine

Máy trạng thái hữu hạn


SVM

Support vector machine

Véc tơ máy hỗ trợ

AI

Artifficial Inteligence

Trí truệ nhân tạo

ML

Machine Learning

Máy học

IoT

Internet of Things

Internet vạn vật

Term frequency - Inverse

Tần suất- Tần suất đảo nghịch

document frequency


từ

BoW

Bag of Word

Nhóm từ

LSTM

Long short term memory

Bộ nhớ ngắn dài

TF - IDF


vii

DANH MỤC CÁC BẢNG

Bảng 1.1. Mô tả cải tiến kỹ thuật được sử dụng trong các thế hệ chatbot................10
Bảng 1.2. Chatbot hỏi thông tin khách hàng truy vấn dịch vụ mở sổ tiết kiệm........23
Bảng 2.1. Ví dụ đoạn hội thoại hỏi về thông tin dịch vụ Vinaphone.......................50
Bảng 3.1. Kết quả tính tốn thủ cơng giá trị TF-IDF...............................................67
Bảng 3.2. Kết quả tính tốn giá trị TF-IDF từ hàm được cài đặt.............................67
Bảng 3.3. Thử độ đo theo mơ hình phân lớp với các bộ dữ liệu riêng biệt..............71
Bảng 3.4. Thời gian thử nghiệm mơ hình................................................................73
Bảng 3.5. Tỷ lệ trả lời đúng của mơ hình sau khi huấn luyện..................................73

Bảng 3.6. Một đoạn hội thoại thử nghiệm mơ hình sau huấn luyện.........................73


viii

DANH MỤC HÌNH VẼ

Hình 1.1. Các mốc thời gian phát triển của chatbot...................................................8
Hình 1.2. Mơ tả phép thử Turing...............................................................................9
Hình 1.3. Biếu đồ của 4 loại chatbot [2]..................................................................11
Hình 1.4 Artificial General Intelligence - AGI) [3].................................................12
Hình 1.5. Cấu trúc một chương trình chatbot cơ bản [4].........................................14
Hình 1.6. Các dịch vụ đáp ứng u cầu người dùng................................................15
Hình 1.7. Gán nhãn từ theo mơ hình B-I-O trong trích xuất thơng tin.....................20
Hình 1.8. Mơ tả quản lý hội thoại theo mơ hình máy trạng thái hữu hạn FSM........22
Hình 1.9. Phương pháp Top-Down..........................................................................26
Hình 1.10. Nhiệm vụ và kiến trúc Pipeline của NLG [7].........................................28
Hình 1.11. Kiến trúc phân lớp intent theo phương pháp học có giám sát................30
Hình 1.12. Mơ tả neural đơn....................................................................................31
Hình 1.13. Mơ tả Neural network............................................................................32
Hình 1.14. Logo VNPT nổi bật hiện nay.................................................................33
Hình 2.1 Mơ hình hoạt động Chatterbot..................................................................39
Hình 2.2. Học chun sâu có sử dụng vecter điều hướng (LSTM – Vecter)...........40
Hình 2.3. Mạng lưới thần kinh nhân tạo Artificial Neural Network (ANN)............44
Hình 2.4. Mơ hình thiết kế tổng quan hệ thống chatbot...........................................49
Hình 2.5. Tổ chức dữ liệu intents theo định dạng markdown..................................51
Hình 2.6. Tổ chức dữ liệu theo định dạng json........................................................51
Hình 2.7. Những từ đặc trưng sẽ được nhóm vào một nhóm và đánh trọng số........53
Hình 2.8. Mơ hình BoW được sử dụng trong NLP..................................................53
Hình 2.9. Class SVM...............................................................................................54

Hình 2.10 Multi-Class SVM (9)..............................................................................55
Hình 2.11. LSTM trong luồng xử lý chatbot...........................................................56
Hình 2.12. Kiến trúc cơ bản của mơ hình hóa đoạn hội thoại..................................56


ix

Hình 2.13. Học tăng cường của một hệ thống quản lý hội thoại..............................57
Hình 3.1. Cài đặt thư viện cần thiết.........................................................................68
Hình 3.2. Kết quả ước lượng độ chính xác tập dữ liệu huấn luyện phân loại ý định70
Hình 3.3. Ma trận nhầm lẫn, khơng chuẩn hóa........................................................71
Hình 3.4. Biểu đồ tương quan loss value và accuracy.............................................72
Hình 3.5. Mơ tả rẽ nhánh của phần quản lý hội thoại..............................................75
Hình 3.6. Build và start server chatbot....................................................................77
Hình 3.7. Deploy ứng dụng client............................................................................77
Hình 3.8. Cửa sổ chatbot box..................................................................................78
Hình 3.9. Script sử dụng tích hợp lên mơi trường website của VNPT.....................78
Hình 3.10. Demo VNPT Smartbot trên mơi trường web.........................................79


1

MỞ ĐẦU
1. Đặt vấn đề
Trong giai đoạn cạnh tranh hiện nay, ngành công nghệ thông tin đang là một
trong những lĩnh vực then chốt, quan trọng trong chiến lược phát triển của một đất
nước. Thành quả của nó mang lại cho nền kinh tế đã được chứng minh trong
khoảng 10 năm trở lại đây. Đến năm 2021, sự phát triển của công nghệ thông tin đã
được xác định đây là một giai đoạn mới và giới công nghệ cũng như các phương
tiên thông tin đại chúng đã đặt tên cho nó là thời đại cơng nghiệp 4.0. Cùng với sự

phát triển của các lĩnh vực thương mại điện tử, các công nghệ ứng dụng dữ liệu đa
phương tiện đang ngày càng phổ biến, các loại hình như âm thanh, hình ảnh ngày
càng trở thành cơng cụ truyền thơng, giải trí cũng như làm việc chủ yếu trên môi
trường mạng, hoặc nội bộ hiện nay.
Theo thống kế của các chuyên gia thì hiện nay các nguồn dữ liệu này chiếm từ
80-90% là dữ liệu khơng có cấu trúc và khối lượng dữ liệu này ngày càng tăng lên
một cách nhanh chóng và đáng kể. Vậy để các dữ liệu này có thể được tận dụng, sử
dụng có hiệu quả trong những mục đích khác nhau và việc ứng dụng của nó cụ thể ở
những đâu, hoàn cảnh nào là những bài tốn khơng hề đơn giản, chủ đề này ln là
những vấn đề mà các nhà công nghệ luôn luôn đặt ra và nghiên cứu hướng, giải
pháp ngày càng tốt hơn, hiệu quả hơn trong việc xử lý những dữ liệu này.
Một trong những hướng đi mà các hãng công nghệ lớn đang hướng tới trong
việc ứng dụng, sử dụng những dữ liệu khổng lồ này một cách có hiệu quả đó là ứng
dụng vào trí tuệ nhân tạo (Artificial Intelligent, gọi tắt là AI) và các hệ thống học máy
(Machine Learning, gọi tắt là ML). Nói đến trí tuệ nhân tạo hay học máy, chúng ta có
thể nghĩ ngay đến các phần mềm ứng dụng trí tuệ nhân tạo đang rất đình đám hiện
nay đó là các hệ thống trả lời tự động, trợ lý ảo, nhận diện khuôn mặt ứng dụng trên
các thế hệ điện thoại thông minh, trên các mạng xã hội (facebook, twitter…), và đặc
biệt là sự kiện nổi tiếng gần đây khi mà một hệ thống học máy đã chiến thắng được
trí tuệ con người ở một khía cạnh nào đó, đó là Alphago, một hệ thống học sâu đã


2

chiến thắng kiện tướng cờ vây người Hàn Quốc Lee Sedol thông qua các cơ chế tự
học.
Từ những ứng dụng thiết thực và hướng đi rất mới của công nghệ trí tuệ nhân
tạo, học máy thì hãng cơng nghệ lớn hoạt động trong lĩnh vực này đã và đang đầu tư
phát triển công nghệ AI và ML dựa trên những dữ liệu khổng lồ được cập nhật hàng
giây từ người dùng. Sản phẩm của AI và ML như nhận diện khn mặt, các hệ dự

đốn, chatbot, hệ thống trả lời tự động (question-answering).
Vậy để ứng dụng công nghệ để xử lý các khối dữ liệu phi cấu trúc trên thì các
kỹ thuật có thể xử lý dữ liệu phi cấu trúc văn bản cần được phát triển. Trong luận
văn này, tác giá sẽ tập trung nghiên cứu các kỹ thuật có thể xử lý văn bản bằng cách
phát triển một chatbot và ứng dụng chatbot trong bối cảnh giao tiếp giữa hệ thống tư
vấn Viễn thông và khách hàng sử dụng dịch vụ của VNPT. Chatbot là một tác nhân
đàm thoại có thể tương tác với con người một cách tuần tự bằng ngơn ngữ tự nhiên.
Mục tiêu chính của luận văn tốt nghiệp này là xây dựng một chatbot để trả lời các
câu hỏi phức tạp, thường đòi hỏi câu trả lời thậm chí phức tạp hơn trong một miền
được xác định rõ. Trọng tâm là chỉ trả lời các câu hỏi mà câu trả lời chất lượng
được đưa ra.
Có thể dễ dàng nhận thấy chatbot hiện nay đã xuất hiện trên nhiều hệ thống đa
phương tiên khác nhau. Tuy nhiên, một trong những hoạt động dịch vụ hiện nay
đang vẫn cịn bỏ ngỏ đó là ứng dụng chatbot trong hoạt động tư vấn dịch vụ VNPT
và công tác CSKH của VNPT. Những năm gần đây số lượng khách hàng sử dụng
các dịch vụ online ngày càng tăng từ thoại truyền thống sang thoại data, các trang
mạng xã hội với Viber, Zalo, Messenger … là con số người dùng vô cùng lớn, việc
đáp ứng nhu cầu khách hàng ngày càng cao, ứng dụng chatbot trong giao tiếp với
khách hàng sẽ giúp cho hoạt động kinh doanh của Viễn thông về tư vấn và chăm
sóc khách hàng hiệu quả hơn rất nhiều. Đặc biệt, các hoạt động về tư vấn, hậu kiểm,
trong các hoạt động tiếp cận khách hàng là những hoạt động mang tính chất khn
khổ phục vụ khách hàng tốt hơn hài lòng hơn về dịch vụ được cung cấp , trong
khi hiện nay các VNPT tỉnh thành vẫn đang phải duy trì một số lượng lớn nhân


3

viên, bộ phận hổ trợ để thực hiện các nghiệp vu tư vấn với khách hàng. Những
nghiệp vụ này hoàn tồn có thể thực hiện nghiên cứu tự động hóa, có thể giải đáp,
tư vấn cho khách hàng những nội dung cơ bản của các sản phẩm hay những chương

trình ưu đãi dành cho cá nhân và khách hàng doanh nghiệp, hay hậu kiểm dịch vụ
CSKH.
Trong một vài năm gần đây, các công ty tư vấn đã ứng dụng nhiều tiến bộ và
phát triển của lĩnh vực học máy phục vụ hỗ trợ khách hàng trong quá trình ra quyết
định. Đặc biệt trong lĩnh vực Marketing và IoT, đây là các lĩnh vực có nhiều thách
thức với khối lượng dữ liệu lớn, dữ liệu không cấu trúc.
Trong nghiên cứu này, tác giả xây dựng một chatbot để trả lời những câu hỏi
phức tạp và cả những câu trả lời tương ứng cũng phức tạp hơn, cụ thể là trên lĩnh
vực khiếu nại. Tại nghiên cứu này tác giả chỉ tập trung vào việc trả lời các câu hỏi
để làm sao có được một câu trả lời với chất lượng cao nhất. Tất nhiên trong đó có
những câu hỏi khơng nằm trong phạm vi của chatbot sẽ được gửi thẳng trực tiếp
đến con người để xử lý. Ví dụ hệ thống có thể rất hữu dụng cho các cơng ty khi họ
nhận được các câu hỏi tương đối phức tạp thì hệ thống của họ sẽ phải thực hiện đưa
ra những câu trả lời với chất lượng cao nhất sát nhất với mong muốn giải đáp của
khách hàng, trong khi đó cũng phải làm sao để giảm thiểu được tối đa sự can thiệp
của con người trong quá trình thực hiện dịch vụ hỏi đáp này, điều này cũng sẽ đồng
nghĩa với việc giảm chi phí cho tổ chức đang ứng dụng chatbot này. Một chatbot có
thể thay thế cho các bộ phận như helpdesk (quầy hổ trợ), trả lời tin nhắn tự động, trả
lời các phản hồi trên mạng xã hội hoặc tư vấn về các sản phẩm dịch vụ cung cấp.
Việc xử lý để xây dựng nên một chatbot trong nghiên cứu này tập trung vào hai kỹ
thuật quan trọng và chủ yếu đó là xử lý ngơn ngữ tự nhiên và đưa ra các phản hồi
đến người dùng với độ tin cậy và chính xác cao.
2. Phương pháp đề x́t
Bài tốn về các hệ thống hỏi đáp nói chung hay chatbot nói riêng đã có nhiều
cách giải quyết. Trên thực tế, khi chúng ta đứng trước bài toán xây dựng một
chatbot cho riêng mình hoặc cho một tổ chức, câu hỏi luôn đặt ra rằng nên bắt đầu


4


từ đâu, lựa chọn phương pháp nào, kỹ thuật nào để xây dựng chatbot, việc lựa chọn
này sẽ quyết định việc xây dựng chatbot thành công hay không.
Chatbot – chatterbot làm việc như thế nào?
Chatbot hoạt động như một người hổ trợ trung gian helpdesk, bằng cách bắt
chước các cuộc trò chuyện của con người và bắt đầu cuộc trò chuyện ngay lập tức
khi người dùng đặt câu hỏi và trả lời không mệt mỏi, bất kỳ thời điểm nào. Chatbots
tương ứng với hệ thống phụ trợ, truy xuất dữ liệu cần thiết từ kho lưu trữ dữ liệu và
cơ sở kiến thức trong thời gian thực và trả lời lại các truy vấn được nêu ra sau khi
xử lý dữ liệu thơng qua các thuật tốn NLP.
Trải qua q trình phát triển của chatbot trong một thời gian dài như vậy, có
nhiều loại chatbot được áp dụng những kỹ thuật khác nhau, chúng ta có thể tổng
quát lại gồm có 2 phương pháp tiếp cận chính để có thể xây dựng lên một hệ thống
chatbot đó là:
- Máy trạng thái hữu hạn (Finite state machines - FSM)
- Học máy (Machine learning - ML)
Đối với phương pháp máy hữu hạn (FSM) [1] ý tưởng chung là dựa trên kỹ
thuật khớp mẫu (pattern matching). Các FSM này có thể thực hiện những kỹ thuật
khớp mẫu từ đơn giản cho đến phức tạp cho các câu hỏi (được coi là một chuỗi văn
bản đến) từ người dùng bằng những mẫu hội thoại (patterns) đã được định nghĩa
trước. Khớp mẫu còn được gọi là kỹ thuật tự động hữu hạn và kỹ thuật này khơng
được xây dựng với mục đích phản hồi lại người dùng những câu hỏi ngoài phạm vi
hoặc rộng hơn những nội dung mà tập mẫu của nó được định nghĩa. Đây cũng là kỹ
thuật khá cổ điển, độ phức tạp khơng khó và nó có thể dễ dàng để xây dựng với chi
phí thấp, tuy nhiên phương pháp này không hiệu quả đối với miền dữ liệu phạm vi
rộng hoặc những khả năng phản hồi linh hoạt, tự nhiên.
Phương pháp học máy được ứng dụng với mục đích nhằm xây dựng một
chatbot với tính đáp ứng cao tới người dùng, khả năng bao quát ở một miền rộng
hơn những gì mà nó đang có, những câu trả lời, phản hồi khơng cứng nhắc như
những gì mà nó được sắp đặt, định nghĩa trước và việc áp dụng phương pháp. Với



5

những kỹ thuật phát triển hiện nay và với những vấn đề đã được đặt ra, thì việc tiếp
cận theo phương pháp học máy là một cách tiếp cận khả thi nhất để thực hiện.
Bản chất của phương pháp học máy sử dụng các mơ hình mơ phỏng mạng
(Neural network) để thực hiện cho mục đích xây dựng chatbot. Bằng cách này, các
chatbot sẽ có khả năng phản ứng tốt, hiệu quả hơn trong việc quản lý hội thoại với
con người hơn so với phương pháp máy hữu hạn. Bên cạnh đó, ứng dụng học máy ở
một kỹ thuật phức tạp hơn là học sâu (deep learning) sẽ còn giúp cho bot có thể kiểm
sốt được đa miền (multi-domain) hơn trên phương diện đa lĩnh (multi- service) vực
hơn.
Đối với lĩnh vực CNTT, Internet cũng có thể được coi là một miền ứng dụng
đóng trong số lượng các dịch vụ VNPT cung cấp. Tuy nhiên, lĩnh vực có nhiều đối
tượng cần phải thực hiện xử lý để định hướng được đoạn hội thoại giữa chatbot và
người dùng. Chatbot ứng dụng có thể là yếu tố giúp cho khách hàng có thiện cảm
với dịch vụ mà VNPT đang cung cấp, đáp ứng nhanh chóng hơn, bền bỉ, chính xác
hơn và tiết kiệm chi phí nhân cơng cho doanh nghiệp. Yếu tố này cũng ảnh hưởng
trực tiếp đến việc kinh doanh dịch vụ của Viễn thơng Quảng trị. Do đó, lựa chọn
phương pháp tiếp cận để xây dựng chatbot là VNPT Smartbot học máy sẽ giúp cho
việc giải quyết bài toán hiệu quả hơn.
Hiện nay có nhiều mơ hình huấn luyện máy được sử dụng trong học máy là
Long Short Term Memory (LSTM) trí nhớ ngắn/dài hạn được áp dụng trong dự báo
ngơn ngữ, để đạt được hiệu suất dự đoán tốt hơn và các yếu tố ảnh hưởng quan
trọng hơn được nhấn mạnh trong hội thoại. Recurrent Neural Network (RNN) mạng
thần kinh tái diễn giải quyết mỏ/đóng cuộn ngữ cảnh phù hợp (LSTM), Support
Vector Machine (SVM) có thể được phân tích về mặt lý thuyết bằng cách sử dụng
các khái niệm từ lý thuyết học tính tốn, đồng thời có thể đạt được hiệu suất tốt khi
áp dụng vào các bài toán thực tế.… đề tài lựa chọn SVM kết hợp với LSTM để thực
hiện hổ trợ nghiên cứu và thử nghiệm hai phương pháp đã lựa chọn trên, để xây

dựng chatbot trên miền đóng phục vụ tư vấn các dịch vụ VNPT cung cấp.
3. Mục tiêu của nghiên cứu


6

Tác giả lựa chọn đề tài nghiên cứu với mục tiêu tổng quát là nghiên cứu về
cấu trúc của một chatbot, ứng dụng (VNPT Smartbot) để tối ưu hoá chi phí nhân
cơng cho lĩnh vực tư vấn dịch vụ và chăm sóc khách hàng, các cơng việc chính cần
thực hiện sẽ tập trung vào việc:
- Nghiên cứu các công nghệ tiên tiến được ứng dụng và các kỹ thuật xây dựng
chatbot như xử lý ngôn ngữ tự nhiên, xác định ý định người dùng, trích xuất thơng
tin, quản lý hội thoại và các kỹ thuật xử lý học máy trong ứng dụng chatbot.
- Đưa ra được bài toán thực nghiệm, ứng dụng một số mơ hình ứng dụng
chatbot AI (hay các hệ thống question-answering) cho bài toán dự đoán, hỏi đáp
trong một lĩnh vực cụ thể. Bên cạnh mục tiêu tổng quát, luận văn cũng xác định đối
tượng chính của nghiên cứu là xây dựng lên một chatbot với việc trả lời các câu hỏi
phức tạp. Tác giả chỉ tập trung vào việc chatbot sử dụng kỹ thuật xử lý ngôn ngữ tự
nhiên và học máy để truy vấn câu trả lời từ mơ hình dữ liệu đã được huấn luyện từ
bộ dữ liệu câu hỏi-đáp trên một miền đóng cụ thể data VNPT.
Vậy cần đạt được của nghiên cứu:
- Ứng dụng được các phương pháp học máy để đưa ra được phương án triển
khai một chatbot tư vấn dịch vụ VNPT.
- Đánh giá được tính hiệu quả áp dụng và khả năng triển khai chatbot trong thực tế.
- Rút ra được những kết luận, đề xuất phát triển ứng dụng.
4. Bố cục luận văn
Bố cục của luận văn sẽ gồm những phần chính sau:
 Mở đầu: Đặt vấn đề và đưa ra hướng nghiên cứu bài toán
 Chương 1: Kiến thức tổng quan: Giới thiệu các kiến thức tổng quan về
chatbot, các thành phần của một hệ thống chatbot.

 Chương 2: Xây dựng Chatbot tư vấn dịch vụ VNPT : Thiết kế để xuất,
mô tả tổng thể hệ thống thử nghiệm gồm các bước thực hiện.
 Chương 3: Kết quả và thực nghiệm: Đề xuất bài toán, ứng dụng
framework mã nguồn mở để xây dựng thử nghiệm bài toán. Đưa ra đánh giá thực tế
về hệ thống, đề xuất giải pháp cải tiến.


7

 Kết luận: Đưa ra kết luận những kết quả đạt được trong luận văn và định
hướng phát triển cho bài toán rộng rãi trong thực tế.


8

Chương 1: KIẾN THỨC TỔNG QUAN
1.1 Tổng quan về Chatbot
1.1.1 Giới thiệu về chatbot
Chatbot hoặc Chatterbot là một ứng dụng phần mềm được sử dụng để thực
hiện một cuộc trò chuyện trực tuyến qua văn bản hoặc văn bản thành lời nói, thay vì
cung cấp liên hệ trực tiếp với một tổng đài viên là con người trực tiếp, Chatbot được
biết đến như một hệ thống hỗ trợ giao tiếp và nó có thể tương tác với con người
theo dạng hỏi-đáp (question-answering) sử dụng ngôn ngữ tự nhiên. Chatbot trước
đây chỉ sử dụng hệ thống hội thoại dựa trên ngôn ngữ tự nhiên với nội dung chỉ
trong một phạm vi nhất định với những câu từ, chủ đề đã được định sẵn. Tuy nhiên,
chatbot hiện nay đang phát triển rộng rãi, ứng dụng trên nhiều lĩnh vực khác nhau
và cho nhiều mục đích khác nhau. Chatbots hiện nay đã cung cấp khả năng trợ giúp
theo phương thức logic học, thậm chí cịn có khả năng tư duy tự nhiên dựa trên
cơng nghệ học máy, trí tuệ nhân tạo, nó được sử dụng hiệu quả cho các lĩnh vực
dịch vụ khách hàng hoặc cho các hệ thống giải trí.

Chatbot là một loại phần mềm có thể giúp khách hàng bằng cách tự động hóa
các cuộc hội thoại. Mặc dù chatbots đã và đang được nghiên cứu khá rộng, tuy
nhiên chúng ta có thể nhận thấy thành quả là các hệ thống hiện tại đối với một số
lĩnh vực chuyên sâu đã gần tiệm cận với tri thức của con người hoặc đã cho những
phản hồi gần như là chính xác. Được thiết kế để mô phỏng một cách thuyết phục
như một con người, có hành xử như một đối tác trị chuyện.
Chatbots được sử dụng trong các hệ thống hộp thoại cho các mục đích khác
nhau bao gồm dịch vụ khách hàng, định tuyến yêu cầu hoặc thu thập thông tin. Mặc
dù một số ứng dụng chatbot sử dụng các quy trình phân loại từ rộng rãi, bộ xử lý
ngơn ngữ tự nhiên và AI tinh vi, các ứng dụng khác chỉ cần quét các từ khóa chung
và tạo phản hồi bằng cách sử dụng các cụm từ phổ biến thu được từ thư viện hoặc
cơ sở dữ liệu liên quan. Toàn bộ các xử lý để đưa ra các phản hồi từ trong việc xử lý
ngôn ngữ tự nhiên, đều được xử lý tuyệt vời từ các hệ thống máy tính. Thiết kế một


9

hệ thống máy tính để có thể hiểu và đưa ra ngôn ngữ của con người là một lĩnh vực
sâu của học máy mà chúng ta hay nghe đến trong thời gian gần đây là Trí tuệ nhân
tạo (AI), đặc biệt là xử lý ngôn ngữ tự nhiên.
Chatbots khá phổ biến ở thời điểm hiện tại. Có rất nhiều tạp chí chun sâu về
chatbot được phổ biến trên mơi trường internet như Chatbot Journal và cộng đồng
như Chatbot News . Sự phổ biến này đã mang đến những bước đột phá cho các
công ty lớn như Facebook, Microsoft, Google và IBM trong thế giới trí tuệ nhân
tạo. Khơng những thế một điểm nữa khiến cho chatbot trở nên phổ biến đó là nó dễ
dàng với mọi người để có thể tự tạo một hệ chatbot riêng mà không cần bất cứ một
kỹ năng lập trình nào. Hiện nay, có nhiều websites và dịch vụ mà ở đó mọi người
đều có thể sử dụng để tạo một ứng dụng bot riêng cho mình, phổ biến có thể kể đến
như API.ai, Chatfuel, Kit Bot và Facebook wit.ai [1].
1.1.2 Sự phát triển của chatbot

Chatbot được phát triển từ khi hình thành những ý tưởng đầu tiên cho đến nay
(thời điểm 2021) cũng đã hơn 70 năm, cũng có thể nói một chặng đường lịch sử khá
dài cho một lĩnh vực cơng nghệ.

Hình 1.1. Các mốc thời gian phát triển của chatbot
Từ các phép thử Turing năm 1950:
Về cơ bản phép thử được xuất phát từ một ý tưởng của một người có tên Alan
Turing là một loạt các phép thử dựa trên việc phân tích câu trả lời của một máy tính.
Các phép thử Turing được thực hiện để xác định xem một chương trình máy tính có
thể phân biệt được máy tính với con người trong một cuộc trị chuyện chỉ có văn
bản thuần túy hay không?



×