Tải bản đầy đủ (.pdf) (103 trang)

Xây dựng ứng dụng hỏiđáp hỗ trợ tư vấn đăng ký khám bệnh trực tuyến tại bình dương

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (31.75 MB, 103 trang )

DAI HOC DA NANG
TRUONG DAI HOC SU PHAM

NGUYEN THAO NHIEN
XÂY DỰNG ỨNG DỤNG HỎI/ĐÁP HO TRỢ
TU VAN ĐĂNG KÝ KHÁM BỆNH TRỰC TUYẾN

TẠI BÌNH DƯƠNG
Chuyén nganh: HE THONG THONG TIN
Mã số : 848.01.04

LUẬN VĂN THẠC SĨ
NGƯỜI HƯỚNG DẪN KHOA HỌC:
TS. NGUYEN HOANG SY

Đà Nẵng - Năm 2022

LOI CAM ON

Để hoàn thành luận văn này, tơi tỏ lịng biết ơn sâu sắc đến tiến sĩ Nguyễn Hoàng
Sỹ, là giảng viên đã tận tình hướng dẫn tơi trong suốt q trình nghiên cứu. Nhân đây,
tôi xin gửi lời cám ơn đến gia đình, chồng và các con tơi đã tạo mọi điều kiện chăm sóc
gia đình để tơi có thể hồn thành việc học và bảo vê luận văn này.

Nhân dịp này tôi xin bày tỏ sự kính trọng và lịng biết ơn sâu sắc đến q thầy, cơ
đã giúp đỡ tơi trong suốt q trình học tập và thực hiện luận văn. Tôi cũng xin gửi lời
cảm ơn đến quý Ban lãnh đạo Trường Đại học Sư phạm Da Nẵng, Phòng Đào tạo Sau

Đại học, khoa Công Nghệ Thông Tin đã dày công giảng day trong suốt khóa học, tạo

điều kiện thuận lợi cho tơi trong quá trình học tập và thực hiện đề tài.



Mặc dù luận văn được thực hiện với sự nỗ lực cố gắng hết sức của bản thân, nhưng

do điều kiện thời gian có hạn, trình độ kiến thức và kinh nghiệm nghiên cứu cịn hạn chế

nên luận văn khó tránh khỏi những thiếu sót. Tơi rất mong nhận được những góp ý q
báu của q thầy cơ giáo để luận văn được hồn thiện hơn.

Cuối cùng, tôi xin chúc quý thầy, cô dồi dào sức khỏe và thành công trong sự nghiệp

cao quý.

Bình Dương, ngày tháng năm 2022
Người thực hiện

lí ee

Nguyễn Thảo Nhiên

ii

LOI CAM DOAN

Trong quá trình nghiên cứu đề tài có rất nhiều kiến thức khơng nằm trong chương
trình giảng dạy ở bậc Đại học, Thạc sĩ tuy vậy tơi xin cam đoan đây là cơng trình nghiên
cứu của riêng tơi dưới sự hướng dẫn của TS. Nguyễn Hồng Sỹ. Nội dung nghiên cứu
và các kết quả đều là trung thực và chưa từng được công bố trước đây. Các số liệu được
sử dụng cho q trình phân tích, nhận xét được chính tơi thu thập từ nhiều nguồn khác
nhau và sẽ được ghỉ rõ trong phần tài liệu tham khảo.


Ngoài ra, tơi cũng có sử dụng một số nhận xét, đánh giá và số liệu của các tác giả

khác, cơ quan tổ chức khác. Tắt cả đều có trích dẫn và chú thích nguồn gốc. Nếu phát

hiện có bất kỳ sự gian lận nào, tơi xin hồn tồn chịu trách nhiệm về nội dung luận văn
của mình.

Bình Dương, ngày tháng năm 2022
Người thực hiện

a.
Nguyễn Thảo Nhiên

ii

Tên đề tài: XÂY DỰNG ỨNG DỤNG HỎI ĐÁP HỎ TRỢ TƯ VẤN ĐĂNG KY
KHÁM BỆNH TRỰC TUYẾN TẠI BÌNH DƯƠNG

Ngành : Hệ thống thông tin Hoàng Sỹ
Họ tên học viên : Nguyễn Thảo Nhiên
Đà Nẵng
Người hướng dẫn khoa học: TS. Nguyễn

Cơ sở đào tạo: Đại học sư phạm Đại học

Tóm tắt:

Nội dung chính của luận văn nhằm tìm hiểu, nghiên cứu xây dựng ứng dụng “Xây
dựng ứng dụng hỏi/đáp trực tuyến hỗ trợ đăng ký và tư vấn khám bệnh” đáp ứng kịp
thời, nhanh chóng, góp sức chống dịch, hỗ trợ người dân, nền tảng đặt lịch khám bệnh

và chăm sóc sức khỏe tồn diện miễn phí. Trong q trình nghiên cứu, tôi đã tiến hành
tổng hợp các kỹ thuật nền tảng cơ bản của hệ thống xử lý ngôn ngữ tự nhiên trong
chatbot. Thực hiện một số phương pháp ứng dụng trí tuệ nhân tạo trong chatbot trả lời
câu hỏi xử lý theo ngôn ngữ tự nhiên dựa trên Framework mã nguồn mở Rasa giúp máy
tính tương tác/nói chuyện với từng bệnh nhân, từng chuyên gia, bác sĩ chuyên khoa.

Chương trình hỗ trợ kết nói trực tuyến giữa những người gặp khó khăn khi tiếp
cận dịch vụ y tế nhanh chóng, hạn chế tìm hiểu các thủ tục đăng ký, tư vấn trực tuyến

và tiết kiệm thời gian tìm kiếm thơng tin liên quan. Phần còn lại của luận văn tập trung

vào việc trình bay vấn đề hỏi đáp thơng tin trực tuyến hỗ trợ đăng ký, tư vấn và trả lời
các văn bản liên quan nhanh chóng thơng qua kết quả của mơ hình thực hiện. Cuối cùng,
tơi đề xuất hướng phát triển tiếp theo của để tài trong tương lai.

Từ khóa: hỗ trợ y tế trực tuyến, đặt lịch phòng khám online, đăng ký và tư vấn
khám bệnh online

Xác nhận của giáo viên hướng dẫn Người thực hiện đề tài

`TS. Nguyén Hoang S¥ ee

Nguyễn Thảo Nhiên

a

ili

Name of thesis: BUILDING A Q&A APP TO SUPPORT ONLINE MEDICAL
REGISTRATION CONSULTANCY IN BINH DUONG


Major: Information Systems
Student's full name: Nguyen Thao Nhien
Scientific instructor: Dr. Nguyen Hoang Sy
Training institution: The University of Education, University of Da Nang

Summary:
The main content of the thesis aims to learn and research and build an application
"Building an online Q&A application to support registration and consultation" to
respond promptly and quickly, contribute to fighting epidemics, supporting people, the
platform to schedule medical examinations and comprehensive health care for free.
During my research, I conducted a compilation of the basic foundational techniques of
the natural language processing system in chatbots. Approaching the problem in many
different directions, I implement several methods of applying artificial intelligence in
chatbots to answer questions handled in natural language based on the Rasa open-source
framework to help computers to interact/talk with each patient, each expert, specialists.
The program supports online connections between people who have difficulty
accessing health services quickly, limiting learning of registration procedures, online
consultations, and saving time seeking relevant information. The rest of the thesis
focuses on presenting online Q&A issues for signing, advising and responding to
relevant documents quickly. Through the results of the implementation model. Finally,
I propose the next direction of development of the topic in the future.
Key words: online medical assistance, online clinic booking, Register and consult
online medical examination

Supervior’s confirmation Student

”—
_


Dr. Nguyen Hoang Sy Nguyen Thao Nhien

v

MUC LUC

/9190).00 A01... i

LOL GAM DOAN sisseicinssnssmnmusasmmnenuanmnmuanminanenemamnent: ii

TOM TAT XAY DUNG UNG DUNG HOI DAP HO TRO TU VAN DANG KY

KHAM BENH TRUC TUYEN TAI BINH DUONG .u...ccesssesssessssesesssesssseesseseesssseeeees iii

MO TT Ctunngitstogignttiniaiiod00i013r18t014t089d1ou0n5en8a0n2tn0a8ne1r8e4ru8n3mm8o1n0na0n3eG4S V

DANH MỤC CÁC TỪ VIẾT TẮTT.................. ¿2c 2+2 2E1+£E115221211112211112721122111E1c1r1ee viii

DANH MỤC CÁC BẢNG.........2.5522.22 ....t.H.............i.r.ri.r.r.e ix

DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ.....................-..:- c::252vvtttEExrtrktrrrttttireerrirerrrreeo x

MO DAU =e 1

1. Ly do chon 8 taie..ccccccccecsscssssssessssesssseesssesssssetessecssssessssssissesssssecssseessessseseaseesneesees 1
2. Mục đích nghiên cứu
3. Phạm vi nghiên cứu của đề tài...................22.E2.2.1:--s21:1©1121s1t1121c21x1e.cxcre. 2
4. Phương pháp nghiÊn CỨU...........kh.v.n...TH H..H..H.H .ng....H.H..-gi 2,
5. Cau tritc cla Lian Van. ecccccccsesscssessesscssessessessessessessvsvssvssvsssessvsssssvssssussuessecsessesseeeess 2


Chương 1 CƠ SỞ LÝ THUYÍẾT.......2.2: .22.22+2.222.222.222.+22.222.111.222.111.1.2.121.112-...-E Lce 4

N0 09.01... ................

1.1.1. Giới thiệu Chatbot

1.1.2. Các thành phần cơ bản

1.1.3. Tiêu chí phân lOạI......--.¿-.¿c.1..k.k*..HH......H.H..... t 7

1.1.4. Ứng dụng Chatbot hiện nay......¿55.25.22.2.231.222.312.212.e.Etr.rtrr.rrk-rtri.rrrke 11

1,2. Phuong phap phan tich. Chatbot sccscvccoserssorssonssnetvvoovevsassornsmecrersssvanrenwseeevecessunes 14

1.2.1. Phương pháp nhúng từ (Word embedding).. ....14

1.2.2. Phương pháp quản ly hội thoại .........ó.c...tt.h ...e .... .... 16

1;2:3: Phương phấp dựa trên máy hộC sssssssssssssnsbiogoonitioidtetSA1605381131651..11604 20

1.2.4. Ứng dụng RNN vào quản lý hội thoại ................. .....--c¿:5555ccccxcerxvrrrvrrrrrrre 30

1.2.5. Phương pháp phân tách các từ (Tokenization hay word segmention)........... 32

1.3. Các kỹ thuật cơ bản xây dựng ChatbOI ........................ ¿cành

1.3.1. Xác định ý định người dùng (intent)

1.3.2. Các vấn đề lưu ý khi xác định ý định..................---.-:--:¿¿©c+2x2cxvsrxvrrxrerrrertre 33


1.3.3. Xác định ý định dựa trên học máy (machine learning) .....................-- -:----:--‹ 34

1.3.4. Trích xuất thơng tin thực thể (NER)......................--.---52cc22xc2terxrerrrrerrrrrrrrrre 36
Chương 2 XÂY DỰNG CÔNG CỤ HỎI ĐÁP THÔNG TIN...........................-----: 43

QL. GiGi thiQu 6-4441... 43

vi

2.2. Rasa Prameworkiiesowermnarcnaan eaarenmneammnerenareemreeerneroiernesyearl

2.2.1. Giới thiỆU......................... Sàn SH HH HH HH HH Hy
2.2.2. Một số thuật ngữ của Rasa.............2 .22.1 .222.21.12.22.11.22.212.1..11..... .---re

2:2.3, Phuong phap xay dung Chatbot Rasa scssecsaserersosrsssscovsnecstevesvsorsnssnoovessesvet

2.2.4. M6 hinh hudn luyén cho Chatbot ...c.ccccscsssesssssesssesssessseesseessessecseesseeseeseesees

2.3. Thiết kế sơ đồ và chức năng các khối hệ thống.

2.4. Xây dựng và huấn luyện đữ liệu Chatbot bài toán

2.4.1. Xây dựng ý định (intenf) bài tOán....................... «cach Hàn

2.4.2. Xây dựng mẫu (templaf€S)...s.22..+ t.221.22.211.211.211.211.212.111.1 2.-rtE.tr.ttke

2.4.3. Xây dựng hành động (actions)

2.4.4. Xây dựng thực thể (entity)........................---...--


2.4.5. Xây dựng câu chuyén (stories)

2.4.6. Chức năng tra cứu văn bản — chính sách (Realtime) ........................-‹‹‹---‹:- 54

2.4.7. Xây dựng chức năng hỏi đấp ............- -.ó.c............He.. 55

2.4.8. Xây dựng chức năng đặc lịch khám...........¿.6.c.c..v...s.t.rr.rr.rr.rr.rr.ee 56

2.4.9. Chức năng xem tin tức

24.10, Template Chath obisssssessossscsesccvessosessscaresesavesssvesestoverenoessctvsorneesvenvuaseessassesoess

2.5. Cấu hình cài đặt triển khai Chatbot Rasa Messenger ....cc.sssssscsssssesssessseecsseessneeeeees 60

Chương 3 THỰC NGHIỆM VÀ ĐÁNH GIÁ MƠ HÌNH...................................-------: 62

3). THE TSMISI......rneresneesreediinsieednadneaine eieasm iAeTIinmaantasstitRoTneSs

3.1.1. Menu chính khi người dùng nhắn nút bắt đầu

3.1.2. Giới thiệu phòng khám và đội ngũ bác sĩ

3.1.3. Form điền thơng tin liên hệ.................-----s-5¿©22+222Sx22312211231221Er11eE1

3.1.4.. Các dịch:vụ khám..................--ccscsccssissiAS22641436184353955EEXTXXSGSRSEGSE4ASEXE

3.1.5. Các gói chăm sóc của phịng khám

3.1.6. Các tỉn tức từ cổng thong tin tinh Binh Duong


3.1,7.. Đặt lịch Kham ;:zzss:szsinsgszistssgiditsstttnilgtfttte©Ygfi1H84950341355445035835E831102083E

3.1.8. Nhà thuốc online ................----2s:©5¿222x22211222121122311227112211211211E12111,12

3.1.9. Chức năng hỏi đáp ....................... ánh nền HH nà HH He,

3.1.10. T7a cứu văn bản hanh chinh vss ncacecsees
3/2. Đánh giá kết:quã, mổ hình .........0.21.6 :S00:0s00-:i13c81-01x300c88s03s041s01s8ãt030088
KET LUAN VA HUONG PHAT TRIEN ..........................-----222c+222Sxrettzxvrrrtrrrrrrrrre

eo comecieeire=essbsdieidtemmdoiiiodoetsieidtitodc-roosngiliiAG303530105800020813801000000

2. Dinh huéng nghién citu tiép theo.. .............

i/)00/00690.0 09.804 7.01“.

vil

Ì5.:Gài đặt:†rT61,fỜTE?VILURTTV cuusesseniisisaeissesessosiaS826i003W5GSNGISEBVSERRHRQRIXSESDSNGS PL2

IENe i08) I20 1... .................

2. CaidatRASA.........:nsu-m cnsicemencmnam

3. Cấu trúc file của đề tài

A, Kiểm thử......................................cccccecrererrrree

4.1. Cau n0... an n6 ẽ . ... . . ...........


4.2. Thực nghiệm kết GUA... ssrounssnessoressnennsonsnonenoasononssnonstbracareenensaastnaneeagaansansoneassnebaoess

Vill
DANH MUC CAC TU VIET TAT

TT Các chữ viêtl Nội dung viết đầy đủ

tắt

Ị NLP Natural language processing

2 RNN Recurrent Neural Network

3 NER Named Entity Recognition

4 NLG Natural Language Generator

5 NLU Natural Language Understanding

6 LSTM Long Short Term Memory networks

1 CRF Conditional Random Field

8 URL Uniform Resource Locator

9 DM Dialog Management

10 Al Artificial intelligence

li API Application Programming Interface


DANH MUC CAC BANG

Số hiệu Tên bảng Trang
bảng
1.1 Bảng 1.1 Các loại chatbot có thể được thực hiện dựa trên các tiêu 8
chí.
1.2 Bảng 1.2 Trình bày ưu và nhược điểm của mơ hình chatbot theo 9
quy tắc
1.3 Bang 1.3 Một số nên tảng Chatbot phô biến 11
1.4 Bang 1.4 Uu va khuyét diém cia chatbot AI 20
2.1 Bảng 2.1 Các khôi chức năng trong hệ thong Rasa 50

Số hiệu DANH MỤC CÁC HÌNH VẼ, ĐỊ THỊ Trang

hình vẽ Tên hình vẽ, đồ thị 5
6
Ll Câu trúc các thanh phan co ban hé thong Chatbot 7
1.2 Thanh phân sinh ngôn ngữ tự nhiên (NLG) 9
15 Các buéc xt ly chinh trong pipeline cua NLU 10
1.4 Minh hoa dang (Menu/button) chatbot 14
1.5 Minh hoạ Chatbot nhận dạng từ khoá 15
1.6 Các bước xử lý trong NLŨ 17
17 Mơ hình CBOVW và Skip-Ngram 17
1.8 Quản lý hội thoại 18
1.9 Mơ hình Finite-State Machines 18
1.10 Mô hình Frame-based 19
1.11 Mơ hình sinh ngơn ngữ hội thoại 19
1.12 Phương pháp sinh ngôn ngữ dựa trên tập mẫu câu trả lời 20
1.13 Phương pháp sinh ngôn ngữ Plan-based

1.14 Phương pháp sinh ngôn ngữ Class-based 21
1.15 Kién trac mang no-ron nhan tao 22
Quá trình xử lý thơng tin của một mạng nơ-ron nhân tạo 24
1.16 Mạng nơ-ron hôi quy RNN 25
11 Mạng nơ-ron RNN 2 tâng 25
1.18 Mạng nơ-ron RNN nhiêu tâng 26
1.19 Các mô-đun lặp của mạng LSTM chứa I layer 26
1.20 Các mô-đun lặp của mạng LSTM chứa 4 layer 26
1.21 Ký hiệu sử dụng trong mạng LSTM 27
1.22 Tế bào trạng thái LSTM giống như một băng truyền 27
1.23 Công trạng thái LSTM 27
1.24 LSTM focus f 28
125 LSTM focus 1 29
1.26 LSTM focus c 29
1.27 LSTM focus c 30
1.28 RNN phụ thuộc short-term 30
1.29 RNN phụ thuộc long-term 31
1.30 Mơ hình word-based DST với mạng RNN 32
1.31 Mơ hình Global-Locally Self-Attentive DST (GLAD)
1.32

xi

Số hiệu Tên hình vẽ, đồ thị , Trang

hình vẽ M6 hinh Global-locally self-attentive encoder module 32
1.33 Xác định ý định người dùng 33
1.34 34
1.35 Xác định ý định dựa trên học máy 36
1.36 Trích xt thơng tin thực thê 37

1.37 Trích xt thơng tin thực thê dựa trên học máy
38
1.38 | Đỗ thị vô hướng mô tả CRF
44
2.1 Minh họa mơ hình hoạt động Rasa 45
2,2 Xu hướng Rasa theo ngữ cảnh 46
2.3 47
2.4 Ví dụ vê một nội dung kịch bản trong file nlu.md 48
25 Một sô hàm trong file domail.yml
Hình 2.5 Ví dụ về một đoạn hội thoại ngăn 49
2.5
Các thành phần của Rasa 49
2.7 50
2.8 Hoạt động tương tác của Rasa 50
2.9 51
2.10 Công cụ Rasa X 53
2.11 Cơ chê hoạt động Rasa phản hôi tin nhăn 54
2.12 55
2.13 So do hé thong chatbot Rasa 56
2.14 Xây dựng ý định (intent) trên RASA 56
2515 Mẫu (template) dịch vụ khám nhi khoa 57
216 Liệt kê các hành động dựa trên ý định
Thực thể (entities) trích xuất từ ý định người dùng 58
2.17 Một sô câu chuyện tương tác giữa người dùng và bot 58
2.18 Code lây những “Văn bản hành chính” realtime từ trang web 59
219 của cơng thơng tin tỉnh Bình Dương
Code xử lý thông minh hỏi đáp 60
2.20 60
2.21 Code xử lý chức năng “Đặt lịch khám 60
2,22 Code xứ lý “Tin tức” realtime từ trang công thông tin tỉnh 61

2.23 Binh Duong 61
2.24 Giao dién chinh chabot 61
225 Giao diện Templates | 62
2.26 Giao diện Templates 2 65
3.1 Giao diện Templates 3
Giao diện Templates 4

Giao diện Templates 5
Kiên trúc cài đặt của chương trình
Menu chinh chatbot

Số hiệu XI Trang

Tên hình vẽ, đồ thị 65
3.2 66
3.3 Giao diện giới thiệu 66
3.4 Form điên thông tin liên hệ 67
3.5 Các dịch vụ khám 67
3.6 Các gói chăm sóc của phịng khám 68
3.7 Các tin tức mới từ công thông tin tỉnh Bình Dương 68
3.8 Đặt lịch khám 69
3.9 Nhà thuốc online 69
3.10 Chức năng hỏi đáp PLI
3.11 Tra cứu văn bản hành chính PLI
3.12 Cài đặt python 3.7 PL2
3.13 Kiểm tra cài dat python 3.7 PL2
3.14 Tao thư mục mới đề chứa các file của project PL2
3.15 Cài đặt môi trường ảo PL3
3.16 Môi trường ảo đã được tạo thành công PL3
Sel Kích hoạt mơi trường ảo thành cơng PL4

3.18 Downloads Ngrok va gidi nén bang terminal PL4
3.19 Cai dat Rasa PL4
3.20 Cài đặt rasa thành công PL5
3.21 Tạo các file trong project PL5
3.22 Các file của project PLS
3.23 Xây dựng Credentials.yml PL6
3.24 Xây dựng Acess Token cua fanpage PL6
3.25 Khóa bí mật của fanpage PL7
3.26 ID va Acess Token vao file credentials.yml
Khdi tao terminal | PL7
3.27 Khoi tao terminal 2 PL7
3.28 Khởi tạo terminal 3
Forward dich vy https ngork PL8
3.29 URL Fampage Messenger goi lai PL8
3.30 Giao dién chinh chabot
PL9
3.31

>>

1

MO DAU

1. Lý do chọn đề tai
Trong bối cảnh tình hình dịch bệnh ngày càng diễn biến phức tạp, luôn là vấn đề

quan tâm hàng đầu của ngành y tế, trong khi việc thực hiện triển khai các nghiên cứu,
các giải pháp phòng chống dịch thường bị hạn chế về cả thời gian lẫn nguồn lực. Việc
xây dựng giải pháp hỗ trợ thông minh trong tư vấn và đăng ký khám bệnh online hiện

là dịch vụ được nhiều người quan tâm và sử dụng.

Để nhanh chóng khống chế, đập dịch, sớm đưa cuộc sống trở lại bình thường,

nhiều tỉnh, thành phố phải thực hiện giãn cách xã hội theo Chỉ thị sé 16/CT-TTg cua

Thủ tướng Chính phủ, việc kết nối trực tuyến giữa những người gặp khó khăn khi tiếp

cận dịch vụ y tế, những người thuộc diện cách ly hoặc đang trong khu vực phong tỏa

với bác sĩ và cơ sở y tế một cách nhanh chóng, hạn chế các thủ tục đăng ký và tiết

kiệm thời gian chờ đợi thông qua mạng lưới tư vấn, khám chữa bệnh online là rất cần

thiết trong điều kiện chống dịch COVID-19.
Nhằm chia sẻ với hệ thống y tế và người dân, đặc biệt với những địa phương phải

thực hiện giãn cách, nhiều y bác sĩ, cán bộ y tế đã thiết lập mạng lưới, nền tảng kết nối
"khám bệnh online" với mục đích tư vấn, giải đáp thắc mắc về COVID-19 và các bệnh
lý thường gặp, đặt lịch khám bệnh. Trên cơ sở nghiên cứu về ứng dụng trí tuệ nhân tạo
trong chatbot trả lời câu hỏi xử lý theo ngôn ngữ tự nhiên (Natural language
processing-NLP) dựa trên Framework mã nguồn mở hiện nay giúp máy tính giúp
tương tác/nói chuyện với từng bệnh nhân, từng chuyên gia, bác sĩ chuyên khoa.

Luận văn đề tài nghiên cứu, thiết kế, xây dựng ứng dụng “Xây dựng ứng dụng
hỏi/đáp trực tuyến hỗ trợ đăng ký và tư vấn khám bệnh tại Tỉnh Bình Dương” đáp ứng
kịp thời, nhanh chóng, góp sức chống dịch, hỗ trợ người dân, nền tảng đặt lịch khám
bệnh và chăm sóc sức khỏe tồn diện miễn phí. Chương trình hỗ trợ kết nối trực tuyến
giữa những người gặp khó khăn khi tiếp cận dịch vụ y tế, những người thuộc diện cách
ly hoặc đang trong khu vực phong tỏa với bác sĩ và cơ sở y tế một cách nhanh chóng,

hạn chế các thủ tục đăng ký và tiết kiệm thời gian.

2. Mục đích nghiên cứu
2.1. Mục tiêu tổng quát
Nghiên cứu hệ thống hoá cơ sở khoa học trong xử lý ngơn ngữ tự nhiên, ứng

dụng kỹ thuật trích xuất thông tin thực thể dựa trên học máy; Người dùng có thể đặt

lịch các bác sĩ đến khám sức khỏe định kỳ, lấy mẫu xét nghiệm tại nhà, khám dinh

dưỡng v.v. hoặc được tư vấn sức khỏe online từ các bác sĩ có chun mơn hay quản lý

các bệnh án điện tử. Bất kỳ ở đâu, đang làm gì, đều có thể đặt lịch khám chủ động về

thời gian, địa điểm.

2.2. Mục tiêu cụ thể:
Như vậy để thực hiện theo đúng mục tiêu của đề tài cần xác định một số công

việc phải giải quyết như sau:
Nghiên cứu tổng quan, lựa chọn phương pháp thích hợp trong xử lý ngôn ngữ
tự nhiên.
Tìm hiểu kỹ thuật phân tích, thu thập thơng tin đã và đang thực hiện trong lĩnh
vực xử lý ngôn ngữ tự nhiên, khai phá đữ liệu để áp dụng vào chăm sóc sức

khỏe bệnh nhân một cách an toàn và nhanh chóng.

Mơ hình hố các quy trình hỗ trợ thơng minh cho bệnh nhân và bác sĩ một cách
khoa học, đảm bảo thơng tin chính xác, an tồn: Đăng ký khám bệnh online -
đặt lịch khám bệnh nhanh chóng, tiện lợi; Chọn dịch vụ khám linh hoạt; Xem


thông tin bác sĩ; Hỏi đáp thông tin bệnh phổ biến; Liên hệ.

Ngoài ra, đề tài đề xuất mơ hình hóa chức năng cung cấp các thơng tin, văn bản

hành chính trên cổng thông tin quốc gia liên quan đến lĩnh vực y tế, giúp các y
bác sĩ cập nhật thông tin nhanh nhất.

Triển khai ứng dụng “Xây dựng ứng dụng hỏi/đáp trực tuyến hỗ trợ đăng ký và
tư vấn khám bệnh tại Tỉnh Bình Dương” trên nền tảng framework ma nguén
mở Rasa trong thực tế trên giao diện chatbot.
3. Pham vi nghiên cứu của đề tài
Đặt lịch khám bệnh trực tuyến; Chọn dịch vụ khám; Xem thông tin bác sĩ; Hỏi-

đáp thông tin bệnh phổ biến; Liên hệ.

4. Phương pháp nghiên cứu
Sử dụng phương pháp phân loại, hệ thống hóa lý thuyết về lĩnh vực xử lý ngôn

ngữ tự nhiên.
Sử dụng phương pháp phân tích và tổng hợp lý thuyết, nghiên cứu các giải thuật

trong ý định người dùng, xây dựng thực thể.

Sử dụng phương pháp thu thập, phân tích, tiền xử lý, trích lọc các thông tin.
Sử dụng phương pháp huấn luyện mơ hình và mơ hình phân lớp, mơ hình sinh

hội thoại.
Đề xuất phương pháp phân tích, thu thập thơng tin và thực nghiệm ứng dụng,
đánh giá.

5; Cấu trúc của luận văn
Ngoài phần mở đầu, kết luận và định hướng kế hoạch tiếp tục phát triển trong
luận văn, danh mục tài liệu tham khảo và các phụ lục, luận văn gồm có 03 chương:
Chương 1: Trình bày cơ sở lý thuyết, nghiên cứu một số kĩ thuật được sử dụng

trợ lý ảo (chatbot), mơ hình kiến trúc và các thành phần cơ bản của chatbot NLP, tim

hiểu về Framework mã nguồn mở phát triển xây dựng ứng dụng của đề tài

Chương 2: Xây dựng công cụ hỏi đáp thông tin Giới thiệu công cụ hỏi đáp
thông tin trên nền tang framework Rasa. Trong chuong nay sé đề xuất phương pháp
thực hiện phân tích, q trình xây dựng hỏi/đáp trực tuyến thơng tin tư vấn và đăng ký

khám chữa bệnh dựa trên phát triển Framework mã nguồn mở NLP.

Chương 3: Phương pháp thực nghiệm và đánh giá. Chương này trình bày thực
nghiệm và đánh giá sẽ cho ta biết khả năng phục vụ của Chatbot nhằm phục vụ nghiệp
vụ trả lời lĩnh vực y tế và đăng ký khám bệnh tự động đến người dùng.

4

1.1. Téng quan Chatbot Chương Í

CO SO LY THUYET

1.1.1. Giới thiệu Chatbot

Hệ thống trả lời tự động hay còn gọi là Chatbot là một một chương trình máy

tính được thiết kế để trò chuyện với con người, đặc biệt là qua internet [6]. Chatbot


thường trao đổi với người dùng qua hình thức tin nhắn hoặc âm thanh. Do được thiết

kế để mơ phỏng cách trị chuyện với con người, các hệ thống chatbot thường phải điều

chỉnh và thử nghiệm liên tục.

Chatbot thường được sử dụng trong các hệ thống hội thoại cho các mục đích

khác nhau bao gồm dịch vụ khách hàng, định tuyến yêu cầu hoặc để thu thập thông tin.

Mặc dù một số ứng dụng chatbot sử dụng các phương pháp phân loại như: ChatBot

viết kịch bản: Đây là những ChatBot có hành vi được xác định bởi các quy tắc. tại mỗi

bước trong cuộc trò chuyện, người dùng sẽ cần chọn các tùy chọn rõ ràng để xác định

bước tiếp theo của cuộc trò chuyện. Các cách tùy chọn được trình bày cho người dùng

ở mỗi bước trong cuộc hội thoại, tức là liệu họ cần phản hồi bằng một văn bản, giọng

nói hoặc cảm ứng thì sẽ phụ thuộc vào các tính năng của nền tảng trò chuyện mà người

dùng đang sử dụng và thiết kế của ChatBot.

Hoặc ChatBot thông minh (Intelligent ChatBot): ChatBot thong minh la ChatBot

được xây dựng với kỹ thuật nhân tạo thơng minh. Trí tuệ nhân tạo (AI) cho phép

chúng cải thiện linh hoạt về đầu vào người dung mà chúng có thể thu nhận. Chúng có


thể thu nhận đầu vào dạng tự do đưới hình thức trình bày văn bản hoặc giọng nói và

cũng khơng giới hạn các dạng đầu vào khác nếu có ý nghĩa. Ví dụ: Khi bạn muốn mua

quan do, Bot sẽ tự động hỏi bạn một danh sách câu hỏi về phong cách quan do ưa thích

của bạn và sẽ đưa ra mẫu gợi ý và giá của mặt hàng. Ngày nay, hầu hết các chatbot

được truy cập trực tuyến thông qua cửa số popup của trang web hoặc thông qua các trợ

lý ảo như Google Assistant, Amazon Alexa hoặc các ứng dụng nhắn tin như Facebook

Messenger hoặc WeChait...

1.1.2. Các thành phần cơ bản

Khi thiết kế một hệ thống, cần tuân theo cách tiếp cận phát triển mô đun một, cụ

thể tiêu chuẩn sử dụng chia nó thành các bộ phận cấu thành để có thể hiểu được các ý

định và có thể trích chọn được các thơng tin từ yêu cầu của người dùng, lưu được ngữ
cảnh và sinh ra được câu trả lời phù hợp nhất, giúp cho trải nghiệm của người dùng
được tự nhiên hơn. Để xây dựng được mơ hình trên thì Chatbot phải có cấu trúc và các

thành phần hệ thống như hình 1.1 cho thấy Chatbot có ba thành phần chính là: thành

phần hiểu ngôn ngữ tự nhiên (NLU), thành phần quản lý hội thoại (DM), thành phần
sinh ngôn ngữ (NLG) [21]. Mỗi thành phần trong Chatbot đều có vai trị riêng. Cụ thể


như sau:

Natural Language Dialogue Policy Management

Understanding

User

firg) LÍ [¡ action ¥ o-l

| o.97
xo) | 0.02 |

0.01|

Natural Language
Generation

Hình 1.1 Cấu trúc các thành phần cơ bản hệ thống Chatbot [21]

1.1.2.1. Quản lý hội thoại
Quản ly hdi thoai (Dialog Management - DM): Thanh phần quản lý đối thoại giữ

và cập nhật ngữ cảnh của cuộc hội thoại là ý định hiện tại, các thực thể được xác định
hoặc các thực thể bị thiếu cần thiết để thực hiện các yêu cầu của người dùng. Hơn nữa,

nó u cầu thơng tin thiếu, xử lý làm rõ bởi người dùng và đặt câu hỏi tiếp theo. Ví dụ:

chatbot có thể phản hồi câu hỏi trên lại bằng cdu: “Would you like to tell me as well an
example sentence with the word environment?”


Quản lý hội thoại cũng có nhiệm vụ xác định được hành động (action) tiếp theo
dựa vào trạng thái hành động trước đó hay ngữ cảnh hội thoại. Các ngữ cảnh này phải
được đối chiếu trong các kịch bản dựng sẵn (history) đã đào tạo cho bot. Thành phần
này cũng đảm nhiệm việc lấy dữ liệu từ hệ thống khác qua các API/Data sources gọi

trong action.
1.1.2.2. Sinh ngôn ngữ tự nhiên
Sinh ng6n ngfr tu nhién (Natural Language Generator - NLG) 1a thanh phan sinh

ngôn ngữ dựa vào chính sách (policy) và hành động được xác định trong DM thông

qua các tập hội thoại [4].
Khi phản hồi, NLG chuẩn bị phản hồi giống ngôn ngữ tự nhiên cho người dùng

dựa trên ý định và thông tin ngữ cảnh. Các câu trả lời thích hợp được tạo ra bởi một
Khi phản hồi, NLG chuẩn bị phản hồi giống ngôn ngữ tự nhiên cho người dùng dựa
trên ý định và thơng tin ngữ cảnh. Các câu trả lời thích hợp được tạo ra bởi một trong
các mơ

hình thiết kế theo luật hoặc theo AI. Để hiểu rỡ chỉ tiết hơn về luồng xử lý tin nhắn từ

6
các thành phần của Chatbot trình bày trong hình 1.2 [26].

Chat bot architecture

Helio —--——-—y NLU component — nent and entit |
(extract intent and


entties)

Hi <name>, how can! XÀ ý ieee 1

help you? n/, / C > TÊN <* Slots = | |
fy |
what is the weather looking ike
ltomorrow’ 2 A X // i| | oe Mgmt (mode! predicts “Sis _» Database request/ |
/ /\ ‘API call URL request |
its going to ba mostly | next_action based on previous }
N/ ‘ tions action results, slots)
cloudy with little rain
TA
how about day after?“ \ wees ied

its going to be sunny \ \ Message | |
= Generator (use
*.. \ 4
C ì “Sy pre-defined
J2 4———nextazton—
templates with
placehoiders)

Hình 1.2 Thành phần sinh ngôn ngữ tự nhiên (NLG)

1.1.2.3. Hiểu ngôn ngữ tự nhiên
Ngôn ngữ tự nhiên (Natural Language Understanding - NLU) bao gồm việc xử lý

ngơn ngữ tự nhiên có nhiệm vụ xác định được ý định câu hỏi (intent classification) và
trich chon thong tin (slots filter) [25].


NLU nhằm mục đích trích xuất ngữ cảnh (context) và ý nghĩa từ đầu vào của
người dùng bằng ngơn ngữ tự nhiên, mà có thể khơng có cấu trúc và phản hồi một
cách thích hợp theo ý định của người dùng (user intent). Nó xác định mục đích của
người dùng và trích xuất các thực thé (entities) theo miền cụ thể. Cụ thể hơn, một ý
định đại diện cho một ánh xạ giữa những gì người dùng nói và hành động (action) nên
được thực hiện bởi chatbot. Các hành động tương ứng với các bước mà chatbot sẽ thực

hiện khi các ý định cụ thể được kích hoạt bởi các đầu vào của người dùng và có thể có
các tham số để xác định thơng tin chỉ tiết về nó. Phát hiện ý định thường được xây

dựng dưới dạng phân loại câu, trong đó các nhãn ý định đơn hoặc nhiều ý định được

dự đoán cho mỗi câu.

Thực thể là một cơng cụ để trích xuất các giá trị tham số từ các đầu vào ngơn ngữ

tự nhiên. Ví dụ, hãy xem xét câu “What is the weather in Greece?”. Mục đích của
người dùng là tìm hiểu dự báo thời tiết. Giá trị thực thé là Greece. Do đó, người dùng
yêu cầu dự báo thời tiết ở Hy Lạp. Các thực thê có thể do hệ thống xác định hoặc do
nhà phát triển xác định.

Ngữ cảnh là các chuỗi lưu trữ ngữ cảnh của đối tượng mà người dùng đang đề
cập hoặc nói đến. Ví dụ, một người dùng có thể tham chiếu đến một đối tượng đã được

7

xác định trước đó trong câu sau của họ. Người dùng có thể nhập "Switch on the fan",
Ở đây, ngữ cảnh sẽ được lưu là fan (cái quạt) để khi người dùng nói, "Switch it off"


làm đầu vào tiếp theo, ý định "tắt" có thê được gọi trên ngữ cảnh "quạt".

NLU xử lý tin nhắn người dùng bằng một đường ống (pipeline) nơi mà cấu hình
các bước xử lý liên tiếp theo tuần tự hình 1.3 minh họa đường ống có thể tùy chỉnh các

thành phần từ bước tiền xử lý dữ liệu, mơ hình hóa ngơn ngữ, các thuật tốn dùng để
tách từ và trích xuất thơng tin thực thể.

Hình 1.6 thể hiện chỉ tiết các bước xử lý trong phân loại ý định của một câu nói

của người dùng, chúng ta cần mơ hình hóa ngơn ngữ, nghĩa là biểu diễn ngôn ngữ dưới
dạng một vectơ số học để máy tính thực thi [25].

Phân loại ý định (intent Trích chọn thơng tin
Classification) (Entity Extraction)

Hình 1.3 Cac bước xử lý chính trong pipeline của NUU

1.1.3. Tiêu chí phân loại
Chatbots có thể được phân loại thành nhiều loại khác nhau dựa trên một số tiêu

chí được tóm tắt trong Bảng 1.1 trình bày các loại chatbot có thể được thực hiện dựa

trên các tiêu chí sau [1Š].

STT Phân loại Mô tả

1 Chê độ tương tác Text-Based: Dựa trên văn bản
(Interact Mode) Voice-Based: Dựa trên giọng nói
Miễn đóng/miên cụ thê (Closed Domain):Giải qut một sơ

2_ | Miên (Domain) vấn đề trong phạm vi nhất định;

3 | Mục tiêu (Goals) Dữ liệu huấn luyện trong phạm vi nhỏ, phổ biến;

Dễ huấn luyện, độ chính xác cao
Miễn mở (Open Domain):
Loại này là mục tiêu của trí tuệ nhân tạo.
Một chatbot biết mọi thứ và có thể trả lời mọi van dé;
Rất nhiều chatbot thông minh được tạo ra.
Hướng nhiệm vụ (Task-Oriented):
Được thiết kế cho một nhiệm vụ cụ thé;
Được thiết lập để có thời gian ngắn;
Các cuộc hội thoại trong miền đóng.
Không hướng nhiệm vụ (Non Task-Oriented):
Mơ phỏng cuộc trị chuyện với một người;
Thực hiện chat cho mục đích giải trí;
Các cuộc hội thoại trong miền mở.


×