1
MỤC LỤC
MỤC LỤC 1
DANH MỤC CÁC TỪ VIẾT TẮT 4
DANH MỤC CÁC BẢNG BIỂU 5
DANH MỤC CÁC HÌNH VẼ 6
CHƢƠNG 1 - TỔNG QUAN 7
1.1. GIỚI THIỆU 7
1.2. ĐỘNG CƠ NGHIÊN CỨU 9
1.3. MỤC TIÊU LUẬN VĂN 11
1.4. PHẠM VI NGHIÊN CỨU 12
1.5. Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN 12
CHƢƠNG 2 - CƠ SỞ LÝ THUYẾT 14
2.1. HỆ CHUYÊN GIA 14
2.1.1. Cơ sở tri thức 14
2.1.2. Hệ chuyên gia 15
2.1.3. Cấu trúc hệ chuyên gia 18
2.1.4. Kỹ thuật suy luận trong hệ chuyên gia 19
2.1.5. Quy trình xây dựng hệ chuyên gia: 22
2.1.6. Thuận lợi và khó khăn của hệ chuyên gia 22
2.2. CƠ SỞ TRI THỨC 24
2.3. CÁC PHƢƠNG PHÁP BIỂU DIỄN TRI THỨC 25
2.3.1. Biểu diễn tri thức dựa trên logic hình thức 25
2.3.2. Biểu diễn tri thức dựa trên hệ luật dẫn 27
2.3.3. Biểu diễn tri thức bằng Frame 27
2.3.4. Biểu diễn tri thức dựa trên mạng ngữ nghĩa 30
2.3.5. Mạng các đối tƣợng tính toán 31
2.3.6. Biểu diễn tri thức dựa trên mô hình COKB 32
2.4. ĐỘNG CƠ SUY DIỄN 36
2.4.1. Suy diễn tiến 37
2.4.2. Suy diễn lùi 38
2.4.3. Ƣu nhƣợc điểm của các kỹ thuật suy diễn 38
2
CHƢƠNG 3 BIỂU DIỄN TRI THỨC CHUYÊN GIA 40
3.1. TRI THỨC VỀ BỆNH UNG THƢ TẾ BÀO GAN 40
3.1.1. Khái niệm về bệnh UTGNP 42
3.1.2. Đặc điểm lâm sàng 43
3.1.3. Đặc điểm cận lâm sàng 44
3.2. MÔ HÌNH BIỂU DIỄN TRI THỨC CHUYÊN GIA 53
3.2.1. Danh sách các thuộc tính 54
3.2.2. Tập hợp các hành động 57
3.2.3. Tập hợp các Rules 59
3.2.4. Tập đối tƣợng Patient 60
CHƢƠNG 4 VẤN ĐỀ CHẨN ĐOÁN VÀ THUẬT GIẢI SUY LUẬN TRONG
CHẨN ĐOÁN BỆNH 61
4.1. VẤN ĐỀ CHẨN ĐOÁN 61
4.1.1. Chẩn đoán lâm sàng 61
4.1.2. Chẩn đoán cận lâm sàng 63
4.1.3. Chẩn đoán và theo dõi 64
4.2. QUY TRÌNH CHẨN ĐOÁN BỆNH UNG THƢ GAN 65
4.3. THUẬT GIẢI SUY LUẬN TRONG CHẨN ĐOÁN BỆNH 68
4.3.1. Ý tƣởng của thuật giải 68
4.3.2. Thuật giải suy luận trong chẩn đoán bệnh 68
CHƢƠNG 5 THIẾT KẾ HỆ THỐNG VÀ CÀI ĐẶT THỬ NGHIỆM 72
5.1. THIẾT KẾ HỆ THỐNG 72
5.1.1. Mục tiêu ứng dụng 72
5.1.2. Sơ lƣợc quy trình chẩn đoán bệnh của hệ thống 72
5.1.3. Cấu trúc của hệ thống 73
5.1.4. Tổ chức cơ sở tri thức 74
5.2. CÀI ĐẶT THỬ NGHIỆM 78
5.2.1. Nền tảng công nghệ 78
5.2.2. Tổ chức các giao diện 78
5.3. KẾT QUẢ THỬ NGHIỆM 82
CHƢƠNG 6 KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN 83
6.1. KẾT LUẬN 83
6.2. HẠN CHẾ VÀ HƢỚNG PHÁT TRIỂN CỦA ĐỀ TÀI 84
6.2.1. Hạn chế của đề tài 84
6.2.2. Hƣớng phát triển của đề tài 85
3
TÀI LIỆU THAM KHẢO 86
PHỤ LỤC A 90
PHỤ LỤC B 112
PHỤ LỤC C 115
4
DANH MỤC CÁC TỪ VIẾT TẮT
Tiếng Anh
Tiếng Việt
AASLD:
American Assiociation for Study of
Liver Diseases
Hiệp hội nghiên cứu về bệnh
gan Hoa Kỳ
AFP :
Alpha Fetoprotein
Protein phôi thai
BCLC :
Barcelona Clinic Liver Cancer
Thang điểm phân loại giai
đoạn lâm sàng ung thƣ gan
nguyên phát theo Barcelona
COKB :
Computational Objects Knowledge
Bases
Mô hình tri thức các đối tƣợng
tính toán
CSTT :
Knowledge Base
Cơ sở tri thức
CTScan:
Computed Tomography Scan
Chụp cắt lớp điện toán
ES :
Expert System
Hệ chuyên gia
ESLCD:
Expert System for Liver Cancer
Diagnosis
Hệ hỗ trợ chẩn đoán bệnh ung
thƣ gan
HBsAg:
Hepatitis B surface antigen
Kháng nguyên bề mặt viêm
gan B
HBV :
Hepatitis virus B
Viêm gan siêu vi B
HCC :
Hepatocellular Carcinoma
Ung thƣ biểu mô tế bào gan
HCV :
Hepatitis virus C
Viêm gan siêu vi C
MRI :
Magnetic Resonance Imaging
Chụp cộng hƣởng từ
MSCT :
Multislice Computerised
Tomography
Chụp cắt lớp điện toán
SubCOKB:
Sub Computational Objects
Knowledge Bases
Mô hình tri thức các đối tƣợng
tính toán thu hẹp
UTGNP :
Hepatocellular Carcinoma
Ung thƣ gan nguyên phát
UTTBG:
Hepatocellular Cancer
Ung thƣ tế bào gan
WHO:
World Health Organization
Tổ chức Y tế Thế giới
5
DANH MỤC CÁC BẢNG BIỂU
Bảng 1.1 Số liệu ung thƣ gan ở nam nữ tại Việt Nam theo WHO năm 2008 10
Bảng 3.1 Độ nhạy và độ đặc hiệu của AFP trong UTGNP 44
Bảng 3.2 Xếp giai đoạn theo BCLC 49
Bảng 3.3 Phân loại CHILD – PUGH 50
Bảng 4.1 Thời gian xuất hiện các triệu chứng 62
Bảng 5.1 Thống kê kết quả thử nghiệm 81
6
DANH MỤC CÁC HÌNH VẼ
Hình 2.1 Các thành phần của một hệ chuyên gia 16
Hình 2.2 Hoạt động của một hệ chuyên gia 16
Hình 2.3 Cấu trúc cơ bản của một hệ chuyên gia 19
Hình 2.4 Nền tảng của công nghệ hệ chuyên gia dựa trên luật 20
Hình 2.5 Quan hệ giữa các đối tƣợng hình học phẳng 29
Hình 2.6 Mạng ngữ nghĩa mô tả tri thức về xe 30
Hình 3.1 Tỷ lệ dẫn đến xơ gan và UTTBG ở bệnh nhân viêm gan siêu vi C 41
Hình 3.2 Sơ đồ chẩn đoán UTGNP theo hƣớng dẫn thực hành AASLD 2010 48
Hình 4.1 Quy trình chẩn đoán trong thực tế lâm sàng và cận lâm sàng (1) 65
Hình 4.2 Quy trình chẩn đoán trong thực tế lâm sàng và cận lâm sàng (2) 66
Hình 4.3 Thuật giải suy luận trong chẩn đoán bệnh 69
Hình 5.1 Quy trình chẩn đoán bệnh của hệ thống 73
Hình 5.2 Giao diện màn hình chính 79
Hình 5.3 Giao diện màn hình dữ liệu bệnh nhân 79
Hình 5.4 Giao diện màn hình chẩn đoán bệnh 80
Hình 5.5 Giao diện màn hình yêu cầu thực hiện thêm 81
Hình 5.6 Giao diện màn hình kết quả chẩn đoán 81
Chương 1 – Tổng Quan
7
CHƯƠNG 1 - TỔNG QUAN
Chƣơng 1 giới thiệu tổng quan về đề tài bao gồm các nghiên cứu khảo sát về
bệnh ung thƣ gan và thực trạng chẩn đoán các triệu chứng của bệnh. Trình bày động
cơ nghiên cứu, mục tiêu luận văn, phạm vi nghiên cứu, ý nghĩa khoa học và thực
tiễn của đề tài.
1.1. GIỚI THIỆU
Ngày nay, Công Nghệ Thông Tin (Information Technology) không ngừng
phát triển trên toàn cầu và đƣợc ứng dụng trong mọi lĩnh vực nhƣ: Nghiên cứu khoa
học, Y tế, Giáo dục,…Vấn đề hiện nay đang đƣợc quan tâm của “Trí Tuệ Nhân
Tạo” là nghiên cứu các phƣơng pháp biểu diễn và xử lý tri thức. Trên cơ sở đó giúp
ta ứng dụng tạo nên một chƣơng trình “Thông minh” nhƣ Hệ chuyên gia có thể
chẩn đoán hay nhận biết đƣợc bất kì một nguyên nhân, hiện tƣợng nào trong bất kỳ
lĩnh vực nào mà ngƣời dùng cần đến. Ngƣời dùng có thể biết đƣợc có bệnh hay
không bệnh,… chỉ cần thông qua hệ chuyên gia. [6], [36]
Ung thƣ [3] là một bệnh hiểm nghèo, sinh ra do sự rối loạn tế bào. Ung thƣ
gan là một trong những bệnh phổ biến nhất thế giới. Nó là loại ung thƣ phổ biến ở
Châu Phi, Đông Nam Á,…Ung thƣ chiếm tỉ lệ 0,13% ở các trƣờng hợp mổ tử thi và
chiếm khoảng 1% các ung thƣ. Riêng ở nƣớc ta ung thƣ gan đứng thứ 4, chiếm
khoảng 5-6% tổng số ung thƣ, miền Bắc nhiều hơn miền Nam. Tỉ lệ ung thƣ gan
ngày càng có xu hƣớng ra tăng. Ung thƣ gan là một loại ung thƣ có tính chất ác tính
rất cao, nếu không đƣợc điều trị kịp thời thì thời gian sống của bệnh nhân chỉ đƣợc
khoảng 6 – 7 tháng và nếu phát hiện ra là giai đoạn cuối thì thời gian sống khoảng 2
– 3 tháng. Vì vậy ta cần thăm khám, phát hiện tiêm phòng và điều trị kịp thời. [4]
Theo tài liệu [11], ung thƣ gan đƣợc phát hiện qua gan to toàn bộ hoặc riêng
một thùy hay một phân thùy, mặt gan to gồ ghề nếu u nằm ở lớp nông, góc dƣới và
góc bên của gan mở rộng (bình thƣờng góc gan trái là 45
0
và góc gan phải là 75
0
).
Trong cơ thể có một ổ hình siêu âm của u là một khối đặc bờ đều, không đều xung
quanh thƣờng có một viền giảm âm, kích thƣớc ở giai đoạn sớm dƣới 3cm ở giai
đoạn muộn có thể trên 10cm, cấu trúc âm của khối đặc có thể là tăng âm, giảm âm
và ở giữa tăng âm xung quanh giảm âm (hình bia bắn súng hoặc hình mắt bò tót).
Chương 1 – Tổng Quan
8
Trƣờng hợp u sẽ hình thành một khối đặc ở giữa rỗng, bờ hốc rỗng dầy và không
đều. Trong cơ thể nhiều ổ thấy nhiều khối đặc tăng âm nằm tập trung ở một thùy
hoặc rải rác khắp cả gan phải trái. Trong thể lan tỏa không thấy khối mà chỉ thấy
một vùng tăng âm, hoặc xen kẽ cả giảm âm giới hạn không rõ (hình tổ ong). Ung
thƣ gan nguyên phát thƣờng gây huyết khối ở tĩnh mạch cửa và tĩnh mạch chủ dƣới
có thể phát hiện bằng siêu âm. Có thể dùng DOPPLER xung và chụp động mạch
gan để đánh giá sự tăng mạch máu trong khối ung thƣ. Nếu ung thƣ phát triển trên
gan lành, hình nhu mô xung quanh bình thƣờng, còn nếu ung thƣ phát triển trên nền
xơ sẽ có dấu hiệu xơ gan.
Theo phân loại của OKUDA có 4 thông số: khối lƣợng u chiếm trên 50% khối
lƣợng gan, có cổ trƣớng, Bilirubin máu trên 30mg/l và abumin dƣới 30mg/l siêu âm
xác định đƣợc hai thông số đầu.
– K giai đoạn I không có thông số nào
– K giai đoạn II có một hoặc 2 thông số
– K giai đoạn III có 3 hoặc 4 thông số
Siêu âm giúp theo dõi K lớn gấp đôi theo thời gian, u càng ác tính thời gian
càng ngắn. Siêu âm hƣớng dẫn vị trí kích thƣớc khối u, đƣờng vào khối u, ví dụ:
bơm hóa chất điều trị qua ống thông luồn vào động mạch gan, chọc kim qua da để
bơm cồn 95
0
vào u nhỏ dƣới 4cm.
Nhờ siêu âm kiểm tra hàng loạt những ngƣời có nguy cơ cao để phát hiện sớm
ung thƣ nhỏ hơn 3cm, chƣa có triệu chứng lâm sàng do đó điều trị sẽ tốt hơn. Theo
ChenD.S sự chính xác của siêu âm chẩn đoán K gan dƣới 3cm nhƣ sau: siêu âm
95%, cắt lớp vi tính 94%, chụp động mạch gan 89%, chụp lấp lánh 16%, soi ổ bụng
12%.
Để giải quyết vấn đề trên, chƣơng trình sẽ thu thập tri thức về các triệu chứng
và dấu hiệu nhận biết bệnh ung thƣ gan, tổ chức biểu diễn tri thức xây dựng hệ hỗ
trợ chẩn đoán bệnh ung thƣ gan. Đó là mô hình COKB ( Computational Objects
Knowledge Base)
Chƣơng trình dựa trên tri thức của nhiều bác sĩ chuyên khoa Nội tiêu hóa –
Gan mật có kiến thức chuyên sâu, kinh nghiệm lâm sàng và những công trình
nghiên cứu căn bệnh này để phân tích những triệu chứng mơ hồ, căn bệnh phức tạp
Chương 1 – Tổng Quan
9
để đƣa ra chẩn đoán và cách điều trị thích hợp. Chƣơng trình có ý nghĩa quan trọng
trong việc các bác sĩ mới ra trƣờng hoặc những bác sĩ không chuyên về bệnh nội
tiêu hóa kế thừa những kinh nghiệm của các chuyên gia trong một thời gian ngắn và
bác sĩ tuyến huyện nâng cao trình độ chuyên môn trong việc chẩn đoán và điều trị
căn bệnh này.
Qua thời gian tìm hiểu và tham khảo ý kiến chuyên gia về chuyên môn Công
nghệ thông tin và Y khoa, tôi đã nghiên cứu tài liệu và chọn hƣớng đề tài : “Xây
dựng hệ hỗ trợ chẩn đoán bệnh ung thư gan”.
1.2. ĐỘNG CƠ NGHIÊN CỨU
Hiện nay bệnh ung thƣ gan đứng thứ ba trên thế giới theo tài liệu [14], các
khối u ác tính nguyên phát thƣờng gặp nhất của gan ở ngƣời lớn là ung thƣ biểu mô
tế bào gan hay còn gọi là Hepatocellular Carcinoma (HCC). HCC là một bệnh đặc
biệt nguy hiểm, tỷ lệ ngƣời bệnh hằng năm tƣơng đƣơng với tỷ lệ tử vong. Một
phần lớn bệnh nhân HCC có xơ gan căn bản và rối loạn chức năng gan. Chăm sóc
bệnh nhân HCC là rất quan trọng, an toàn và hiệu quả tối ƣu hóa các lựa chọn điều
trị, chẳng hạn nhƣ cải tiến điều trị virus viêm gan, tăng sàng lọc bệnh nhân có nguy
cơ cao phát triển HCC, cải tiến lựa chọn bệnh nhân ghép gan và phẩu thuật cắt bỏ
và chấp thuận điều trị chống ung thƣ. [21], [23], [25], [28]
Tại Việt Nam cũng nhƣ các nƣớc Đông Nam Á, ung thƣ gan chủ yếu là ung
thƣ gan nguyên phát, ngƣợc lại với các nƣớc Tây Âu và Bắc Mỹ chủ yếu là ung thƣ
gan thứ phát. Ung thƣ tế bào gan đang tăng cao ở các nƣớc Đông Á, Việt Nam cùng
bối cảnh với các nƣớc trong khu vực, phần lớn ung thƣ tế bào gan là do viêm gan
siêu vi B, bệnh ảnh hƣởng đặc biệt đến nhiều ngƣời ở độ tuổi đang làm việc và chi
phí điều trị. Các thống kê tại các bệnh viện và các khu vực cho thấy ung thƣ tế bào
gan là một trong những ung thƣ phổ biến nhất ở Việt Nam cho cả hai giới, nhất là
nam giới.
Theo thống kê của tổ chức Y tế thế giới năm 2008, tại nƣớc ta ung thƣ gan là
một bệnh có tỷ lệ mắc bệnh cao nhất trong tất cả các loại ung thƣ, cao hơn ung thƣ
phổi, ung thƣ dạ dày, ung thƣ đại trực tràng. Tỷ lệ tử vong 92,62%, số mắc bệnh và
chết ung thƣ gan ở nam và nữ đều đứng đầu trong các loại ung thƣ. Số trƣờng hợp
Chương 1 – Tổng Quan
10
ung thƣ gan mới mắc hàng năm rất cao (Bảng 1.1 ), tỷ lệ nam /nữ là 1,9/1 và tỷ lệ tử
vong nam /nữ là 1,8/1.[28]
Bảng 1.1 Số liệu ung thƣ gan ở nam nữ tại Việt Nam theo WHO năm 2008
Nội dung
Nam
Nữ
Tổng cộng
Số trƣờng hợp mới mắc
15.193
8.058
23.251
Số trƣờng hợp chết
14.073
7.675
21.748
Xuất độ mắc /100.000 dân
42,3
18,5
60,8
Xuất độ chết / 100.000 dân
39,2
17,3
56,5
Với sự phát triển của y học, ngày nay ung thƣ tế bào gan đã đƣợc phát hiện
ngày càng nhiều, chẩn đoán ngày càng sớm, tiên lƣợng và tầm soát bệnh rất tốt
bằng các phƣơng tiện cận lâm sàng khá phổ biến nhƣ: siêu âm, một số xét nghiệm,
chụp cắt lớp vi tính, Nếu đƣợc phát hiện và loại bỏ khối u sớm sẽ có tiên lƣợng rất
tốt. Vì vậy việc xây dựng hệ hỗ trợ chẩn đoán bệnh ung thƣ tế bào gan là một nhu
cầu cần thiết cho thực tiễn cuộc sống.
Với tình hình bệnh gan ngày càng tăng thì một chƣơng trình máy tính hỗ trợ
bác sĩ chẩn đoán và theo dõi bệnh gan là cần thiết. Loại chƣơng trình này thƣờng
đƣợc biết đến với tên gọi là hệ chuyên gia. Đó là một loại chƣơng trình máy tính có
khả năng mô hình hóa khả năng giải quyết vấn đề của các chuyên gia trong từng
lĩnh vực. Hệ chuyên gia là một trong những lĩnh vực của trí tuệ nhân tạo đƣợc
nghiên cứu và phát triển từ giữa thập niên 60 [26]. Cho đến nay hệ chuyên gia đƣợc
áp dụng trong nhiều lĩnh vực, trong đó y khoa là một trong những lĩnh vực đƣợc áp
dụng đầu tiên.
Theo tài liệu website [42], Trƣờng Đại học Y Dƣợc hằng năm đều có chỉ tiêu
tuyển sinh bác sĩ ở các chuyên khoa khác nhau. Một bác sĩ sau khi ra trƣờng ít nhất
phải mất 2 năm để hoàn tất chƣơng trình bác sĩ chuyên khoa I và thêm thời gian làm
việc ở bệnh viện 6 năm mới đƣợc học chƣơng trình chuyên khoa II kéo dài trong 2
năm mới có kiến thức và kinh nghiệm chuyên sâu trong lĩnh vực Y khoa. Chuyên
khoa cấp II là loại hình đào tạo sau đại học đặc thù của ngành y tế, nhằm mục đích
Chương 1 – Tổng Quan
11
đào tạo các chuyên gia y tế bậc cao, có khả năng thực hành giỏi trong một chuyên
ngành hẹp. Chuyên khoa cấp II là bậc học tiếp theo của chuyên khoa cấp I, nội trú
bệnh viện là bậc cao nhất về thực hành và áp dụng cho tất cả các chuyên ngành lâm
sàng và thực hành nghề nghiệp trong lĩnh vực khoa học sức khỏe. [10], [40]
Việc xây dựng hệ chẩn đoán này sẽ giúp cho việc chẩn đoán của bác sĩ thuận
tiện hơn. Chƣơng trình này dựa trên tri thức chuyên sâu của bác sĩ chuyên khoa II,
khoa Nội tiêu hóa – Gan mật tại bệnh viện Nhân dân Gia Định. Đồng thời chƣơng
trình cũng giúp ích cho các bác sĩ mới ra trƣờng chƣa có kinh nghiệm trong việc
chẩn đoán bệnh. Ngoài ra, giá trị lớn nhất là giúp cho mọi ngƣời dân có thể sử dụng
để phát hiện bệnh hay nghi ngờ bệnh và đến bệnh viện kịp thời. Chƣơng trình xây
dựng hệ hỗ trợ chẩn đoán bệnh ung thƣ gan đƣợc gọi tắt là ESLCD (The Expert
System for Liver Cancer Diagnosis).
1.3. MỤC TIÊU LUẬN VĂN
Từ nhu cầu thực tiễn cuộc sống về khám chữa bệnh với những động lực đã
nêu trên, đề tài mong muốn ứng dụng công nghệ thông tin vào lĩnh vực y khoa và
đặc biệt là chuyên khoa Nội tiêu hóa - Gan mật về chẩn đoán bệnh ung thƣ gan. Đề
tài sẽ tìm hiểu và nghiên cứu về những phƣơng pháp và kĩ thuật xây dựng hệ
chuyên gia.
Vận dụng mô hình biểu diễn tri thức nhằm xây dựng hệ hỗ trợ chẩn đoán bệnh
ung thƣ gan. Hệ hỗ trợ chẩn đoán này đáp ứng một số yêu cầu từ ý kiến của chuyên
gia, có giao diện mang tính tƣơng tác và hệ thống thử nghiệm trên các bệnh án thực
tế. Hệ thống có cơ sở tri thức từ các chuyên gia cấp cao để hỗ trợ cho bác sĩ trẻ chƣa
có nhiều kinh nghiệm hay các bác sĩ tuyến huyện rút kinh nghiệm trƣớc khi ra quyết
định lâm sàng. Đây là một chƣơng trình ứng dụng thực tế cao.
Thông qua ứng dụng này có một số đóng góp về mặt kỹ thuật biểu diễn tri
thức và suy luận. Dựa trên cơ sở kỹ thuật ứng dụng chƣơng trình giải quyết những
vấn đề về nghiên cứu tri thức thực tế từ chuyên gia cấp cao về bệnh ung thƣ gan để
xây dựng mô hình biểu diễn tri thức và đƣa ra những kết quả chẩn đoán cho bệnh
nhân ung thƣ gan.
Chương 1 – Tổng Quan
12
Để xây dựng ứng dụng đòi hỏi nghiên cứu tri thức thực tế từ lĩnh vực Y khoa
về chẩn đoán bệnh ung thƣ gan để xây dựng mô hình biểu diễn tri thức. Thông qua
ứng dụng này có đóng góp nhất định về mặt mô hình và kỹ thuật có thể phát triển
sau này.
1.4. PHẠM VI NGHIÊN CỨU
Về mặt phạm vi nghiên cứu, đề tài chỉ thu thập những tri thức chuyên gia, các
triệu chứng trong việc chẩn đoán thực tế và dấu hiệu nhận biết bệnh ung thƣ gan.
Chƣơng trình hỗ trợ cho các bác sĩ không thuộc chuyên khoa Nội Tiêu hóa –
Gan mật, các bác sĩ mới ra trƣờng và bác sĩ đa khoa tuyến huyện chƣa có kiến thức
chuyên sâu về bệnh gan.
Chƣơng trình hỗ trợ bác sĩ trong việc ra quyết định lâm sàng, chẩn đoán cuối
cùng phải là chẩn đoán của bác sĩ điều trị trực tiếp.
Về mặt phƣơng pháp thực hiện thì việc đầu tiên là thu thập tri thức từ các bác
sĩ chuyên khoa Nội tiêu hóa – Gan mật của Bệnh viện Nhân dân Gia Định Thành
phố Hồ Chí Minh. Nghiên cứu và ứng dụng các mô hình biểu diễn tri thức và các
phƣơng pháp suy diễn để xây dựng hệ hỗ trợ chẩn đóan các bệnh ung thƣ gan.
Nghiên cứu sử dụng các mẫu thử nghiệm bao gồm các bệnh nhân nhập viện
khoa Nội tiêu hóa – Gan mật bệnh viện từ tháng 04/2014 đến tháng 08/2014 để hệ
chuyên gia thử nghiệm. Kết quả chẩn đoán bằng hệ hỗ trợ đƣợc so sánh với kết quả
chẩn đoán của các bác sĩ trong khoa.
1.5. Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN
Đề tài này mang tính ứng dụng thực tế rất cao do nhu cầu của con ngƣời cần
có một chƣơng trình hỗ trợ cho việc chẩn đoán và phát hiện bệnh sớm để kịp thời
chữa trị. Trong khi làm ứng dụng này, tôi đã nghiên cứu tìm hiểu một số phƣơng
pháp, kĩ thuật để thiết kế chƣơng trình nhằm xây dựng một hệ chuyên gia phù hợp
hơn so với chƣơng trình ứng dụng thông thƣờng. Sử dụng mô hình mới để xây dựng
một hệ chuyên gia hỗ trợ cho việc chẩn đoán bệnh trong lĩnh vực Y khoa là một
công cụ giúp nâng cao hiệu quả công việc và mang tính thực tiễn rất cao.
Chương 1 – Tổng Quan
13
Ngoài ra, vấn đề chẩn đoán bệnh ung thƣ gan đã đƣợc các bác sĩ trong lĩnh
vực chuyên khoa nghiên cứu, nhƣng việc ứng dụng mô hình Biểu diễn tri thức về
bệnh chƣa đƣợc ai vận dụng. Vì vậy tính mới của đề tài là việc ứng dụng công nghệ
tri thức và biểu diễn tri thức vào lĩnh vực y khoa để chẩn đoán bệnh ung thƣ gan.
Đề tài đã đƣa ra một mô hình tri thức áp dụng những phƣơng pháp thiết kế hệ
cơ sở tri thức dựa vào hệ chuyên gia, phƣơng pháp biểu diễn và kĩ thuật xử lý tri
thức phức tạp trong lĩnh vực y khoa là một đóng góp về mặt khoa học của đề tài.
Dựa vào kết quả của đề tài này, ngoài việc ứng dụng mô hình Sub-COKB vào
toán học và y khoa, ta còn có thể ứng dụng mô hình này cho tất cả các lĩnh vực
trong đời sống giúp con ngƣời tiết kiệm thời gian và chi phí, nâng cao chất lƣợng
cuộc sống ngày càng tiến bộ và văn mình hơn, hiện đại hóa đất nƣớc.
Chương 2 – Cơ Sở Lý Thuyết
14
CHƢƠNG 2 - CƠ SỞ LÝ THUYẾT
Trong chƣơng này sẽ trình bày cơ sở lý thuyết liên quan đến hệ chuyên gia,
các cơ sở tri thức, phƣơng pháp biểu diễn tri thức, mô hình biểu diễn tri thức, động
cơ suy diễn và các kỹ thuật xây dựng một hệ cơ sở tri thức để xây dựng một hệ
chuyên gia.
2.1. HỆ CHUYÊN GIA
2.1.1. Cơ sở tri thức
Tri thức [5] là những gì mà một ngƣời có thể biết và hiểu đƣợc. Tri thức có thể
đƣợc phân loại thành tri thức có cấu trúc hoặc không có cấu trúc, tri thức rõ ràng
hay tri thức ngụ ý, không rõ ràng. Những gì mà chúng ta biết đƣợc thƣờng là các tri
thức rõ ràng. Tri thức không có cấu trúc mà vẫn hiểu đƣợc, nhƣng không đƣợc phát
biểu rõ ràng là các tri thức ngầm ý, tri thức không rõ. Khi tri thức đƣợc tổ chức để
có thể chia sẻ thì lúc đó tri thức đƣợc gọi là tri thức có cấu trúc. Để có thể chuyển
đổi từ tri thức không rõ ràng sang tri thức rõ ràng thì tri thức đó cần phải đƣợc cấu
trúc hóa và định dạng lại.
Phân loại tri thức: nhƣ đã đề cập ở trên, tri thức có nhiều loại tùy thuộc vào
tính chất cấu trúc và tính chất rõ ràng của tri thức. Tri thức có thể đƣợc phân loại
thành các loại tri thức sau, đây là các loại tri thức thƣờng gặp trong thực tế:
– Tri thức thủ tục: trong thực tế, nhiều bài toán mà ta có thể gặp là các bài toán mà
tri thức không đơn thuần là khái niệm hay mô tả mà là một hành động hay một
công thức, thủ tục. Ta gọi các tri thức nhƣ vậy là các tri thức thủ tục (diễn tả các
vấn đề đƣợc giải quyết).
– Tri thức mô tả: cho biết một vấn đề đƣợc thấy nhƣ thế nào.
– Tri thức meta: diễn tả tri thức về tri thức.
– Tri thức may rủi: diễn tả các luật may rủi dẫn dắt quá trình suy lý. Tri thức này
có đƣợc dựa trên kinh nghiệm tích lũy nên còn gọi là hueristic.
– Tri thức cấu trúc: mô tả mô hình tri thức tổng quát của chuyên gia về một vấn
đề.
Chương 2 – Cơ Sở Lý Thuyết
15
Tùy thuộc vào ứng dụng cụ thể mà tri thức đƣợc biểu diễn theo những phƣơng
thức khác nhau. Ứng với mỗi dạng biểu diễn đó có một cơ chế để xử lý tri thức đó.
Hệ cơ sở tri thức là một tập hợp các cơ sở lập luận, các luật, các quy trình, thủ tục
đƣợc tổ chức thành một lƣợc đồ. Đó là tập hợp của tất cả các thông tin cũng nhƣ tất
cả các kiến thức về một lĩnh vực cụ thể nào đó.
Quá trình thu thập tri thức đƣợc gọi là quá trình rút trích tri thức và định dạng
tri thức đƣợc thực hiện từ nhiều nguồn khác nhau, đặc biệt là từ các chuyên gia
trong các lĩnh vực cụ thể. Công việc này là một trong những bƣớc quan trọng và
thƣờng mất rất nhiều thời gian cũng nhƣ công sức trong quá trình xây dựng một hệ
cơ sở tri thức đƣợc sử dụng trong hệ chuyên gia. Trong quá trình phát triển một hệ
chuyên gia, các kỹ sƣ tri thức, những nhà chuyên môn trong lĩnh vực trí tuệ nhân
tạo, có nhiệm vụ thu thập tri thức từ các chuyên gia thuộc lĩnh vực chuyên ngành.
Sau đó “sao chép” các tri thức đó vào cơ sở tri thức và diễn đạt các tri thức đó dƣới
dạng có thể dùng đƣợc trong hệ chuyên gia. [7]
2.1.2. Hệ chuyên gia
Theo E.Feigenbaum: “ Hệ chuyên gia (Expert System) là một chƣơng trình
máy tính thông minh sử dụng tri thức (knowledgea) và các thủ tục suy luận
(inference procedures) để giải những bài toán tƣơng đối khó khăn đòi hỏi những
chuyên gia mới giải đƣợc”. [26]
Hệ chuyên gia là một hệ thống tin học có thể mô phỏng (emulates) năng lực
quyết đoán (decision) và hành động (making ability) của một chuyên gia (con
ngƣời). Hệ chuyên gia là một trong những lĩnh vực ứng dụng của trí tuệ nhân tạo
(Artificial Intelligence).
Hệ chuyên gia sử dụng tri thức của chuyên gia để giải quyết các vấn đề (bài
toán) khác nhau thuộc mọi lĩnh vực.
Tri thức (knowledge) trong hệ chuyên gia phản ánh sự tinh thông tích tụ từ
sách vở, tạp chí, từ các chuyên gia hay các nhà bác học. Các thuật ngữ hệ chuyên
gia, hệ thống dựa trên tri thức (knowledge – based system) hay hệ chuyên gia dựa
trên tri thức (knowledge – based expert system) thƣờng có cùng nghĩa.
Một hệ chuyên gia bao gồm ba thành phần chính là cơ sở tri thức (knowledge
base), máy suy diễn hay môtơ suy diễn (inference engine) và hệ thống giao tiếp với
Chương 2 – Cơ Sở Lý Thuyết
16
ngƣời sử dụng (userinterface). Cơ sở tri thức chứa các tri thức để từ đó máy suy
diễn tạo ra câu trả lời cho ngƣời sử dụng qua hệ thống giao tiếp.
Ngƣời sử dụng (user) cung cấp sự kiện (facts) là những gì đã biết, đã có thật hay
những thông tin có ích cho hệ chuyên gia và nhận đƣợc những câu trả lời là những
lời khuyên hay những gợi ý đúng đắn (expertise). [37]
Hình 2.1 Các thành phần của một hệ chuyên gia [37]
Hoạt động của một hệ chuyên gia dựa trên cơ sở tri thức đƣợc minh họa:
Hình 2.2 Hoạt động của một hệ chuyên gia [11]
Chương 2 – Cơ Sở Lý Thuyết
17
Những chƣơng trình trí tuệ nhân tạo đạt đƣợc khả năng giải quyết các vấn đề
trong các lĩnh vực cụ thể ở mức độ chuyên gia bằng cách sử dụng một cơ sở tri thức
trong lĩnh vực đó gọi là các hệ cơ sở tri thức hoặc hệ chuyên gia. Thông thƣờng,
thuật ngữ Hệ chuyên gia đƣợc dùng riêng cho các chƣơng trình mà cơ sở tri thức
của nó chứa đựng các tri thức đƣợc dùng bởi các chuyên gia thực thụ, khác với các
tri thức đƣợc thu thập trong các sách giáo khoa hoặc không phải là tri thức chuyên
môn. Tuy nhiên, đôi khi 2 thuật ngữ Hệ chuyên gia và Hệ cở sở tri thức đƣợc sử
dụng tƣơng tự nhƣ nhau. Phạm vi của trí tuệ nhân tạo cố gắng để đạt đƣợc trong
một hệ chuyên gia gọi là lĩnh vực chuyên ngành. Nhiệm vụ này có thể là các hoạt
động nhƣ giải quyết vấn đề, hoặc là các suy luận hƣớng đích. Còn chuyên ngành là
phạm vi tri thức mà nhiệm vụ đang thực hiện. Các chức năng (nhiệm vụ) thông
thƣờng nhƣ chẩn đoán bệnh, lập kế hoạch, lập lịch, thiết lập cấu hình và thiết kế.
Một ví dụ cụ thể là lập lịch bay cho phi hành đoàn trong các chuyến bay của một
hãng hàng không, hay phân tích cấu trúc của một tòa nhà và đƣa ra các giải pháp
hay tƣ vấn về việc thiết kế tòa nhà đó.
Có thể phân loại các hệ chuyên gia nhƣ sau: [26]
– ES – phân loại: là các hệ áp dụng trong chẩn đoán hoặc phân loại đối tƣợng.
Tri thức thƣờng đƣợc tổ chức dƣới dạng hệ luật dẫn.
– ES – tƣ vấn: là các hệ thực hiện tƣ vấn từ các giả thiết có sẵn hoặc từ các giả
thiết mới đƣợc thiết lập.
– ES – phản biện: thực hiện phản biện dựa vào tập phản đề sẵn có hay là tự tạo
phản biện.
– ES – quyết định: là các hệ trợ giúp quyết định, thƣờng đƣợc kết hợp với các
công cụ tính toán.
Việc xây dựng một hệ chuyên gia đƣợc hiểu nhƣ là việc ứng dụng các kiến
thức khoa học vào việc vận hành và bảo trì tri thức, và ngƣời vận hành tri thức này
gọi là ngƣời thiết kế tri thức. Ngƣời thiết kế tri thức phải đảm bảo rằng máy tính
luôn có đủ tri thức để giải quyết một vấn đề nào đó. Ngƣời thiết kế tri thức phải
chọn một hoặc nhiều hình thức miêu tả các tri thức đƣợc yêu cầu dƣới dạng các mô
hình kí hiệu trong bộ nhớ của máy tính và nhƣ vậy anh ta phải chọn một cách biểu
diễn có hiệu quả bằng việc chọn ra một số các biện pháp lập luận.
Chương 2 – Cơ Sở Lý Thuyết
18
2.1.3. Cấu trúc hệ chuyên gia
Mỗi hệ chuyên gia đều bao gồm 2 thành phần cơ bản là: hệ cơ sở tri thức và
bộ máy suy diễn. Tùy theo cách biểu diễn tri thức mà ta có thể xây dựng mô tơ suy
diễn theo thuật giải suy diễn nào. Ngoài ra còn có thể kết hợp phƣơng pháp biểu
diễn thừa số chắc chắn để hệ chuyên gia hoạt động một cách tự nhiên. [26]
Cấu trúc của một hệ chuyên gia thƣờng đƣợc phân ra thành các thành phần nhỏ nhƣ:
– Giao diện người máy: Thực hiện giao tiếp giữa ngƣời dùng và hệ thống nhận
dạng các thông tin từ ngƣời dùng (các câu hỏi, các yêu cầu về lĩnh vực) và đƣa
ra các lời khuyên, các câu trả lời, các giải thích về lĩnh vực đó.
– Bộ thu nạp tri thức làm nhiệm vụ thu nạp tri thức từ chuyên gia con ngƣời, từ kỹ
sƣ tri thức và ngƣời sử dụng thông qua các câu hỏi và yêu cầu của họ sau đó lƣu
trữ vào cơ sở tri thức.
– Bộ giải thích: giải thích những hành động cũng nhƣ những quyết định của hệ
thống cho ngƣời dùng.
– Mô tơ suy diễn: thực hiện các cơ chế suy diễn (để biến đổi hoặc tìm ra tri thức),
xử lý và điều khiển các tri thức đƣợc biểu diễn trong cơ sở tri thức nhằm đáp
ứng các câu hỏi và yêu cầu của ngƣời sử dụng.
– Cơ sở tri thức: Lƣu trữ các tri thức trong lĩnh vực mà hệ đảm nhận làm cơ sở
cho mọi hoạt động của hệ. Cơ sở tri thức bao gồm các sự kiện và các luật.
Chương 2 – Cơ Sở Lý Thuyết
19
Hình 2.3 Cấu trúc cơ bản của một hệ chuyên gia [11]
2.1.4. Kỹ thuật suy luận trong hệ chuyên gia
Có nhiều phƣơng pháp tổng quát để suy luận các chiến lƣợc giải quyết vấn đề
của hệ chuyên gia. Những phƣơng pháp hay gặp là suy diễn tiến (forward chaining),
suy diễn lùi (backward chaining) và phối hợp hai phƣơng pháp này (mixed
chaining).
Những phƣơng pháp khác là phân tích phƣơng tiện (means-end analysis), rút
gọn vấn đề (problem reduction), quay lui (backtracking), kiểm tra lập kế hoạch
(plan- generate-test), lập kế hoạch phân cấp (hierachical planning)
Dƣới đây là nền tảng của công nghệ hệ chuyên gia hiện đại (foundation of
modern rule-based expert system).
Chương 2 – Cơ Sở Lý Thuyết
20
Hình 2.4 Nền tảng của công nghệ hệ chuyên gia dựa trên luật [11]
Phƣơng pháp suy diễn tiến
Suy diễn tiến (forward charning) là lập luận từ các sự kiện, sự việc để rút ra
các kết luận. Ví dụ: Nếu thấy trời mƣa trƣớc khi ra khỏi nhà (sự kiện) thì phải lấy áo
mƣa (kết luận).
Trong phƣơng pháp này, ngƣời sử dụng cung cấp các sự kiện cho hệ chuyên
gia để hệ thống (máy suy diễn) tìm cách rút ra các kết luận có thể. Kết luận này
đƣợc xem là những thuộc tính có thể đƣợc gán giá trị. Trong số những kết luận này,
có thể có những kết luận làm ngƣời sử dụng quan tâm, một số khác không nói lên
điều gì, một số khác có thể vắng mặt.
Các sự kiện thƣờng có dạng: Attribute = value
Lần lƣợt các sự kiện trong cơ sở tri thức đƣợc chọn và hệ thống xem xét tất cả
các luật mà các sự kiện này xuất hiện nhƣ là tiền đề. Theo nguyên tắc lập luận trên,
hệ thống sẽ lấy ra những luật thỏa mãn. Sau khi gán giá trị cho các thuộc tính kết
Chương 2 – Cơ Sở Lý Thuyết
21
luận tƣơng ứng, ngƣời ta nói rằng các sự kiện đã đƣợc thõa mãn. Các thuộc tính
đƣợc gán giá trị sẽ là một phần của kết quả chuyên gia. Sau khi mọi sự kiện đã đƣợc
xem xét, kết quả đƣợc xuất ra cho ngƣời sử dụng.
Phƣơng pháp suy diễn lùi:
Phƣơng pháp suy diễn lùi tiến hành các lập luận theo chiều ngƣợc lại (đối với
phƣơng pháp suy diễn tiến). Từ một giả thuyết (nhƣ là một kết luận), hệ thống đƣa
ra một tình huống trả lời gồm các sự kiện là cơ sở của giả thuyết đã cho này. Ví dụ:
nếu ai đó vào nhà mà cầm áo mƣa và quần áo bị ƣớt thì giả thuyết là trời mƣa.
Để củng cố giả thuyết này, ta sẽ hỏi ngƣời đó xem có phải trời mƣa không?
Nếu ngƣời đó trả lời có thì giả thuyết trời mƣa đúng và trở thành một sự kiện. Nghĩa
là trời mƣa nên phải cầm áo mƣa và áo quần bị ƣớt.
Suy diễn lùi là cho phép nhận đƣợc giá trị của một thuộc tính. Đó là câu trả lời
cho câu hỏi “ giá trị của thuộc tính A là bao nhiêu?” với A là một đích (goal).
Để xác định giá trị của A cần có các nguồn thông tin. Những nguồn này có thể
là những câu hỏi hoặc có thể là những luật. Căn cứ vào các câu hỏi, hệ thống nhận
đƣợc một cách trực tiếp từ ngƣời sử dụng những giá trị của thuộc tính liên quan.
Căn cứ vào các luật, hệ thống suy diễn có thể tìm ra giá trị sẽ là kết luận của một
trong số các kết luận có thể của thuộc tính liên quan,v.v
Ý tƣởng của thuật toán suy diễn lùi nhƣ sau. Với mỗi thuộc tính đã cho, ngƣời
ta định nghĩa nguồn của nó:
– Nếu thuộc tính xuất hiện nhƣ là tiền đề của một luật (phần đầu của luật), thì
nguồn sẽ thu gọn thành một câu hỏi.
– Nếu thuộc tính xuất hiện nhƣ là hậu quả của một luật (phần cuối của luật), thì
nguồn sẽ là các luật mà trong đó, thuộc tính là kết luận.
– Nếu thuộc tính là trung gian, xuất hiện đồng thời nhƣ là tiền đề và nhƣ là kết
luận, khi đó nguồn có thể là các luật, hoặc có thể là các câu hỏi mà chƣa
đƣợc nêu ra.
Nếu mỗi lần với câu hỏi đã cho, ngƣời sử dụng trả lời hợp lệ, giá trị trả lời này
sẽ đƣợc gán cho thuộc tính và xem nhƣ thành công. Nếu nguồn là các luật, hệ thống
sẽ lấy lần lƣợt các luật mà thuộc tính đích xuất hiện nhƣ kết luận, để có thể tìm giá
Chương 2 – Cơ Sở Lý Thuyết
22
trị các thuộc tính thuộc tiền đề. Nếu các luật thõa mãn, thuộc tính kết luận sẽ đƣợc
ghi nhận.
2.1.5. Quy trình xây dựng hệ chuyên gia:
Theo tài liệu [26], quy trình đƣợc chia làm 7 giai đoạn nhƣ sau:
– Giai đoạn 1:
Xác định miền tri thức
Xác định phạm vi vấn đề
Thu thập tri thức
– Giai đoạn 2: Thiết kế cơ sở tri thức
Biểu diễn tri thức
Tổ chức cơ sở tri thức
– Giai đoạn 3: Thiết kế bộ suy diễn
Thu thập và biểu diễn vấn đề chẩn đoán.
Thiết kế giải thuật để chẩn đoán
– Giai đoạn 4: Thiết kế giao diện ngƣời dùng
– Giai đoạn 5: Cài đặt
– Giai đoạn 6: Xây dựng bảng mẫu để kiểm tra
– Giai đoạn 7: Hiệu chỉnh
2.1.6. Thuận lợi và khó khăn của hệ chuyên gia
Thuận lợi:
Tính lâu dài của Hệ chuyên gia: các chuyên gia là con ngƣời vẫn có thể quên
những lập luận hay khái niệm nào đó, nhƣng hệ chuyên gia thì không. Ngoài ra hệ
chuyên gia còn có khả năng tái sử dụng cho các mục đích khác nhau, với các lĩnh
vực khác nhau, một cách nhanh chóng và dễ dàng. Trong khi đó, quá trình tạo ra
một cuyên gia là con ngƣời phải mất một khoảng thời gian và công sức không nhỏ.
Các hệ chuyên gia có thể dùng các luật hay quy tắc một cách nhanh chóng mà
không nhầm lẫn, nếu trong trƣờng hợp có quá nhiều quy tắc hay luật thì một chuyên
gia là con ngƣời không xử lý nhanh nhƣ một hệ chuyên gia đƣợc.
Về tính hiệu quả, một hệ chuyên gia có thể tăng số lƣợng đƣợc đƣa vào hệ và
giảm đi các chi phí nhân công. Mặc dù các hệ chuyên gia đƣợc xây dựng và bảo trì
Chương 2 – Cơ Sở Lý Thuyết
23
thƣờng tốn kém, nhƣng để vận hành các hệ chuyên gia không phải tốn nhiều công
sức và tiền bạc. Việc phát triển và duy trì một hệ chuyên gia có thể đƣợc trải đều ra
cho nhiều ngƣời, và tổng chi phí cho việc này sẽ hợp lý hơn rất nhiều so với việc
kiếm một chuyên gia thực thụ.
Nếu nhƣ không có sự trục trặc về thiết bị máy móc thì một hệ chuyên gia có
thể hoạt động rất ổn định, với các tập luật đã đƣợc xây dựng và cùng với các khả
năng xử lý khác, hệ có thể đƣa ra các quyết định gần nhƣ nhau trong các tình huống
tƣơng tự nhau. Ngoài ra, một hệ chuyên gia có thể cung cấp các giải pháp một cách
thƣờng xuyên trong một quá trình giải quyết vấn đề. Trong một thời điểm thì một hệ
chuyên gia có khả năng giải quyết đƣợc nhiều vấn đề hơn so với một chuyên gia là
con ngƣời.
Một thuận lợi lớn khác của các hệ chuyên gia đó là kiến thức của rất nhiều
chuyên gia khác nhau đƣợc đƣa vào hệ chuyên gia, điều này rõ ràng là làm cho cơ
sở tri thức của một hệ chuyên gia rộng và phong phú hơn so với một vài chuyên gia
đơn lẻ. Trong lĩnh vực kinh tế, hệ chuyên gia sẽ có thể giảm thiểu đƣợc nhiều rủi ro
hơn.
Những bất lợi của một hệ chuyên gia dựa trên luật:
Một điều dễ nhận ra là các hệ chuyên gia không có khả năng học nhƣ các hệ
thống thông minh khác nhƣ Suy luận dựa tình huống (Case-based reasoning) hay
Mạng nơron (Neural Networks), Vì vậy nếu có những thay đổi từ phía các chuyên
gia là con ngƣời thì hệ chuyên gia cần đƣợc cập nhật lập tức. Hệ chuyên gia không
có khả năng sáng tạo và không có đƣợc các giác quan thông thƣờng nhƣ con ngƣời,
trong những tình huống bất thƣờng, hệ chuyên gia không có khả năng giải quyết.
Ngoài ra, các hệ chuyên gia không có đƣợc những kinh nghiệm, sự nhạy bén,
tính sáng tạo nhƣ các chuyên gia là con ngƣời, và cũng không thể nhận ra đƣợc vấn
đề nếu nhƣ vấn đề đó không thuộc phạm vi “hiểu biết” của hệ thống.
Chương 2 – Cơ Sở Lý Thuyết
24
2.2. CƠ SỞ TRI THỨC
Cơ sở tri thức của hệ chuyên gia bao gồm cả tri thức thực tế và tri thức
Heuristic. Tri thức thực tế là tri thức chuyên ngành mà đƣợc phổ biến và chia sẻ
trong phạm vi rộng, có thể tìm thấy dễ dàng trong sách giáo khoa hoặc trong các
sách báo và nhìn chung là đƣợc chấp nhận dựa trên các kiến thức đúng đắn trong
từng lĩnh vực cụ thể. Còn tri thức Heuristic mang ít tính nghiêm ngặt hơn, dựa
nhiều vào kinh nghiệm và sự phán đoán hơn. Trái với tri thức thực tế, tri thức
Heuristic ít khi đƣợc thảo luận, và mang đậm tính cá nhân. Nó là kiến thức rút ra từ
việc thực hành và phán đoán tốt và sự lập luận chặt chẽ trong từng lĩnh vực. [16]
Biểu diễn tri thức là mô hình hóa và tổ chức tri thức. Một phƣơng pháp biểu
diễn tri thức đƣợc sử dụng rộng rãi là sử dụng hệ các luật dẫn hoặc là dùng các luật
đơn giản. Một luật bao gồm một phần IF và một phần là THEN (còn gọi là điều
kiện và kết luận). Phần IF liệt kê một tập hợp các điều kiện đƣợc liên kết logic với
nhau. Một mẫu tri thức đƣợc biểu diễn bởi luật dẫn có liên quan đến dòng lập luận
đang đƣợc khai triển nếu nhƣ phần IF của luật đƣợc thỏa mãn. Vì vậy, phần THEN
của luật có thể đƣợc kết luận, hoặc là vấn đề của luật có thể đƣợc giải quyết.
Ví dụ:
(1) Nếu điều-kiện P thì kết-luận C
(2) Nếu trạng-thái S thì hành-động A
(3) Nếu các điều kiện C1, Cn đúng thì kết luận C đúng.
Hệ luật dẫn đƣợc sử dụng rộng rãi là do các nguyên nhân sau:
Tính đơn thể: Mỗi luật định nghĩa một phần nhỏ và độc lập các tri thức.
Dễ thêm: Có thể thêm các luật mới vào CSTT tƣơng đối độc lập với các quy
tắc đã có.
Dễ sửa đổi: Có thể sửa đổi các quy tắc trong CSTT tƣơng đối độc lập với các
quy tắc khác.
Trong suốt: Hệ thống dựa trên luật dẫn có khả năng giải thích các hành động
cũng nhƣ các quyết định của nó.
Mô hình giải quyết vấn đề tổ chức và điều khiển các bƣớc thực hiện để giải
quyết một vấn đề nào đó của hệ chuyên gia. Một mô hình thông dụng nhƣng hiệu
Chương 2 – Cơ Sở Lý Thuyết
25
quả là liên kết các mắt xích của các luật IF-THEN để hình thành một dòng lập luận.
Nếu nhƣ chuỗi mắt xích đó bắt đầu từ một tập hợp các điều kiện và tiến đến các kết
luận thì phƣơng pháp này gọi là suy luận tiến. Còn nếu nhƣ kết luận đã đƣợc biết
trƣớc nhƣng các bƣớc suy luận để dẫn đến kết luận vẫn chƣa biết thì khi đó, hàm
suy lùi sẽ đƣợc gọi, và phƣơng pháp suy luận này gọi là suy diễn lùi. Các phƣơng
pháp giải quyết vấn đề này đƣợc xây dựng trong các module của chƣơng trình và
đƣợc gọi là các bộ máy suy diễn hoặc là các thủ tục suy diễn, các module này sẽ
điều khiển và sử dụng tri thức trong cơ sở tri thức để hình thành dòng lập luận.
Tri thức là thành phần quan trọng nhất trong bất kỳ một hệ chuyên gia nào.
Sức mạnh của các hệ chuyên gia dựa vào các tri thức cụ thể và có chất lƣợng mà nó
chứa đối với các lĩnh vực chuyên ngành. Do tầm quan trọng của tri thức đối với các
hệ chuyên gia và vì hiện nay các phƣơng pháp thu thập tri thức còn tốn nhiều chi
phí, các hệ chuyên gia trong tƣơng lai cần phải giải quyết đƣợc vấn đề thu thập tri
thức và cải tiến việc hệ thống hóa cũng nhƣ việc biểu diễn một hệ cơ sở tri thức lớn.
Với mục tiêu xây dựng một hệ chuyên gia có những bƣớc suy luận giống nhƣ con
ngƣời thì đòi hỏi trƣớc hết hệ thống cần phải có một cơ sở tri thức phong phú và sâu
rộng về vấn đề mà hệ chuyên gia cần giải quyết, quá trình thu thập cơ sở tri thức là
một quá trình quan trọng đối với bất cứ một hệ chuyên gia nào, và việc quản lý cơ
sở tri thức cũng là một vấn đề quan trọng. [5]
2.3. CÁC PHƢƠNG PHÁP BIỂU DIỄN TRI THỨC
Tri thức là sự hiểu biết về một lĩnh vực của một chủ đề. Tri thức thƣờng bao
gồm các khái niệm, sự kiện. Biểu diễn tri thức là sự diễn đạt và thể hiện của tri thức
dƣới những dạng thích hợp để có thể tổ chức một cơ sở tri thức của hệ thống. Phần
này sẽ trình bày các phƣơng pháp và kỹ thuật biểu diễn tri thức.[11],[29],[34],[35]
2.3.1. Biểu diễn tri thức dựa trên logic hình thức
Đây đƣợc xem nhƣ các biểu diễn tri thức đơn giản nhất trong máy tính. Sử
dụng các kí hiệu để mô tả tri thức. Mỗi kí hiệu nhằm diễn tả một khái niệm nào đó
trong lĩnh vực đang xét, và mỗi kí hiệu này mang 2 giá trị luận lý là đúng hoặc sai.
Các phép toán logic đƣợc sử dụng phổ biến của dạng là: and (^), or (v), not (~) và