Tải bản đầy đủ (.pdf) (109 trang)

nghiên cứu một số phương pháp của trí tuệ tính toán ứng dụng trong y học

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.45 MB, 109 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
---------------------------------------

NGÔ THỊ DIỆU THÚY

NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP CỦA TRÍ TUỆ TÍNH TOÁN
ỨNG DỤNG TRONG Y HỌC

Chuyên ngành: CÔNG NGHỆ THÔNG TIN

LUẬN VĂN THẠC SĨ KHOA HỌC
CÔNG NGHỆ THÔNG TIN

NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS. NGUYỄN HOÀNG PHƯƠNG

Hà Nội - Năm 2012


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
---------------------------------------

NGÔ THỊ DIỆU THÚY

NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP CỦA TRÍ TUỆ TÍNH TOÁN
ỨNG DỤNG TRONG Y HỌC

Chuyên ngành: CÔNG NGHỆ THÔNG TIN


LUẬN VĂN THẠC SĨ KHOA HỌC
CÔNG NGHỆ THÔNG TIN

NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS. NGUYỄN HOÀNG PHƯƠNG

Hà Nội – Năm 2012


MỤC LỤC
LỜI CAM ĐOAN ....................................................................................................... 4
LỜI CẢM ƠN ............................................................................................................. 5
DANH MỤC CÁC TỪ VIẾT TẮT ............................................................................ 6
DANH MỤC HÌNH VẼ .............................................................................................. 7
ĐẶT VẤN ĐỀ ............................................................................................................. 9
1. Giới thiệu ............................................................................................................. 9
2. Mục đích của luận văn ........................................................................................ 10
3. Phương pháp thực hiện luận văn ......................................................................... 10
4. Nội dung của luận văn ........................................................................................ 11
CHƯƠNG 1. GIỚI THIỆU VỀ TRÍ TUỆ TÍNH TOÁN ........................................ 12
1.1. Trí tuệ tính toán là gì?...................................................................................... 12
1.2. Các thành phần cơ bản của trí tuệ tính toán ...................................................... 16
1.2.1 Mạng nơron nhân tạo (ANN) ..................................................................... 16
1.2.2. Các giải thuật tính toán tiến hóa và di truyền ............................................ 19
1.2.3. Tính toán xác suất và mạng tin cậy ........................................................... 22
1.2.4. Hệ chuyên gia (Expert System - ES) ........................................................ 25
1.2.5. Tổng quan về Logic mờ (Fuzzy Logic), xây dựng cơ sở tri thức cho hệ
chuyên gia mờ .................................................................................................... 41
1.3. Áp dụng lý thuyết Fuzzy logic và lý thuyết về độ chắc chắn trong “Hệ chuyên
gia chẩn đoán bệnh khớp” ...................................................................................... 48

1.4. Kết luận ........................................................................................................... 49
CHƯƠNG 2. BỆNH KHỚP VÀ QUY TRÌNH CHẨN ĐOÁN BỆNH KHỚP ...... 50
2.1. Bệnh khớp và Bệnh viêm khớp dạng thấp ........................................................ 50
2.2. Các loại bệnh khớp .......................................................................................... 52
2.2.1. Bệnh khớp do viêm .................................................................................. 52
2.2.2. Bệnh khớp không do viêm ........................................................................ 52
2.3. Các kiểu triệu chứng và chẩn đoán trong bệnh khớp ........................................ 53
2.3.1. Các kiểu triệu chứng ................................................................................. 53
2.3.2. Các phương pháp chẩn đoán bệnh khớp.................................................... 55

2


2.4. Quy trình làm bệnh án cơ xương khớp ............................................................. 56
2.5. Phương pháp chẩn đoán trong bệnh khớp ........................................................ 60
2.6. Kết luận ........................................................................................................... 62
CHƯƠNG 3. XÂY DỰNG THỬ NGHIỆM HỆ CHUYÊN GIA CHẨN ĐOÁN
BỆNH KHỚP............................................................................................................ 63
3.1. Cơ sở tri thức ................................................................................................... 63
3.1.1. Triệu chứng .............................................................................................. 64
3.1.2. Bệnh ......................................................................................................... 65
3.1.3. Các luật sản xuất ...................................................................................... 66
3.2. Cấu trúc bộ thu nhận tri thức ........................................................................... 69
3.3. Xây dựng cơ chế suy diễn sử dụng Fuzzy Logic và lý thuyết độ chắc chắn...... 70
3.3.1. Quan hệ triệu chứng - bệnh nhân .............................................................. 70
4.3.2. Quan hệ triệu chứng - bệnh....................................................................... 71
4.3.3. Quan hệ bệnh nhân - bệnh về khớp ........................................................... 72
3.3.4. Thuật toán ................................................................................................ 77
3.4. Kết luận ........................................................................................................... 82
CHƯƠNG 4. PHÂN TÍCH VÀ THIẾT KẾ HỆ THỐNG ...................................... 83

4.1. Phân tích.......................................................................................................... 83
4.2. Thiết kế hệ thống ............................................................................................. 84
4.2.1. Biểu đồ UseCase ...................................................................................... 84
4.2.2. Biểu đồ hoạt động .................................................................................... 85
CHƯƠNG 5. CÀI ĐẶT CHƯƠNG TRÌNH THỬ NGHIỆM ................................. 94
CHƯƠNG 6. KẾT LUẬN ...................................................................................... 100
ĐỀ XUẤT HƯỚNG PHÁT TRIỂN ....................................................................... 101
TÀI LIỆU THAM KHẢO ...................................................................................... 102
PHỤ LỤC................................................................................................................ 104
PHỤ LỤC 1: TRIỆU CHỨNG BỆNH KHỚP ...................................................... 104
PHỤ LỤC 2: CƠ SỞ TRI THỨC NẾU – THÌ ...................................................... 106
PHỤ LỤC 3: CÁC TOÁN TỬ FUZZY LOGIC ................................................... 108

3


LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của tôi, dưới sự hướng dẫn của
PGS.TS Nguyễn Hoàng Phương.
Các nội dung nghiên cứu và kết quả trong đề tài này là trung thực, những số liệu
trong các bảng biểu phục vụ cho việc phân tích, nhận xét được chính tác giả thu thập từ
các nguồn khác nhau có ghi trong phần tài liệu tham khảo.
Ngoài ra đề tài còn sử dụng một số nhận xét, đánh giá cũng như số liệu của các
tác giả, cơ quan tổ chức khác và cũng được thể hiện trong phần tài liệu tham khảo.

Hà Nội, ngày 10 tháng 3 năm 2012
Học viên

Ngô Thị Diệu Thúy


4


LỜI CẢM ƠN
Lời đầu tiên em xin chân thành bày tỏ lòng cảm ơn và kính trọng sâu sắc đối với
người Thầy, PGS. TS. Nguyễn Hoàng Phương, Phó Vụ trưởng Vụ Khoa học và Đào
tạo, Bộ Y tế, người thầy đã trực tiếp hướng dẫn, giúp em định hướng, tận tình chỉ bảo
và hỗ trợ em trong suốt quá trình nghiên cứu và thực hiện luận văn.
Em cũng xin thể hiện sự kính trọng và lòng biết ơn đến Quý Thầy Cô trong
Viện Công nghệ thông tin, trường Đại học Bách Khoa Hà Nội, những người đã
trang bị cho em rất nhiều kiến thức chuyên ngành, cũng như sự chỉ bảo, giúp đỡ tận
tình của quý Thầy Cô đối với em trong suốt quá trình học tập. Tất cả các kiến thức mà
em lĩnh hội được từ bài giảng của các Thầy Cô là vô cùng quý giá.
Nhân đây, con xin gửi lời cảm ơn sâu sắc đến Bố, Mẹ và những người thân
trong gia đình, những người luôn luôn bên cạnh và tạo mọi điều kiện thuận lợi nhất để
em có thể hoàn thành luận văn.
Tôi cũng xin được cảm ơn các bác sỹ, các bạn đồng nghiệp đang công tác tại
Bệnh viện Y học cổ truyền TW, những người đã cung cấp và chia sẻ tài liệu, thông
tin quý báu trong suốt quá trình học tập, nghiên cứu, hoàn thành luận văn này.

Hà Nội, ngày 10 tháng 3 năm 2012
Ngô Thị Diệu Thúy

5


DANH MỤC CÁC TỪ VIẾT TẮT
Từ viết tắt
Tiếng Anh


Tiếng Việt

ES

Diễn giải tiếng Anh
Expert System

Diễn giải tiếng Việt
Hệ chuyên gia
Cơ sở tri thức

CSTT
CI

Computational Intelligence

Trí tuệ tính toán

GA

Genetic Algorithm

Giải thuật di truyền

ANN

Artificial Neural Network

Mạng nơron nhân tạo


BN

Belief Network

Mạng tin cậy

PR

Probabilistic Reasoning

Lập luận xác suất

AI

Atificial Intelligence

Trí tuệ nhân tạo

GM

German Measles

Sởi Đức

GrC

Granular Computing

Tính toán hạt


O-A-V

TTNT

Trí tuệ nhân tạo

CNTT

Công nghệ thông tin
Object – Attribute - Value

Đối tượng – Thuộc tính –
Giá trị

6


DANH MỤC HÌNH VẼ
Hình 1. Các thành phần của Trí tuệ tính toán .............................................................. 15
Hình 2. Kiến trúc của một nơron nhân tạo và mạng nơron nhiều lớp .......................... 17
Hình 3. Sơ đồ lặp của giải thuật di truyền ................................................................... 21
Hình 4. Gán ma trận xác suất có điều kiện trong cung nối trực tiếp từ A đến B .......... 24
Hình 5. Các thành phần chính của Hệ chuyên gia ....................................................... 25
Hình 6. Cách thức giải quyết vấn đề con người........................................................... 27
Hình 7. Cách thức giải quyết vấn đề con người........................................................... 27
Hình 8. Mô hình Hệ chuyên gia .................................................................................. 28
Hình 9. Kiến trúc hệ chuyên gia dựa trên luật ............................................................. 34
Hình 10. Nhân tố chắc chắn sử dụng trong MYCIN.................................................... 38
Hình 11. Đồ thị hàm thuộc  thấp(h) .......................................................................... 44
Hình 12. Lược đồ chẩn đoán bệnh khớp ..................................................................... 59

Hình 13. Đồ thị hàm thuộc  Sốtcao(t) ........................................................................ 65
Hình 14. Cấu trúc bộ thu nhận tri thức ........................................................................ 69
Hình 15. Thang đo giá trị ngôn ngữ ............................................................................ 75
Hình 16. Ví dụ minh họa về quan hệ RPD .................................................................. 76
Hình 17. Mô hình lập luận .......................................................................................... 78
Hình 18. Sơ đồ thuật toán tính toán ............................................................................ 79
Hình 19. Biểu đồ UseCase "Chẩn đoán bệnh khớp" .................................................... 84
Hình 20. Biểu đồ cập nhật triệu chứng ........................................................................ 85
Hình 21. Biểu đồ cập nhật bệnh .................................................................................. 86
Hình 22. Sơ đồ cập nhật tri thức ................................................................................. 87
Hình 23. Biểu đồ cập nhật thông tin bệnh nhân........................................................... 88
Hình 24. Biểu đồ cập nhật thông tin cần khám ............................................................ 90
Hình 25. Biểu đồ chẩn đoán........................................................................................ 91
7


Hình 26. Sơ đồ cơ sở dữ liệu ...................................................................................... 93
Hình 27. Giao diện form chính ................................................................................... 94
Hình 28. Giao diện Cập nhật triệu chứng .................................................................... 95
Hình 29. Giao diện Cập nhật tập luật .......................................................................... 96
Hình 30. Giao diện khám lâm sàng ............................................................................. 97

8


ĐẶT VẤN ĐỀ
1. Giới thiệu
Công nghệ thông tin nói chung và Trí tuệ tính toán (Computing Intelligence CI) nói riêng đã và đang trở thành công cụ đắc lực cho cuộc sống hiện đại. Việc áp
dụng Công nghệ thông tin vào nhằm làm hiện đại hóa các quy trình làm việc của các
ngành nghề đã mang lại hiệu quả cao về chi phí, tiết kiệm thời gian và tăng độ chính

xác trong xử lý vấn đề.
Y tế là một ngành đặc thù mà ở đó việc áp dụng Công nghệ thông tin sẽ làm
tăng cường hiệu quả khám chữa, chăm sóc và điều trị bệnh cho cộng đồng. Không
những thế, các hệ thống thông tin Y tế thông minh sẽ là giải pháp cho vấn đề chẩn
đoán sớm, kiểm soát dịch bệnh và nghiên cứu… Trí tuệ tính toán hứa hẹn sẽ là một
trong những công cụ hỗ trợ đắc lực cho vấn đề này.
Lý thuyết trí tuệ tính toán có những bước phát triển mạnh mẽ trong những năm
qua. Chúng cung cấp các kỹ thuật và công cụ hỗ trợ có ích cho các quyết định của con
người trong những bối cảnh phức tạp. Độ phức tạp ở đây có nghĩa là số lượng lớn các
yếu tố, thay đổi tình trạng bệnh, tri thức không chính xác, mơ hồ, thiếu dữ liệu… Sử
dụng các kỹ thuật này cho lĩnh vực chăm sóc sức khỏe và y tế có thể có tiềm năng cao
nhất. Ngày nay, việc sử dụng những kỹ thuật này trong công việc hàng ngày của các
bác sỹ đã không còn mới lạ và dự kiến rằng, với những bằng chứng tin cậy thì việc áp
dụng mạnh mẽ các kỹ thuật sẽ mang lại những lợi ích thực tế cho bệnh nhân và cho bác
sỹ.
Qua khảo sát thực tế cho thấy các phần mềm ứng dụng hiện nay trong ngành Y
tế Việt Nam đã thể hiện được sức mạnh tính toán, lưu trữ, truy xuất nhanh chóng và
hiệu quả trong quản lý kinh tế. Tuy nhiên, có một thực tế rằng, hàm lượng “thông
minh” trong hầu hết các phần mềm ứng dụng trong Y học Việt Nam hiện nay vẫn còn
thấp. Chẩn đoán bệnh là một nhiệm vụ khó và quan trọng trong y học rất cần có sự trợ

9


giúp đắc lực của các phương pháp trí tuệ tính toán nhằm tận dụng và kết hợp tối đa tri
thức của các chuyên gia trong lĩnh vực cụ thể.
Thực tế cho thấy, khi cuộc sống ngày càng trở nên hiện đại thì đời sống nhân
dân phải đối mặt với các căn bệnh nguy hiểm hơn. Trong đó căn bệnh “Thấp khớp”
dường như lại là căn bệnh ngày càng phổ biến nhất. Hàng ngày, tại Khoa khám bệnh
của Bệnh viện Y học cổ truyền Trung ương vẫn tiếp đón rất nhiều bệnh nhân với các

triệu chứng của căn bệnh này, đặc biệt vào những ngày thời tiết nồm, độ ẩm cao. Thế
nhưng để chẩn đoán và tìm ra đúng bệnh đối với người bác sĩ là vô cùng khó khăn và
bệnh nhân cũng phải mất thời gian chờ đợi cùng với đầy đủ các xét nghiệm. Tuy nhiên,
hiện nay ở Việt Nam vẫn chưa có một phần mềm nào trợ giúp chẩn đoán bệnh khớp.
Nguồn tri thức của nhân loại vô cùng rộng lớn và phong phú nhưng làm thế nào
để có thể khai thác và biến những tri thức đó thành những ứng dụng thực tiễn nhằm
phục vụ trong đời sống là nhiệm vụ của những người làm khoa học. Phỏng theo tư duy
suy diễn của hệ chuyên gia, sử dụng lập luận xấp xỉ, thuật toán Fuzzy Logic, trong thời
gian thực hiện luận văn về Trí tuệ tính toán ứng dụng trong Y học, tôi đã lựa chọn bài
toán ứng dụng cho bệnh Khớp để xây dựng bản thử nghiệm “Hệ chuyên gia chẩn
đoán bệnh khớp”.
2. Mục đích của luận văn
Nghiên cứu một số phương pháp của Trí tuệ tính toán ứng dụng trong y học, đề
xuất một phương pháp để giải quyết vấn đề thực tế đặt ra ở Việt Nam.
3. Phương pháp thực hiện luận văn
Để thực hiện luận văn này, chúng tôi đã phải nghiên cứu các lý thuyết sau đây:
Nghiên cứu lý thuyết về các phương pháp tính toán mềm trong Y học, bao gồm
các lĩnh vực: Hệ chuyên gia, Logic mờ, Lập luận xấp xỉ…

10


4. Nội dung của luận văn
Đề tài tập trung vào Nghiên cứu các phương pháp của Trí tuệ tính toán ứng
dụng trong Y học nhằm khai thác khả năng áp dụng Trí tuệ tính toán trong việc hỗ trợ
chẩn đoán bệnh khớp ở Việt Nam.
Luận văn bao gồm các chương:
Chương 1: Giới thiệu Trí tuệ tính toán.
Chương 2: Bệnh khớp và Quy trình chẩn đoán bệnh khớp.
Chương 3: Xây dựng thử nghiệm Hệ chuyên gia chẩn đoán bệnh khớp.

Chương 4: Phân tích và thiết kế hệ thống.
Chương 5: Cài đặt chương trình thử nghiệm.
Chương 6: Kết luận.
Chương 7: Đề xuất hướng phát triển
Tài liệu tham khảo.
Phụ lục.

11


CHƯƠNG 1
GIỚI THIỆU VỀ TRÍ TUỆ TÍNH TOÁN
Lĩnh vực trí tuệ tính toán đã phát triển với mục tiêu phát triển các máy có thể
suy nghĩ giống như con người. Kết quả là, thành tựu mới nhất của lĩnh vực này có thể
bắt chước hoặc vượt xa khả năng nhận thức của con người bao gồm lập luận, hiểu,
học… Trí tuệ tính toán (Computational Intelligence - CI) bao gồm logic mờ, mạng
nơron, các thuật giải di truyền, lập luận xác suất, …
Chương này giới thiệu các khía cạnh cơ bản của các thành phần chính của trí tuệ
tính toán hiện đại. Chúng thể hiện cách nhìn toàn diện về các công cụ của trí tuệ tính
toán (chẳng hạn, logic mờ, mạng nơron, giải thuật di truyền, mạng tin cậy, lý thuyết
hỗn độn, lý thuyết học tính toán, và cuộc sống nhân tạo). Hành vi cộng tác của các
công cụ trên vượt xa nhiều lần hiệu suất cá nhân của chúng. Chương này cũng bao gồm
các thảo luận về hành vi cộng tác của nơron-mờ, các giải thuật nơron-di truyền (GA),
nơron-tin cậy, và các mô hình mạng nơron-tin cậy.
1.1. Trí tuệ tính toán là gì?
Trí tuệ máy đề cập đến năm 1936, khi Turing đề xuất ý tưởng về máy toán học
phổ quát, một khái niệm lý thuyết trong lý thuyết toán học về khả năng tính toán [1,2].
Turing và Post đã chứng minh một cách độc lập rằng việc xác định khả năng quyết
định các mệnh đề toán học là tương đương với yêu cầu các loại trình tự của một số hữu
hạn các biểu tượng có thể nhận biết được bằng một máy trừu tượng với một tập hữu

hạn các lệnh.
Cơ chế như vậy được biết đến là máy Turing [3]. Turing nghiên cứu xác định
các tham số với khả năng tạo ra máy trí tuệ tính toán và gợi ý các câu trả lời cho những
lập luận, đề xuất các kiểm tra Turing như một bài kiểm tra thực nghiệm về trí thông
minh [4].

12


Kiểm tra Turing, được gọi là trò chơi mô phỏng bởi Turing, đo hiệu năng của
máy so với con người. Máy và người (A) được đặt ở 2 phòng. Người thứ ba, được
thẩm vấn, trong một căn phòng khác với hai phòng của người (A) và máy. Người thẩm
vấn không thể nhìn hoặc nói chuyện trực tiếp đối với (A) hoặc máy, giao tiếp với họ
chỉ thông qua một số tin nhắn văn bản hoặc thậm chí chỉ là một cửa sổ trò chuyện.
Nhiệm vụ của người phỏng vấn là nhằm phân biệt giữa người và máy tính dựa trên các
câu hỏi mà anh ta/cô ta có thể đưa ra đối với cả hai thông qua các thiết bị đầu cuối. Nếu
người thẩm vấn không thể phân biệt máy từ con người sau đó, thì Turing lập luận máy
được giả định là thông minh. Trong thập niên 1960s, máy tính không thể vượt qua các
kiểm tra Turing do tốc độ xử lý chậm của các máy tính.
Trong vài thập kỷ gần đây đã thấy rằng thập niên mới của trí tuệ nhân tạo tập
trung vào các nguyên tắc, các khía cạnh thuộc về lý thuyết, và phương pháp luận thiết
kế của các thuật toán thu được từ tự nhiên.
Các ví dụ là mạng nơron nhân tạo lấy cảm hứng từ hệ thần kinh động vật có vú,
tính toán tiến hóa được lấy cảm hứng từ lựa chọn tự nhiên trong sinh học, mô phỏng
luyện kim lấy cảm hứng từ các nguyên tắc nhiệt động lực học và trí tuệ bầy đàn lấy
cảm hứng từ hành vi tập thể của côn trùng hoặc vi sinh vật, và như vậy, việc tương tác
cục bộ với môi trường gây ra mô hình chức năng thống nhất toàn cục để xuất hiện.
Những kỹ thuật này đã tìm thấy cách riêng để giải quyết các vấn đề thế giới thực trong
khoa học, kinh doanh, công nghệ, và thương mại.
Trí tuệ tính toán (CI) là một mô hình được thiết lập tốt [5-8], áp dụng lý thuyết

mới có liên quan đến hiểu biết về sinh học. Các hệ thống thực nghiệm hiện nay có
nhiều đặc điểm của các máy tính sinh học (bộ não) và đang bắt đầu được xây dựng với
nhiều hiệu năng cho các nhiệm vụ khó hoặc không thể thực hiện với các máy tính
truyền thống. Điểm tên một số ứng dụng, chúng ta có lò vi sóng, máy giặt, camera số
có thể cài đặt sử dụng nhằm đạt được hiệu năng tối ưu với khả năng lập luận, tạo ra các
quyết định thông minh, và học từ kinh nghiệm.

13


Thông thường, định nghĩa CI là một nhiệm vụ không khó. Bezdek [5] đã định
nghĩa hệ CI theo cách sau:
“Một hệ thống trí tuệ tính toán khi: chỉ xử lý dữ liệu số (mức thấp), có các thành
phần nhận dạng mẫu, không sử dụng tri thức theo kiểu trí tuệ nhân tạo; và hơn nữa khi
CI bắt đầu thể hiện:
i)

Khả năng tính toán thích nghi

ii)

Khả năng chịu lỗi tính toán

iii)

Tốc độ tiếp cận giống con người và

iv)

Tỷ lệ lỗi gần bằng với thể hiện của con người.”


Định nghĩa trên suy luận rằng một hệ thống trí tuệ tính toán nên được đặc trưng
bởi khả năng thích nghi tính toán, chịu lỗi, tốc độ tính toán cao, và lỗi ít bị nhiễu bởi
các nguồn thông tin. Nó cũng thể hiện rằng tốc độ tính toán cao và tỷ lệ lỗi ít hơn so
với con người. Điều đó đúng với tốc độ tính toán cao đôi khi có thể mang lại sự thiếu
chính xác trong các kết quả.
Logic mờ và mạng nơron hỗ trợ mức độ song song cao thường có phản ứng
nhanh đối với các kích thích đầu vào. Hơn nữa, không giống như hệ suy diễn truyền
thống (dựa trên luật), là hệ mà chỉ có luật duy nhất bị kích hoạt tại một thời điểm, logic
mờ cho phép kích hoạt một số lượng lớn các luật đảm bảo cho việc phù hợp với một
phần các sự kiện có sẵn với các mệnh đề tiền đề của những luật này. Vì thế khả năng
lập luận của logic mờ giống con người, và kết quả là nó gây ít lỗi. Mạng nơron nhân
tạo có tốc độ tính toán cao do nó cho phép kích hoạt đồng thời số lượng lớn các nơron.
Mạng nơron thường thích nghi với các tham số thỏa mãn tập các ràng buộc có tỷ lệ lỗi
cực tiểu. Thực hiện song song của GA và mạng tin cậy với cùng lý do là có tốc độ tính
toán tốt, và hành vi lọc thông tin vốn có duy trì độ chính xác của các kết quả đầu ra.
Khi định nghĩa CI, Marks [9] đã đề cập rõ ràng tên các thành phần cấu thành
nên CI:

14


“… mạng nơron, các thuật giải di truyền, hệ mờ, lập trình tiến hóa và đời sống
nhân tạo là những viên gạch tạo thành CI.”
Về điểm này, việc đề cập có ý nghĩa đến đời sống nhân tạo cũng là một nguyên
tắc nổi bật dựa trên giả thuyết rằng các luật về hóa học và vật lý là đủ tốt để giải thích
trí thông minh của các sinh vật sống. Langton [10] định nghĩa đời sống nhân tạo như
sau:
“… là một mô hình gộp cố gắng nhận ra hành vi sống động như thật bằng cách
bắt chước các quá trình xảy ra trong sự phát triển hoặc các cơ chế của cuộc sống.”

Hình 1 tổng hợp lại chính xác những hiểu biết về cụm từ “Trí tuệ tính toán”,
hình vẽ đã phác họa các chủ đề với một số ý tưởng chung về ngành mới này.
Các định nghĩa trước đây về trí tuệ tính toán tập trung vào logic mờ, mạng
nơron, thuật giải di truyền, và lập luận xác suất cùng với nghiên cứu về sự cộng tác của
chúng. Hiện nay, trí tuệ tính toán bị ảnh hưởng lớn bởi các mô hình lấy cảm hứng sinh
học của trí tuệ máy. Nó xử lý các mô hình mờ như tính toán granular (tính toán chia
nhỏ), tính toán nơron, và tính toán tiến hóa ... Mạng tin cậy (BN- Belief Network) và
lập luận xác suất (PR - Probabilistic reasoning) là giao điểm của trí tuệ nhân tạo truyền
thống và trí tuệ tính toán.

Trí tuệ tính toán truyền
thống
PR

Tính toán mờ và tính
toán chia nhỏ

Tính toán tiến
hóa

Tính toán nơron
BN

Cuộc sống nhân tạo, Tập thô,
Lý thuyết hỗn độn, Trí tuệ bầy đàn, …

Hình 1. Các thành phần của Trí tuệ tính toán

15



Bezdek [5], Marks [9], Pedrycz [11-12], và các nhà nghiên cứu khác đã định
nghĩa CI theo các cách khác nhau dựa trên các phát triển sau đó về nguyên tắc mới này.
Một giao điểm của các định nghĩa này sẽ chắc chắn tập trung vào logic mờ, Mạng
nơron nhân tạo (ANN), và thuật giải di truyền (GA), nhưng sự thống nhất (và tổng quát
hóa) của tất cả các định nghĩa này bao gồm nhiều chủ đề khác (ví dụ: lý thuyết tập thô,
lý thuyết hỗn độn, và lý thuyết tính toán). Hơn nữa, CI đang trở thành một ngành mới
nổi bật không được định nghĩa chính xác chỉ đối với số lượng hữu hạn các chủ đề.
Ngoài ra CI cần có một phạm vi mở rộng theo các hướng khác nhau và kết hợp với các
ngành khác hiện có.
Xu hướng gần đây là nhằm tích hợp các thành phần khác nhau để tận dụng các
tính năng bổ sung và phát triển hệ thống cộng tác. Kiến trúc lai như hệ nơron-mờ, hệ
tiến hóa - mờ, mạng tiến hóa-nơron, hệ nơron-mờ tiến hóa, … đã được áp dụng rộng
rãi trong việc giải quyết các vấn đề của thế giới thực.
Các phần tiếp theo sẽ giải thích và nêu các lợi điểm chính của các thành phần
chức năng chính trong trí tuệ tính toán và các lĩnh vực ứng dụng.
1.2. Các thành phần cơ bản của trí tuệ tính toán
Phần này sẽ cung cấp tổng quát về khái niệm của các mô hình CI thông thường
dựa trên các đặc tính cơ bản của nó.
1.2.1 Mạng nơron nhân tạo (ANN)
Mạng nơron nhân tạo [13-15] được phát triển khái quát như các mô hình toán
học trong các hệ thần kinh sinh học. Trong mô hình toán học đơn giản hóa các tế bào
thần kinh, ảnh hưởng của các xinap được thể hiện bởi các trọng số kết nối điều chỉnh
ảnh hưởng của các tín hiệu đầu vào có liên quan, và đặc điểm phi tuyến thể hiện bởi
các tế bào thần kinh được biểu diễn bằng một hàm chuyển đổi (hàm kích hoạt), thường
là hàm sigmoid, Gaussian, hàm lượng giác… Tế bào thần kinh thúc đẩy sau đó được
tính toán như tổng trọng số của các tín hiệu đầu vào, được chuyển đổi nhờ hàm kích
hoạt. Khả năng học của một tế bào thần kinh nhân tạo đạt được bằng việc điều chỉnh

16



các trọng số phù hợp với giải thuật học đã chọn. Hầu hết các ứng dụng của mạng nơron
được chia thành các loại sau đây:
 Dự báo. Sử dụng các giá trị đầu vào để dự báo một số đầu ra.
 Phân loại. Sử dụng các giá trị đầu vào để xác định phân loại.
 Kết hợp dữ liệu. Giống như phân loại, nhưng nó cũng nhận biết dữ liệu có lỗi.
 Khái niệm hóa dữ liệu. Phân tích các đầu vào để nhóm các quan hệ có thể
được suy luận.
Mạng nơron nhiều lớp điển hình và nơron nhân tạo được minh họa trong hình 2.

Hình 2. Kiến trúc của một nơron nhân tạo và mạng nơron nhiều lớp
Mỗi nơron được đặc trưng bởi một mức độ hoạt động (đại diện cho trạng thái
phân cực của một nơron), một giá trị đầu ra (đại diện cho tỷ lệ kích hoạt của nơron),
một tập các kết nối đầu vào (đại diện cho các xinap trên tế bào và các sợi nhành của
nó), một giá trị sai lệch (đại diện cho mức độ nghỉ nội bộ của nơron), và một tập các
kết nối đầu ra (đại diện cho các phép chiếu của các sợi trục của tế bào). Mỗi khía cạnh
của đơn vị được thể hiện bằng toán học bởi các số thực. Vì thế mỗi kết nối có một
trọng số kết hợp (sức mạnh của xinap), xác định ảnh hưởng của đầu vào ban đầu trên
mức độ kích hoạt của đơn vị. Các trọng số có thể là dương hoặc âm.
Theo hình 2, luồng tín hiệu từ đầu vào x1 … xn được coi là một chiều được chỉ
ra bằng các mũi tên, như một luồng tín hiệu đầu ra của nơron (O). Tín hiệu đầu ra
nơron O được cho bởi quan hệ sau:

17


 n

O  f ( net)  f   w j x j 

 j 1


(1.1)

Trong đó wj là vectơ trọng số và hàm f(net) là hàm kích hoạt và được định nghĩa
như một kết quả vô hướng của trọng số và các vectơ đầu vào.
(1.2)

net  w T x  w1 x1  ...  wn x n

T là hoán vị của ma trận và trong trường hợp đơn giản nhất thì giá trị đầu ra O
được tính toán như sau:
T
(1.3)
1 nếu w x ≥ θ
O  f net   
0 ngược lại với θ được gọi là mức ngưỡng và kiểu nút

được gọi là đơn vị ngưỡng tuyến tính.
Hành vi của mạng nơron phụ thuộc phần lớn vào tương tác giữa các nơron khác
nhau. Kiến trúc cơ bản bao gồm 3 kiểu lớp nơron: lớp đầu vào, lớp ẩn, và lớp đầu ra.
Trong mạng truyền thẳng, luồng tín hiệu là từ các đơn vị đầu vào đến các đơn vị đầu ra
nghiêm ngặt theo hướng truyền thẳng. Việc xử lý dữ liệu có thể mở rộng đến nhiều đơn
vị, nhưng không thể hiện các kết nối ngược, đó là, việc mở rộng các kết nối từ đầu ra
đến đầu vào của các đơn vị ở cùng lớp hay ở các lớp trước.
Mạng hồi quy bao gồm các kết nối ngược. So với mạng truyền thẳng, các thuộc
tính động của mạng là quan trọng. Trong một số trường hợp, các giá trị kích hoạt của
các đơn vị trải qua một tiến trình nghỉ do mạng sẽ tiến đến một trạng thái ổn định trong
đó các kích hoạt không thay đổi nữa. Trong các ứng dụng khác, sự thay đổi các giá trị

kích hoạt của các nơron đầu ra là đáng kể, nhờ đó mà hành vi động tạo thành đầu ra
của mạng. Một số kiến trúc mạng nơron khác (mạng Elman, ánh xạ lý thuyết cộng
hưởng thích nghi, mạng cạnh tranh…) phụ thuộc vào các thuộc tính và yêu cầu của ứng
dụng.
Mạng nơron đã được cấu hình thành ứng dụng của một tập các đầu vào sinh ra
tập các đầu ra mong muốn. Nhiều phương pháp nhằm tạo ra tập sức mạnh của các kết

18


nối đang có. Một phương pháp nhằm thiết lập các trọng số rõ ràng, bằng việc sử dụng
tri thức tiền nghiệm (tri thức đã có từ trước).
Một cách khác để huấn luyện mạng nơron bằng cách đưa các mẫu dạy học và
cho phép thay đổi các trọng số theo một số luật học. Các tình huống học ở mạng nơron
có thể được phân loại thành 3 loại khác nhau. Đó là học có giám sát, học không có
giám sát và học tăng cường. Trong học có giám sát, vectơ đầu vào được trình bày tại
đầu vào cùng với tập các phản hồi mong muốn, một phản hồi cho mỗi nút, tại lớp đầu
ra. Những phản hồi này sau đó được dùng để xác định trọng số thay đổi trong mạng
theo luật học có ưu thế. Các ví dụ nổi tiếng nhất của kỹ thuật này xuất hiện trong thuật
giải lan truyền ngược, luật delta, và luật perceptron.
Trong học không có giám sát (hay tự tổ chức) một đơn vị (đầu ra) được huấn
luyện để đáp ứng lại cụm các mẫu trong đầu vào. Trong mô hình này, hệ thống được
cho là để khám phá ra các đặc trưng nổi bật của thống kê đầu vào. Khác với mô hình
học có giám sát, ở đây không có tập tiền nghiệm của các loại mẫu được phân loại; đúng
hơn là hệ thống phải phát triển thể hiện của kích thích đầu vào riêng.
Trong quá trình học có giám sát, giả thiết rằng đáp ứng đầu ra của mạng đã đạt
được giá trị mong muốn. Nhưng ở một mẫu vào - ra nào đó bị cho rằng có kết quả
không đáng tin cậy, vì vậy cần phải tiến hành kiểm tra lại mẫu nói trên. Khi đó chỉ có
một bit tín hiệu của mẫu cần kiểm tra đóng vai trò là tín hiệu củng cố được đưa vào
mạng để góp phần khẳng định kết quả quá trình học có giám sát đúng hay sai. Kiểu học

này được gọi là kiểu học củng cố (hay học tăng cường). Kiểu học này cũng có tín hiệu
củng cố được lấy từ bên ngoài nên nó chỉ là một trường hợp đặc biệt của kiểu học có
giám sát.
1.2.2. Các giải thuật tính toán tiến hóa và di truyền
Để giải quyết vấn đề tính toán phức tạp, cũng như nhiều nhiệm vụ tính toán
phức tạp khác, các nhà nghiên cứu về máy tính đã tìm kiếm bản chất trong nhiều năm
(cả như là mô hình và như phép ẩn dụ) cho cảm hứng. Việc tối ưu hóa là trọng tâm của

19


các quá trình tự nhiên (chẳng hạn, thuyết tiến hóa Darwin). Qua hàng triệu năm, mỗi
loài đã tối ưu các cấu trúc vật lý để thích nghi với môi trường sống. Hiện nay, quá trình
thích nghi, việc tối ưu hóa hình thái này là hoàn hảo, sự giống nhau giữa một con cá
mập, một con cá heo hay một động vật sống dưới biển là điều đáng chú ý.
Một quan sát sắc sảo về mối quan hệ cơ bản giữa tối ưu hóa và tiến hóa sinh học
đã dẫn đến sự phát triển một mô hình CI mới (các kỹ thuật tính toán tiến hóa) để thực
hiện tìm kiếm và tối ưu hóa rất phức tạp.
Tính toán tiến hóa sử dụng bộ lặp tiến (ví dụ, tăng trưởng hoặc phát triển trong
quần thể). Quần thể này sau đó được lựa chọn trong một tìm kiếm ngẫu nhiên có hướng
dẫn sử dụng tiến trình song song để đạt được kết quả mong muốn. Các tiến trình như
vậy thường được lấy cảm hứng từ các cơ chế sinh học của sự tiến hóa. Mô hình các kỹ
thuật tính toán tiến hóa xuất hiện trở lại vào đầu những năm 1950, khi ý tưởng sử dụng
các nguyên tắc Darwin cho vấn đề giải quyết tự động được sinh ra. Mãi đến những
năm 1960, 3 cách giải thích khác biệt của ý tưởng này bắt đầu được phát triển ở ba địa
điểm khác nhau. Lập trình tiến hóa (Evolutionary programming - EP) được Lawrence
J.Fogel [17] giới thiệu ở Mỹ, khi John Henry Holland đã gọi phương pháp của ông là
thuật giải di truyền (Genetic Algorithm - GA) [18]. Ở Đức Ingo Rechenberg và HansPaul Schwefel đã giới thiệu các chiến lược tiến hóa [19,20]. Những chiến lược này đã
được phát triển tách biệt trong 15 năm. Từ đầu những năm 1990, chúng được thống
nhất là các đại diện khác nhau của một công nghệ, được gọi là tính toán tiến hóa. Ngoài

ra, đầu những năm 1990, một luồng thứ tư sau những ý tưởng chung đã nổi lên lập
trình di truyền (Genetic Programming - GP) [21]. Tất cả đều có chung một cơ sở khái
niệm về mô phỏng tiến hóa các cấu trúc cá nhân thông qua quá trình lai, đột biến và
sinh sản. Các quá trình phụ thuộc vào thể hiện nhận thức của các cấu trúc riêng đã
được định nghĩa bởi môi trường (vấn đề). GA xử lý các tham số với độ dài hữu hạn,
được mã hóa bằng việc sử dụng một bảng chữ cái hữu hạn, hơn là tự thao tác trực tiếp
các thông số. Điều này có nghĩa là tìm kiếm không bị ràng buộc bởi tính liên tục của

20


hàm dưới sự kiểm tra hoặc sự tồn tại của một hàm phái sinh. Hình 4 minh họa mô hình
khối chức năng của GA và các khía cạnh được đề cập dưới đây. Giả sử rằng giải pháp
tiềm năng cho một vấn đề có thể được biểu diễn như một tập các tham số. Những tham
số này (được gọi là gen) được kết hợp cùng nhau để tạo thành một chuỗi các giá trị
(được gọi là nhiễm sắc thể). Một gen (cũng được gọi là đặc tính, đặc trưng, hoặc bộ dò)
là một thuộc tính cụ thể được mã hóa trong nhiễm sắc thể. Các giá trị gen đặc biệt có
thể được gọi là allel.
Các vấn đề mã hóa xử lý việc trình bày giải pháp về nhiễm sắc thể và thật không
may, không có một kỹ thuật nào làm việc tốt nhất cho mọi vấn đề. Một hàm phù hợp
phải được sinh ra cho mỗi vấn đề được giải quyết. Cho trước một nhiễm sắc thể đặc
biệt, hàm phù hợp trả về một giá trị số duy nhất phù hợp hoặc con số cụ thể, sẽ xác
định khả năng của mỗi cá thể, mà nhiễm sắc thể đó thể hiện. Việc tái sinh là thuộc tính
thứ hai của GA ở đó 2 cá thể được chọn lựa từ quần thể được phép giao phối để tạo ra
con cái, mà sẽ bao gồm cả thế hệ tiếp theo. Có lựa chọn cha mẹ, con cái sẽ được sinh
ra, điển hình bằng việc sử dụng các cơ chế chéo và đột biến.

Hình 3. Sơ đồ lặp của giải thuật di truyền
Việc lựa chọn sống còn phù hợp nhất với GA. Nó xác định các cá thể nào cho
mục đích duy trì nòi giống. Giai đoạn lựa chọn bao gồm 3 phần. Phần đầu tiên bao

gồm xác định sự phù hợp của cá thể bởi hàm phù hợp. Hàm phù hợp phải được sinh ra;
cho trước nhiễm sắc thể phù hợp, hàm phù hợp trả lại giá trị phù hợp bằng số, là tỷ lệ
của khả năng, hoặc tính khả dụng, của cá thể được thể hiện bằng nhiễm sắc thể. Phần

21


thứ hai bao gồm việc chuyển đổi hàm phù hợp thành một giá trị mong muốn sau đó bởi
lần cuối cùng mà giá trị mong muốn sau đó được chuyển đổi thành một số con cái.
Một số kỹ thuật lựa chọn thường được sử dụng là bánh xe roullette và lấy mẫu
ngẫu nhiên. Nếu GA đã được thực hiện một các chính xác, thì quần thể sẽ phát triển
các thế hệ kế tiếp tốt nhất để phù hợp nhất và cá thể trung bình trong mỗi thế hệ tăng
lên theo hướng tối ưu. Hiện nay, các kỹ thuật tiến hóa hầu hết bao gồm các giải thuật
tối ưu hóa meta-heuristic, như là các giải thuật tiến hóa (bao gồm GA, lập trình tiến
hóa, chiến lược tiến hóa, lập trình di truyền, các hệ phân loại học và tiến hóa khác biệt).
1.2.3. Tính toán xác suất và mạng tin cậy
Các mô hình xác suất được xem như giống với một trò chơi, các hoạt động dựa
trên các kết quả mong muốn. Trung tâm quan tâm chuyển từ xác định các mô hình xác
suất bằng việc sử dụng các định giá thống kê và dự đoán. Trong quá trình mô hình hóa
xác suất, rủi ro có nghĩa là không chắc chắn cho sự phân bố xác suất được biết đến. Vì
thế, đánh giá rủi ro có nghĩa là nghiên cứu nhằm xác định các kết quả quyết định cùng
với xác suất của chúng.
Những người ra quyết định thường đối mặt với việc thiếu thông tin nghiêm
trọng. Việc đánh giá xác suất định lượng khoảng cách thông tin giữa những gì đã được
biết đến và những gì cần được biết để có quyết định tối ưu. Các mô hình xác suất được
sử đụng để bảo vệ chống lại sự không chắc chắn bất lợi, và khai thác sự không chắc
chắn thuận lợi.
Một ví dụ hay về mạng nơron xác suất (học Bayesian) trong đó xác suất được sử
dụng để biểu diễn sự không chắc chắn về mối quan hệ đã biết.
Trước khi thấy dữ liệu, các ý kiến ban đầu về những gì mà mối quan hệ thực sự

có thể được thể hiện trong phân bố xác suất thông qua các trọng số mạng xác định mối
quan hệ này. Sau đó chúng ta tìm kiếm dữ liệu, kiểm tra lại các ý kiến đã thu thập bởi
sự phân bố trước đây thông qua trọng số mạng. Các trọng số mạng trước đó dường như
là chính đáng, nhưng không phù hợp với dữ liệu, giờ đây sẽ được xem như là rất ít khả

22


năng, trong khi đó xác suất cho các giá trị trọng số thực sự phù hợp với dữ liệu đã tăng
lên. Điển hình, mục đích huấn luyện là nhằm tạo ra các dự báo cho các trường hợp
tương lai trong đó chỉ những đầu vào mạng được biết đến. Kết quả của việc huấn luyện
mạng thông thường là tập duy nhất của các trọng số có thể được sử dụng cho những dự
báo như vậy.
Mạng tin cậy Bayesian [23,24] được biểu diễn bằng một đồ thị hoặc cây mạch
hở trực tiếp, ở đó các nút chỉ ra các sự kiện và các cung chỉ ra mối quan hệ nguyên
nhân - kết quả giữa các nút cha và các nút con. Ở đây, mỗi nút, có thể giả sử một số giá
trị có thể. Ví dụ, nút A có thể có n số giá trị có thể, biểu diễn bằng A1, A2, …, An. Với
hai nút bất kỳ, A và B, có tồn tại sự phụ thuộc AB, chúng tôi gán một ma trận xác
suất có điều kiện [P(B/A)] đến cung trực tiếp từ nút A đến B. Phần tử ở hàng thứ j và
cột thứ i của P(B/A), ký hiệu là P(Bj /Ai ), đại diện cho xác suất có điều kiện của B j giả
sử với sự xuất hiện trước của Ai. Điều này được mô tả trong hình 4.
Cho trước phân phối xác suất của A, ký hiệu bởi [P(A1)P(A2) ····· P(An)], chúng
tôi có thể tính toán phân phối xác suất của sự kiện B bằng cách sử dụng biểu thức sau:

Bây giờ chúng ta minh họa tính toán của P(B) với 1 ví dụ.
Pearl [22-24] đã đề xuất một mô hình cho việc truyền tin cậy của bằng chứng
trong mạng Bayesian. Trước tiên, chúng tôi minh họa mô hình của Pearl với cây
Bayesian như trong hình 4. Tuy nhiên, chú ý rằng, mỗi biến giống như cây trong hình
4, A, B… cần có không chỉ 2 giá trị có thể. Ví dụ, nếu một nút trong 1 cây chỉ ra bệnh
sởi Đức (GM), nó có thể có 3 giá trị như GM-nặng, GM-ít, và GM-vừa phải.

Trong mô hình Pearl dùng lập luận bằng chứng, ông xem xét cả ảnh hưởng
nguyên nhân và ảnh hưởng chẩn đoán đối với tính toán hàm tin cậy tại một nút cho

23


trước trong cây tin cậy Bayesian. Để tính toán tin cậy tại một nút V, ông chia cây thành
2 phần:
(1): Cây con có gốc tại V và
(2): Phần còn lại của cây.

Hình 4. Gán ma trận xác suất có điều kiện trong cung nối trực tiếp từ A đến B
Mô tả tập con bằng chứng, nằm tại cây con của V bởi ev- – và tập con bằng
chứng từ phần còn lại của cây bởi ev+. Hàm tin cậy của nút V được biểu diễn bằng
Bel(V), định nghĩa như sau:
Bel(V) = P(V/ev+, ev-)
= P(ev-/V). P(V/ev+)/α
= λ(V)Π(V)/α

(1.8)

Với λ(V)=P(ev-/V)}
Π(V) = P(V/ev+)

(1.9)

Và α là hằng số chuẩn hóa, được xác định bởi:
α=

+

v∈(true, false)P(e v /V).P(V/e v )

(1.10)

Từ biểu thức cuối cùng giả sử v chỉ có 2 giá trị: đúng và sai. Đó chỉ là ký hiệu
minh họa. Trong thực tế, v có thể có một số giá trị có thể.
Pearl đã thiết kế một giải thuật thú vị về lan truyền tin cậy trong cây nguyên
nhân. Ông gán xác suất tiền nghiệm của một nút lá không hoàn chỉnh, sau đó truyền độ
tin cậy từ nút này đến nút cha của nó, và sau đó, từ nút cha đến nút ông, cho đến khi
tiếp cận đến gốc. Sau đó, ông xem xét lan truyền ngược độ tin cậy từ gốc đến các con,
và từ mỗi nút con đến con của nó… cho đến khi đến được các lá. Lá có độ tin cậy cao
nhất sau đó được gán xác suất tiền nghiệm và toàn bộ tiến trình được mô tả ở trên được
24


×