Tải bản đầy đủ (.doc) (26 trang)

Lý thuyết phương pháp học bằng xây dựng cây định danh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (585.23 KB, 26 trang )

ĐẶT VẤN ĐỀ
0
Từ những hệ máy tính đầu tiên ra đời cho đến các hệ máy tính ngày nay
cũng như những hệ siêu máy tính, các nhà khoa học đã không ngừng nghiên
cứu sáng tạo để máy tính có thể tự suy nghó như con người nhằm thay con
người giải quyết các công việc trong cuộc sống hàng ngày hay những tính
toán dự báo cho tương lai.
Khả năng tự phân tích, tính toán, tự suy nghó của máy tính – đó là trí tuệ
nhân tạo, là sản phẩm trí tuệ của con người sáng tạo ra, cụ thể là những hệ
phần mềm, hệ chương trình chuyên gia ngày càng hoàn thiện càng thông
minh hơn có khả năng giải quyết vấn đề thực tế như cách giải quyết của con
người.
Trí tuệ nhân tạo bao gồm rất nhiều lónh vực, trong đó tiêu biểu là lónh
vực Máy học - làm sao cho các hệ chương trình có thể tích lũy kiến thức
thông qua việc học từ các sai lầm, từ những quan sát ngẫu nhiên, hay từ các
yêu cầu đặt ra của con người. Bánùi cách khác là làm cho các chương trình có
khả năng rút kinh nghiệm từ những quan sát thực tế.
Bài thu hoạch này là một khảo sát nhỏ về một phương pháp học trong trí
tuệ nhân tạo, đó là việc học bằng phương pháp xây dựng cây đònh danh. Bài
toán được đặt ra là từ một mẫu cơ sở dữ liệu có sẳn, máy tính có thể phát
hiện ra tính quy luật trong mẫu dữ liệu đó bằng phương pháp xây dựng cây
đònh danh và nhờ đó giúp con người đưa ra các quyết đònh nhanh chóng và
chuẩn xác.
Ví dụ : Bảng dữ liệu dưới đây được rút trích ra từ cơ sở dữ liệu lưu trữ hồ
sơ bệnh án tại phòng khám ĐHYD TP. HCM gồm các thuộc tính như sau:
Nhóm tuổi : dựa trên số tuổi bệnh nhân mà chia thành 4 nhóm tuổi
- Dưới 20 tuổi.
- Từ 20 – 49 tuổi.
- Từ 50 – 60 tuổi.
- Trên 60 tuổi.
1


Loại BMI (Body Mass Index) : Chỉ số cơ thể được sử dụng để xác đònh tình
trạng cơ thể của một người nào đó có bò béo phì, thừa cân hay quá gầy hay
không. Thông thường người ta dùng để tính toán mức độ béo phì .
(m) cao Chiều*cao Chiều
(Kg) lượng Trọng
BMI =
Căn cứ vào chỉ số BMI đo được mà ta phân loại BMI
• Gầy : < 18,5
• Bình thường : 18,5 – 24.9
• Thừa cân : 25 - 30
• Béo phì : >30
Hoạt động thể thao : Có chơi thể thao; Không chơi thể thao.
Tiền sử bệnh nội khoa : Có / Không bệnh nội khoa trước khi khám sức khỏe.
Kết quả : sau khi khám là Bình thường hoặc là bò Tim mạch;
thì một người khi khám sức khỏe có nguy cơ bệnh tim mạch hay không?
Dữ liệu rút trích được trong bảng như sau:
Mã hồ sơ Nhóm tuổi Loại BMI
Hoạt động
thể thao
Tiền sử bệnh
nội khoa
Kết quả
BN1 Dưới 20 t Gầy Không Không Bình thường
BN2 Từ 20 - 49t Bình thường Có Không Bình thường
BN3 Từ 50 - 60t Bình thường Có Có Tim mạch
BN4 Dưới 20 t Béo phì Không Không Bình thường
BN5 Trên 60t Gầy Có Có Tim mạch
BN6 Từ 50 - 60t Béo phì Có Không Tim mạch
BN7 Từ 20 - 49t Gầy Có Không Bình thường
BN8 Trên 60t Béo phì Có Không Tim mạch

BN9 Từ 20 - 49t Béo phì Có Không Bình thường
BN10 Từ 20 - 49t Bình thường Không Không Bình thường
BN11 Từ 50 - 60t Bình thường Có Không Tim mạch
2
BN12 Trên 60t Béo phì Không Không Tim mạch
BN13 Từ 20 - 49t Béo phì Không Không Bình thường
BN14 Dưới 20 t Gầy Không Có Bình thường
BN15 Dưới 20 t Béo phì Không Có Bình thường
BN16 Dưới 20 t Bình thường Không Không Bình thường
BN17 Từ 50 - 60t Bình thường Không Không Tim mạch
BN18 Dưới 20 t Gầy Có Có Bình thường
BN19 Trên 60t Gầy Có Không Tim mạch
BN20 Từ 20 - 49t Béo phì Không Không Bình thường
BN21 Từ 50 - 60t Bình thường Không Có Tim mạch
BN22 Trên 60t Béo phì Không Có Tim mạch
BN23 Từ 50 - 60t Gầy Không Có Tim mạch
BN24 Trên 60t Béo phì Có Có Tim mạch
BN25 Từ 20 - 49t Bình thường Không Có Bình thường
BN26 Từ 50 - 60t Gầy Có Có Bình thường
BN27 Từ 50 - 60t Béo phì Có Có Tim mạch
BN28 Từ 20 - 49t Gầy Không Không Bình thường
BN29 Dưới 20 t Bình thường Có Không Bình thường
BN30 Trên 60t Gầy Không Có Tim mạch
BN31 Từ 20 - 49t Béo phì Có Có Bình thường
Sau khi dữ liệu này được đưa vào chương trình máy vi tính thì chương
trình sẽ trả lời các tính quy luật như sau:
1. Người trên 60 tuổi → hay mắc bệnh Tim mạch
2. Người tuổi từ 50 – 60, béo phì → mắc bệnh Tim mạch
3. Người dưới 20 tuổi → Bình thường
Tại sao máy vi tính đưa ra được các quy luật này ? Ta hãy nghiên cứu kỹ

hơn trong phần lý thuyết cơ sở của phương pháp học bằng xây dựng cây đònh
danh.
3
LÝ THUYẾT PHƯƠNG PHÁP HỌC
BẰNG XÂY DỰNG CÂY ĐỊNH DANH
I- ĐỊNH NGHĨA VỀ CÂY ĐỊNH DANH :
Cây đònh danh là cây mà khi ta thực hiện phép duyệt đi từ nút gốc đến
các nút lá thì ta sẽ có một quyết đònh hay một quy luật, những quy luật này
dựa vào các thuộc tính trên nút mà phép duyệt đi qua. Như vậy mỗi đường đi
sẽ cho ra một quy luật, do vậäy người ta còn gọi cây đònh danh là cây quyết
đònh.
Với ví dụ ở trên thì cây đònh danh được xác đònh như sau :
Nhóm tuổi
{bn1,
bn4,
bn14,
bn5,
bn16,
bn18,
bn29}
{bn2, bn7, bn9,
bn10, bn13,
bn20, bn25,
bn28, bn31}
{bn5,
bn8,
bn12,
bn19,
bn24,
bn30}

Loại BMI
Hoạt động thể thao
Dưới 20 tuổi
Từ 20 – 49 tuổi
Từ 50 – 60 tuổi
Trên 60t
{ bn3 ,
bn21,
bn11,
bn17 }
Béo phì
Gầy
Bình thường
{ bn27, bn6 }
{ bn23 }
{ bn26}

Không
4
II- PHÂN TÍCH BÀI TOÁN :
Bài toán học bằng phương pháp xây dựng cây đònh danh được phân tích
và khai thác qua các bước sau đây, dựa vào bảng dữ liệu ở phần đặt vấn đề.
Người ta dựa vào ý tưởng tiếp cận hình học là phân chia không gian bài toán
tạo thành một cây đònh danh sau đó xây dựng các phương pháp học dựa trên
cây đònh danh đó. Cây đònh danh được xây dựng bằng cách tìm các quy luật
của dữ liệu.
Gọi P là tập hợp mẫu các đối tượng quan sát được :
1- Ta xét ngẫu nhiên qua từng thuộc tính rồi phân nhóm kết quả theo
từng giá trò của thuộc tính.
Quan sát thuộc tính nhóm tuổi ta có:

P
dưới 20 tuổi
= {bn1, bn4, bn14, bn5, bn16, bn18, bn29}
P
từ 20–49tuổi
= {bn2, bn7, bn9, bn10, bn13, bn20, bn25, bn28, bn31}
P
từ 50 – 60 tuổi
= {bn26, bn3, bn6 , bn11, bn17, bn21, bn23, bn27}
P
trên 60 tuổi
= {bn5 , bn8 , bn12 , bn19 , bn24 , bn30 }
Bệnh nhân được gạch dưới và in đậm là bò tim mạch, ta có sơ đồ sau:
Ta thấy P
từ 50 – 60 tuổi
giá trò kết quả còn lẫn lộn giữa bình thường và Tim
mạch, tiếp tục quan sát thuộc tính kế tiếp là Loại BMI với các tập hợp còn
lẫn lộn này ta có:
P
từ 50 – 60 tuổi,
= {BN26, BN3, BN6, BN11, BN17, BN21, BN23, BN27}
Nhóm tuổi
{bn1,
bn4,
bn14,
bn5,
bn16,
bn18,
bn29}
{bn2, bn7, bn9,

bn10, bn13,
bn20, bn25,
bn28, bn31}
{bn5,
bn8,
bn12,
bn19,
bn24,
bn30}
{bn26, bn3, bn6,
bn11, bn17, bn17,
bn21, bn23, bn27 }
Dưới 20 tuổi
Từ 20 – 49 tuổi
Từ 50 – 60 tuổi
Trên 60t
5
2- Thực hiện quá trình như số 1 cho đến khi tất cả các nút lá của cây
không còn lẫn lộn gía trò kết quả giữa trò số bình thường & tim mạch. Qua
mỗi bước phân hoạch như vậy cây ngày càng phình ra đến khi ta xét hết các
thuộc tính thì cây cuối cùng là cây đònh danh có khả năng cho ta các kết luận
cuối cùng.
Nhận xét: Như vậy nếu ta chọn các thuộc tính ngẫu nhiên khác nhau
thì kết quả cuối cùng sẽ cho ra cây đònh danh cuối cùng khác nhau. Với nhận
xét này ta thấy nếu ta chọn thuộc tính đầu tiên theo một cách nào đó thông
minh hơn dựa vào tần xuất xuất hiện của giá trò dữ liệu trên thuộc tính thì có
thể sẽ cho ta một cây đònh danh đơn giản hơn. Việc chọn thuộc tính như thế
nào là thông minh hơn ta sẽ xem thuật toán Quinlan sau đây:
III- THUẬT TOÁN QUINLAN :
1) Thuật toán :

Loại BMI
{ bn3 , bn21, bn11, bn17 }
Béo phì
Gầy
Bình thường
{ bn27, bn6 } { bn26, bn23 }
Hoạt động thể thao
{ bn23 }

Không
{ bn26}
6
- Với mỗi thuộc tính dẫn xuất A còn có thể sử dụng để phân hoạch thì
ta tính V
A
(j) = (T(j, r
1
), T(j, r
2
), …, T(j, r
n
), )
j là A làxuất dẫn tính thuộc
trò giá có hoạch phântrong tử phầnsố Tổng
rlà tiêu mục tính thuộc trò giá có và j là A là
xuất dẫn tính thuộc trò giá có hoạch phântrong tử phầnsố Tổng
)rT(j,
i
i
=

- Trong đó r
1
, r
2
, …, r
n
là các giá trò thuộc tính mục tiêu. Như vậy nếu
một thuộc tính A có thể nhận một trong 5 giá trò khác nhau thì nó sẽ có 5
vector đặc trưng.
- Một vector V(A
j
) được gọi là vector đơn vò nếu nó có duy nhất một
thành phần có giá trò 1 và những thành phần khác có giá trò 0.
- Thuộc tính được chọn để phân hoạch là thuộc tính có nhiều vector
đơn vò nhất.
2) Minh họa thuật toán :
Bước 1:
+ Xét thuộc tính Nhóm tuổi
- Xét giá trò : Dưới 20 tuổi
V
Nhóm tuổi
(dưới 20 tuổi) = {T(dưới 20t, BT), T(dưới 20t, TM)}
Dưới 20 tuổi : 7 người
Dưới 20 tuổi ; kết quả Bình thường : 7 người
Dưới 20 tuổi ; kết quả Tim mạch : 0 người
⇒ V
Nhóm tuổi
(dưới 20 tuổi) = (7/7 , 0/7) = (1 , 0)  vector đơn vò
- Tương tự xét giá trò : từ 20 – 49 tuổi
V

Nhóm tuổi
(từ 20 – 49 tuổi) = {T(từ 20 – 49t, BT), T(từ 20 – 49t, TM)}
Từ 20 - 49 tuổi : 9 người
Từ 20 - 49 tuổi, kết quả BT : 9 người
Từ 20 - 49 tuổi, kết quả TM : 0 người
⇒ V
Nhóm tuổi
(từ 20 – 49 tuổi) = (9/9 , 0/9) = (1 , 0)  vector đơn vò
7
- Tương tự xét giá trò : từ 50 – 60 tuổi
V
Nhóm tuổi
(từ 50 – 60 tuổi) = {T(từ 50 – 60t, BT), T(từ 50 – 60t, TM)}
Từ 50 – 60 tuổi : 8 người
Từ 50 – 60 tuổi, kết quả BT : 1 người
Từ 50 – 60 tuổi, kết quả TMù : 7 người
⇒ V
Nhóm tuổi
(từ 50 – 60 tuổi) = (1/8 , 7/8)
- Tương tự xét giá trò : trên 60 tuổi
V
Nhóm tuổi
(trên 60 tuổi) = {T(trên 60 tuổi, BT), T(trên 60 tuổi, TM)}
Trên 60 tuổi : 7 người
Trên 60 tuổi, kết quả BT : 0 người
Trên 60 tuổi, kết quả TM : 7 người
⇒ V
Nhóm tuổi
(trên 60 tuổi) = (0/7 , 7/7) = (0 , 1)  vector đơn vò
⇒ thuộc tính Nhóm tuổi có 3 véctor đơn vò

+ Xét thuộc tính Loại BMI
- Xét giá trò : Gầy
V
Loại BMI
(gầy) = {T(gầy, Bình thường), T(gầy, Tim mạch)}
Gầy : 10 người
Gầy , kết quả Bình thường : 6 người
Gầy , kết quả Tim mạch : 4 người
⇒ V
Loại BMI
(gầy) = (6/10 , 4/10) = (1.5 , 1)
- Tương tự xét giá trò : Bình thường
V
Loại BMI
(Bình thường) = {T(Bình thường, BT), T(Bình thường, TM)}
Bình thường : 9 người
Bình thường , kết quả BT : 5 người
Bình thường , kết quả TM : 4 người
⇒ V
Loại BMI
(Bình thường) = (5/9 , 4/9)
8
- Tương tự xét giá trò : Béo phì
V
Loại BMI
(Béo phì) = {T(Béo phì , BT), T(Béo phì , TM)}
Béo phì : 12 người
Béo phì , kết quả Bình thường : 6 người
Béo phì , kết quả Tim mạch : 6 người
⇒ V

Loại BMI
(Béo phì) = (6/12, 6/12) = (0.5 , 0.5)
+ Xét thuộc tính Hoạt động thể thao
- Xét giá trò : Có
V
hoạt động thể thao
(Có) = {T(Có, Bình thường), T(Có, Tim mạch)}
Có hoạt động thể thao : 15 người
Có hoạt động thể thao , kết quả Bình thường : 7 người
Có hoạt động thể thao , kết quả Tim mạch : 8 người
⇒ V
hoạt động thể thao
(Có) = (7/15 , 8/15)
- Tương tự xét giá trò : Không
V
hoạt động thể thao
(Không) = {T(Không, BT), T(Không, TM)}
Không hoạt động thể thao : 16 người
Không hoạt động thể thao, kết quả Bình thường : 10 người
Không hoạt động thể thao, kết quả Tim mạch : 6 người
⇒ V
hoạt động thể thao
(Không) = (10/16 , 6/16)
+ Xét thuộc tính Tiền sử bệnh nội khoa
- Xét giá trò : Có
V
Tiền sử bệnh nội khoa
(Có) = {T(Có, Bình thường), T(Có, Tim mạch)}
Có Tiền sử bệnh nội khoa : 14 người
Có Tiền sử bệnh nội khoa, kết quả Bình thường : 6 người

Có Tiền sử bệnh nội khoa, kết quả Tim mạch : 8 người
⇒ V
Tiền sử bệnh nội khoa
(Có) = (6/14 , 8/14)
9
- Tương tự xét giá trò : Không
V
Tiền sử bệnh nội khoa
(Không) = {T(Không, BT), T(Không, TM)}
Không Tiền sử bệnh nội khoa : 17 người
Không Tiền sử bệnh nội khoa, kết quả Bình thường : 11 người
Không Tiền sử bệnh nội khoa, kết quả Tim mạch : 6 người
⇒ V
Tiền sử bệnh nội khoa
(Không) = (11/17 , 6/17)
Như vậy : thuộc tính nhóm tuổi có số vector đơn vò nhiều nhất (3 vector đơn
vò) nên sẽ được chọn đầu tiên để phân hoạch. Sau khi phân hoạch theo nhóm
tuổi ta có các tập phân hoạch:
Nhóm dưới 20 tuổi
Mã hồ

Nhóm tuổi Loại BMI
Hoạt động
thể thao
Tiền sử bệnh
nội khoa
Kết quả
BN1 Dưới 20 t Gầy Không Không Bình thường
BN4 Dưới 20 t Béo phì Không Không Bình thường
BN14 Dưới 20 t Gầy Không Có Bình thường

BN15 Dưới 20 t Béo phì Không Có Bình thường
BN16 Dưới 20 t Bình thường Không Không Bình thường
BN18 Dưới 20 t Gầy Có Có Bình thường
BN29 Dưới 20 t Bình thường Có Không Bình thường
Nhóm từ 20 - 49 tuổ
Mã hồ

Nhóm tuổi Loại BMI
Hoạt động
thể thao
Tiền sử bệnh
nội khoa
Kết quả
BN2 Từ 20 - 49t Bình thường Có Không Bình thường
BN7 Từ 20 - 49t Gầy Có Không Bình thường
BN9 Từ 20 - 49t Béo phì Có Không Bình thường
BN10 Từ 20 - 49t Bình thường Không Không Bình thường
BN13 Từ 20 - 49t Béo phì Không Không Bình thường
BN20 Từ 20 - 49t Béo phì Không Không Bình thường
BN25 Từ 20 - 49t Bình thường Không Có Bình thường
BN28 Từ 20 - 49t Gầy Không Không Bình thường
BN31 Từ 20 - 49t Béo phì Có Có Bình thường
10
Nhóm từ 50 - 60 tuổi
Mã hồ

Nhóm tuổi Loại BMI
Hoạt động
thể thao
Tiền sử

bệnh nội
khoa
Kết quả
BN26 Từ 50 - 60t Gầy Có Có Bình thường
BN3 Từ 50 - 60t Bình thường Có Có Tim mạch
BN6 Từ 50 - 60t Béo phì Có Không Tim mạch
BN11 Từ 50 - 60t Bình thường Có Không Tim mạch
BN17 Từ 50 - 60t Bình thường Không Không Tim mạch
BN21 Từ 50 - 60t Bình thường Không Có Tim mạch
BN23 Từ 50 - 60t Gầy Không Có Tim mạch
BN27 Từ 50 - 60t Béo phì Có Có Tim mạch
Nhóm trên 60 tuổi
Mã hồ sơ Nhóm tuổi Loại BMI
Hoạt động thể
thao
Tiền sử
bệnh nội
khoa
Kết quả
BN5 Trên 60t Gầy Có Có Tim mạch
BN8 Trên 60t Béo phì Có Không Tim mạch
BN12 Trên 60t Béo phì Không Không Tim mạch
BN19 Trên 60t Gầy Có Không Tim mạch
BN22 Trên 60t Béo phì Không Có Tim mạch
BN24 Trên 60t Béo phì Có Có Tim mạch
BN30 Trên 60t Gầy Không Có Tim mạch
Bước 2 :
Trong tập phân hoạch này ta thấy tập nhóm từ 50 – 60 tuổi còn chứa
những người bình thường và tim mạch, tiếp tục phân hoạch tập này.
Nhóm từ 50 - 60 tuổi

Mã hồ

Nhóm tuổi Loại BMI
Hoạt động
thể thao
Tiền sử
bệnh nội
khoa
Kết quả
BN26 Từ 50 - 60t Gầy Có Có Bình thường
BN3 Từ 50 - 60t Bình thường Có Có Tim mạch
BN6 Từ 50 - 60t Béo phì Có Không Tim mạch
BN11 Từ 50 - 60t Bình thường Có Không Tim mạch
BN17 Từ 50 - 60t Bình thường Không Không Tim mạch
BN21 Từ 50 – 60t Bình thường Không Có Tim mạch
BN23 Từ 50 – 60t Gầy Không Có Tim mạch
BN27 Từ 50 – 60t Béo phì Có Có Tim mạch
11
+ Xét thuộc tính Loại BMI
- Xét giá trò : Gầy
V
Từ 50 – 60 t uổi, Loại BMI
(gầy) = {T(gầy, BT), T(gầy, TM)}
Từ 50 – 60 tuổi, Gầy : 2
Từ 50 – 60 tuổi, Gầy , kết quả Bình thường : 1
Từ 50 – 60 tuổi, Gầy , kết quả Tim mạch : 1
⇒ V
Từ 50 – 60 t uổi, Loại BMI
(gầy) = (1/2 , 1/2) = (0.5 , 0.5)
- Tương tự xét giá trò : Bình thường

V
Từ 50 – 60 t uổi, Loại BMI
(Bình thường) = {T(BT, BT), T(BT, TM)}
Từ 50 – 60 tuổi, Bình thường : 4
Từ 50 – 60 tuổi, Bình thường , kết quả BT : 0
Từ 50 – 60 tuổi, Bình thường , kết quả TM : 4
⇒ V
Từ 50 – 60 t uổi, Loại BMI
(Bình thường) = (0/4 , 4/4) = (0 , 1)  Vđv
- Tương tự xét giá trò : Béo phì
V
Từ 50 – 60 t uổi, Loại BMI
(Béo phì) = {T(Béo phì , BT), T(Béo phì , TM)}
Từ 50 – 60 tuổi , Béo phì : 2
Từ 50 – 60 tuổi, Béo phì , kết quả Bình thường : 0
Từ 50 – 60 tuổi ,Béo phì , kết quả Tim mạch : 2
⇒ V
Từ 50 – 60 t uổi, Loại BMI
(Béo phì) = (0/2, 2/2) = (0 , 1)  vector đơn vò
+ Xét thuộc tính Hoạt động thể thao
- Xét giá trò : Có
V
Từ 50 – 60 t uổi, Hoạt động thể thao
(Có) = {T(Có, BT), T(Có, TM)}
Từ 50 – 60 tuổi, Có hoạt động thể thao : 5
Từ 50 – 60 tuổi, Có hoạt động thể thao, kết quả Bình thường : 1
Từ 50 – 60 tuổi , Có hoạt động thể thao, kết quả Tim mạch : 4
⇒ V
Từ 50 – 60 t uổi, Hoạt động thể thao
(Có) = (1/5 , 4/5)

- Tương tự xét giá trò : Không
V
Từ 50 – 60 t uổi, Hoạt động thể thao
(Không) = {T(Không, BT), T(Không, TM)}
Từ 50 – 60 tuổi , Không hoạt động thể thao : 3
Từ 50 – 60 tuổi , Không hoạt động thể thao, kết quả Bình thường : 0
12
Từ 50 – 60 tuổi , Không hoạt động thể thao, kết quả Tim mạch : 3
⇒ V
Từ 50 – 60 t uổi, Hoạt động thể thao
(Không) = (0/3 , 3/3)  vector đơn vò
+ Xét thuộc tính Tiền sử bệnh nội khoa
- Xét giá trò : Có
V
Từ 50 – 60 t uổi,Tiền sử bệnh nội khoa
(Có) = {T(Có, BT), T(Có, TM)}
Từ 50 – 60 tuổi , Có Tiền sử bệnh nội khoa : 5
Từ 50 – 60 tuổi , Có Tiền sử bệnh nội khoa, kết quả Bình thường : 1
Từ 50 – 60 tuổi , Có Tiền sử bệnh nội khoa, kết quả Tim mạch : 4
⇒ V
Tiền sử bệnh nội khoa
(Có) = (1/5 , 4/5)
- Tương tự xét giá trò : Không
V
Từ 50–60 t uổi,Tiền sử bệnh nội khoa
(Không) = {T(Không, BT), T(Không, TM)}
Từ 50 – 60 tuổi , Không Tiền sử bệnh nội khoa : 3
Từ 50 – 60 tuổi , Không Tiền sử bệnh nội khoa, kết quả BT : 0
Từ 50 – 60 tuổi , Không Tiền sử bệnh nội khoa, kết quả TM : 3
⇒ V

Tiền sử bệnh nội khoa
(Không) = ( 0/3 , 3/3) = ( 0 , 1 )  vector đơn vò
Như vậy : thuộc tính nhóm Loại BMI có số vector đơn vò nhiều nhất (2 vector
đơn vò) nên sẽ được chọn để phân hoạch kế tiếp. Sau khi phân hoạch theo
nhóm tuổi ta có tập phân hoạch :
Nhóm từ 50 - 60 tuổi – Béo phì
Mã hồ sơ Nhóm tuổi Loại BMI Hoạt động thể thao
Tiền sử bệnh
nội khoa
Kết quả
BN27 Từ 50 - 60t Béo phì Có Có Tim mạch
BN6 Từ 50 - 60t Béo phì Có Không Tim mạch
Nhóm từ 50 - 60 tuổi – Bình thường
Mã hồ sơ Nhóm tuổi Loại BMI
Hoạt động
thể thao
Tiền sử
bệnh nội
khoa
Kết quả
BN3 Từ 50 - 60t Bình thường Có Có Tim mạch
BN21 Từ 50 - 60t Bình thường Không Có Tim mạch
BN11 Từ 50 - 60t Bình thường Có Không Tim mạch
BN17 Từ 50 - 60t Bình thường Không Không Tim mạch
13
Nhóm từ 50 - 60 tuổi – Gầy
Mã hồ sơ Nhóm tuổi Loại BMI
Hoạt động
thể thao
Tiền sử bệnh

nội khoa
Kết quả
BN26 Từ 50 - 60t Gầy Có Có Bình thường
BN23 Từ 50 - 60t Gầy Không Có Tim mạch
Bước 3 :
Trong tập phân hoạch này ta thấy tập nhóm từ 50 - 60 tuổi – Gầy , kết quả
còn chứa giá trò bình thường và tim mạch, nên tiếp tục phân hoạch tập này.
Nhóm từ 50 - 60 tuổi – Gầy
Mã hồ sơ Nhóm tuổi Loại BMI
Hoạt động
thể thao
Tiền sử bệnh
nội khoa
Kết quả
BN26 Từ 50 - 60t Gầy Có Có Bình thường
BN23 Từ 50 - 60t Gầy Không Có Tim mạch
+ Xét thuộc tính Hoạt động thể thao
- Xét giá trò : Có
V
Từ 50 – 60 t uổi, Gầy, Hoạt động thể thao
(Có) = {T(có, BT), T(có, TM)}
Từ 50 – 60 tuổi, Gầy, có hoạt động thể thao : 1
Từ 50 – 60 tuổi, Gầy , có hoạt động thể thao, kết quả BT : 1
Từ 50 – 60 tuổi, Gầy , có hoạt động thể thao, kết quả TM : 0
⇒ V
Từ 50 – 60 t uổi, Gầy, Hoạt động thể thao
(Có) = (1/1 , 0/1) = (1 , 0)  Vđv
- Tương tự xét giá trò : Không
V
Từ 50– 60tuổi, Gầy, Hoạt động thể thao

(Không) = T(Không, BT), T(Không, TM)}
Từ 50 – 60 tuổi, Gầy, Không hoạt động thể thao : 1
Từ 50 – 60 tuổi, Gầy, Không hoạt động thể thao, kết quả BT : 0
Từ 50 – 60 tuổi, Gầy, Không hoạt động thể thao, kết quả TM : 1
⇒ V
Từ 50 – 60 t uổi, Gầy, Hoạt động thể thao
(Không) = (0/1 , 1/1) = (1 , 0)  Vđv
+ Xét thuộc tính Tiền sử bệnh nội khoa
- Xét giá trò : Có
V
Từ 50 – 60 t uổi, Gầy, Tiền sử bệnh nội khoa
(Có) = {T(có, BT), T(có, TM)}
14
Từ 50 – 60 tuổi, Gầy , Có tiền sử bệnh nội khoa : 2
Từ 50 – 60 tuổi, Gầy , Có tiền sử bệnh nội khoa, kết quả BT : 1
Từ 50 – 60 tuổi, Gầy , Có tiền sử bệnh nội khoa, kết quả TM : 1
⇒ V
Từ 50 – 60 t uổi, Gầy, Tiền sử bệnh nội khoa
(Có) = (1/2 , 1/2) = (0.5 , 0.5)
Như vậy : thuộc tính nhóm Hoạt động thể thao có 1 vector đơn vò nên sẽ được
chọn để phân hoạch kế tiếp. Sau khi phân hoạch theo nhóm tuổi ta có tập
phân hoạch:
Nhóm từ 50 - 60 tuổi – Gầy – có hoạt động thể thao
Mã hồ sơ Nhóm tuổi Loại BMI
Hoạt động
thể thao
Tiền sử bệnh
nội khoa
Kết quả
BN26 Từ 50 - 60t Gầy Có Có Bình thường

Nhóm từ 50 - 60 tuổi – Gầy – Không hoạt động thể thao
Mã hồ sơ Nhóm tuổi Loại BMI
Hoạt động
thể thao
Tiền sử bệnh
nội khoa
Kết quả
BN23 Từ 50 - 60t Gầy Không Có Tim mạch
Những tập phân hoạch đạt được trong bước này giá trò kết quả không
còn lẫn lộn giữa bình thường và tim mạch nên thuật toán kết thúc. Ta có cây
đònh danh cuối cùng:
Nhóm tuổi
{bn1,
bn4,
bn14,
bn5,
bn16,
bn18,
bn29}
{bn2, bn7, bn9,
bn10, bn13,
bn20, bn25,
bn28, bn31}
{bn5,
bn8,
bn12,
bn19,
bn24,
bn30}
Loại BMI

Hoạt động thể thao
Dưới 20 tuổi
Từ 20 – 49 tuổi
Từ 50 – 60 tuổi
Trên 60t
{ bn3 ,
bn21,
bn11, bn17
}
Béo phì
Gầy
Bình thường
{ bn27, bn6 }
{ bn23 }
{ bn26}

Không
15
3) Nhận xét (độ đo hỗn loạn) :
Thay vì phải xây dựng vector đặc trưng theo như phương pháp Quinlan,
ứng với mỗi thuộc tính dẫn xuất ta chỉ cần tính ra độ đo hỗn loạn và lựa chọn
thuộc tính nào có độ đo hỗn loạn là thấp nhất. Người ta tính được công thức
như sau :
Gọi T
A
là độ đo hỗn loạn của một thuộc tính A, ta có:

Trong đó:
- b
t

là tổng số phần tử có trong phân hoạch
- b
j
là số phần tử có thuộc tính dẫn xuất A có giá trò j
- b
ri
là tổng số phần tử có thuộc tính dẫn xuất A có giá trò j và thuộc
tính mục tiêu có giá trò i.
* Tính độ đo hỗn loạn của thuộc tính Nhóm tuổi trong bài toán trên:
Tập Nhóm tuổi Dưới 20 tuổi : 7 Bình thường.
Tập Nhóm tuổi từ 20 - 49 tuổi : 9 Bình thường.
Tập Nhóm tuổi từ 50 - 60 tuổi : 1 Bình thường ; 7 tim mạch.
Tập Nhóm tuổi trên 60 tuổi : 7 tim mạch.
T
nhóm tuổi
= 7/31(-7/7log
2
7/7 – 0/7log
2
0/7) + 9/31(-9/9log
2
9/9 – 0/9log
2
0/9) +
8/31(-1/8log
2
1/8 – 7/8log
2
7/8 ) + 7/31(-7/7log
2

7/7 – 0/7log
2
0/7)
T
nhóm tuổi
= 0.14
- Tương tự ta tính độ đo hỗn loạn của thuốc tính Loại BMI
Tập BMI Gầy : 6 Bình thường ; 4 tim mạch.
Tập BMI Bình thường : 5 Bình thường ; 4 tim mạch.
Tập BMI Béo phì : 6 Bình thường ; 6 tim mạch.
T
BMI
= 10/31(-6/10log
2
6/10 - 4/10log
2
4/10) + 9/31(-5/9log
2
5/9 - 4/9log
2
4/9)
+ 12/31(-6/12log
2
6/12 - 6/12log
2
6/12)
T
BMI
= 0.98
16

j
b
j
b
t
x
b
j
b
t
- x log
2
b
j
b
t
-
T
A
=
- Tương tự ta tính độ đo hỗn loạn của thuộc tính Hoạt động thể thao
Tập Có hoạt động thể thao : 7 Bình thường ; 8 tim mạch.
Tập Không hoạt động thể thao : 10 Bình thường ; 6 tim mạch.
T
hoạt động thể thao
= 15/31(-7/15log
2
7/15 - 8/15log
2
8/15) + 16/31(-10/16log

2
10/16 -
6/16log
2
6/16)
T
hoạt động thể thao
= 0.975
- Tương tự ta tính độ đo hỗn loạn của thuộc tính Tiền sử bệnh nội khoa
Tập Có bệnh nội khoa : 6 Bình thường ; 8 tim mạch.
Tập Không bệnh nội khoa : 11 Bình thường ; 6 tim mạch.
T
Tiền sử bệnh nội khoa
=14/31(-6/14log
2
6/1 - 8/14log
2
8/14) + 17/31(-11/17log
2
11/17 -
6/17log
2
6/17)
T
Tiền sử bệnh nội khoa
= 0.959
 Ta chọn được thuộc tính Nhóm tuổi (T
nhóm tuổi
= 0.14) để phân hạch đầu
tiên. Tiếp tục tính độ đo hỗn loạn trên các thuộc tính còn lại trên tập “Nhóm

từ 50 – 60 tuổi”
Nhóm từ 50 - 60 tuổi
Mã hồ

Nhóm tuổi Loại BMI
Hoạt động
thể thao
Tiền sử
bệnh nội
khoa
Kết quả
BN26 Từ 50 - 60t Gầy Có Có Bình thường
BN3 Từ 50 - 60t Bình thường Có Có Tim mạch
BN6 Từ 50 - 60t Béo phì Có Không Tim mạch
BN11 Từ 50 - 60t Bình thường Có Không Tim mạch
BN17 Từ 50 - 60t Bình thường Không Không Tim mạch
BN21 Từ 50 - 60t Bình thường Không Có Tim mạch
BN23 Từ 50 - 60t Gầy Không Có Tim mạch
BN27 Từ 50 - 60t Béo phì Có Có Tim mạch
- Tính độ đo hỗn loạn của thuốc tính Loại BMI
Tập BMI Gầy : 1 Bình thường ; 1 tim mạch.
Tập BMI Bình thường : 4 tim mạch.
Tập BMI Béo phì : 2 tim mạch.
17
T
BMI
= 2/8(-1/2log
2
1/2 – -1/2log
2

1/2) + 4/8(-0/4log
2
0/4 – 4/4log
2
4/4) + 2/8(-
0/2log
2
0/2 - 2/2log
2
2/2)
T
BMI
= 0
- Tương tự ta tính độ đo hỗn loạn của thuộc tính Hoạt động thể thao
Tập Có hoạt động thể thao : 1 Bình thường ; 4 tim mạch.
Tập Không hoạt động thể thao : 3 tim mạch.
T
hoạt động thể thao
= 5/8(-1/5log
2
1/5 - 4/5log
2
4/5) + 3/31(-0/3log
2
0/3 - 3/3log
2
3/3)
T
hoạt động thể thao
= 0.451

- Tương tự ta tính độ đo hỗn loạn của thuộc tính Tiền sử bệnh nội khoa
Tập Có bệnh nội khoa : 1 Bình thường ; 4 tim mạch.
Tập Không bệnh nội khoa : 3tim mạch.
T
Tiền sử bệnh nội khoa
= 5/8(-1/5log
2
1/5 - 5/5log
2
4/5) + 3/8(-0/3log
2
0/3 - 3/3log
2
3/3)
T
Tiền sử bệnh nội khoa
= 0.491
 Ta chọn được thuộc tính Loại BMI (T
BMI
= 0 ) để phân hoạch kế tiếp
Tiếp tục tính độ đo hỗn loạn trên các thuộc tính còn lại trên tập “Nhóm từ 50
– 60 tuổi” có Loại BMI = “Gầy”
Nhóm từ 50 - 60 tuổi – Gầy
Mã hồ sơ Nhóm tuổi Loại BMI
Hoạt động
thể thao
Tiền sử bệnh
nội khoa
Kết quả
BN26 Từ 50 – 60t Gầy Có Có Bình thường

BN23 Từ 50 – 60t Gầy Không Có Tim mạch
- Tính độ đo hỗn loạn của thuộc tính Hoạt động thể thao
Tập Có hoạt động thể thao : 1 Bình thường
Tập Không hoạt động thể thao : 1 tim mạch.
T
hoạt động thể thao
= 1/2(-1/1log
2
1/1 - 0/1log
2
0/1) + 1/2(-0/1log
2
0/1 - 1/1log
2
1/1)
T
hoạt động thể thao
= 0
18
- Tương tự ta tính độ đo hỗn loạn của thuộc tính Tiền sử bệnh nội khoa
Tập Có bệnh nội khoa : 1 Bình thường ; 1 tim mạch.
T
Tiền sử bệnh nội khoa
= 2/2(-1/2log
2
1/2 - 1/2log
2
1/2)
T
Tiền sử bệnh nội khoa

= 1
 Ta chọn được thuộc tính Hoạt động thể thao (T
hoạt động thể thao
= 0 ) để phân
hoạch kế tiếp. Cuối cùng ta được cây đònh danh
IV- THUẬT TOÁN ILA
1. Thuật toán:
Bước 1: Chia mẫu ban đầu thành n bảng con. Mỗi bảng con ứng với một giá
trò của thuộc tính quyết đònh của tập mẫu
Thực hiện lần lượt các bước từ 2 đến 8 cho mỗi bảng con có được
Bước 2: j = 1
Bước 3: Trên mỗi bảng con đang khảo sát, chia danh sách các thuộc tính
thành các tổ hợp khác nhau, mỗi tổ hợp bao gồm j thuộc tính.
Bước 4: Với mỗi tổ hợp thuộc tính có được, tính số lần giá trò thuộc tính xuất
hiện theo cùng tổ hợp thuộc tính trong các dòng còn lại của bảng
con đang xét (mà đồng thời không xuất hiện tổ hợp giá trò này trên
tất cả các bảng còn lại). Gọi tổ hợp đầu tiên (trong bảng con) có số
lần xuất hiện nhiều nhất là tổ hợp lớn nhất.
Bước 5: Nếu tổ hợp lớn nhất có giá trò bằng 0, tăng j lên 1, quay lại bước 3.
Bước 6: Loại bỏ các dòng thỏa tổ hợp lớn nhất ra khỏi bảng con đang xử lý.
Bước 7: Thêm luật mới vào tập luật R, với vế trái là tập các thuộc tính của
tổ hợp lớn nhất (kết hợp các thuộc tính bằng toán tử AND) và vế
phải là giá trò thuộc tính quyết đònh tương ứng.
Bước 8: Nếu tất cả các dòng đều đã được loại bỏ, tiếp tục thực hiện từ bước
2 cho các bảng con còn lại. Ngược lại (nếu còn dòng chưa bò loại
bỏ) thì quay lại bước 4. Nếu tất cả các dòng con đã được xét đến thì
kết thúc. Tập R chính là tập luật cần tìm.
19
2. Minh họa thuật toán:
Minh họa giải thuật ILA cho bảng dữ liệu sau đây:

Stt Khối lượng giao
dòch
Tín hiệu CK Mã Chứng khoán Quyết đònh giao
dòch
1 Trung bình Blue Chip BAF Mua
2 Nhỏ Đỏ VFC Bán
3 Nhỏ Đỏ SAM Mua
4 Lớn Đỏ VFC Bán
5 Lớn Xanh PNJ Mua
6 Lớn Đỏ PNJ Bán
7 Lớn Xanh SAM Mua
Ghi chú :
+ Khối lương giao dòch :
+ Tín hiệu CK :
- Đỏ : tình trạng giá trò cổ phiếu của công ty đang ở mức báo động
giảm giá
- Xanh : tình trạng giá trò cổ phiếu của công ty đang phát triển.
- Blue chip : Blue chip là loại cổ phiếu "chất lượng cao" hay còn gọi
là cổ phiếu "thượng hạng", do các công ty lớn có tiếng
phát hành
+ Mã Chứng khoán : tên các công ty phát hành cổ phiếu chứng khoán.
+ Quyết đònh giao dòch : tùy tình hình diễn biến trên bảng điện tử giao dòch
trên sàn chứng khoán mà người ta quyết đònh mua hoặc bán một loại cổ
phiếu nào đó.
Bước 1: Chia tập mẫu ban đầu thành hai bảng con (2 lớp) bởi 2 loại quyết
đònh “Mua” và “Bán” như sau:
Bảng 1 (Mua)
Stt Khối lượng giao
dòch
Tín hiệu CK Mã Chứng khoán Quyết đònh giao

dòch
1 Trung bình Blue Chip BAF Mua
3 Nhỏ Đỏ SAM Mua
5 Lớn Xanh PNJ Mua
7 Lớn Xanh SAM Mua
20
Bảng 2 (bán)
Stt Khối lượng giao
dòch
Tín hiệu CK Mã Chứng khoán Quyết đònh giao
dòch
2 Nhỏ Đỏ VFC Bán
4 Lớn Đỏ VFC Bán
6 Lớn Đỏ PNJ Bán
Bước 2: Áp dụng lần lượt các bước từ 2 đến 8 với bảng con thứ nhất
Với j = 1.
- Có 3 tổ hợp, mỗi tổ hợp gồm một thuộc tính là :
{Khối lượng giao dòch}, {Tín hiệu CK}, {Mã Chứng khoán}
- Với tổ hợp {Khối lượng giao dòch} với thuộc tính “Trung bình” xuất hiện
1 lần trong bảng 1 và không xuất hiện trong bảng 2; thuộc tính “Nhỏ” và
“Lớn” xuất hiện trên cả hai bảng
T(Khối lượng giao dòch
“Trung bình”
) = 1
T(Khối lượng giao dòch
“Nhỏ”
) = 0
T(Khối lượng giao dòch
“Lớn”
) = 0

- Với tổ hợp {Tín hiệu CK} thuộc tính “Xanh” xuất hiện 2 lần trong bảng
1 và không xuất hiện trong bảng 2; thuộc tính “Blue Chip” xuất hiện 1 lần
trong bảng 1 và không xuất hiện trong bảng 2; thuộc tính “Lớn” xuất hiện
trên cả hai bảng
T(Tín hiệu CK
“Xanh”
) = 2
T(Tín hiệu CK
“Blue Chip”
) = 1
T(Tín hiệu CK
“Đỏ”
) = 0
- Với tổ hợp {Mã Chứng khoán} thuộc tính “BAF” xuất hiện 1 lần trong
bảng 1 và không xuất hiện trong bảng 2; thuộc tính “SAM” xuất hiện 2 lần
trong bảng 1 và không xuất hiện trong bảng 2; thuộc tính “PNJ” xuất hiện
trên cả hai bảng
T(Mã Chứng khoán
“BAF”
) = 1
T(Mã Chứng khoán
“SAM”
) = 2
T(Mã Chứng khoán
“PNJ”
) = 0
21
⇒ Ta có T(Tín hiệu CK
“Xanh”
) và T(Mã Chứng khoán

“SAM”
) lớn nhất và đều
bằng 2. do đó mặc đònh chọn T(Tín hiệu CK
“Xanh”
) và ta sẽ có luật:
IF (Tín hiệu CK = “Xanh” ) { Quyết đònh giao dòch = “Mua” }
Kế tiếp, loại bỏ hai dòng ứng với Tín hiệu CK = “Xanh” ra khỏi bảng ta được
Stt Khối lượng giao
dòch
Tín hiệu CK Mã Chứng
khoán
Quyết đònh giao dòch
1 Trung bình Blue Chip BAF Mua
3 Nhỏ Đỏ SAM Mua
Lập lại việc tính toán các giá trò T cho dữ liệu còn lại ta được:
T(Khối lượng giao dòch
“Trung bình”
) = 1
T(Tín hiệu CK
“Blue Chip”
) = 1
T(Mã Chứng khoán
“SAM”
) = 1
Ta chọn trường hợp T(Khối lượng giao dòch
“Trung bình”
) để xây dựng ta được :
IF ( Khối lượng giao dòch = “Trung bình” )
{ Quyết đònh giao dòch = “Mua” }
Kế tiếp, loại bỏ dòng ứng với Khối lượng giao dòch = “Trung bình” ra khỏi

bảng ta được
Stt Khối lượng giao
dòch
Tín hiệu CK Mã Chứng
khoán
Quyết đònh giao
dòch
3 Nhỏ Đỏ SAM Mua
Tính giá trò T cho dữ liệu còn lại ta được : T(Mã Chứng khoán
“SAM”
) = 1 ; Ta
có luật:
IF (Mã Chứng khoán =“SAM” ) { Quyết đònh giao dòch =“Mua”}
22
Như vậy tất cả các dòng trong bảng 1 bò loại bỏ ta chuyển sang bảng 2
- Với j = 1, có 3 tổ hợp mỗi tổ hợp gồm 1 thuộc tính là :
{Khối lượng giao dòch}, {Tín hiệu CK}, {Mã Chứng khoán}.
- Ta tính được :
T(Mã Chứng khoán
“VFC”
) = 2 là lớn nhất.
Do đó ta có luật :
IF (Mã Chứng khoán =“VFC”) { Quyết đònh giao dòch =“Bán” }
Dữ liệu còn lại:
Stt Khối lượng giao
dòch
Tín hiệu CK Mã Chứng
khoán
Quyết đònh giao
dòch

6 Lớn Đỏ PNJ Bán
Với các dòng còn lại, mọi giá trò của thuộc tính đều xuất hiện trong cả hai
bảng (mọi giá trò T đều bằng 0) nên ta sẽ tăng j lên 1 và thực hiện lại bước 2.
Với j = 2, có 3 tổ hợp mỗi tổ hợp gồm 3 thuộc tính là :
{Khối lượng giao dòch, Tín hiệu CK},
{Khối lượng giao dòch, Mã Chứng khoán},
{Tín hiệu CK, Mã Chứng khoán}
Ta có: T(Khối lượng giao dòch
“Lagre”
, Tín hiệu CK
“Đỏ”
û
) = 1
T(Tín hiệu CK
“Đỏ”
û
,Mã Chứng khoán
“PNJ”
) = 1
Chọn trường hợp đầu tiên để xây dựng luật ta có luật sau :
IF (Khối lượng giao dòch = “Lớn” && Tín hiệu CK = “Đỏ”)
{ Quyết đònh giao dòch = “Bán” }
 Thuật toán kết thúc vì tất cả các bảng đã được xét đến và tất cả các
dòng trong các bảng đã được loại bỏ.
23
MINH HỌA ỨNG DỤNG
0
Trong Bài thu hoạch này ứng dụng chỉ minh họa cho giải thuật ILA để
tìm ra tri thức cho bảng dữ liệu.
1. Giải thuật ILA :

+Input : Bảng dữ liệu chứa thông tin, thuộc tính giả thiết, thuộc tính kết
luận.
+ Output : Tập các luật sinh ra từ bảng.
• Thuật toán:
// Lọc ra từ bảng chính có thuộc tính quyết đònh = giá trò tương ứng
For ( với mỗi Giá trò của thuộc tính quyết đònh )
{ Tách ra bảng con tương ứng; }
For ( Với mỗi bảng con )
While ( bảng con <> rỗng )
{ + Xét Tổ hợp có 1 thuộc tính giả thiết
For ( với mỗi Tổ hợp )
For ( mỗi tập giá trò của Tổ hợp )
{ Tính tần xuất của Tổ hợp }
/* đếm số lần xuất hiện của giá trò ứng với Tohop
trong bảng đang xét và đồng thời không xuất hiện
trong các bảng còn lại */
+ Chọn Tổ hợp có tập giá trò của Tổ hợp tương ứng với
tần xuất lớn nhất
If (tần xuất của Tổ hợp có giá trò lớn nhất = 0)
{ tăng số lượng Tổ hợp lên 1 }
else { + Rút ra kết luận
+ Xoá Tổ hợp này ra khỏi bảng đang
xét
}
}
24
KẾT LUẬN
0
Sau khi học xong môn Công nghệ tri thức do GS.TSKH. Hoàng Kiếm
tận tình giảng dạy, tôi đã rút ra được rất nhiều điều lý thú đặc biệt là các vấn

đề có liên quan đến trí tuệ nhân tạo và công nghệ tri thức ngày nay.
Do thời gian có hạn, vừa phải xin dữ liệu vừa phải xử lý và viết bài….
nên chưa kòp viết code thực hiện chương trình minh hoạt ứng dụng. Bài thu
hoạch này chỉ mới mô tả khái quát lên một cách học truyền thống và thú vò
của chương trình máy tính đó là “Học bằng phương pháp xây dựng cây đònh
danh”. Phương pháp học này đã được áp dụng trong thực tế và đã giải được
một số bài toán quan trọng trong việc tìm ra tri thức trong một tập hợp dữ liệu
có sẵn. Đặc biệt là trong thời đại công nghệ thông tin hiện nay, sự bùng nổ
thông tin với nền kinh tế thò trường thì việc nghiên cứu phương pháp học này
của chương trình máy tính đã góp phần mang tính chiến lược cho công nghệ
tri thức hiện nay.
Tuy nhiên do thời gian và kiến thức còn hạn chế bài viết khó tránh
được những sai sót. Rất mong nhận được sự thông cảm và đóng góp của Quý
thầy cô và các bạn học.
25

×