Tải bản đầy đủ (.docx) (31 trang)

Bài tập nhóm hệ cơ sở tri thức đề tài hệ học

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (652.35 KB, 31 trang )

TRƯỜNG ĐẠI HỌC NHA TRANG
KHOA CÔNG NGHỆ THÔNG TIN
*
BÀI TẬP NHÓM
HỆ CƠ SỞ TRI THỨC
Đề tài:
HỆ HỌC
Giảng viên hướng dẫn:
Bùi Đức Dương
Sinh viên thực hiện:


Lớp: 52CNTT

Năm 2013
Tống Đức Nam – 52131893
Nguyễn Thị Ngọc – 52131898
Trần Thị Trầm – 52131924
Nguyễn Thị Ánh Trúc – 52131927
Trần Thị Như Ý – 52131944
Bài tập nhóm - Học phần Hệ cơ sở tri thức
MỤC LỤC
LỜI GIỚI THIỆU
Từ khi các hệ cơ sở trí thức ra đời cho đến nay, người ta không ngừng thực hiện các
công trình nghiên cứu để đưa tư tưởng nghiên cứu cùng với máy tính ứng dụng vào giải quyết
các công việc trong thực tiễn đời sống.
Một trong những nguyên nhân làm cho các hệ cơ sở tri thức phổ biến trong thời đại
hiện nay là việc làm cho máy tính trở nên thông minh hơn, nói cụ thể hơn là người ta tìm cách
tạo ra các chương trình thông minh hơn có khả năng giải quyết các vấn đề thực tế như cách
giải quyết của con người. việc học chương trình máy tính ngày càng biến hóa và phát triển
thích ứng với môi trường và yêu cầu phức tạp của xã hội hiện nay.


Bài báo cáo sau đây về hệ học trong hệ cơ sở tri thức, đó là việc học bằng phương
pháp xây dựng cây định danh. Bài toán được đặt ra là từ một mẫu cơ sở dữ liệu có sẳn, máy
tính có thể phát hiện ra tính quy luật trong mẫu dữ liệu đó bằng phương pháp xây dựng cây
định danh và nhờ đó giúp con người đưa ra các quyết định nhanh chóng và chuẩn xác.
Trong một bài toán của hệ học, đầu vào là một tập dữ liệu huấn luyện bao gồm các
mẫu dữ liệu. Mỗi mẫu dữ liệu bao gồm một tập giá trị ứng với các thuộc tính. Tập thuộc tính
được chia làm hai phần: thuộc tính quan sát và thuộc tính kết quả. Mục tiêu của học máy là
tìm một ánh xạ từ thuộc tính quan sát vào thuộc tính kết quả (tìm moi quan hệ giữa thuộc tính
quan sát và thuộc tính kết quả) ứng với tập dữ liệu huấn luyện. Ánh xạ này sẽ được áp dụng
lên những mẫu quan sát mới để rút ra kết quả tương ứng.
Công việc của từng thành viên
STT Thành viên Nội dung được phân công Tỷ lệ
1 Tống Đức Nam Demo + Ứng dụng 20%
2 Nguyễn Thị Ngọc Độ bất định + Ứng dụng 20%
3 Trần Thị Trầm ILA + Ứng dụng 20%
4 Nguyễn Thị Ánh Trúc Các hình thức học + nơron + Ứng dụng 20%
2
Hệ học
2
Bài tập nhóm - Học phần Hệ cơ sở tri thức
5 Trần Thị Như Ý Cây định danh + Quinlan + Ứng dụng 20%
Cộng 100%
Danh mục các hình
Danh mục các bảng
PHẦN I. LÝ THUYẾT
I. HỆ HỌC:
Thuật ngữ "học" là tiếp thu tri thức.
Có hai tiếp cận cho hệ thống học:
– Học từ ký hiệu: bao gồm việc hình thức hóa, sửa chữa các luật tường minh, sự kiện và
các quan hệ.

– Học từ dữ liệu số: được áp dụng cho những hệ thống được mô hình dưới dạng số liên
quan đến các kỹ thuật nhằm tối ưu các tham số. Học theo dạng số bao gồm mạng Neural nhân
t ạo, thuật giải di truyền, bài toán tối ưu truyền thống. Các kỹ thuật học theo số không tạo ra
CSTT tường minh.
Quá trình học diễn ra dưới nhiều hình thức như:
3
Hệ học
3
Bài tập nhóm - Học phần Hệ cơ sở tri thức
1. Học vẹt:
Hệ tiếp nhận các khẳng định của các quyết định đúng. Khi hệ tạo ra một quyết định
không đúng, hệ sẽ đưa ra các luật hay quan hệ đúng mà hệ đã sử dụng. Hình thức học vẹt
nhằm cho phép chuyên gia cung cấp tri thức theo kiểu tương tác.
2. Học bằng cách chỉ dẫn:
Thay vì đưa ra một luật cụ thể cần áp dụng vào tình huống cho trước, hệ thống sẽ được
cung cấp bằng các chỉ dẫn tổng quát. Ví dụ: "gas hầu như bị thoát ra từ van thay vì thoát ra từ
ống dẫn". Hệ thống phải tự mình đề ra cách biến đổi từ trừu tượng đến các luật khả dụng.
3. Học bằng qui nạp:
Hệ thống được cung cấp một tập các ví dụ và kết luận được rút ra từ từng ví dụ. Hệ
liên tục lọc các luật và quan hệ nhằm xử lý từng ví dụ mới.
4. Học bằng tương tự:
Hệ thống được cung cấp đáp ứng đúng cho các tác vụ tương tự nhưng không giống
nhau. Hệ thống cần làm thích ứng đáp ứng trước đó nhằm tạo ra một luật mới có khả năng áp
dụng cho tình huống mới.
5. Học dựa trên giải thích:
Hệ thống phân tích tập các lời giải ví dụ (và kết quả) nhằm ấn định khả năng đúng
hoặc sai và tạo ra các giải thích dùng để hướng dẫn cách giải bài toán trong tương lai.
6. Học dựa trên tình huống:
Bất kỳ tính huống nào được hệ thống lập luận đều được lưu trữ cùng với kết quả cho
dù đúng hay sai. Khi gặp tình huống mới, hệ thống sẽ làm thích nghi hành vi đã lưu trữ với

tình huống mới.
7. Khám phá hay học không giám sát:
Thay vì có mục tiêu tường minh, hệ khám phá liên tục tìm kiếm các mẫu và quan hệ
trong dữ liệu nhập. Các ví dụ về học không giám sát bao gồm gom cụm dữ liệu, học để nhận
dạng các đặc tính cơ bản như cạnh từ các điểm ảnh.
Ví dụ:
- Hệ MYCIN.
- Mạng Neural nhân tạo: Mạng neuron sử dụng một hình thức học có sự hướng dẫn.
- Thuật toán học Quinland.
- Bài toán nhận dạng.
4
Hệ học
4
Bài tập nhóm - Học phần Hệ cơ sở tri thức
- Máy chơi cờ carô, cờ tướng
II. CÂY ĐỊNH DANH:
Cây định danh là cây mà nếu ta đi từ nút gốc đến các lá ta sẽ có một quyết định hay
một quy luật dựa vào các Thuộc tính trên đường đi từ gốc đến lá, như vậy mỗi đường đi từ nút
gốc đến nút lá sẽ cho ra một quyết định hay một quy luật.
Vì vậy người ta còn gọi cây định danh là cây quyết định.
Bảng dữ liệu cây định danh luật.
Bài toán học bằng phương pháp xây dựng cây định danh được phân tích và khai thác
qua các bước sau đây, dựa vào bảng dữ liệu ở bảng số 1 ở phần đặt vấn đề.
Người ta dựa vào ý tưởng tiếp cận hình học là phân chia không gian bài toán tạo thành
một cây định danh sau đó xây dựng các phương pháp học dựa trên cây định danh đó. Cây
định danh được xây dựng bằng cách tìm các quy luật của dữ liệu.
Ta xét ngẫu nhiên qua từng thuộc tính rồi phân nhóm kết quả theo từng giá trị
của Thuộc tính
Tên Vỏ Màu Bên trong Kích thước Độc
A Có gai Nâu Cứng Lớn Không

B Có gai Xanh Cứng Lớn Không
C Nhẵn Đỏ Mềm Lớn Có
D Có gai Xanh Mềm Lớn Không
E Có gai Đỏ Cứng Nhỏ Không
F Nhẵn Đỏ Cứng Nhỏ Không
G Nhẵn Nâu Cứng Nhỏ Không
H Có gai Xanh Mềm Nhỏ Có
I Nhẵn Xanh Cứng Nhỏ Có
J Có gai Đỏ Cứng Lớn Không
5
Hệ học
Thử
Xây dựng
5
Bài tập nhóm - Học phần Hệ cơ sở tri thức
K Nhẵn Nâu Mềm Lớn Không
L Nhẵn Xanh Mềm Nhỏ Có
M Có gai Đỏ Mềm Nhỏ Không
N Nhẵn Đỏ Cứng Lớn Có
O Nhẵn Đỏ Cứng Nhỏ Không
P Có gai xanh Cứng Nhỏ Có
Hình 1. Bảng 1Bảng số liệu Cây có độc hay không
Ta có kết quả
Hình 2. Hình 1Cây định danh có độc hay không
III. THUẬT TOÁN QUINLAN:
Là thuật toán học theo quy nạp dùng luật, đa mục tiêu.
- Do Quinlan đưa ra năm 1979.
- Ý tưởng: Chọn Thuộc tính quan trọng nhất để tạo cây quyết định.
- Thuộc tính quan trọng nhất là Thuộc tính phân loại Bảng quan sát thành các bảng
con sao cho từ mỗi bảng con này dễphân tích để tìm quy luật chung.

1. Thuật toán:
Với mỗi Thuộc tính dẫn xuất A còn có thể sử dụng để phân hoạch thì ta tính:
6
Hệ học
6
Bài tập nhóm - Học phần Hệ cơ sở tri thức
xây dựng các vector
VA(j) = (T(j, r
1
), T(j, r
2
), …, T(j, r
n
), )
Trong đó
- r1, r2, …, rn là các giá trị Thuộc tính mục tiêu.
- Thuộc tính A là Thuộc tính dẫn xuất.
- T(j,r
1
)=T
Aij
/T
Aj
T
Aij
: tổng số phần tử trong phân hoạch có Thuộc tính A là j và Thuộc tính mục tiêu là r
i
.
T
Aj

: tổng số phần tử trong phân hoạch có Thuộc tính A là j.
- T(j,r1)+T(j,r2)+…+T(j,rn)=1
Vector đơn vị nếu nó có duy nhất một thành phần có giá trị 1 và những thành phần
khác có giá trị 0.
- Thuộc tính được chọn để phân hoạch là Thuộc tính cá nhiều vector đơn vị nhất.
2. Ví dụ:
Tên Vỏ Màu Bên trong Kích thước Độc
A Có gai Nâu Cứng Lớn Không
B Có gai Xanh Cứng Lớn Không
C Nhẵn Đỏ Mềm Lớn Có
D Có gai Xanh Mềm Lớn Không
E Có gai Đỏ Cứng Nhỏ Không
F Nhẵn Đỏ Cứng Nhỏ Không
G Nhẵn Nâu Cứng Nhỏ Không
H Có gai Xanh Mềm Nhỏ Có
I Nhẵn Xanh Cứng Nhỏ Có
J Có gai Đỏ Cứng Lớn Không
K Nhẵn Nâu Mềm Lớn Không
L Nhẵn Xanh Mềm Nhỏ Có
M Có gai Đỏ Mềm Nhỏ Không
N Nhẵn Đỏ Cứng Lớn Có
7
Hệ học
7
Bài tập nhóm - Học phần Hệ cơ sở tri thức
O Nhẵn Đỏ Cứng Nhỏ Không
P Có gai xanh Cứng Nhỏ Có
Hình 3. Bảng 2Bảng số liệu cây có độc hay không
Thuộc tính Vỏ (2 giá trị):
V

Vỏ
(Có gai) = (T(Có gai/Độc),T(Có gai/Không độc)) = (2/8;6/8) = (1/4;3/4);
V
Vỏ
(Nhẵn) = (T(Nhẵn/Độc),T(Nhẵn/Không độc)) = (4/8;4/8) = (1/2;1/2);
Số vectơ đơn vị : 0
Thuộc tính Màu (3 giá trị):
V
Màu
(Nâu) = (T(Nâu/Độc),T(Nâu/Không độc)) = (0/3;3/3) = (0;1);
V
Màu
(Xanh) = (T(Xanh/Độc),T(Xanh/Không độc)) = (4/6;2/6) = (2/3;1/3);
V
Màu
(Đỏ) = (T(Đỏ/Độc),T(Đỏ/Không độc)) = (2/7;5/7);
Số vectơ đơn vị : 1
Thuộc tính Bên trong (2 giá trị):
V
Bên trong
(Cứng) = (T(Cứng/Độc),T(Cứng/Không độc)) = (3/10;7/10);
V
Bên trong
(Mềm) = (T(Mềm/Độc),T(Mềm/Không độc)) = (3/6;3/6) = (1/2;1/2);
Số vectơ đơn vị : 0
Thuộc tính Kích thước (2 giá trị):
V
Kích thước
(Lớn) = (T(Lớn/Độc),T(Lớn/Không độc)) = (2/7;5/7);
V

Kích thước
(Nhỏ) = (T(Nhỏ/Độc),T(Nhỏ/Không độc)) = (4/9;5/9);
Số vectơ đơn vị : 0
Chọn Thuộc tính Màu làm Thuộc tính phân hoạch.
8
Hệ học
8
Bài tập nhóm - Học phần Hệ cơ sở tri thức
Hình 4. Hình 2Cây định danh thuộc tính Màu
♦ Bảng theo Thuộc tính màu xanh:
Màu Tên Vỏ Bên trong Kích thước Độc
Xanh B Có gai Cứng Lớn Không
Xanh D Có gai Mềm Lớn Không
Xanh H Có gai Mềm Nhỏ Có
Xanh I Nhẵn Cứng Nhỏ Có
Xanh L Nhẵn Mềm Nhỏ Có
Xanh P Có gai Cứng Nhỏ Có
Hình 5.
Hình 6. Bảng 3Bảng theo thuộc tính Màu Xanh
Thuộc tính Vỏ (2 giá trị):
V
Vỏ
(Có gai) = (T(Có gai/Độc),T(Có gai/Không độc)) = (2/4;2/4) = (1/2;1/2);
V
Vỏ
(Nhẵn) = (T(Nhẵn/Độc),T(Nhẵn/Không độc)) = (2/2;0/2) = (1;0);
Số vectơ đơn vị : 1
Thuộc tính Bên trong (2 giá trị):
V
Bên trong

(Cứng) = (T(Cứng /Độc),T(Cứng /Không độc)) = (2/3;1/3);
V
Bên trong
(Mềm) = (T(Mềm/Độc),T(Mềm/Không độc)) = (2/3;1/3)
Số vectơ đơn vị : 0
Thuộc tính Kích thước (2 giá trị):
V
Kích thước
(Lớn) = (T(Lớn/Độc),T(Lớn/Không độc)) = (0/2;2/2) = (0;1);
9
Hệ học
9
Bài tập nhóm - Học phần Hệ cơ sở tri thức
V
Kích thước
(Nhỏ) = (T(Nhỏ/Độc),T(Nhỏ/Không độc)) = (4/4;0/4) = (1;0);
Số vectơ đơn vị : 2
Chọn Thuộc tính Kích thước làm Thuộc tính phân hoạch:
Hình 7. Hình 3Cây định danh thuộc tính Màu và Kích thước 1
♦ Bảng Thuộc tính màu đỏ:
Màu Tên Vỏ Bên trong Kích thước Độc
Đỏ C Nhẵn Mềm Lớn Có
Đỏ E Có gai Cứng Nhỏ Không
Đỏ F Nhẵn Cứng Nhỏ Không
Đỏ J Có gai Cứng Lớn Không
Đỏ M Có gai Mềm Nhỏ Không
Đỏ N Nhẵn Cứng Lớn Có
Đỏ O Nhẵn Cứng Nhỏ Không
Hình 8. Bảng 4Bảng theo thuộc tính Màu Đỏ
Thuộc tính Vỏ (2 giá trị):

V
Vỏ
(Có gai) = (T(Có gai/Độc),T(Có gai/Không độc)) = (2/4;2/4) = (1/2;1/2);
V
Vỏ
(Nhẵn) = (T(Nhẵn/Độc),T(Nhẵn/Không độc)) = (0/3;3/3) = (0;1);
Số vectơ đơn vị : 1
Thuộc tính Bên trong (2 giá trị):
10
Hệ học
10
Bài tập nhóm - Học phần Hệ cơ sở tri thức
V
Bên trong
(Cứng) = (T(Cứng/Độc),T(Cứng/Không độc)) = (1/2;1/2);
V
Bên trong
(Mềm) = (T(Mềm/Độc),T(Mềm/Không độc)) = (1/5;4/5);
Số vectơ đơn vị : 0
Thuộc tính Kích thước (2 giá trị):
V
Kích thước
(Lớn) = (T(Lớn/Độc),T(Lớn/Không độc)) = (2/3;1/3);
V
Kích thước
(Nhỏ) = (T(Nhỏ/Độc),T(Nhỏ/Không độc)) = (0/4;4/4) = (0;1);
Số vectơ đơn vị : 1
Chọn Thuộc tính Kích thước làm Thuộc tính phân hoạch:
Hình 9. Hình 4Cây định danh thuộc tính Màu và Kích thước 2
Kích thước Tên Vỏ Bên trong Độc

Lớn C Nhẵn Mềm Có
Lớn N Nhẵn Cứng Có
Lớn J Có gai Cứng Không
Hình 10. Bảng 5Bảng theo thuộc tính Màu Đỏ, Kích thước Lớn
Thuộc tính Vỏ (2 giá trị):
V
Vỏ
(Có gai) = (T(Có gai/Độc),T(Có gai/Không độc)) = (2/2;0/2) = (1;0);
V
Vỏ
(Nhẵn) = (T(Nhẵn/Độc),T(Nhẵn/Không độc)) = (0/1;1/1) = (0;1);
Số vectơ đơn vị : 2
11
Hệ học
11
Bài tập nhóm - Học phần Hệ cơ sở tri thức
Thuộc tính Bên trong (2 giá trị):
V
Bên trong
(Cứng) = (T(Cứng/Độc),T(Cứng/Không độc)) = (1/2;1/2);
V
Bên trong
(Mềm) = (T(Mềm/Độc),T(Mềm/Không độc)) = (1/1;0/1) = (1;0);
Số vectơ đơn vị : 1
Chọn Thuộc tính Vỏ làm Thuộc tính phân hoạch:
Hình 11. Hình 5Cây định danh thuộc tính Màu, Kích thước, Vỏ
Cây định danh kết quả:
12
Hệ học
12

Bài tập nhóm - Học phần Hệ cơ sở tri thức
Hình 12. Hình 6Cây định danh đầy đủ
3. Phát sinh tập luật:
Kết quả học:
1. If (Màu = Nâu) then (Độc = Không)
2. If (Màu = Xanh) AND (Kích thước = Lớn) then (Độc = Không)
3. If (Màu = Xanh) AND (Kích thước = Nhỏ) then (Độc = Độc)
4. If (Màu = Đỏ) AND (Kích thước = Nhỏ) then (Độc = Không)
5. If (Màu = Đỏ) AND (Kích thước = Lớn) AND (Vỏ= Nhẵn) then (Độc = Độc)
6. If (Màu = Đỏ) AND (Kích thước = Lớn) AND (Vỏ= Có gai) then (Độc = Không)
IV. HỌC THEO ĐỘ BẤT ĐỊNH
Đối với một cơ sở dữ liệu thực thì không phải lúc nào cũng cho ra một tập đồng nhất. Với
cơ sở dữ liệu này người ta cần đo độ bất định (lộn xộn) của dữ liệu, hay độ không đồng bộ
nhất trong các tập con được sinh ra.
- Độ bất định Entropy của thuộc tính Y được tính theo công thức:
Trong đó:
n
t
là tổng số phần tử có trong phân hoạch.

n
b
là tổng số phần tử có thuộc tính dẫn xuất Y có giá trị b.
n
bc
: tổng số phần tử có thuộc tính dẫn xuất Y có giá trị b và Thuộc tính
13
Hệ học
13
Bài tập nhóm - Học phần Hệ cơ sở tri thức

mục tiêu có giá trị c.
Dù công thức chưa cho thấy sự lộn xộn nhưng người ta dùng nó để đo độ
thông tin. Để thấy được các khía cạnh quan tâm, giả sử có một tập gồm các phần tử
của 2 lớp A và B. Nếu số phần tử của 2 lớp là cân bằng thì độ bất định là 1 và giá trị
cực đại về độ bất định được tính theo:
=
Mặt khác nếu phần tử thuộc chỉ 1 trong A, B, độ bất định là 0.
-1- 0 =0
Độ bất định bằng 0 khi tập là đồng nhất và bằng 1 khi tập không đồng nhất.
Độ bất định sẽ có giá trị từ 0 đến 1.
1. Thuật toán:
B1: Ta tính độ bất định cho tất cả các Thuộc tính
B2: Chọn Thuộc tính có độ bất định nhỏ nhất để phân hoạch. Trừ khi hết
Thuộc tính phân hoạch thì dừng.
2. Ví dụ.
Đây là bảng khảo sát về loại quả có Độc hay Không có độc
Hình 13. Bảng 6Bảng số liệu Cây có Độc hay không
Giải:
14
Hệ học
14
Bài tập nhóm - Học phần Hệ cơ sở tri thức
- Thuộc tính Vỏ: (2 giá trị)
Tập Có gai: 2/8 bị Độc ; 6/8 Không bị độc
Tập Nhẵn: 4/8 bị Độc ; 4/8 Không bị độc
 E (Vỏ) =
- Thuộc tính Màu: (3 giá trị)
Tập Màu nâu: 0/3 bị Độc ; 3/3 Không bị độc
Tập Màu đỏ: 2/7 bị Độc ; 5/7 Không bị độc
Tập Màu xanh: 4/6 bị Độc ; 2/6 Không bị độc

 E (Màu) =
+
= 0,721
- Thuộc tính Bên trong: (2 giá trị)
Tập Cứng: 3/10 bị Độc ; 7/10 Không bị độc
Tập Mềm: 3/6 bị Độc ; 3/6 Không bị độc
 E (Bên trong) =
= 0,550 + =0,925
- Thuộc tính Kích thước: (2 giá trị)
Tập Lớn: 2/7 bị Độc ; 5/7 Không bị độc
Tập Nhỏ: 4/9 bị Độc ; 5/9 Không bị độc
 E (Kích thước) =
= 0,377 + 0,557 = 0,934
Vậy ta chọn Thuộc tính Màu làm Thuộc tính phân hoạch
Hình 14. Hình 7Cây định danh Màu theo độ bất định
Ta rút ra được luật :
- Nếu Màu của quả là Nâu thì sẽ Không bị độc
Từ sơ đồ trên ta có 2 bảng:
15
Hệ học
15
Bài tập nhóm - Học phần Hệ cơ sở tri thức
Bảng 1:
Tên Màu Vỏ Bên trong Kích thước Độc
B Xanh Có gai Cứng Lớn không
D Xanh Có gai Mềm Lớn không
H Xanh Có gai Mềm Nhỏ Có
I Xanh Nhẵn Cứng Nhỏ Có
L Xanh Nhẵn Mềm Nhỏ Có
P Xanh Có gai Cứng Nhỏ có

Hình 15. Bảng 7Bảng theo thuộc tính Màu Xanh
- Thuộc tính Vỏ (2 giá trị )
Tập Có gai: 2/4 bị Độc ; 2/4 Không bị độc
Tập Nhẵn: 2/2 bị Độc ; 0/2 Không bị độc
 E (Vỏ) =
= 4/6 = 0.66
- Thuộc tính Bên trong (2 giá trị)
Tập Cứng: 2/3 bị Độc ; 1/3 Không bị độc
Tập Mềm: 2/3 bị Độc ; 1/3 Không bị độc
 E (Bên trong) =
= 0,459 + 0,459 =0,981
- Thuộc tính Kích thước (2 giá trị)
Tập Lớn: 0/2 bị Độc ; 2/2 Không bị độc
Tập Nhỏ: 4/4 bị Độc ; 0/4 Không bị độc
 E (Kích thước) = =0
Vậy ta chọn Thuộc tính Kích thước làm Thuộc tính phân hoạch
Hình 16. Hình 8Cây định danh Kích thước theo độ bất định
Từ cây trên ta rút ra được luật :
- Nếu Kích thước của quả là Lớn và quả có Màu Xanh thì sẽ Không bị độc
Bảng 2:
Tên Màu Vỏ Bên trong Kích thước Độc
C Đỏ Nhẵn Mềm Lớn Có
16
Hệ học
16
Bài tập nhóm - Học phần Hệ cơ sở tri thức
E Đỏ Có gai Cứng Nhỏ Không
F Đỏ Nhẵn Cứng Nhỏ Không
J Đỏ Có gai Cứng Lớn Không
M Đỏ Có gai Mềm Nhỏ Không

N Đỏ Nhẵn Cứng Lớn Có
O Đỏ Nhẵn Cứng Nhỏ Có
Hình 17. Bảng 8Bảng theo thuộc tính Màu Đỏ
- Thuộc tính Vỏ (2 giá trị)
Tập Có gai: 0/3 bị Độc ; 3/3 Không bị độc
Tập Nhẵn: 2/4 bị Độc ; 2/4 Không bị độc
 E (Vỏ) =
,571
- Thuộc tính Bên trong (2 giá trị)
Tập Mềm: 1/2 bị Độc ; 1/2 Không bị độc
Tập Cứng: 1/5 bị Độc ; 4/5 Không bị độc
 E (Bên trong) =
= 2/7 +0,515 = 0,801
- Thuộc tính Kích thước (2 giá trị )
Tập Lớn: 2/3 bị Độc ; 1/3 Không bị độc
Tập Nhỏ: 0/4 bị Độc ; 4/4 Không bị độc
 E (Kích thước) =
= 0,393
Vậy ta chọn Thuộc tính Kích thước để phân hoạch
Hình 18. Hình 9Cây định danh Kích thước theo độ bất định 2
Từ cây trên ta rút ra được luật :
- Nếu Kích thước là Nhỏ và quả có Màu Đỏ thì sẽ Không bị độc
Từ hình trên ta có bảng :
Bảng 3:
Tên Vỏ Bên trong Độc
C Nhẵn Mềm Có
17
Hệ học
17
Bài tập nhóm - Học phần Hệ cơ sở tri thức

N Nhẵn Cứng Có
J Có gai Cứng không
Hình 19. Bảng 9Bảng theo thuộc tính Màu Đỏ, Kích thước Lớn
- Thuộc tính Vỏ (2 giá trị)
Tập Có gai: 0/1 bị Độc ; 1/1 Không bị độc
Tập Nhẵn: 2/2 bị Độc ; 0/2 Không bị độc
 E (Vỏ) =
- Thuộc tính Bên trong (2 giá trị)
Tập Mềm: 1/1 bị Độc ; 0/1 Không bị độc
Tập Cứng: 1/2 bị Độc ; 1/2 Không bị độc
 E (Bên trong) =
Vậy ta chọn Thuộc tính Vỏ để phân hoạch
Ta rút ra được luật :
- Nếu quả có Kích thước Lớn và Màu quả là Đỏ và quả có Vỏ Nhẵn thì sẽ bị Độc.
- Nếu quả có Kích thước Lớn và Màu quả là Đỏ và Vỏ là Có gai thì sẽ không bị độc.
Cây định danh
Hình 20. Hình 10Cây định danh đầy đủ
18
Hệ học
18
Bài tập nhóm - Học phần Hệ cơ sở tri thức
V. THUẬT TOÁN ILA
Thuật giải ILA được dùng để xác định các luật phân loại cho tập hợp và các mẫu học.
Thuật giải này được thực hiện cơ chế lặp, để tìm luật riêng đại diện cho tập mẫu cùng lớp. Sau
khi xác định được luật ILA bỏ các tập mẫu liên quan khỏi tập mẫu, đồng thời thêm luật mới
này vào tập luật
Kết quả có được là một danh sách có thứ tự các luật.
1. Xác định dữ liệu.
- Tập mẫu được liệt kê trong một bảng, với mỗi dòng tương ứng một tập mẫu, và
mỗi cột thể hiện một Thuộc tính trong tập mẫu.

- Tập mẫu có m mẫu, mỗi mẫu gồm k Thuộc tính, trong đó có 1 Thuộc tính quyết
định. Tổng số n giá trị của Thuộc tính này chính là số lớp của tập mẫu.
- Tập luật R có giá trị khởi tạo là ∅.
- Tất cả các dòng trong bảng ban đầu chưa được đánh dấu (kiểm tra).
2. Thuật giải ILA
- B1: Dựa vào Thuộc tính quyết định (có m giá trị), chia bảng thành m bảng con.
- B2: Xét bảng con thứ (i):
Khởi tạo biến đếm kết hợp Thuộc tính j, j=1 (Thuộc tính).
- B3: Với mỗi bảng con đang xét, phân chia danh sách các Thuộc tính theo các tổ
hợp phân biệt, mỗi tổ hợp ứng với j Thuộc tính phân biệt.
- B4: Với mỗi tổ hợp các Thuộc tính, đếm các giá trị Thuộc tính xuất hiện theo cùng
tổ hợp Thuộc tính trong các dòng chưa được đánh dấu của bảng con đang xét
(đồng thời không xuất hiện với tổ hợp Thuộc tính này trên các bảng còn lại). Gọi
tổ hợp đầu tiên (trong bảng con) có số lần xuất hiện nhiều nhất là tổ hợp lớn nhất.
- B5: Nếu tổ hợp lớn nhất bằng ∅, tăng j lên 1 và quay lại B3.
- B6: Đánh dấu các dòng thoả tổ hợp lớn nhất của bảng con đang xét.
- B7: Thêm luật mới vào tập luật R, với vế trái là tập các giá trị của Thuộc tính ứng
với tổ hợp lớn nhất (kết hợp các Thuộc tính bằng toán tử AND) và vế phải là giá
trị Thuộc tính quyết định tương ứng.
- B8: Nếu tất cả các dòng đều đã được đánh dấu thì ta thực hiện tương tự với các
bảng con còn lại (B2 -> B7). Ngược lại (nếu chưa đánh dấu hết các dòng) thì quay
lại B4. Nếu tất cả các bảng con đã được đánh dấu hết thì ta kết thúc, kết quả thu
được là tập luật cần tìm.
3. Ưu điểm của thuật giải
- Dạng các luật sẽ phù hợp cho việc khảo sát dữ liệu, mô tả mỗi lớp một cách đơn
giản để phân biệt với các lớp khác.
19
Hệ học
19
Bài tập nhóm - Học phần Hệ cơ sở tri thức

- Tập luật được sắp theo thứ tự, riêng biệt – cho phép quan tâm đến một luật tại thời
điểm bất kỳ một cách dễ dàng.
4. Ví dụ minh họa
Bảng:
Tên Vỏ Màu Bên trong Kích thước Độc
A Có gai Nâu Cứng Lớn Không
B Có gai Xanh Cứng Lớn Không
C Nhẵn Đỏ Mềm Lớn Có
D Có gai Xanh Mềm Lớn Không
E Có gai Đỏ Cứng Nhỏ Không
F Nhẵn Đỏ Cứng Nhỏ Không
G Nhẵn Nâu Cứng Nhỏ Không
H Có gai Xanh Mềm Nhỏ Có
I Nhẵn Xanh Cứng Nhỏ Có
J Có gai Đỏ Cứng Lớn Không
K Nhẵn Nâu Mềm Lớn Không
L Nhẵn Xanh Mềm Nhỏ Có
M Có gai Đỏ Mềm Nhỏ Không
N Nhẵn Đỏ Cứng Lớn Có
O Nhẵn Đỏ Cứng Nhỏ Không
P Có gai xanh Cứng Nhỏ Có
Hình 21. Bảng 10Bảng số liệu Cây có Độc hay không
Bảng có 4 thuộc tính dẫn xuất (Vỏ, Màu, Bên trong, Kích thước) và 1 thuộc tính dẫn xuất
(độc).
B1: Chia bảng trên thành 2 bảng con (dựa vào thuộc tính quyết định là có độc hay không).
Bảng 1:
Tên Vỏ Màu Bên trong Kích thước Độc
C Nhẵn Đỏ Mềm Lớn Có
H Có gai Xanh Mềm Nhỏ Có
I Nhẵn Xanh Cứng Nhỏ Có

L Nhẵn Xanh Mềm Nhỏ Có
N Nhẵn Đỏ Cứng Lớn Có
P Có gai Xanh Cứng Nhỏ Có
Hình 22. Bảng 11Bảng theo kết quả có Độc
Bảng 2:
Tên Vỏ Màu Bên trong Kích thước Độc
A Có gai Nâu Cứng Lớn Không
B Có gai Xanh Cứng Lớn Không
D Có gai Xanh Mềm Lớn Không
E Có gai Đỏ Cứng Nhỏ Không
F Nhẵn Đỏ Cứng Nhỏ Không
20
Hệ học
20
Bài tập nhóm - Học phần Hệ cơ sở tri thức
G Nhẵn Nâu Cứng Nhỏ Không
J Có gai Đỏ Cứng Lớn Không
K Nhẵn Nâu Mềm Lớn Không
M Có gai Đỏ Mềm Nhỏ Không
O Nhẵn Đỏ Cứng Nhỏ Không
Hình 23. Bảng 12Bảng theo kết quả Không độc
B2: Xét bảng 1:
Bảng 1:
Tên Vỏ Màu Bên trong Kích thước Độc
C Nhẵn Đỏ Mềm Lớn Có
H Có gai Xanh Mềm Nhỏ Có
I Nhẵn Xanh Cứng Nhỏ Có
L Nhẵn Xanh Mềm Nhỏ Có
N Nhẵn Đỏ Cứng Lớn Có
P Có gai Xanh Cứng Nhỏ Có

Hình 24. Bảng 13Bảng theo kết quả có Độc
Xét j=1 (Thuộc tính).
Có 4 tổ hợp: {Vỏ}, {Màu}, {Bên trong}, {Kích thước}
{Vỏ} {Màu} {Bên trong} {Kích thước}
∅ ∅ ∅ ∅
Tổ hợp lớn nhất = ∅.
Xét j = 2 (Thuộc tính).
Có 6 tổ hợp: {Vỏ, Màu}, {Vỏ, Bên trong}, {Vỏ, Kích thước}, {Màu, Bên trong}, {Màu, Kích
thước}, {Bên trong, Kích thước}.
{Vỏ,
Màu}
{Vỏ,
Bên trong}
{Vỏ,
Kích thước}
{Màu,
Bên trong}
{Màu,
Kích thước}
{Bên trong,
Kích thước}
Nhẵn, Xanh (2) ∅ ∅ ∅ Xanh, Nhỏ (4) ∅
- Tổ hợp lớn nhất: {Màu, Kích thước} = “Xanh, Nhỏ”.
- Đánh đấu dòng có {Màu, Kích thước} = “Xanh, Nhỏ”.
Tên Vỏ Màu Bên trong Kích thước Độc
C Nhẵn Đỏ Mềm Lớn Có
H Có gai Xanh Mềm Nhỏ Có
I Nhẵn Xanh Cứng Nhỏ Có
L Nhẵn Xanh Mềm Nhỏ Có
N Nhẵn Đỏ Cứng Lớn Có

21
Hệ học
21
Bài tập nhóm - Học phần Hệ cơ sở tri thức
P Có gai Xanh Cứng Nhỏ Có
Hình 25. Bảng 14Bảng Có độc sau khi đánh dấu "Xanh, Nhỏ"
- R= R {Màu = Xanh AND Kích thước = Nhỏ THEN Độc = Có}.
- Quay lại kiểm tra, ta có:
{Vỏ,
Màu}
{Vỏ,
Bên trong}
{Vỏ,
Kích thước}
{Màu,
Bên trong}
{Màu,
KíchThước}
{BênTrong,
Kích thước}
∅ ∅ ∅ ∅ ∅ ∅
- Xét j = 3 (Thuộc tính)
- Có 3 tổ hợp: {Vỏ, Màu, Bên trong}, {Vỏ, Màu, Kích thước}, {Màu, Bên trong, Kích
thước }.
{Vỏ,
Màu, Bên trong}
{Vỏ,
Màu, Kích thước}
{Màu,
Bên trong, Kích thước}

Nhẵn, Đỏ, Mềm (1) Nhẵn. Đỏ, Lớn (2) Đỏ, Mềm, Lớn (1)
- Tổ hợp lớn nhất: {Vỏ, Màu, Kích thước} = “Nhẵn, Đỏ, Lớn”.
- Đánh dấu dòng có {Vỏ, Màu, Kích thước} = “Nhẵn, Đỏ, Lớn”.
Tên Vỏ Màu Bên trong Kích thước Độc
C Nhẵn Đỏ Mềm Lớn Có
H Có gai Xanh Mềm Nhỏ Có
I Nhẵn Xanh Cứng Nhỏ Có
L Nhẵn Xanh Mềm Nhỏ Có
N Nhẵn Đỏ Cứng Lớn Có
P Có gai Xanh Cứng Nhỏ Có
Hình 26. Bảng 15Bảng Có độc sau khi đánh đấu "Xanh, Nhỏ" và "Nhẵn, Đỏ, Lớn"
- R= R {Vỏ= Nhẵn AND Màu = Đỏ AND Kích thước = Lớn THEN Độc = Có}.
Xét bảng con i=2
Tên Vỏ Màu Bên trong Kích thước Độc
A Có gai Nâu Cứng Lớn Không
B Có gai Xanh Cứng Lớn Không
D Có gai Xanh Mềm Lớn Không
E Có gai Đỏ Cứng Nhỏ Không
F Nhẵn Đỏ Cứng Nhỏ Không
G Nhẵn Nâu Cứng Nhỏ Không
J Có gai Đỏ Cứng Lớn Không
K Nhẵn Nâu Mềm Lớn Không
M Có gai Đỏ Mềm Nhỏ Không
O Nhẵn Đỏ Cứng Nhỏ Không
Hình 27. Bảng 16Bảng theo kết quả Không độc
- Xét j = 1 (Thuộc tính).
22
Hệ học
22
Bài tập nhóm - Học phần Hệ cơ sở tri thức

- Có 4 tổ hợp: {Vỏ}, {Màu}, {Bên trong}, {Kích thước}
{Vỏ} {Màu} {Bên trong} {Kích thước}

Nâu (3)
∅ ∅
- Tổ hợp lớn nhất: {Màu} = “Nâu”.
- Đánh dấu dòng có {Màu} = “Nâu”.
Tên Vỏ Màu Bên trong Kích thước Độc
A Có gai Nâu Cứng Lớn Không
B Có gai Xanh Cứng Lớn Không
D Có gai Xanh Mềm Lớn Không
E Có gai Đỏ Cứng Nhỏ Không
F Nhẵn Đỏ Cứng Nhỏ Không
G Nhẵn Nâu Cứng Nhỏ Không
J Có gai Đỏ Cứng Lớn Không
K Nhẵn Nâu Mềm Lớn Không
M Có gai Đỏ Mềm Nhỏ Không
O Nhẵn Đỏ Cứng Nhỏ Không
Hình 28. Bảng 17Bảng Không độc sau khi đánh dấu "Nâu"
- R = R { Màu = Nâu THEN Độc = Không}.
- Quay lại kiểm tra:
{Vỏ} {Màu} {Bên trong} {Kích thước}
∅ ∅ ∅ ∅
- Xét j=2 (Thuộc tính).
- Có 6 tổ hợp: {Vỏ, Màu}, {Vỏ, Bên trong}, {Vỏ , Kích thước}, {Màu, Bên trong},
{Màu, Kích thước}, {Bên trong, Kích thước}.
{Vỏ,
Màu}
{Vỏ,
Bên trong}

{Vỏ,
Kích thước}
{Màu,
Bên trong}
{Màu,
KíchThước}
{BênTrong,
Kích thước}
Có gai, Đỏ (3) ∅ Có gai, Lớn (3) ∅ Xanh, Lớn (2)
Đỏ, Nhỏ (4)

- Tổ hợp lớn nhất: {Vỏ, Màu} = “Đỏ, Nhỏ”.
- Đánh dấu dòng có {Vỏ, Màu} = “Đỏ, Nhỏ”.
Tên Vỏ Màu Bên trong Kích thước Độc
A Có gai Nâu Cứng Lớn Không
B Có gai Xanh Cứng Lớn Không
D Có gai Xanh Mềm Lớn Không
E Có gai Đỏ Cứng Nhỏ Không
F Nhẵn Đỏ Cứng Nhỏ Không
23
Hệ học
23
Bài tập nhóm - Học phần Hệ cơ sở tri thức
G Nhẵn Nâu Cứng Nhỏ Không
J Có gai Đỏ Cứng Lớn Không
K Nhẵn Nâu Mềm Lớn Không
M Có gai Đỏ Mềm Nhỏ Không
O Nhẵn Đỏ Cứng Nhỏ Không
Hình 29. Bảng 18Bảng Không độc sau khi đánh dấu "Nâu", "Đỏ, Nhỏ"
- R= R {Màu = Đỏ AND Kích thước = Nhỏ THEN Độc = Không}.

- Quay lại kiểm tra:
{Vỏ,
Màu}
{Vỏ,
Bên trong}
{Vỏ,
Kích thước}
{Màu,
Bên trong}
{Màu,
KíchThước}
{BênTrong,
Kích thước}
Có gai, Đỏ (1) ∅ Có gai, Lớn (3) ∅ Xanh, Lớn (2) ∅
- Tổ hợp lớn nhất :{Vỏ, Kích thước} = “Có Gai, Lớn”
- Đánh dấu dòng có {Vỏ, Kích thước} = “Có Gai, Lớn”
Tên Vỏ Màu Bên trong Kích thước Độc
A Có gai Nâu Cứng Lớn Không
B Có gai Xanh Cứng Lớn Không
D Có gai Xanh Mềm Lớn Không
E Có gai Đỏ Cứng Nhỏ Không
F Nhẵn Đỏ Cứng Nhỏ Không
G Nhẵn Nâu Cứng Nhỏ Không
J Có gai Đỏ Cứng Lớn Không
K Nhẵn Nâu Mềm Lớn Không
M Có gai Đỏ Mềm Nhỏ Không
O Nhẵn Đỏ Cứng Nhỏ Không
Hình 30. Bảng 19Bảng Không độc sau khi đánh dấu “Nâu”, “Đỏ, Nhỏ”, “Có gai, Lớn”
- R = R {Vỏ = Có gai AND Kích thước= Lớn THEN Độc = Không}.
- Đánh dấu hết dòng AND xét hết bảng con => kết thúc.

5. Đánh giá giải thuật.
Số lượng các luật thu được xác định mức độ thành công của thuật giải. Đây chính là
mục đích chính của bài toán phân lớp thông qua một tập mẫu học.
VI. MÔ HÌNH MẠNG NEURON NHÂN TẠO:
1) Tổng quan về mạng neuron nhân tạo :
Trái với mô hình học máy trên cơ sở tri thức, mô hình học máy nhờ mạng neuron nhân tạo đó
là mô hình học bằng cách mô phỏng lại cấu trúc và nguyên lý làm việc của hệ neuron sinh học
con người. Hệ neuron sinh học con người được thừa nhận có khỏang 10
10
hoặc 10
12
tế bạo
neuron gồm nhiều lớp đó là lớp vào, các lớp ẩn và lớp ra. Lớp vào nối với các phần tử cảm
24
Hệ học
24
Bài tập nhóm - Học phần Hệ cơ sở tri thức
biến như tai, mắt, miệng, mũi, da vân vân, lớp ra nối với các phần tử cơ bắp như chân, tay vân
vân và các lớp ẩn chứa các đơn vị xử lý xử các thông tin nhận được từ lớp vào và gởi quyết
định đến lớp ra để điều khiển các phần tử cơ bắp như chân và tay vân vân. Mỗi neuron sinh
học có nhiều ngõ vào và một ngõ ra và ngõ ra của neuron này được kết nối với ngõ vào của
neuron khác. Tín hiệu truyền từ neuron này đến neuron khác là dưới dạng điện áp. Nếu tín
hiệu truyền giữa hai neuron là điện áp dương thì hai nuron được kết nối dưới dạng kích thích.
Nếu tín hiệu truyền giữa hai neuronlà điện áp âm thì hai neuron được kết nối dưới dạng ức
chế. Nếu tín hiệu truyền giữa hai neuron là điện áp zero thì hai neuron là không có sự kết nối.
Lượng điện áp truyền giữa các neuron được gọi là cường độ kết nối. Trên cơ sở của hệ neuron
sinh học con người như được mô tả, một mạng neuron nhân tạo nhiều lớp được thiết lập như
hình:
Hình 31. Hình 11Mạng neuron nhân tạo
Có ba thành phần cơ bản của các mạng neuron nhân tạo đó là mô hình kết nối, đơn vị

xử lý và luật học.
+ Mô hình kết nối : Có hai mô hình kết nối đó là kết nối truyền thẳng và kết nối hồi
quy. Mô hình kết nối truyền thẳng được gọi là mạng truyền thẳng đó là cấu trúc mạng được
kết nối chuyển tiếp tín hiệu từ lớp vào thông qua lớp ẩn và đến lớp ra. Mô hình kết nối hồi
quy được gọi là mạng hồi quy đó là cấu trúc mạng được kết nối chuyển tiếp tín hiệu từ lớp
vào thông qua lớp ẩn đến lớp ra và đồng thời hồi tiếp tín hiệu về đơn vị xử lý chính nó hoặc
các đơnvị xử khác trong lớp hoặc ở lớp khác. + Đơn vị xử lý : Một mạng neuron nhân tạo có
nhiều lớp đó là lớp vào, các lớp ẩn và lớp ra. Lớp vào chứa các neuron được xem như nơi
25
Hệ học
25

×