Tải bản đầy đủ (.pdf) (16 trang)

Bài giảng Nhập môn trí tuệ nhân tạo: Chương 4 - Văn Thế Thành

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (323.66 KB, 16 trang )

2/19/2014

NHẬP MƠN TRÍ TUỆ NHÂN TẠO

CHƯƠNG 4:
MỘT SỐ VÍ DỤ VỀ MÁY HỌC

1

1. GIỚI THIỆU
Một số phương pháp máy học để tiếp
thu tri thức hay tạo ra tri thức
Học vẹt
Học cách đề xuất
Học bằng cách thu thập các trường hợp
Học bằng cách xây dựng cây định danh
Học không giám giám sát và bài tóm gom
nhóm dữ liệu
Học giám sát và bài toán phân lớp dữ liệu

2

1


2/19/2014

1. GIỚI THIỆU (tt)
Học vẹt
Hệ tiếp nhận các khẳng định của các quyết định
đúng. Khi hệ tạo ra một quyết định không đúng, hệ


sẽ đưa ra các luật hay quan hệ đúng mà hệ đã sử
dụng. Hình thức học vẹt nhằm cho phép chuyên gia
cung cấp tri thức theo kiểu tương tác.
Học bằng cách chỉ dẫn
Thay vì đưa ra một luật cụ thể cần áp dụng vào tình
huống cho trước, hệ thống sẽ được cung cấp bằng
các chỉ dẫn tổng qt.
Ví dụ: "gas hầu như bị thốt ra từ van thay vì thốt ra từ
ống dẫn". Hệ thống phải tự mình đề ra cách biến đổi từ trừu
tượng đến các luật khả dụng.
3

1. GIỚI THIỆU (tt)
Học bằng qui nạp
Hệ thống được cung cấp một tập các ví dụ và kết
luận được rút ra từ từng ví dụ. Hệ liên tục lọc các
luật và quan hệ nhằm xử lý từng ví dụ mới.
Học bằng tương tự
Hệ thống được cung cấp đáp ứng đúng cho các tác
vụ tương tự nhưng không giống nhau. Hệ thống cần
làm thích ứng đáp ứng trước đó nhằm tạo ra một
luật mới có khả năng áp dụng cho tình huống mới.

4

2


2/19/2014


1. GIỚI THIỆU (tt)
Học dựa trên giải thích
Hệ thống phân tích tập các lời giải ví dụ ( và kết quả) nhằm ấn
định khả năng đúng hoặc sai và tạo ra các giải thích dùng để
hướng dẫn cách giải bài tốn trong tương lai.
Học dựa trên tình huống
Bấy kỳ tính huống nào được hệ thống lập luận đều được lưu trữ
cùng với kết quả cho dù đúng hay sai. Khi gằp tình hướng mới,
hệ thống sẽ làm thích nghi hành vi đã lưu trữ với tình huống
mới.
Khám phá hay học khơng giám sát
Thay vì có mục tiêu tường minh, hệ khám phá liên tục tìm kiếm
các mẫu và quan hệ trong dữ liệu nhập. Các ví dụ về học khơng
giám sát bao gồm gom cụm dữ liệu, học để nhận dạng các đặc
tính cơ bản như cạnh từ các điểm ảnh.

5

2. Một số ví dụ:
Học qua logic:
Bongard (1970) là người đầu tiên ứng dụng
các toán tử logic để học và nhận dạng các
đối tượng hình ảnh.
Ý tưởng: Tìm quan hệ đơn giản nhất trong
số các quan hệ có thể sử dụng để học và
nhận dạng các hình ảnh.
6

3



2/19/2014

2. Một số ví dụ (tt)

Lớp A

Lớp B

Chúng ta có thể quan sát thấy các hình vẽ thuộc lớp A có
3 vịng trắng ln ln nằm trên một đường thẳng.
7

2. Một số ví dụ (tt)
Vấn đề đặt ra:
-Tìm quan hệ đơn giản nhất có thể phân biệt được các hình
ảnh.
Bongard đã dùng bảng logic “mô tả – quan hệ” để dẫn xuất
ra các mệnh đề logic:
φ = ∨(ϕ ∧ ϕ ∧ ... ∧ ϕn )
1 2
φ có thể dùng để phân biệt 2 lớp E và E’ nếu φ(E) và
φ(E’) đối ngẫu nhau.
8

4


2/19/2014


2. Một số ví dụ (tt)
P1

P2

P3

P4

P5

1

2

3

4

5

6

7

8

9

10


9

2. Một số ví dụ (tt)
Các đối tượng trong mẫu:
1

P1
1

P2
1

P3
1

P4
1

P5
0

P1 P2 P3 P4 P5

2
3

1
0


0
1

0
0

1
0

0
1

P1 P2 P3 P4 P5
P1 P2 P3 P4 P5

4
5

0
0

1
1

0
0

0
1


6

1

1

0

1

P1 P2 P3 P4 P5
1
0 ⇒ P1 P2 P3 P4 P5
P1 P2 P3 P4 P5
0

7
8

1
1

1
0

0
0

0
1


0
0

P1 P2 P3 P4 P5
P1 P2 P3 P4 P5

9
10

0
1

0
1

0
0

1
0

0
0

P1 P2 P3 P4 P5
P1 P2 P3 P4 P5

10


5


2/19/2014

2. Một số ví dụ (tt)
Sau khi tính tổng và
rút gọn lại được:
P1 .P2 + P1 .(P2 .P3 + P2 .P3 )
 P1.P2
Không có thì phải có hình
(3,4,5)

(1)
x ∈ ϕ( A)  P1.P2 .P3 Có thì phải có hình và hình

(1)
 P1.P2 .P3 Có thì không có hình và hình

11

3. HỌC BẰNG CÁCH XÂY DỰNG
CÂY ĐỊNH DANH
Thử
Bảng dữ liệu

Xây dựng
Cây định danh

Luật


Cây định danh: Là một dạng của cây quyết định, trong đó
mỗi tập các kết luận có thể xảy ra được thiết lập một cách
ngầm định bởi một danh sách các mẫu mà chúng được phân
vào một lớp đã biết.

12

6


2/19/2014

3. HỌC BẰNG CÁCH XÂY DỰNG
CÂY ĐỊNH DANH

(tt)

Ví dụ có bảng dữ liệu quan sát
Tên

Tóc

Ch.Cao

Cân Nặng

Dùng kem?

Kết quả


Sarah

Vàng

T.Bình

Nhẹ

Khơng

Cháy

Dana

Vàng

Cao

T.Bình



Khơng

Alex

Nâu

Thấp


T.Bình



Khơng

Annie

Vàng

Thấp

T.Bình

Khơng

Cháy

Emilie

Đỏ

T.Bình

Nặng

Khơng

Cháy


Peter

Nâu

Cao

Nặng

Khơng

Khơng

John

Nâu

T.Bình

Nặng

Khơng

Khơng

Kartie

Vàng

Thấp


Nhẹ



Khơng
13

3. HỌC BẰNG CÁCH XÂY DỰNG
CÂY ĐỊNH DANH

(tt)

•Thuộc tính mục tiêu: là thuộc tính quan tâm (tính chất
cháy nắng hay khơng cháy nắng) .
R = {"cháy nắng", "bình thường"}.
•Thuộc tính dẫn xuất: Chúng ta quan sát hiện tượng cháy
nắng dựa trên 4 thuộc tính sau : chiều cao (cao, trung
bình, thấp), màu tóc (vàng, nâu, đỏ), cân nặng (nhẹ,
TB, nặng), dùng kem (có, khơng) là thuộc tính dẫn xuất
P là tất cả những người được liệt kê trong bảng dưới
(8 người)
14

7


2/19/2014

3.1.Đâm chồi

Đỏ

Vàng
Nâu

15

3.1. Đâm chồi (tt)

16

8


2/19/2014

3.2. Phương án chọn thuộc
tính phân hoạch
Vấn đề mà chúng ta gặp phải cũng tương tự
như bài tốn tìm kiếm : "Đứng trước một
ngã rẽ, ta cần phải đi vào hướng nào?".
Hai phương pháp đánh giá dưới đây giúp ta
chọn được thuộc tính phân hoạch tại mỗi
bước xây dựng cây định danh.
17

3.2.1. Thuật tốn Quinlan (1)
•Quinlan quyết định thuộc tính phân hoạch bằng cách xây
dựng các vector đặc trưng cho mỗi giá trị của từng thuộc
tính dẫn xuất và thuộc tính mục tiêu.

•Cách tính vectơ đặc trưng:
Với mỗi thuộc tính dẫn xuất A cịn có thể sử dụng để phân
hoạch, tính :
VA(j) = ( T(j , r1), T(j , r2) , …, T(j , rn) )
*T(j, ri) = (tổng số phần tử trong phân hoạch có giá trị
thuộc tính dẫn xuất A là j và có giá trị thuộc tính mục tiêu là
ri ) / ( tổng số phần tử trong phân hoạch có giá trị thuộc
tính dẫn xuất A là j )
18
* r1, r2, … , rn là các giá trị của thuộc tính mục tiêu

9


2/19/2014

3.2.1. Thuật tốn Quinlan (2)
Vector đơn vị là vector có duy nhất
một thành phần có giá trị 1 và những
thành phần khác có giá trị 0.
Thuộc tính được chọn để phân hoạch là
thuộc tính có nhiều vector đơn vị
nhất.

19

3.2.1. Thuật tốn Quinlan

Cháy nắng =


Tổng số quan sát cháy nắng có tóc vàng
Tổng số quan sát có tóc vàng

Khơng cháy nắng = Tổng số quan sát không cháy nắng có tóc vàng

Tổng số quan sát có tóc vàng

20

10


2/19/2014

3.2.1. Thuật tốn Quinlan(tt)
VTóc (vàng) = (T(vàng,cháy nắng),T(vàng, khơng cháy nắng))
Số người tóc vàng là : 4
Số người tóc vàng và cháy nắng là : 2
Số người tóc vàng và khơng cháy nắng là : 2
Do đó
VTóc(vàng) = (2/4 , 2/4) = (0.5, 0.5)

Tương tự
VTóc(nâu) = (0/3, 3/3) = (0,1) (vector đơn vị)
VTóc(đỏ) = (1/1, 0/1) = (1,0) (vector đơn vị)

Tổng số vector đơn vị của thuộc tính tóc là 2
21

3.2.1. Thuật tốn Quinlan (tt)

Các thuộc tính khác được tính tương tự, kết quả như sau :
VC.Cao(Cao) = (0/2,2/2) = (0,1)
VC.Cao(T.B) = (2/3,1/3)
VC.Cao(Thấp) = (1/3,2/3)
VC.Nặng (Nhẹ) = (1/2,1/2)
VC.Nặng (T.B) = (1/3,2/3)
VC.Nặng (Nặng) = (1/3,2/3)
VKem (Có) = (3/3,0/3) = (1,0)
VKem (Khơng) = (3/5,2/5)
Như vậy thuộc tính màu tóc có số vector đơn vị nhiều nhất nên sẽ được
chọn để phân hoạch.
22

11


2/19/2014

3.2.1. Thuật toán Quinlan (tt)
Sau khi phân hoạch theo màu tóc xong, chỉ có phân hoạch theo tóc vàng
(Pvàng) là cịn chứa những người cháy nắng và khơng cháy nắng nên ta sẽ
tiếp tục phân hoạch tập này. Ta sẽ thực hiện thao tác tính vector đặc trưng
tương tự đối với các thuộc tính cịn lại (chiều cao, cân nặng, dùng kem).
Trong phân hoạch Pvàng, tập dữ liệu của chúng ta cịn lại là :
Tên

Ch.Cao

Cân Nặng


Dùng kem?

Kết quả

Sarah

T.Bình

Nhẹ

Khơng

Cháy

Dana

Cao

T.Bình



Khơng

Annie

Thấp

T.Bình


Khơng

Cháy

Kartie

Thấp

Nhẹ



Khơng

23

3.2.1. Thuật tốn Quinlan
(tt)
VC.Cao(Cao) = (0/1,1/1) = (0,1)
VC.Cao(T.B) = (1/1,0/1) = (1,0)
VC.Cao(Thấp) = (1/2,1/2)
VC.Nặng (Nhẹ) = (1/2,1/2)
VC.Nặng (T.B) = (1/2,1/2)
VC.Nặng (Nặng) = (0,0)
VKem (Có) = (0/2,2/2) = (0,1)
VKem (Khơng) = (2/2,0/2) = (1,0)
2 thuộc tính dùng kem và chiều cao đều có 2 vector đơn vị.
Ta chọn phân hoạch theo thuộc tính dùng kem.
24


12


2/19/2014

3.2.1. Thuật toán Quinlan (tt)
Kết quả Cây định danh cuối cùng :
Vàng

Đỏ
Nâu

25

3.2.2. Phương pháp độ đo hỗn loạn
Với mỗi thuộc tính dẫn xuất ta chỉ cần tính ra độ đo hỗn loạn
và lựa chọn thuộc tính nào có độ đo hỗn loạn là thấp nhất.
Cơng thức tính như sau :

trong đó :
• bt là tổng số phần tử có trong phân hoạch
• bj là tổng số phần tử có thuộc tính dẫn xuất A có giá trị j.
• bri : tổng số phần tử có thuộc tính dẫn xuất A có giá trị j và thuộc tính mục
tiêu có giá trị i.

26

13



2/19/2014

Ví dụ:
STT

Kích cỡ

Màu sắc

Hình dáng

Quyết
định

1

Trung bình

Đỏ

Cầu

Mua

2

Lớn

Vàng


Hộp

Mua

3

Trung bình

Xanh

Trụ

Khơng mua

4

Nhỏ

Xanh

Cầu

Mua

5

Trung bình

Xanh


Nón

Khơng mua

6

Nhỏ

Xanh

Nón

Khơng mua

7

Trung bình

Đỏ

Trụ

Mua

27

Ví dụ (tt)
Kích cỡ
Lớn


Nhỏ

√1
3
5
√7

Xanh

Đỏ

Cầu

Vàng

Trung bình
√4
6

Hình dáng

Màu sắc

√2

√1
√7

√2


3
√4
5
6

√1
√4

Hộp
√2

Nón
Trụ
3
√7

5
6

28

14


2/19/2014

Ví dụ (tt)
Độ hỗn loạn TB kích cỡ:

=


2 1
1 1
1 4 2
2 2
2 1 1
1  2 4 6
 − × log 2 − × log 2  +  − × log 2 − × log 2  +  − × log 2 − 0  = + =
7 2
2 2
2 7 4
4 4
4 7 1
1  7 7 7
Độ hỗn loạn TB màu sắc:

4 1
1 3
3
= 0 + 0 +  − × log 2 − × log 2  ≈ 0.46
7 4
4 4
4

Độ hỗn loạn TB hình dáng:

2 1
1 1
= 0 + 0 +  − × log 2 − × log 2
7 2

2 2

1
2
+0 =
2
7
29

Ví dụ (tt)
Chọn thuộc tính hình dáng vì có độ hỗn loạn
trung bình nhỏ nhất:
Hình dáng

Nón

Cầu
Hộp
Mua

Mua

Trụ
?

Khơng mua

30

15



2/19/2014

Ví dụ (tt)
Sau khi test lần 1 xong, ta đã loại ra 5 mẫu ổn định => có 1 bảng nhỏ hơn:
STT

Kích cỡ

Màu sắc

Quyết định

3

Trung bình

Xanh

Khơng mua

7

Trung bình

Đỏ

Mua


Kích
cỡ
Trung
bình
3
√7

Màu
Xanh sắc Đỏ
√7

3

Độ hỗn loạn trung bình kích cỡ:=1
Độ hỗn loạn trung bình màu sắc:=0
31

Ví dụ (tt)
Chọn thuộc tính màu sắc vì có độ hỗn loạn TB nhỏ nhất:

Màu sắc
Xanh

Đỏ

Khơng mua

Mua

Cây quyết định:


Hình dáng
Nón

Cầu
Hộp
Mua

Trụ

Mua

Màu sắc
Đỏ
Mua

Khơng mua

Xanh
Khơng mua

32

16



×