NHAP MON TRI TUE NHAN TAO
on
ai>
@copyrights by Dr Nguyén Xuan
Hoai
Hoc quy nap
¢ Vi du: hoc một hàm từ mẫu ví du.
f lànàm mục tiêu
Một mẫu ví dụ là một cặp (x, f(x))
Bài tốn: Tìm giả thuyết h
sao choh =f
dựa trên tập mẫu cho trước
Mơ hình đơn giản hố việc học:
— Khơng tính đến tri thức có sẵn
— Giả sử tập mẫu là có đủ.
Phương
pháp học quy nạp
°. Xây dựng h gân với f trên tập huấn luyện
° _(h được gọi là nhất quán với f trên tập mẫu)
° E.g., khớp đường cong:
fix)
A
_
Phương
pháp học quy nạp
°. Xây dựng h gân với f trên tập huần luyện
°_(h được gọi là nhất quán với f trên tập mẫu)
° E.g., khớp đường cong:
fix)
Phương
pháp học quy nạp
°. Xây dựng h gân với f trên tập huấn luyện
° _(h được gọi là nhất quán với f trên tập mẫu)
° E.g., khớp đường cong:
Tix)
Phương
pháp học quy nạp
°. Xây dựng h gân với f trên tập huần luyện
°_ (h được gọi là nhất quán với f trên tập mẫu)
° E.g., khớp đường cong:
fix)A
Phương
pháp học quy nạp
° . Xây dựng h gân với f trên tập huần luyện
° _ (h được gọi là nhất quán với f trên tập mẫu)
°
.E.g., khớp đường cong:
jit)
_—
1
Phương
pháp học quy nạp
Xây dựng h gân với f trên tập huân luyện.
(h được gọi là nhât quán với f trên tập mâu)
E.g., khớp đường cong:
Ockhams razor: ưu tiên những giả. thiệt nào xấp
xỉ tốt hàm mục tiêu và càng đơn giản càng tốt
Học các cây quyết định
Bài toán: Học xem khi nào thì nên ngồi bàn đợi tại
mot restaurant:
1.
2.
3.
4.
5.
6.
7.
8.
9.
1 0.
Alternate: Co restaurant nao canh day khong?
Bar; Liệu có khu vực quây bar có thê ngơi khơng?
Fri/Sat: hom nay la thu 8 hay thứ 7?
Hungry: co dang đói khơng?
Fal)
S6 ngudi trong restaurant (None, Some,
u
Price: khoảng giá ($, $$, $$$)
Raining: ngồi trời có mưa không?
Reservafion: đã đặt trước chưa?
Type: loai restaurant (French, Italian, Thai, Burger)
WaitEstimate: thời gian chờ đợi (0-10, 10-30, 3060, >60)
Biêu diễn thuộc tính giá trị
»-
Các mẫu được biểu diễn bằng các thuộc tính và giá tri (Boolean,
discrete, continuous)
Example
Alt|
Bar|
Fri|
Hun|
F
T
AY
T |
F
À2
A3
AA
A5
T |
F}
TỊ
TỊ
F | F
T | F
F | T|
F
ỊT
Aq
Ag
Ag
X10
Attributes
Pat | Price| Rain|
Res|
$$$
F
T | French | 0-10
T
T | Full
F
|Some|
T | Ful
F | Full |
$
$
$
$$$
$$
F
F
F
F
T |
F
F
F
T
|
|
|
|
Thai
|3060|
Burger | 0-10
Thai
|10-30[
French | >60
F
T
T
F
F | T | F
F|F
ỊF
F)}
T | T |
T | T | TJ]
F
|None|l
T
|Some}
F | Ful
T | Ful |
$
$$
5
$5$
i
ii
i
E
F
T
F
T
|
|
|
|
Burger | 0-10
Thai | 0-10
Burger | >60
Italian |} 10-30)
F
T
F
=F
Xi
P|
F
F
F
|None|
$
F
F |
Thai | 0-10
F
Xp
T{
T
|LT |
T |
Ful
$
F
F
Xe
Fl}
T | F |
T
|Some|
‘Target
Type | Est |) Wait
|Somel
T | Italian | 0-10
|Burger
|30-00 ||
T
T
Nhiệm vụ đặt ra là phân loại xem trường hợp nào trong tương lai là
positive (T) hay negative (F)
Cây quyết định
° - Biểu diễn giả thiết cần học.
Vi du:
Patrons?
m
Full
WantEstimate?
>60
30
Ci
Alte mate?
Reservation?
No
Yes
Bar?
No
Yes
10-
nh
Fri‘Sat? ¬
0-10
Hungry?
mế
CÀ.
nate ?
No
ma
Kha nang biéu dién
° - Cây quyết định có khả năng dùng để biểu diễn bất cứ hàm nào.
°Ò
E.g. ham Boolean:
A
B
F
F
T
T
F
T
OF
T
F
T
T
F
° - Với một cây quyết định nhất quán với tập mẫu huấn luyện thì mỗi
input, output cua ham tương ứng với một đường ởi trong, Cây.
Nhưng cũng có thê khả năng khái qt hố khơng cao đồi với các ví
dụ mới chưa biết.
°Ị - Ưu tiên tìm cây có độ phức tạp nhỏ.
Không gian giả thuyết
Số lượng cây quyết định cho hàm Boolean =
= Số lượng hàm boolean
= số lượng bảng luận ý với 2" hàng = 22°
° E.g., nêu có 6 thuộc tính Boolean, có
18,446,/44,073,/709,551,616 cây
Thuat toan hoc cay qut dinh
° - Mục đích: Tìm cây nhỏ nhất quán với tập mẫu huấn luyện.
° _ Ý tưởng: Tìm kiễm heuristic chọn thuộc tính quan trọng nhất dé
phân tách (đê quy)
function D'TL(ezarmples, œttributes, defaulf) returns a decision tree
if examples is empty then return default
else if all examples have the same classification then return the classification
else if attributes is empty then return MODE( examples)
else
best ~ CHOOSE- ATTRIBUTE( attributes, examples)
tree
for each value vu; of best do
examples; — {elements of examples with best = v;}
subtree ~ DT L(examples;, attributes — best, MODE(examples))
add a branch to free with label v; and subtree subtree
return [ree