Tải bản đầy đủ (.ppt) (22 trang)

bài giảng môn trí tuệ nhân tạo Giới thiệu máy học

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (207.75 KB, 22 trang )

Giới thiệu máy học
ThS. Dương Thị Thùy Vân
Khoa CNTT-TƯD
Trang 2
Học là gì?

ghi nh i u gì óớ đ ề đ

h c các s ki n qua quan sát và th m dòọ ự ệ ă

c i thi n các k n ng v n ng và/hay nh n th c ả ệ ỹ ă ậ độ ậ ứ
qua vi c luy n t pệ ệ ậ

t ch c tri th c m i thành các bi u di n t ng quát, ổ ứ ứ ớ ể ễ ổ
hi u quệ ả
Thế nào là máy học (Machine Learning)

Máy h c có ngh a là vi c mô hình hóa môi tr ng xung ọ ĩ ệ ườ
quanh hay kh n ng m t ch ng trình máy tính sinh ra ả ă ộ ươ
m t c u trúc d li u m i khác v i c u trúc hi n có. Ch ng ộ ấ ữ ệ ớ ớ ấ ệ ẳ
h n vi c tìm ra nh ng lu t ạ ệ ữ ậ If…then… t t p d li u u ừ ậ ữ ệ đầ
vào.
(Krzysztof J. Cios, Witold Pedrycz, Roman W. Swiniarski. Data Mining
Methods for Knowledge Discovery. Kluwer Academic Publishers, 1998)
Thế nào là khám phá tri thức
(knowledge discovery) ?

Khám phá tri th c là tìm ra nh ng tri th c ti m n, ứ ữ ứ ề ẩ
nh ng tri th c m i (không ph i là nh ng tri th c ữ ứ ớ ả ữ ứ
kinh i n, kinh nghi m, …)đ ể ệ
Dữ liệu


Thông tin
Tri thức
Số lượng
Mức độ
trừu
tượng
Phân loại máy học

Phân lo i thô:ạ

 ọ

 ọ
Phân loại máy học

C p h c:ấ độ ọ
»
Học vẹt (Rote learning)
»
Học theo giải thích (by explanation)
»
Học theo ví dụ, trường hợp (by examples, cases)
»
Học khám phá (by discovering)
Phân loại máy học

Cách ti p c n:ế ậ

Tiếp cận thống kê


Tiếp cận toán tử logic

Tiếp cận hình học
(phân hoạch không gian, xây dựng cây định danh, …)

Tiếp cận mạng Neural

Tiếp cận khai mỏ dữ liệu


Ví dụ 1
Ch ng trình oán ý ngh con ng i. Máy s oán ng i ch i ươ đ ĩ ườ ẽ đ ườ ơ
ngh s 0 hay 1 trong u, ng i ch i s ph i tr l i cho ĩ ố đầ ườ ơ ẽ ả ả ờ
máy bi t là máy ã oán úng hay sai. t ó máy tính s h c ế đ đ đ Để ừ đ ẽ ọ
qui lu t suy ngh a c a ng i ch i.ậ ĩ ủ ườ ơ
Học dựa trên cây định danh

Ví d : ụ Xây d ng các quy lu t k t lu n m t ng i nh ự ậ để ế ậ ộ ườ ư
th nào khi i t m bi n thì b cháy n ng. ế đ ắ ể ị ắ

Ta g i tính ch t cháy n ng hay không cháy n ng là thu c ọ ấ ắ ắ ộ
tính quan tâm (thu c tính m c tiêu).ộ ụ
R = {“cháy n ng”, “bình th ng”}ắ ườ
Học dựa trên cây định danh

P = t p h p 8 ng i quan sát c v i ậ ợ ườ đượ ớ 4 thu c tính ộ
:

  ề ấ


 đỏ

    ặ ẹ ặ

!
 ! "#" "
$%
&'
(
)*+
Sarah Vàng T.Bình Nhẹ Không Cháy
Dana Vàng Cao
T.Bình
Có Không
Alex Nâu Thấp
T.Bình
Có Không
Annie Vàng Thấp
T.Bình
Không Cháy
Emilie Đỏ T.Bình Nặng Không Cháy
Peter Nâu Cao Nặng Không Không
John Nâu T.Bình Nặng Không Không
Kartie Vàng Thấp Nhẹ Có Không
Thuật toán Quinlan

V i m i thu c tính d n xu t A còn có th s d ng phân ớ ỗ ộ ẫ ấ ể ử ụ để
ho ch, tính :ạ

,

-.
/.
0
.
1
2.



.

/       3ổ ố ầ ử ạ ị ộ
 4 -ẫ ấ .  3 5ị ộ ụ 

   ổ ố ầ
    3 4 -ử ạ ị ộ ẫ ấ .

 đ 
0

1
2

   3 5ị ủ ộ ụ

$  6   3-   7 ư ậ ế ộ ộ ể ậ ộ ị
 7  #ẽ đặ ư
Thuật toán Quinlan

M t vector V(Aj ) c g i là vector n v n u nó ch có ộ đượ ọ đơ ị ế ỉ

duy nh t m t thành ph n có giá tr 1 và nh ng thành ph n khác ấ ộ ầ ị ữ ầ
có giá tr 0. ị

Thu c tính c ch n phân ho ch là thu c tính có ộ đượ ọ để ạ ộ
nhi u vector n v nh t. ề đơ ị ấ
Thuật tốn Quinlan

Xét ví dụ, lúc ban đầu (chưa phân hoạch)
V
Tóc
(vàng) = ( T(vàng, cháy nắng), T(vàng, không cháy nắng))
89'!'':;
89'!''!6<':1
89'!''!6<':1
&=!:,
!
'/1>;1>;/?#7?#7
Thuật toán Quinlan

Töông töï

,
!
/?>@@>@/?0=A

89'!':@

89'!'!6<':?

89'!'!6<':@B


,
!
=+/0>0?>0/0?=A

C=A+D3!'1
Thuật tốn Quinlan

Các thuộc tính khác được tính tương tự

,
"#"
"/?>11>1/?0

,
"#"
# /1>@0>@

,
"#"
/0>@1>@

,
"#$%
$E/0>10>1

,
"#$%
# /0>@1>@


,
"#$%
$%/0>@1>@
V
Kem
(Có) = (3/3,0/3) = (1,0)
V
Kem
(Không) = (3/5,2/5)
Thuật tốn Quinlan

Như vậy thuộc tính màu tóc có số vector đơn vò
nhiều nhất nên sẽ được chọn để phân hoạch

Phân hoạch theo tóc vàng (P
vàng
) là còn chứa
những người cháy nắng và không cháy nắng.

EED'6#

3=%999E=!!D3
'E(chiều cao, cân nặng, dùng kem)#
Thuật tốn Quinlan

Trong phân hoạch P
vàng
, tập dữ liệu của chúng ta
còn lại là :
 Ch.Cao "

$%
&'
(
)*+
Sarah T.Bình Nhẹ Không Cháy
Dana Cao
T.Bình
Có Không
Annie Thấp
T.Bình
Không Cháy
Kartie Thấp
Nhẹ
Có Không
Thuật tốn Quinlan

V
C.Cao
(Cao) = (0/1,1/1) = (0,1)

V
C.Cao
(T.B) = (1/1,0/1) = (1,0)

V
C.Cao
(Thấp) = (1/2,1/2)

V
C.Nặng

(Nhẹ) = (1/2,1/2)

V
C.Nặng
(T.B) = (1/2,1/2)

V
C.Nặng
(Nặng) = (0,0)

V
Kem
(Có) = (0/2,2/2) = (0,1)

V
Kem
(Không) = (2/2,0/2) = (1,0)
Thuật tốn Quinlan

2 thuộc tính dùng kem và chiều cao đều có 2 vector đơn vò.
Tuy nhiên, số phân hoạch của thuộc tính dùng kem là ít
hơn nên ta chọn phân hoạch theo thuộc tính dùng kem. Cây
đònh danh cuối cùng:
&'

Không
Dana
Kartie
Sarah
Annie

F'!
Alex
Peter
John
Sarah
Dana
Annie
Kartie
Emmile

×