Tải bản đầy đủ (.pdf) (27 trang)

Tổng quan về mạng Neural Network trong phân tích ảnh pdf

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (299.71 KB, 27 trang )

- 1 -
Tổng quan về mạng Neural Network
trong phân tích ảnh
Trịnh Vũ Long Giao
MSSV: 0211053
Lớp: 02TT1
Khoa: Toán – Tin Học
Trường: ðH KHTN
- 2 -
Mục Lục
TổNG QUAN 3

GIớI THIệU Về MạNG NEURAL 3

Giới thiệu 3

Xấp xỉ hàm số 4

Hệ thống ñộng (Dynamic) và chuỗi thời gian (Time Series) 4

Phân loại (Classification) và nhóm (Clustering) 5

MÔ HÌNH TUYếN TÍNH (LINEAR MODELS) 5

MÔ HÌNH TRựC GIÁC (PERCEPTRON) 6

Thuật toán Huấn luyện 7

FEEDFORWARD VÀ RADIAL BASIS FUNCTION NETWORKS 7

Mạng neural Feedforward (FF) 7



Mạng ña lớp 9

Ví dụ 9

Mạng Radial Basis Network (RBF) 12

Huấn luyện mạng Feedforward và Radial Basis Function 14

Levenberg-Marquardt 15

Gauss-Newton 15

Giảm dốc nhất (Steepest Descent) 15

Lan truyền ngược (Backpropagation) 16

Ví dụ minh so sánh các phương pháp huấn luyện khác nhau 16

MạNG NEURAL ðộNG (DYNAMIC) 19

MạNG HOPFIELD 21

Mạng Hopfield rời rạc thời gian 22

Mạng Hopfield Liên tục thời gian 23

MạNG KHÔNG GIÁM SÁT (UNSUPERVISED) VÀ MạNG VECTOR LƯợNG Tử HÓA (QUANTIZATION) (VQ) 23

CÁC MINH HọA CƠ BảN 24


BÀI TOÁN PHÂN LOạI (CLASSIFICATION) 25

XấP Xỉ HÀM Số (FUNCTION APPROXIMATION) 26

THAM KHảO: 27

- 3 -
Tổng quan
Giới thiệu về mạng Neural
Giới thiệu
• Mạng neural ñược xem như là 1 hàm số với tham số có thể ñiều chỉnh cho thích
hợp.
o Dữ liệu nhập ñược ký hiệu là x là 1 vector dòng giá trị thực với chiều hoặc
ñộ dài tùy ý. 1 cách thông thừơng x chỉ dữ liệu nhập, vector nhập, giá trị
hồi quy (regressor), hoặc vector mẫu (pattern vector). ðộ dài vector chỉ số
nút nhập của mạng.
o Dữ liệu xuất ñược ký hiệu là
ˆ
y
là xấ
p x

c

a giá tr

ra lý t
ưở
ng. là 1 vector

giá tr

th

c có 1 hay nhi

u ph

n t

ch

s

nút ra c

a m

ng.
o
Thông th
ườ
ng t

p d

li

u bao g


m nhi

u c

p d

li

u nh

p-xu

t. x và y
bi

u di

n b

i ma tr

n v

i 1 vector nh

p vector xu

t

m


i dòng.

m

ng neural là 1 c

u trúc bao hàm các quan h

các tr

ng s

c

a neurons, hay các
ñơ
n v

(units) v

i các phép bi
ế
n
ñổ
i vô h
ướ
ng không tuy
ế
n tính và tuy

ế
n tính.

Minh h

a ví d

v

m

ng neural 1 l

p

n v

i 3 nút nh

p, x = {x
1
,x
2
,x
3
} và nút giá
tr

l


ch (unity bias) n

i vào 2 neuron trong l

p

n. 2 giá tr

ra t

l

p

n cùng v

i
giá tr

l

ch
ñượ
c
ñư
a vào 1 neuron

l

p xu


t tính ra giá tr

xu

t vô h
ướ
ng
ˆ
y
.
L

p ch

a các neuron g

i là l

p

n vì giá tr

xu

t c

a nó không c

n xu


t ra tr

c
ti
ế
p trong d

li

u. các ki

u
ñặ
t tr
ư
ng c

a m

ng neural
ñượ
c
ñề
c

p trong ph

n
mạng Feedforward và Radial Basis Function

.
Các m
ũ
i tên t
ượ
ng tr
ư
ng cho các tham s

giá tr

th

c hay tr

ng s

c

a m

ng.

1 neuron là 1 c

u trúc
ñể
x

lý các nút nh


p, bao g

m c

giá tr

l

ch, theo h
ướ
ng
không tuy
ế
n tính, cho ra 1 giá tr

xu

t.
ðồ
ng th

i, t

t c

các nút nh

p
ñư

a vào
neuron
ñượ
c gia t

thêm b

i các tr

ng s

. sau
ñ
ó l

y t

ng và
ñư
a vào hàm s


không tuy
ế
n tuy
ế
n g

i là hàm ho


t
ñộ
ng
σ
.
- 4 -

Nh
ư
minh h

a

hình trên, giá tr

xu

t c

a m

ng d
ượ
c tính nh
ư
sau:

trong
ñ
ó các tr


ng s


1 1 2 2
, , 1
{ , , , }
i j i j
w b w b


Eq (1) là 1 ánh x

không tuy
ế
n tính x

ˆ
y
,

d

ng rút g

n, ánh x


ñượ
c vi

ế
t:

Trong
ñ
ó
θ
là vector giá tr

th

c có các ph

n t

là các tham s

(tr

ng s

) c

a
m

ng.

M


c tiêu c

a vi

c hu

n luy

n m

ng là tìm giá tr

tham s


θ
thích h

p
ñể
v

i d


li

u nh

p x b


t k

có ra 1 giá tr


ˆ
y
x

p x

g

n v

i y nh

t. các thu

t toán hu

n
luy

n s

l

p nhi


u b
ướ
c v

i vector tham s

kh

i t

o
θ

ñượ
c c

p nh

t t

t h

p
trong m

i b
ướ
c l


p.

Tr
ướ
c khi m

ng
ñượ
c ch

p nh

t, c

n có b
ướ
c ki

m nghi

m (validate). Ngh
ĩ
a là
m

ng s


ñượ
c ch


y th

v

i 1 s

d

li

u
ñ
ã bi
ế
t.
ðơ
n gi

n và t

t nh

t là th


nghi

m m


ng v

i t

p d

li

u mà không có trong d

li

u
ñượ
c hu

n luy

n và d


li

u này v

i d

li

u hu


n luy

n
ñượ
c t

o ra trong cùng các
ñ
i

u ki

n t
ươ
ng t


nhau. Vi

c hu

n luy

n m

ng th
ườ
ng th


t b

i trong b
ướ
c ki

m nghi

m, trong
tr
ườ
ng h

p này, ta ph

i ch

n mô hình t

t h
ơ
n. Tuy nhiên,
ñ
ôi khi ta ch

c

n l

p l


i
b
ướ
c hu

n luy

n v

i giá tr

tham s

kh

i t

o
θ
khác. M

t khi m

ng neural
ñ
ã
ñượ
c ki


m nghi

m thành công, m

ng có th


ñượ
c
ñư
a vào s

d

ng.
Xấp xỉ hàm số

Khi d

li

u nh

p b

t ngu

n t

1 hàm s


v

i các nút xu

t giá tr

th

c trong 1
kho

ng liên t

c, m

ng neural
ñượ
c xem nh
ư
là s

x

p x

hàm s

truy


n th

ng. 1
ví d

c

a bài toán x

p x

là nhi

t
ñộ
c

a 1
ñố
i t
ượ
ng có th


ñượ
c tính b

ng
ñộ
b


c
x

. ví d

thông th
ườ
ng khác là c

giày có th


ướ
c l
ượ
ng t

chi

u cao c

a ng
ườ
i
mang. 2 ví d

này liên quan
ñế
n mô hình m


ng v

i 1 nút nh

p vào 1 nút xu

t. 1
mô hình m

nh h
ơ
n

ví d

2 là dùng gi

i tính nh
ư
nút nh

p th

2
ñể

ướ
c l
ượ

ng
chính xác h
ơ
n.

Các hàm s

thu

n túy có th


ñượ
c x

p x

b

i 2 ki

u m

ng neural:
o
Feedforward Neural Networks
o
Radial Basis Function Networks
Hệ thống ñộng (Dynamic) và chuỗi thời gian (Time
Series)


D

li

u vào ph

thu

c th

i gian, c

n
ñế
n “b

nh

” (memory) nên
ñượ
c nói
ñế
n
nh
ư
là h

th


ng
ñộ
ng.
- 5 -

thông tin quá kh


ñượ
c dùng
ñể
d


ñ
oán tr

ng thái t
ươ
ng lai.

Ví d

: d


ñ
oán giá c

; mô t


i t

c
ñộ
máy d

a vào
ñ
i

n áp và t

i tr

ng
o
Ví d

1: time-series không có d

li

u nh

p.
o
Ví d

2: 2 d


li

u nh

p là
ñ
i

n áp và t

i tr

ng.

M

ng neural
ñộ
ng có th

dùng FF hay RBF và c

n b

nh

cho thông tin quá kh

.

Phân loại (Classification) và nhóm (Clustering)

Phân lo

i d

li

u vào trong danh m

c, l

p d

a trên t

p các
ñặ
t tr
ư
ng riêng.

G

i là m

ng phân lo

i (network classifier).


Hu

n luy

n dùng d

li

u vào t

các l

p khác nhau, d

li

u ra là vectors ch

ra
thu

c l

p nào.

D

li

u ra th

ườ
ng là vector các l

p trong
ñ
ó 1 ch

ra d

li

u thu

c l

p và 0 cho t

t
c

l

p còn l

i.

Các ki

u m


ng th
ườ
ng dùng
ñể
gi

i bài toán phân lo

i:
o
Perceptron
o
Vector Quantization (VQ) Networks
o
Feedforward Neural Networks
o
Radial Basis Function Networks
o
Hopfield Networks
Mô hình tuyến tính (Linear Models)

Minh h

a mô hình tuy
ế
n tính:

x
1
, x

2
, …, x
n
là các nút nh

p,
ˆ
y
là nút xu

t. m

i m
ũ
i tên
ñạ
i di

n trong s

t
ươ
ng

ng các nut.
- 6 -

Bi

u di


n b

ng ph
ươ
ng trình:


Mô hình tuy
ế
n tính v

i nhi

u nút xu

t:

Mô hình trực giác (Perceptron)

Là d

ng
ñơ
n gi

n nh

t c


a m

ng neural. Th
ườ
ng
ñượ
c dùng trong vi

c phân lo

i.

Minh h

a mô hình tr

c giác v

i các nút nh

p x
1
, x
2
, …, x
n
và 1 nút xu

t
ˆ

y
:


nút xu

t
ñượ
c tính b

ng công th

c:

trong
ñ
ó {w
1
, w
2
, …, w
n
} là tr

ng s

c

a nút nh


p, b là
ñộ
d

c (bias weigth). M

i
tr

ng s


ñạ
i di

n b

i m
ũ
i tên trong hình trên.
Hàm UnitStep tr

v

0 cho các giá tr

nh

h
ơ

n 0, ng
ượ
c l

i tr

v

1. Do
ñ
ó nút
nh

p
ˆ
y
có giá tr

0 hay 1 tùy theo giá tr

t

ng tr

ng s

. Cho nên mô hình tr

c
giác ch


ra 2 l

p t
ươ
ng

ng 2 giá tr

xu

t.

Trong quá trình hu

n luy

n, các tr

ng s

(nút nh

p và
ñộ
d

c)
ñượ
c

ñ
i

u ch

nh
ñể

giá tr

nh

p ánh x

chính xác
ñế
n 2 l

p.
- 7 -
Thuật toán Huấn luyện

Mô hình tr

c giác
ñượ
c bi

u di


n b

ng tham s

b

i {w, b}. w là vector c

t có
ñộ

dài b

ng chi

u vector nh

p x.

Vector nh

p x = {x
1
,x
2
,…,x
n
}, nút xu

t

ñượ
c bi

u di

n:


N
ế
u x là ma tr

n v

i m

i dòng là 1 vector thì
ˆ
y
là vector c

t có giá tr

t
ươ
ng

ng
cho m


i dòng.

{w, b} nh

n
ñượ
c trong các b
ướ
c l

p hu

n luy

n m

ng v

i các c

p d

li

u nh

p –
xu

t

ñ
ã xác
ñị
nh. M

i vector nh

p là 1 dòng ma tr

n x, m

i nút xu

t là 1 dòng c

a
vector dòng
ˆ
y
.

Cho N c

p, vi

c hu

n luy

n m


ng
ñượ
c
ñị
nh ngh
ĩ
a nh
ư
sau:

Trong
ñ
ó i là các b
ướ
c l

p,
η

ñộ
l

n b
ướ
c nh

y và
ε
i

=y-
ˆ
y
(x,w
i
,b
i
) là vector c

t
N ph

n t

sai s

t
ươ
ng

ng N d

li

u m

u trong t

p hu


n luy

n. Ph

n t

c

a
vector sai s

có th

là 1 trong 3 giá tr

0, -1, 1.

m

i b
ướ
c l

p i, 0 ch

ra d

li

u

m

u phân lo

i chính xác, các giá tr

còn l

i là không chính xác.

Vi

c huy
ế
n luy

n s

d

ng khi t

t c

các tr

ng s

{w,b}
ñựơ

c c

p nh

t sao cho t

t
c

d

li

u m

u
ñề
u
ñựơ
c phân lo

i chính xác ho

c b
ướ
c l

p i ti
ế
n

ñế
n gi

i h

n
i
max
.
• ðộ
l

n b
ướ
c nh

y
η
hay còn g

i là t

c
ñộ
h

c (learning rate) có giá tr

m


c
ñị
nh:

m

c dù giá tr


η
càng l

n có th

t
ă
ng t

c
ñộ
h

c, tuy nhiên c
ũ
ng có th

gây ra s


dao

ñộ
ng làm có th

làm ch

m s

h

i t

.

Feedforward và Radial Basis Function Networks
[introduction…]
Mạng neural Feedforward (FF)

Ph

bi
ế
n và

ng d

ng r

ng rãi nh

t.

ñượ
c bi
ế
t v

i tên g

i khác là m

ng tr

c giác
nhi

u l

p (multi-layer perceptrons)
- 8 -

Minh h

a m

ng FF 1 l

p

n v

i các nút nh


p x
1
, x
2
, …, x
n
và 1 nút xu

t
ˆ
y


m

ng
ñượ
c chia thành nhi

u l

p. l

p nh

p bao g

m các nút nh


p, l

p

n bao g

m
các neuron

n
ñặ
t song song. M

i neural bi

u di

n t

ng tr

ng các nút nh

p sau
ñ
ó
ñượ
c
ñư
a vào hàm ho


t
ñộ
ng
σ
(activation function) còn
ñượ
c g

i là hàm neural.

Bi

u di

n toán h

c:
1
n
j j j
j
w x b
σ
=
 
+
 
 



trong
ñ
ó tr

ng s

{w
j
, b
j
} t
ượ
ng tr
ư
ng b

ng các m
ũ
i tên h
ướ
ng vào neuron.

Nút xu

t b

ng t

ng tr


ng
ñầ
u ra c

a các neuron. T

p các nút xu

t g

i là l

p xu

t.

D

li

u xu

t c

a m

ng
ñượ
c tính b


i công th

c:

n là s

nút nh

p, nh là s

neuron trong l

p

n. các bi
ế
n {
1
,
i j
w
,
1
,
j i
b
,
2
i

w
,
2
b
}
ñượ
c
g

p chung trong vector
θ
. M

t cách t

ng quát, mô hình m

ng neural
ñượ
c vi
ế
t
d
ướ
i d

ng rút g

n g(
θ

,x) .

Trong quá trình hu

n luy

n m

ng. các tham s

s


ñượ
c
ñ
i

u chính t
ă
ng d

n cho
ñế
n khi d

li

u m


u th

a ánh x

mong mu

n nh

t, t

c là
ˆ
( )
y
ϑ
ñạ
t
ñế
n y chính xác
nh

t có th

trong gi

i h

n s

các b

ướ
c l

p.

Hàm ho

t
ñộ
ng phi tuy
ế
n th
ườ
ng
ñượ
c ch

n là hàm có b
ướ
c nh

y m

n (smooth
step function). Ph

bi
ế
n nh


t là hàm sigma

- 9 -
ñồ
th

là:

Mạng ña lớp

Hình minh h

a m

ng có 2 l

p

n v

i nhi

u nút xu

t:


S

các l


p

n và s

neuron

n là các tham s

do ng
ườ
i dùng thi
ế
t k
ế
. 1 quy t

c
chung là ch

n các tham s

sao cho mô hình kh

thi nh

t v

i ít các tham s


nh

t có
th

. Trong th

c t
ế
, quy t

c này không ph

i luôn t

t, mà ta c

n th

v

i nhi

u m

u
l

a ch


n khác nhau, so sánh các k
ế
t qu


ñể
ch

n ra mô hình m

ng phù h

p nh

t
cho bài toán.

Trong nhi

u

ng d

ng th

c t
ế
, m

ng 1 ho


c 2 l

p

n là v

a
ñủ
.

Giá tr

xu

t c

a các neuron trong hình trên là tuy
ế
n tính, không có hàm ho

t
ñộ
ng
phi tuy
ế
n tính
ñượ
c tính sau khi l


y t

ng tr

ng s

.
ñ
i

u này t

t trong các bài toán
h

th

ng
ñộ
ng và dãy th

i gian (dynamic và time series). Tuy nhiên n
ế
u dùng
m

ng FF trong các bài toán phân lo

i, s


thu

n l

i n
ế
u các giá tr

xu

t c

a neuron
là không tuy
ế
n tính. Mô t

s


ñượ
c di

n gi

i trong ví d

dùng m

ng FF cho bài

toán phân lo

i. (example)
Ví dụ

Quy
ướ
c:
o ðể
hu

n luy

n m

ng c

n 1 t

p d

li

u
1
{ , }
N
i i i
x y
=

ch

a N c

p d

li

u nh

p -
xu

t.
ñượ
c bi

u di

n d
ướ
i d

ng ma tr

n, trong
ñ
ó x
i
là vector trên dòng th



i c

a ma tr

n d

li

u nh

p, y
i
là vector trên dòng i c

a d

li

u xu

t.
Ví d

: 20 c

p, vector x
i


ñộ
dài 1, vectory y
i

ñộ
dài 2.
x =
- 10 -
y =

o
Trong bài toán phân lo

i, d

li

u nh

p
ñượ
c g

i là vector m

u. M

i dòng
c


a d

li

u nh

p x ch

a 1 vector m

u, và dòng t
ươ
ng

ng trong d

li

u
xu

t y ch

ra chính xác l

p c

a vector m

u. ma tr


n y có m

i c

t t
ươ
ng

ng 1 l

p, trên m

i dòng,

ng v

i l

p chính xác có giá tr

1, còn l

i mang
giá tr

0. N
ế
u bài toán phân lo


i ch

có 2 l

p, ta c
ũ
ng có th

ch

dùng 1 c

t,
ch

ra l

p v

i giá tr

0 ho

c 1.
Ví d

:
vector m

u x

25
=
t
ươ
ng

ng y
25
= nên m

u thu

c l

p 2.

D

li

u m

u bao g

m 3 l

p, m

i l


p phân thành 2 nhóm. x là d

li

u nh

p, y ch


ra l

p t
ươ
ng

ng.


Trong bài toán phân l

ai,
ñ
i

m quan tr

ng là s

không tuy
ế

n tính khác nhau

nút
ra trong m

ng FF. m

c
ñ
ích c

a không tuy
ế
n tính là ch

c r

ng giá tr

xu

t n

m
bên trong vùng phân l

p khác nhau. chúng ta s

dùng hàm Sigma
ñể

bão hòa các
giá tr

là 0 ho

c 1 chính xác v

i d

li

u xu

t c

a l

p. Chú ý r

ng hàm Sigma
không bao gi

ti
ế
n
ñế
n chính xác giá tr

0, 1.


Hu

n luy

n m

ng FF v

i 8 b
ướ
c l

p:

- 11 -

Sau khi
ñượ
c hu

n luy

n v

i t

p d

li


u m

u, áp d

ng th

cho 2 vector nh

p:
nh

p:
xu

t:
vector d

li

u t
ươ
ng

ng v

i l

p mà có giá tr

l


n nh

t. n
ế
u vector xu

t có nhi

u
ph

n t

mang giá tr

l

n nh

t, ho

c không có ph

n t

nào thì h

th


ng phân lo

i
ñượ
c xem nh
ư
không
ñ
áng tin c

y
ñố
i v

i d

li

u
ñượ
c dùng.

Bi

u di

n h

th


ng phân lo

i b

ng
ñồ thị ñường biên
:


Chúng ta c
ũ
ng có quan sát
ñồ thị hàm phân loại
. có 3
ñồ
th



ng v

i 3 l

p. các
ñườ
ng biên (bi

u di

n


trên)

ng v

i
ñườ
ng cong c

t m

t t

i giá tr

xu

t 0.5:

- 12 -

Minh h

a quá trình hu

n luy

n:

Mạng Radial Basis Network (RBF)


Minh h

a m

ng neural v

i các n nút nh

p và 1 nút xu

t.
ñầ
u ra c

a neuron
ñượ
c
ñư
a vào hàm basis function. Nút xu

t c

a m

ng
ñượ
c tính b

ng các l


y t

ng tr

ng
- 13 -
s

các neuron.


M

ng RBF th
ườ
ng bao g

m c

ph

n tuy
ế
n tính.
ðượ
c vi
ế
t b


ng ph
ươ
ng trình nh
ư

sau:

nb là s

neuron, m

i neuron có 1 hàm basis. Tham s

m

ng RBF bao g

m t

p các
v

trí
1
i
w
c

a các hàm basis là ngh


ch
ñả
o
ñộ
dài
i
λ
c

a hàm basis, tr

ng s


2
i
w
c

a
t

ng xu

t, và các tham s

c

a các thành ph


n tuy
ế
n tính
χ
1,

χ
2,…,

χ
n
.

Các tham s


ñượ
c g

p chung thành
θ
trong d

ng thu g

n g(
θ
,x), g là hàm m

ng và

x là d

li

u nh

p.

Trong quá trình hu

n luy

n, các tham s


ñượ
c
ñ
i

u ch

nh
ñể
d

li

u m


u
ñ
úng v

i
Eq. (10) t

t nh

t có th

. Quy trình hu

n luy

n s


ñượ
c mô t



ph

n ti
ế
p theo.

Trong Eq. (10), hàm basis

ñượ
c ch

n là hàm Gaussian, tuy nhiên có th

ch

n 1
hàm khác.

Minh h

a m

ng RBF v

i nhi

u nút xu

t:

- 14 -
Huấn luyện mạng Feedforward và Radial Basis Function

Cho m

ng v

i d


li

u m

u g

m N c

p d

li

u xu

t – d

li

u nh

p (
1
( , )
N
i i i
x y
=
. Sai
s


bình ph
ươ
ng trung bình (MSE)
ñượ
c
ñị
nh ngh
ĩ
a nh
ư
sau:


Vi

c hu

n luy

n m

ng là tìm ra tham s


θ
phù h

p nh


t.
θ

ñượ
c
ñ
ánh giá t

t khi
MSE là nh

nh

t:


thông th
ườ
ng sai s

c
ă
n bình ph
ươ
ng trung bình (RMSE) th
ườ
ng
ñượ
c dùng khi
ướ

c l
ượ
ng mô hình trong và sau khi hu

n luy

n, RMSE
ñượ
c so sánh tr

c ti
ế
p v

i
giá tr

xu

t. giá tr

RMSE
ñượ
c ghi nh

n l

i minh h

a quá trình hu


n luy

n b

ng
ñồ
th

.


Có nhi

u thu

t toán
ñể
hu

n luy

n m

ng. các thu

t toán b

t
ñầ

u v

i tham s

kh

i
t

o
θ
0
, quá trình hu

n luy

n s

làm gi

m MSE

các b
ứơ
c l

p b

ng cách c


p nh

t
θ
t
ă
ng d

n theo h
ướ
ng làm gi

m d

c (gradient) c

a MSE:


R có th

làm
ñổ
i h
ướ
ng tìm ki
ế
m t

h

ướ
ng gi

m d

c sang h
ướ
ng khác có l

i h
ơ
n.
Tham s


µ

ñ
i

u ch

nh
ñộ
l

n m

i l


n c

p nh

t
θ
cho b
ướ
c l

p i và gi

m giá tr


MSE. Vi

c ch

n R và
µ
khác nhau tùy theo các thu

t toán hu

n luy

n.

N

ế
u R
ñượ
c ch

n là ngh

ch
ñả
o Hessian c

a hàm MSE. Hessian
ñượ
c tính nh
ư

sau:

Eq. (15) là d

ng c

a thu

t toán Newton. N
ế
u Hessian không xác
ñị
nh,
θ


ñượ
c c

p
nh

t theo h
ướ
ng t
ă
ng d

c mà s

làm t
ă
ng giá tr

MSE. Có th

tránh b

ng cách
dùng các R khác nhau. Thu

t toán GN gi

ng v


i Newton v

i ph

n cu

i
ñượ
c l
ượ
c
b

, ph

n
ñầ
u c

a Eq. (15):


V

i H
ñ
ã
ñượ
c
ñị

nh ngh
ĩ
a, các ph
ươ
ng pháp tìm ki
ế
m có th

ch

n 1 trong các
thu

t toán sau:
o
Levenberg-Marquardt
o
Gauss-Newton
o
(Gi

m d

c nh

t) Steepest-descent
o
(Lan truy

n ng

ượ
c) Backpropagation
- 15 -
Levenberg-Marquardt

Thu

t toán Levenberg-Marquardt (LMA) n

i suy gi

a Gauss-Newton (GNA) và
ph
ươ
ng pháp gi

m d

c. LMA thông d

ng h
ơ
n so v

i GNA, trong nhi

u tr
ườ
ng
h


p nó tìm ra giá tr

c

c ti

u r

t nhanh.

Thay vì l

a ch

n
ñộ
l

n
µ

ñể

ñả
m b

o
ñ
i theo h

ướ
ng xu

ng d

c

m

i b
ướ
c l

p
Eq (14), ma tr

n
ñườ
ng chéo
ñượ
c thêm vào H

Eq. (16), R
ñượ
c ch

n nh
ư
sau:



µ
=1.

Giá tr


λ
s


ñượ
c ch

n t


ñộ
ng
ñể
sinh ra b
ướ
c xu

ng d

c.

m


i b
ướ
c l

p, thu

t
toán s

c

gi

m giá tr

c

a
λ
b

ng cách t
ă
ng
∆λ
. N
ế
u giá tr

hi


n t

i c

a
λ

không làm gi

m MSE

Eq. (14) thì
λ
s


ñượ
c làm t
ă
ng trong các b
ướ
c ti
ế
p theo
v

i giá tr



∆λ
cho
ñế
n khi MSE gi

m.

Vi

c hu

n luy

n s

b

d

ng n
ế
u x

y ra 1 trong các
ñ
i

u ki

n sau:

o λ
>10
∆λ
+Max[s]
o

s là
ñộ
dài vector giá tr

riêng l

n nh

t c

a H

Giá tr


λ
l

n t

o ra các tham s

t
ă

ng ch

y
ế
u theo h
ướ
ng gi

m d

c
Gauss-Newton

Nhanh, và m

nh,
ñượ
c dùng trong nhi

u bài toán c

c ti

u khác nhau. Tuy nhiên
n
ế
u m

ng neural có Hessian
ñ

i

u ki

n y
ế
u, t

c là
ñộ
dài vector riêng n

m trong
kho

ng r

t l

n, thu

t toán s

làm ch

m quá trình h

c
ñ
áng k


.

Thu

t toán h

c dùng ph
ươ
ng pháp Gauss-Newton v

i ma tr

n R
ñượ
c ch

n là
ngh

ch
ñả
o c

a H trong Eq. (16) nh
ư
sau:

• ở
m


i b
ướ
c l

p, tham s


ñộ
dài b
ướ
c nh

y
ñượ
c s


µ
=1 n
ế
u MSE trong Eq. (11)
gi

m, ng
ượ
c l

i
µ


ñượ
c chia
ñ
ôi cho
ñế
n khi t

o ra b
ướ
c
ñ
i xu

ng d

c. Sau
ñ
ó
thu

t toán s

ti
ế
p t

c v

i b

ướ
c l

p k
ế
.

Vi

c hu

n luy

n s

b

d

ng n
ế
u x

y ra 1 trong các
ñ
i

u ki

n sau:

o

o

Giảm dốc nhất (Steepest Descent)

Eq. (14) gi

m d

c nh

t khi
- 16 -

Có ngh
ĩ
a là vector tham s


θ

ñượ
c c

p nh

t theo h
ướ
ng gi


m d

c c

a MSE

Eq.
(13)
• ở
m

i b
ướ
c l

p,
µ

ñượ
c nhân
ñ
ôi, n
ế
u MSE không gi

m,
µ
s



ñượ
c chia
ñ
ôi cho
ñế
n khi làm gi

m.
• ð
i

u ki

n dùng

ph
ươ
ng pháp này t
ươ
ng t

ph
ươ
ng pháp Gauss-Newton.

So sánh v

i 2 ph
ươ

ng pháp tr
ướ
c thì ph
ươ
ng pháp này c

n ít s

tính toán h
ơ
n


m

i b
ướ
c l

p b

i không có ma tr

n ngh

ch
ñả
o. tuy nhiên l

i không hi


u qu

b

ng
2 ph
ươ
ng pháp trên.
Lan truyền ngược (Backpropagation)

Ph
ươ
ng pháp lan truy

n ng
ượ
c t
ươ
ng t

gi

m d

c nh

t. v

i

ñ
i

m khác bi

t là
µ

ñượ
c gi

c


ñị
nh trong su

t quá trình h

c.
µ

ñượ
c ch

n m

c
ñị
nh b


ng 0.1.

Luy

n m

ng trong Eq. (24) có th


ñượ
c m

r

ng thêm v

i tham s

mômen
α
:


giá tr

m

c
ñị

nh c

a
α

ñượ
c ch

n là 0.

Vi

c dùng mômen là c

n thi
ế
t
ñể
tránh c

c ti

u
ñị
a ph
ươ
ng.

T


t h
ơ
n nên ch

n các ph
ươ
ng pháp hu

n lu

n khác và l

p l

i quá trình h

c nhi

u
l

n v

i tham s

kh

i t

o khác nhau.

Ví dụ minh so sánh các phương pháp huấn luyện khác
nhau

Trong minh h

a này m

ng ch

có 2 tham s

,
ñể
ta có th

bi

u di

n
ñượ
c b

ng
ñồ

th

, RMSE
ñượ

c bi

u di

n nh
ư
m

t cong.

Hàm minh h

a
ñượ
c ch

n có 1 nút nh

p và 1 nút xu

t v

i tham s


ñ
úng là 2 và -1.

Hình minh h


a các tham s

lân c

n v

i tham s

c

c ti

u (2, -1).

- 17 -

Ch

n tham s

kh

i t

o là (-0.5, -5).

Ph
ươ
ng pháp
Levenberg-Marquardt



o
Mô hình 3D:

tr

c x, y bi

u di

n 2 tham s

, tr

c chi

u cao z bi

u di

n giá tr

RMSE
t
ươ
ng

ng.
o ở

các b
ướ
c l

p,
ñ
i

m t
ươ
ng

ng
ñượ
c tô
ñ
en, n

i liên t

c b

ng các
ñườ
ng
th

ng minh h

a

ñườ
ng qu


ñạ
o. quá trình hu

n luy

n h

i t

sau 5 b
ướ
c
l

p.

Ph
ươ
ng pháp
Gauss-Newton


- 18 -
o
Mô hình 3D:


o
Thu

t toán h

i t

sau 7 b
ướ
c l

p.

Ph
ươ
ng pháp
Steepest Descent Method

o
Mô hình 3D:

o
M

ng s

không h

i t


trong 30 b
ướ
c, tuy nhiên
ñ
i

u này không quan
tr

ng, tham s

ch

c

n
ñặ
t
ñượ
c
ñủ
g

n giá tr

h

i t

.

o
Minh h

a cho th

y càng
ñế
n g

n
ñ
i

m h

i t

t

c
ñộ
càng ch

m. Ph
ươ
ng
pháp Gi

m d


c nh

t cho th

y s

h

i t

di

n ra ch

m h
ơ
n so v

i 2 ph
ươ
ng
pháp trên.

Ph
ươ
ng pháp
Backpropagation

o
Thu


t toán
ñ
òi h

i ch

n
ñộ
l

n b
ướ
c nh

y và giá tr

mômen mà ko ph

i d


dàng
ñể
ch

n ra giá tr

thích h


p.
ñ
i

u này không quan tr

ng
ñố
i v

i các
ph
ươ
ng pháp khác b

i kh

n
ă
ng t


ñ
i

u ch

nh kích th
ứơ
c b

ướ
c nh

y. vi

c
- 19 -
ch

n giá tr

ban
ñầ
u c

a các tham s

s



nh h
ưở
ng
ñế
n t

c
ñộ
h


i t

.

o
Mô hình 3D:

o
B

i toán t

momen
ñượ
c dùng trong quá trình h

c, tham s


ướ
c l
ượ
ng s


ñ
i lên sát d

c


giá tr

kh

i t

o
Mạng Neural ðộng (Dynamic)


H

th

ng g

m 3 ki

u tín hi

u:
o
tín hi

u xu

t y(t) là tín hi

u có th



ñ
o/quan sát
ñượ
c.
o
tín hi

u vào u(t) là tín hi

u
ñ
o
ñượ
c t

bên ngoài, có

nh h
ưở
ng
ñế
n h


th

ng.
o

tín hi

u nhi

u e(t)

nh h
ưở
ng
ñế
n h

th

ng nh

ng là tín hi

u không
ñ
o
ñượ
c.


Trong h

th

ng 1 vào 1 ra (SISO), tín hi


u là 1 ch

s

ph

thu

c th

i gian.
- 20 -

Trong h

th

ng n vào n ra (MIMO), tín hi

u là 1 vector ph

thu

c th

i gian.

N
ế

u không có tín hi

u vào h

th

ng
ñượ
c xem là bài toán d

doán dãy th

i gian
(time series prediction). H

th

ng
ñượ
c g

i là loan truy

n nhi

u (noise driven) vì
tín hi

u xu


t ch

b



nh h
ưở
ng b

i nhi

u e(t).


H

th

ng m

ng neural dynamic bao g

m:
o
T

p h

p m


ng neural FF ho

c RBF.
o
Vector tín hi

u hay vào vector h

i quy (regressor vector) g

m giá tr

tr


vào và ra
ñượ
c
ñ
ánh ch

s

n
a
, n
b
, n
k

.

Trong h

th

ng SISO vector nh

p s

là:
( ) [ ( 1) ( ) ( ) ( 1)]
T
a k k b
x t y t y t n u t n u t n n= − − − − − + (22)
ch

m

c n
a
ch

a giá tr

tr

bao lâu c

a tính hi


u xu

t. Ch

m

c n
k
ch

a giá tr

trì
hoãn c

a tính hi

u nh

p so v

i tính hi

u xu

t. ch

m


c n
b
ch

a giá tr

tr

c

a tính
hi

u xu

t.

ðố
i v

i h

th

ng MIMO, giá tr

tính hi

u tr


là 1 vector có
ñộ
dài t
ươ
ng

ng s


tính hi

u ra và vào. Ví d

: 3-out – 2-in: n
a
={1,2,1}, n
k
={2,1}, n
b
={1,0}:
1 2 2 3 1 1 2
( ) [ ( 1) ( 1) ( 2) ( 1) ( 1) ( 2) ( )]
x t y t y t y t y t u t u t u t
= − − − − − −
(t
ươ
ng t

công th


c c

a SISO nh
ư
ng áp d

ng cho 3 nút xu

t và 2 nút nh

p).

ðố
i v

i bài toán chu

i th

i gian, thì ch

có n
a

ñượ
c ch

n.



Giá tr

d


ñ
oán
ˆ
( )
y t
ñượ
c di

n t

nh
ư
sao:
ˆ
( ) ( , ( ))
y t g x t
θ
=
(23)


Mô v

i giá tr


h

i quy nh
ư
Eq. (22)
ñượ
c g

i là mô hình ARX (AutoRegressive with
eXtra input signal). Khi không có tính hi

u vào u(t) giá tr

tr


ñượ
c lo

i tr

t

Eq.
(22)
ñượ
c g

i là mô hình AR.



M

ng neural mô hình ARX d

a trên m

ng FF 1 l

p

n:



Mô hình ARX không có tín hi

u xu

t g

i (n
a
=0) g

i là mô hình FIR (Finite Impulse
Response)

- 21 -



Tính hi

u nhi

u e(t) m

t dù không
ñ
o
ñượ
c, nh
ư
ng v

n có th


ướ
c l
ượ
ng khi mô hình
ñ
ã
ñượ
c hu

n luy

n.

ðượ
c g

i là l

i d


ñ
óan (prediction error) và
ñượ
c
ñị
nh ngh
ĩ
a là:
ˆ ˆ
( ) ( ) ( )
e t y t y t
= −
(24)

ˆ
( )
e t
ñượ
c xem nh
ư
là ch


s

ch

t l
ượ
ng mô hình (càng nh

càng t

t).

Mạng Hopfield


Th
ườ
ng dùng trong các bài toán phân lo

i v

i các vector m

u nh

phân (binary
pattern vector).


M


ng Hopfield
ñượ
c t

o ra b

ng cách cung c

p các vector d

li

u vào - vector
ki

u m

u t
ươ
ng

ng v

i các l

p khác nhau. G

i là các m


u phân lo

i l

p (class
patterns).


Trong không gian d

li

u n chi

u, các m

u phân lo

i l

p có n thành ph

n nh


phân {1,-1} mà m

i m

u t

ươ
ng

ng v

i 1 góc c

a hình kh

i (cube) trong không
gian n chi

u. Th
ườ
ng dùng
ñể
phân lo

i các m

u b

bi
ế
n d

ng vào trong l

p thích
h


p.


Khi m

u bi
ế
n d

ng
ñ
ã
ñượ
c phân lo

i trong m

ng, nó
ñượ
c quy v

1 m

u khác
(associated pattern). N
ế
u m

ng làm vi


c chính xác m

u liên k
ế
t là 1 trong các
m

u phân lo

i l

p. trong 1 vài tr
ườ
ng h

p, c

c ti

u gi

(spurious minima) có th


xu

t hi

n, d


n
ñế
n m

u liên k
ế
t s

không n

m trong các vector m

u.


M

ng Hopfield
ñ
ôi khi c
ũ
ng
ñượ
c g

i là m

ng Liên k
ế

t (associative networks) b

i
nó liên k
ế
t m

u phân lo

i l

p cho m

i m

u d

li

u nh

p.


Ví d

: nh

n d


ng ký t

. ký t

A, I, Y l

n l
ượ
t
ñượ
c ma tr

n hóa 3x4 sau
ñ
ó
ñư
a v


d

ng vector.
ð
ây là các m

u phân lo

i l

p.


x=-{{{1,-1,1},{1,1,1},{1,-1,1},{1,1,1}},
{{-1,1,-1},{-1,1,-1},{-1,1,-1},{-1,1,-1}},
{{-1,1,-1},{-1,1,-1},{1,-1,1},{1,-1,1}}};
ñư
a vào m

ng Hopfield.
t

o các m

u d

li

u nh

p là các ký t

b

nhi

u:

ñư
a vào m

ng

ñ
ánh giá. Tr

v

:
- 22 -

ñố
i v

i d

li

u nh

p
ñượ
c sinh ng

u nhiên:

quan sát d

li

u tr

v


:

không ph

i lúc nào m

ng c
ũ
ng tr

v

1 trong các d

li

u m

u.
ñ
i

u này do g

p
ph

i tr
ườ

ng h

p c

c ti

u gi

.


2 ki

u m

ng Hopfield:
o
Liên t

c th

i gian (Continuous-time).
o
R

i r

c th

i gian (discrete-time).



Ma tr

n tr

ng s


ñượ
c
ñị
nh ngh
ĩ
a là:

D là s

các m

u phân lo

i l

p (class patterns) {
ξ
1
,
ξ
2

, …,
ξ
D
}, các vector m

u
ξ
i

g

m các ph

n t

±1
ñượ
c l
ư
u tr

trong m

ng, n là s

thành ph

n hay chi

u c


a
vector m

u.

Mạng Hopfield rời rạc thời gian

ðố
i v

i m

ng Hopfield r

i r

c th

i gian:

ch

ra 1 tr

ng thái x(t) t

i m

t th


i
ñ
i

m.

m

i b
ướ
c l

p, tr

ng thái
ñượ
c c

p nh

t
ng

u nhiên. Ti
ế
n trình c

p nh


t không
ñồ
ng b

này c

n thi
ế
t
ñể
m

ng h

i t


x(t)=Sign[W x(t)].
B

t
ñầ
u v

i x(0) là m

u bi
ế
n d


ng. l

p cho
ñế
n khi Eq. (26) tr

v

1 m

u liên k
ế
t
khi ph
ươ
ng trình này h

i t

.


ðố
i v

i m

ng Hopfield r

i r


c th

i gian, n
ă
ng l
ượ
ng (energy) c

a 1 vector x nào
ñ
ó
ñượ
c cho b

i:

Eq. (26) h

i t

v

giá tr

có n
ă
ng l
ượ
ng nh


nh

t. do
ñ
ó các c

c ti

u c

a Eq. (27)
t

o ra các
ñ
i

m h

i t

c

a m

ng. Các c

c ti


u này ch

ra các m

u phân lo

i l

p
{
ξ
1
,
ξ
2
, …,
ξ
D
}. Do
ñ
ó có th


ñả
m b

o
rằng mạng Hopfield sẽ luôn hội tụ về 1
- 23 -
mẫu phân loại lớp

, tuy nhiên không th


ñả
m b

o nó h

i t

v

chính xác m

u
ñ
úng.

Mạng Hopfield Liên tục thời gian

ðị
nh ngh
ĩ
a b

ng ph
ươ
ng trình vi phân:

x(t) là vector tr


ng thái m

ng. W các tr

ng s

.
σ
là hàm phi tuy
ế
n tính thay
ñổ
i lên
tr

ng thái x(t). Tr

ng s

W
ñượ
c
ñị
nh ngh
ĩ
a nh
ư
Eq. (25).



Hàm n
ă
ng l
ượ
ng
ñượ
c
ñị
nh ngh
ĩ
a:



Vector x(t) h

i t

v

c

c ti

u n
ă
ng l
ượ
ng

ñị
a ph
ươ
ng (local energy minimum). Do
ñ
ó các c

c ti

u trong Eq. (29) t

o thành các
ñ
i

m h

i t

c

a m

ng Hopfield.
Nh

ng c

c ti


u này
ñồ
ng nh

t v

i các m

u phân lo

i l

p {
ξ
1
,
ξ
2
, …,
ξ
D
}. Tuy
nhiên
không ñảm bảo ñược rằng các cực tiểu này trùng khớp với tập mẫu
phân loại lớp khởi tạo
.
Mạng không giám sát (Unsupervised) và Mạng
vector Lượng tử hóa (Quantization) (VQ)



Thu

t toán không giám sát
ñượ
c dùng
ñể
tìm c

u trúc c

a d

li

u. ví d

nh
ư
tìm
nhóm các
ñ
i

m d

li

u hay tìm ra m

i quan h


1 chi

u trong d

li

u. n
ế
u c

u trúc
t

n t

i nó có th


ñượ
c dùng
ñể
mô t

d

li

u


nhi

u d

ng rút g

n.


H

u h
ế
t các mô hình m

ng
ñượ
c hu

n luy

n v

i thu

t toán giám sát. Có ngh
ĩ
a là
d


li

u xu

t mong mu

n ph

i t

n t

i

ng v

i m

i vector d

li

u nh

p trong d

ng
trong vi

c hu


n luy

n. M

ng không giám sát hay m

ng t

t

ch

c ch

d

a vào d


li

u nh

p
ñể
tìm ra c

u trúc trong không gian d


li

u nh

p. thu

t toán hu

n luy

n
do
ñ
ó
ñượ
c g

i là không giám sát.


Do không có d

li

u ra “chính xác”, nên c
ũ
ng không có “sai”. Do
ñ
ó quy
ế

t
ñị
nh
tùy thu

c vào ng
ườ
i thi
ế
t k
ế
. sau khi hu

n luy

n, c

n ki

m nghi

m c

u trúc nh

n
ñượ
c th

c s



ñạ
i di

n cho d

li

u. Vi

c ki

m nghi

m s

r

t ph

c t

p
ñặ
t bi
ế
t v

i

không gian nhi

u chi

u.
ðố
i v

i các bài toán 2 ho

c 3 chi

u, có th

bi

u di

n d


li

u và c

u trúc b

ng
ñồ
th


. 1 ki

m nghi

m có th

có s

chi

u b

t k


ñể
ki

m tra
kho

ng cách trung bình gi

a các
ñ
i

m d


li

u và tâm nhóm. Kho

ng cách càng
nh

thì d

li

u càng
ñựơ
c
ñạ
i di

n t

t b

i nhóm.


M

ng không giám sát bao g

m m


t s

các vector codebook, mà thi
ế
t l

p nên các
tâm nhóm. Vector codebook có cùng chi

u v

i không gian d

li

u nh

p, các ph

n
t

c

a nó là các tham s

c

a m


ng không giám sát. Vector codebook
ñượ
c g

i là
neron c

a m

ng không giám sát.
- 24 -


Khi m

ng
ñ
ã
ñượ
c hu

n luy

n, v

trí c

a các vector codebook xác
ñị
nh, kho


ng
cách Euclidian trung bình gi

a
ñ
i

m d

li

u
ñế
n vector codebook g

n nh

t là nh


nh

t.


M

ng không giám sát có th


dùng
ñặ
t tr
ư
ng lân c

n (neighbor feature). Mà hình
thành ánh x

t

t

ch

c (self-organizing map) SOM. M

ng SOM không ch


kho

ng cách trung bình gi

a d

li

u và codebook g


n nh

t nh

nh

t, mà còn có
kho

ng cách trung bình nh

nh

t gi

a các vector codebook. Có kh

n
ă
ng
ñị
nh
ngh
ĩ
a m

i quan h

1 ho


c 2 chi

u gi

a các vector codebook, và m

ng không giám
sát nh

n
ñượ
c tr

thành ánh x

không tuy
ế
n tính t

không gian d

li

u g

c
ñế
n
không gian
ñặ

c tr
ư
ng 1 ho

c 2 chi

u
ñượ
c
ñị
nh ngh
ĩ
a b

i các vector codebook.
Ánh x

t

t

chúng th
ườ
ng
ñượ
c g

i là ánh x



ñặ
c tr
ư
ng t

t

ch

c (self-
organizing feature maps) hay m

ng Kohonen.


Khi t

p d

li

u
ñượ
c ánh x

b

i SOM
ñế
n không gian 1 ho


c 2 chi

u, nó có th


ñượ
c minh h

a b

ng
ñộ
th

1 cách tr

c quan.


M

t ki

u m

ng neural khác t
ươ
ng t


v

i m

ng không giám sát là m

ng vector
l
ượ
ng t

(Vector Quantization) VQ th
ườ
ng dùng trong các bài toán phân lo

i.
Gi

ng nh
ư
m

ng không giám sát, m

ng VQ d

a trên t

p các vector codebook.
M


i l

p có 1 t

p con các vector codebook k
ế
t h

p v

i nó, và vector d

li

u
ñượ
c
phân lo

i vào trong l

p có vector phân lo

i codebook g

n nh

t. Vector codebook
th

ườ
ng
ñượ
c g

i là các neuron c

a m

ng VQ.


M

i vector codebook có 1 ph

n không “gian thu

c” v

nó. Nh

ng t

p con này
ñựơ
c t

o ra b


i các
ñ
a giác và
ñượ
c g

i là các ô Voronoi. Trong các bài toán 2
chi

u, ta có th

v


ñượ
c các ô này.


V

trí c

a vector codebook nh

n
ñượ
c b

ng các thu


t toán h

c giám sát. có 2 thu

t
toán toán khác nhau. Ph
ươ
ng pháp h

c Vector L
ượ
ng t

(Learning Vector
Quantization) LVQ
ñ
i

u ch

nh v

c trí c

a các vector codebook dùng c

d

li


u
phân lo

i chính xác và không chính xác. Ph
ươ
ng pháp th

2 là thu

t toán h

c
c

nh tranh, s

d

ng m

ng không giám sát.
ðố
i v

i m

ng VQ thu

t toán hu


n
luy

n này có th


ñựơ
c dùng b

ng cách xét d

li

u và vector codebook c

a 1 l

p
nào
ñ
ó thu

c d

li

u còn l

i và các vector codebook còn l


i. T
ươ
ng ph

n v

i
m

ng không giám sát, d

li

u xu

t bi

u th

l

p chính xác là c

n thi
ế
t,
ñượ
c dùng
ñể
chia d


li

u xu

t vào trong các l

p khác nhau.
Các minh họa cơ bản


M

i bài toán m

ng neural
ñ
i

u th

c hi

n theo 4 b
ướ
c sau:
1.

chu


n b

t

p d

li

u nh

p.
2.

Kh

i t

o m

ng.
3.

Hu

n luy

n m

ng.
- 25 -

4.

ki

m
ñị
nh mô hình.
Bài toán phân loại (Classification)


Bài toán có 2 tham s


ñể
có th

minh h

a
ñượ
c b

ng
ñồ
th

. D

li


u nh

p g

m
tu

i và tr

ng l
ượ
ng tr

em. D

li

u ra
ñạ
i di

n phân l

p mà nh

ng
ñứ
a tr

thu


c
vào. Có 2 l

p trong ví d

này.


Vì d

li

u ra ch

có 2 l

p nên có th


ñượ
c l
ư
u tr

trong 1 c

t, v

i 1 và 0 ch


ra
ñứ
a
tr

thu

c l

n nào.


D

li

u ra y:



Bi

u di

n d

li

u vào b


ng
ñồ
th

:


ðồ
th

cho th

y rõ d

li

u phân thành 2 l

p mà có th


ñượ
c chia ra b

i 1
ñườ
ng
cong.
ðườ

ng cong này s


ñượ
c tìm ra trong quá trình hu

n luy

n. M

ng phân lo

i
thành công s

tr

v


ñ
úng l

p mà nh

ng
ñứ
a tr

thu


c vào cho b

i tu

i và cân
n

ng.


Th
ướ
c
ñ
o
ñộ
phù h

p (measure of fit),
ñượ
c t

i ti

u b

i thu

t toán hu


n luy

n,
ph

i
ñựơ
c ch

n.
ñố
i v

i bài toán phân l

ai, chu

n
ñượ
c gán là s

m

u phân lo

i
sai. M

ng phân lo


i là chính xác n
ế
u chu

n b

ng 0.


M

ng Perception là m

ng phân l

ai
ñơ
n gi

n nh

t,
ñượ
c s

d

ng trong ví d


này.


Quá trình hu

n luy

n
ñượ
c minh h

a nh
ư
sau:

×