Tải bản đầy đủ (.pdf) (75 trang)

Bài Giảng Xử Lý Ảnh_Chương 6: Nhận Dạng Ảnh.

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (5.9 MB, 75 trang )


Chương 6: Nhận Dạng Ảnh




170
Chương 6

NHẬN DẠNG ẢNH
6.1 Giới thiệu
 Có 3 cách tiếp cận nhận dạng ñối tượng:
o Dựa vào phân hoạch không gian
o Dựa vào cấu trúc
o Dựa vào kỹ thuật mạng neural (cơ chế ñoán nhận, lưu trữ, phân biệt ñối
tượng, mô phỏng theo hoạt ñộng hệ thần kinh)
Nhận dạng là quá trình phân loại các ñối tượng biểu diễn theo một mô hình
nào ñó, gán chúng vào 1 lớp dựa theo các quy luật, các mẫu chuẩn.
 Có hai loại nhận dạng:
1. Nhận dạng có thầy (học có giám sát): supervised learning.
2. Nhận dạng không có thầy (học không giám sát): non-supervised learning.
 Các ứng dụng nhận dạng:
o Nhận dạng chữ viết tay (Document Handling)

Hình 6.1 Ảnh chữ viết tay
o Nhận dạng chữ ký (Signature Verification)

Chương 6: Nhận Dạng Ảnh





171

Hình 6.2 Ảnh chữ ký
o Nhận dạng trong lĩnh vực sinh trắc học (Biometrics)

Hình 6.3 Ảnh trong lĩnh vực sinh trắc học

6.1.1 Không gian biểu diễn và diễn dịch
a. Không gian biểu diễn
o X (ảnh, chữ viết, dấu vân tay,…): ñối tượng ñược biểu diễn bằng n thành
phần (n ñặc trưng):
o X={x
1
, x
2
,…, x
n
}; mỗi x
i
biểu diễn 1 ñặc trưng.
o Không gian biểu diễn ñối tượng gọi là không gian ñối tượng ℵ:
ℵ={X
1
, X
2
,…, X
m
}; X
i

biểu diễn 1 ñối tượng.
b. Không gian diễn dịch
o Không gian diễn dịch là tập các tên gọi của ñối tượng.
Ω - tập tên ñối tượng.

Chương 6: Nhận Dạng Ảnh




172
Ω = {w
1
, w
2
,…, w
k
}.
w
i
(i =1, 2,…) là tên các ñối tượng.
o Quá trình nhận dạng ñối tượng f là 1 ánh xạ f: ℵ→Ω với f là tập các quy
luật ñể xác ñịnh 1 phần tử trong ℵ ứng với một phần tử trong Ω.
o Nếu tập hợp các quy luật và tập tên các ñối tượng ñược biết trước, (ví dụ
như nhận dạng chữ viết, có 26 lớp từ A ñến Z), thì gọi là nhận dạng có thầy.
o
Ngược lại gọi là nhận dạng không có thầy (khó hơn).

6.1.2 Mô hình và bản chất của quá trình nhận dạng
a. Mô hình của quá trình nhận dạng

o Mô hình:
Có 2 họ mô tả:
1. Mô tả theo tham số
2. Mô tả theo cấu trúc
o Cách mô tả ñược chọn sẽ xác ñịnh mô hình của ñối tượng. Có 2 mô hình:
1. Mô hình theo tham số
2. Mô hình theo cấu trúc
 Mô hình tham số:
o Sử dụng 1 vector mô tả 1 ñặc tính của ñối tượng, ví dụ dùng các hàm cơ sở
trực giao biểu diễn các ñặc trưng (ảnh ñược biểu diễn bằng 1 chuỗi của các
hàm trực giao).
C- ñường bao ảnh
C(i,j)- ñiểm thứ i trên ñường bao (i=1,2, ,N)
;
1
;
1
1
0
1
0
∑∑
==
==
N
i
i
N
i
i

y
N
yx
N
x
Tọa ñộ tâm ñiểm (6.0)
o Nên moment trung tâm bậc p,q của ñường bao sẽ là:

Chương 6: Nhận Dạng Ảnh




173
( ) ( )
q
oi
N
i
p
oiqp
yyxx
N
−−=

=1
,
1
µ


(6.1)
o Và vector tham số chính là các moment:
µ
i,j
(i=1,2,…p; j=1,2,…,q) (6.2)
Với các ñặc trưng hình học, thì các tham số: ñường bao, diện tích, chu
tuyến,…Với nhận dạng chữ, thì tham số là các dấu hiệu: số ñiểm bậc 3, 4; số
ñiểm chu trình; số ñiểm ngoặc; số ñiểm kết thúc.

Hình 6.4 Mô hình tham số
 Mô hình cấu trúc:
o Dùng một số dạng nguyên thuỷ (ñoạn thẳng, cung,…), tập các luật sản sinh
o (ví dụ 1: văn phạm G=(V
t
, V
n
, p, s):
V
t
– bộ ký hiệu kết thúc
V
n
– bộ ký hiệu không kết thúc
p – luật sản xuất
s – ký hiệu bắt ñầu
o Ví dụ: ñối tượng nhà gồm: mái, tường (mái là một tam giác gồm 3 cạnh là 3
ñoạn thẳng, tường hình chữ nhật 4 cạnh vuông góc từng ñôi:






b. B
ản chất của quá t
o Quá trình nh
ận d
1. L
ựa chọn mô
2. L
ựa chọn luậ
trình học.
3. H
ọc nhận dạn
o Khi ñã xác ñ
ịnh
ñ
ịnh tính: mô h
o Nh
ận dạng chính
vào 1 l
ớp, nói cá
 H
ọc có giám sát (supe
o K
ỹ thuật phân lo
o ðặc ñiểm c
ơ b
(cánh ñ
ồng lúa, c
o B

ằng cách thiết
(bằng h
àm phân
 H
ọc không giám sát (
o Ph
ải tự ñịnh ra
từng lớp.
o Kỹ thuật n
ày ti

Chươ
174

Hình 6.5 Mô hình cấu trúc

quá tr
ình nhận dạng
ận dạng gồm 3 giai ñoạn:

ọn mô h
ình biểu diễn ñối tượng
ọn luật ra quyết ñịnh (ph
ương pháp nh
ận dạng
ận dạng

ịnh mô h
ình biểu diễn ñối tượng (ñịnh lư
ợng

mô h
ình cấu trúc), thì chuy
ển sang giai ñoạn 3 (
chính l
à tìm ra quy luật và các thu
ật toán ñể có
nói cách
khác là gán cho ñối tượng 1 tên.
t (supervised learning):

hân loại nhờ kiến thức biết tr
ước gọi là h
ọc có g
ơ b
ản là có 1 thư vi
ện các mẫu chuẩn ñể biết
g lúa, cánh rừng, v
ùng ñ
ất hoang, sông, biển, ñ
thiết kế 1 hệ thống ñể so sánh v
à quy
ết ñịnh gá
phân l
ớp hay hàm ra quyết ñịnh)
sát (unsupervised learning):

nh ra các lớp khác nhau v
à xác ñ
ịnh các tham
ày ti

ến hành mọi cách gộp nhóm có thể, v
à ch
hương 6
: Nhận Dạng Ảnh
n dạng) v
à suy diễn quá
ợng: mô h
ình tham số;
ạn 3 (học)

n ñể có thể gán ñối t
ượng
ọc có giám sát.

ñể biết nó thuộc loại n
ào
iển, ñ
ường ô tô,…)
ịnh gán cho chúng 1 lớp
c tham số ñặc tr
ưng cho
à ch
ọn lựa cách tốt nhất.





Hình 6
6.1.3 Kết nhóm ảnh

a. Kết nhóm là gì?
Kết nhóm l
à ñi
m
ột nhóm sẽ giống nh
b. Các ki
ểu kết nhóm
Kiểu nhóm l
à t
kiểu bậc và ki
ểu phân
o Ki
ểu nhóm phân
t
ập con không c
giống nhau.

Chươ
175
ình 6.6 S
ơ ñồ khối các giai ñoạn nhận dạng

à ñi t
ìm nhóm của các ñối tượng m
à các ñ
iống nhau v
à ngược lại
Hình 6.7 Kết nhóm dữ liệu ảnh
nhóm


à t
ập của các nhóm. S
ự khác biệt quan trọng
u phân chia của các nhóm.

phân chia: Dữ liệu trong các ñối t
ượng ñư
ợc p
hông chồn
g l
ấp nhau do ñó mỗi dữ liệu trong

Hình 6.8 Kết nhóm kiểu phân chia
hương 6
: Nhận Dạng Ảnh


ác ñ
ối tượng trong cùng

n trọng giữa các tập theo
ợc phân chia th
ành các
trong một ñối t
ượng là







o Ki
ểu nhóm dạng
cây bậc
c. Các cách k
ết nhóm
o K
ết nhóm dựa v
t
ập hợp các ñiểm
ñi
ểm ở nhóm kh
o K
ết nhóm dựa
tượng mà ñ
ối t
khác. Tr
ọng tâm
trong nhóm ñ
ể ñ

Chươ
176
dạng nhiều bậc: Mỗi tập của nhóm phân v
ùng
Hình 6.9 Kết nhóm kiểu nhiều bậc
nhóm

dựa v
ào cách phân chia chính xác (Well-

separa
c ñiểm m
à những ñiểm trong nhóm là gi
ống nh
óm khác


Hình 6.10 K
ết nhóm phân chia chính xác
dựa v
ào trọng tâm (Center-based): M
ột nhó
ối t
ượng trong nhóm thì g
ần trọng tâm nhất
ng tâm của nhóm th
ường là trung bình c
ủa cá
ể ñại diện cho các ñiểm của nhóm

hương 6
: Nhận Dạng Ảnh
ùng ñư
ợc tổ chức dạng

separated)
: Một nhóm là
ống nhau nhất so với các
xác


ột nhóm l
à tập của ñối
nhất so với các nhóm
ủa các tất cả các ñiểm





Hìn
o K
ết nhóm dựa v
ñi
ểm trong nhóm
o K
ết nhóm dựa v
trong vùng mà n
m
ật ñộ cao. Khi
nhau thì khi
ñó s

o K
ết nhóm dựa v
các nhóm ñ
ể mô
Hình 6

Chươ
177

Hình 6.10 K
ết nhóm phân chia theo trọng tâ
dựa v
ào lân cận (Contiguous): Một nhóm l
à t
nhóm th
ì g
ần các ñiểm lân cận khác so với các
Hình 6.11 Kết nhóm dựa vào lân cận

dựa v
ào mật ñộ (Density-based): M
ột nhóm l
g mà nó ñư
ợc tách từ những vùng có m
ật ñộ
o. Khi sử dụng các nhóm không ñều nhau ho
ñó s
ẽ ảnh hưởng bởi nhiễu và tác ñộng b
ên ng
Hình 6.12 K
ết nhóm dựa vào m
ật ñộ phân b
dựa v
ào ñ
ặc tính hay thuộc tính (Property or C
ể mô tả các ñặc tính chung hoặc mô tả các li
ên

h 6.13 K

ết nhóm theo ñặc tính và thu
ộc tính
hương 6
: Nhận Dạng Ảnh

g tâm

à t
ập các ñiểm mà các
ới các nhóm



hóm l
à mật ñộ các ñiểm
ật ñộ thấp sang v
ùng có
au hoặc không bện v
ào
ên ngoài.


ân bố

y or C
onceptual): Tìm ra
ên quan ñ
ặc biệt
ính







6.2 Nh
ận dạng theo mi
6.2.1 Phân ho
ạch theo miề
Nh
ận dạng theo miền
lượng. Mỗi ñối tượng ñư
gian, hàm phân biệt.
 Phân l
ớp có giám sát:

Chươ
178
heo miền không gian

heo miền không
gian
miền không gian, các ñối t
ượng nhận dạng l
à
ợc biểu diễn 1 vector 1-D. Các khái ni
ệm:
Hình 6.14 Mô hình phân lớp ảnh
m sát:
Phân lớp ảnh theo giá trị ngưỡ

ng cho trư
Hình 6.15 Phân lớp ảnh có giám sát
hương 6
: Nhận Dạng Ảnh
à các ñ
ối tượng ñịnh
ệm: phân hoạch không

ho trư
ớc






 Phân l
ớp không giám
nó có th
ể theo một qu
Hìn
 Phân ho
ạch không gia
o Không gian ñ
ối t
o Ρ
ΡΡ
Ρ -1 phân ho
ạch
∪ C

j
=H
ñây là tr
o Th
ực tế, chỉ tách
o Phân lo
ại dựa v
H

→→


Ρ
ΡΡ
Ρ

o Phân loại bằng

6.2.2 Hàm phân lớp -
hàm
 Hàm phân lớp
(hay hà
o Xác ñ
ịnh số lớp
{g
I
} –
các hàm p
o Nếu ∀ i≠k; g
k

(X

Chươ
179
g giám sát:
Phân l
ớp theo ñặc tính hay tích chấ
ột qui luật nhất ñịnh.

Hình 6.16 Phân l
ớp ảnh không giám sát
ng gian

ối t
ượng H ={X
i
,i=1,2,…,m} ; X
i

là 1 vector
ạch của
H thành các lớp C
i
, C
j
∈ H, nếu: C
i

ây là trư
ờng hợp lý tưởng, tập H tách ñược ho

àn
hỉ tách ñ
ược từng phần
dựa v
ào việc xây dựng một ánh xạ:

công cụ các hàm phân biệt
(disriminant fun
hàm quy
ết ñịnh
(hay hàm ra quy
ết ñịnh)
ố lớp v
à ranh giới giữa các lớp ñọc
hàm phân l
ớp
(X) > g
i
(X), thì ra quyết ñịnh X∈ lớp k.
hương 6
: Nhận Dạng Ảnh
ích chất có trong ảnh m
à

vector


∩ C
j
= H, i ≠ j và C

i
àn toàn

ant functions)


Chương 6: Nhận Dạng Ảnh




180
o ðể phân biệt k lớp, cần (k-1) hàm phân biệt (tuyến tính):
g(X)=W
0
+W
1
X
1
+W
2
X
2
+…+W
k
X
k
(6.3)
W
I

– các trọng số gán cho X
I

W
0
– trọng số viết gọn.
Trường hợp g tuyến tính, ta nói phân lớp là tuyến tính hiện siêu phẳng
(hyperplan).
 Các hàm phân biệt ñược xây dựng trên cơ sở khái niệm khoảng cách hay xác
suất có ñiều kiện sau:
o Nếu khoảng cách < ngưỡng τ, thì coi là hai ñối tượng giống nhau và góp
chúng vào 1 lớp (ngược lại tách thành 2 lớp).
o Xác suất có ñiều kiện Bayes:
+ p(X/C
i
): xác suất ñể có X biết rằng có xuất hiện lớp C
i

+ p(C
i
/X): xác suất có ñiều kiện ñể X thuộc lớp C
i

X: ñối tượng nhận dạng
C
i
: các lớp ñối tượng
o Tính p(C
i
/X):

(
)
(
)
1
( / ) ( / )
( / )
( )
( / )
i i i i
i
n
i
i
p X C p C p X C p C
p C X
p X
p C X
=
= =


(6.4)
Nếu p(C
i
/X)>p(C
k
/X) với ∀i và k, thì X∈C
i


o Mục ñích: Phân tích ñịnh lượng dữ liệu ảnh ña phổ.
 Phương pháp: Sử dụng các thuật toán thích hợp ñể xếp lọai các pixel của ảnh
theo các lớp bao phủ nền khác nhau (gọi là các lớp - class); việc phân lớp dựa
trên thông tin ñã biết về một số các mẫu (samples)
6.2.3 Phân lớp có giám sát

Chương 6: Nhận Dạng Ảnh




181

 Khái niệm:
Giả sử ảnh có k kênh phổ. Khi ñó mỗi pixel trên ảnh sẽ ứng với một vector
k- chiều (mỗi thành phần là giá trị tại kênh thứ k của pixel ñó), gọi là vector phổ
của pixel.

Hình 6.16 Phân lớp ảnh có giám sát
Thuật toán phân lớp sẽ dựa vào quan hệ giữa vector phổ của từng pixel với
các lớp
 Các bước phân lớp có giám sát:
o Chọn trước một tập hợp các lớp mà theo ñó ảnh sẽ ñược phân lớp.
o Với mỗi lớp, chọn ra môt tập các pixel tiêu biểu cho lớp ñó (gọi là samples
hoặc training data)
o Các tập training có thể lấy ñược từ thực tế, từ ảnh chuẩn, hay từ các nguồn
hình ảnh khác

Chương 6: Nhận Dạng Ảnh





182
o Các tập training ñược dùng ñể ước ñoán các tham số của giải thuật phân lớp
sẽ sử dụng (các tham số thuộc 1 lớp training gọi là mã của lớp ñó).
o Dựa vào các tập training, xếp loại tất cả các pixel của ảnh sao cho mỗi pixel
sẽ thuộc về một lớp duy nhất.
o Tạo ảnh (hoặc bản ñồ) phân lớp, tính toán các thống kê của việc phân lớp
6.2.4 Thuật toán nhận dạng theo phân lớp có giám sát
a. Phương pháp Maximum Likelihood
Là phương pháp thông dụng nhất. Sử dụng các thống kê (mean, variance
covariance) trong không gian phổ ñể xây dựng thuật toán.
Giả ñịnh rằng các giá trị phổ (ña chiều) trong mỗi lớp ñều có phân bố chuẩn
(normal distribution).
 Lý thuyết Bayes:
Giả sử có M lớp, gọi x là một vector phổ của một pixel ñang xét, p(x,i) là
xác suất ñể vector x thuộc lớp i. Nguyên tắc Maximum Likelihood là x thuộc lớp
i nếu p(x,i)>p(x,j) với mọi j

i. Gọi p(i,x) là xác suất ñể lớp i hiện hữu, với x cho
trước, lớp i chứa vector x.


ðịnh lý Bayes:
p(i | x)= p(x | i) p(i) / p(x)
(6.5)

Do ñó ñiều kiện chọn lớp cho vector x trở thành
p(x,i) p(i) > p(x,j) p(j)

(6.6)
ðây là ñiều kiện tính toán ñược từ training data
 Biệt thức của lớp (discriminant function):
ðặt:
D
i
(x) = p(x,i) p(i)
(6.7)
Và gọi là biệt thức (discriminant function) của lớp i. Khi ñó ñiều kiện ñể ra
quyết ñịnh là x thuộc lớp i nếu:

Chương 6: Nhận Dạng Ảnh




183
D
i
(x) > D
j
(x)
với mọi j ≠ i
 Bayes và phân bố chuẩn:
Giả thiết phân bố của tất cả các lớp ñều là chuẩn (normal)
( )
(
)










−=
2
2
2
2
exp
2
1
|
i
i
x
ixp
σ
µ
πσ

(6.8)

µ
i
: trị trung bình lớp i
σ

i
2
: phương sai của lớp i


Khi ñó biệt thức của lớp i là
(
)
[
]
)()|(ln ipixpxD
i
=


[ ]
[ ]
(
)







−−−=
2
2
2

2
ln
2
1
2ln
2
1
)(ln
i
i
i
x
ip
σ
µ
σπ

(6.9)

b. Phương pháp Parallepiped
ðồ thị mô tả phương pháp parallepiped trong không gian ñặc trưng 3 chiều

Hình 6.17 Phân lớp ảnh theo phương pháp Parallepiped

Chương 6: Nhận Dạng Ảnh




184

o Các giá trị Minimum và Maximum của mỗi lớp ñược tính và dùng như
ngưỡng ñể phân lọai.
o Ưu ñiểm: ñơn giản, tính nhanh
o Nhược ñiểm: có nhiều pixel sẽ không ñược xử lý
c. Phương pháp Minimum Distance:

Hình 6.18 Phân lớp ảnh theo phương pháp Minimum Distance
Với mỗi lớp, tính vector trung bình của lớp ñó, coi như “tâm” của lớp. Tính
và so sánh các khoảng cách từ ñiểm ñang xét ñến các “tâm” này. Phương pháp
này ñược dùng trong trường hợp thông tin về các lớp phủ là không ñầy ñủ, hoặc
thậm chí không có các giải thuật ñược sử dụng có tên chung là clustering trong
giải thuật clustering, các lớp kết quả là không biết trước, và có thể cả số các lớp
cũng không biết trước.
o Thuận lợi của phương pháp Minimum Distance. Tính toán ñơn giản và
nhanh
o Bất lợi của phương pháp Minimum Distance vô tình làm sai lệch các
phương sai của từng lớp
6.2.5 Phân lớp không giám sát





Hìn
a. Thuật toán K-
mean
Giả thiết số lớp là k

1. ðầu tiên, ch
ọn r

2. M
ột vector pixe
ñ
ến tâm của lớp
3. Tính l
ại tâm của
4. N
ếu tất cả các t
Sau phân lớp k-
mean
o Lớp có
quá ít ph
o Hai lớp có ñ
ặc tr
o Một lớp n
ào ñó
deviation cho cá
 Các tham s
ố của thuậ
o Số các lớp: ng
ư
o S
ố lần lặp: số lầ
tốn thời gian h
ơn
o Ngưỡng thay
ñ
n
ếu sau một lần
không vư

ợt quá,

Chươ
185
Hình 6.19 Phân l
ớp ảnh không giám sát
eans


ọn ra k vector l
àm tâm (mean) cho k l
ớp khởi
r pixel sẽ thuộc lớp m
à khoả
ng cách (Euclide
ủa lớp l
à nh
ỏ nhất (thực hiện với tất cả các vecto
m của các lớp

ả các t
âm giữ nguyên, thuật toán dừng, n
ếu khôn
means, các l
ớp cần phải ñược xem xét:
á ít ph
ần tử: có thể bỏ
ặc tr
ưng gần giống nhau: có th
ể hợp chúng lại

ào ñó
quá lớn: có thể chia nhỏ (bằng cách ch
ỉ ra
cho các kênh ph
ổ)
a thuật toán K
-means:
ư
ời dùng chỉ ñịnh trước số lớp mà thu
ật toá
: số lần c
àng nhiều thì phân hoạ
ch càng “chính
ơn
(cần phải dung hòa).
ñ
ổi lớp (change threshold, thư
ờng tính bằn
ột lần lặp n
ào ñó, số phần trăm pixel thay ñ
ổi t
t quá, th
ì ngừng quá trình lặp.
hương 6
: Nhận Dạng Ảnh

p khởi ñầu

uclide, ch
ẳng hạn) từ nó

c vecto
r trong 1 lần lặp).
u không quay lại b
ước 2
úng lại một.

ỉ ra tr
ước số standard
ật toán phải tạo ra.

“chính xác”
hơn, nhưng
nh bằng %): ng
ưỡng mà
ổi trong tất cả các lớp

Chương 6: Nhận Dạng Ảnh




186
 Tính giá trị kết nhóm k-means:
o Nhìn chung giá trị này ñược tính dựa vào tổng bình phương sai số (Sum of
Squared Error (SSE))
∑∑
= ∈
=
K
i Cx

i
i
xmdistSSE
1
2
),(

(6.10)

o Nếu có k (số thực) nhóm thì sự thay ñổi mỗi trọng tâm của nhóm sẽ nhỏ ñi
o Nếu các nhóm có cùng kích thước n thì:
KK
k
K
K
Kn
nK
P
!
)(
!
==

(6.11)

 Ví dụ nếu k=10 thì: P=10!/10
10
=0,00036
o ðôi khi giá trị khởi tạo sẽ ñiều chỉnh chính trọng tâm ñó theo cách ñúng
nhưng có lúc thì không.

o Xem ví dụ với 5 lần lặp sẽ hình thành các nhóm

Hình 6.20 Phân lớp K-mean 5 lần lặp
b. Thuật toán ISODATA
Thuật toán nhận dạng này rất mềm dẻo không cần cố ñịnh các lớp trước
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2
0
0.5
1
1.5
2
2.5
3
x
y
Iteration 1
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2
0
0.5
1
1.5
2
2.5
3
x
y
Iteration 2
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2
0
0.5

1
1.5
2
2.5
3
x
y
Iteration 3
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2
0
0.5
1
1.5
2
2.5
3
x
y
Iteration 4
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2
0
0.5
1
1.5
2
2.5
3
x
y
Iteration 5






 Các bước thực hiện
:
o L
ựa chọn một p
không ph
ụ thuộc
o Phân vùng b
ằng
cách Euclide.
o Tách ñối tư
ợng l
o Xác ñ
ịnh phân h
ñ
ịnh lại tâm mới
o Tính t
ất cả các k

Nhóm các vùng
thoả mãn tiêu chu
ẩn p
Hình 6.21

Chươ
187

:

một phân hoạch ban ñầu tr
ên các tâm b
ất kỳ (
thuộc v
ào phân lớp ban ñầu).
ằng cách sắp xếp các ñiểm v
ào tâm g
ần nh
ợng lớp ban ñầu, nếu khoảng cách > ng
ư
ỡng t
phân hoạch mới tr
ên cơ s
ở các lần vừa xác ñịnh
m mới.

ả các khoảng cách ñến tâm.

c vùng v
ới tâm theo ngưỡng t
2
lặp lại các

ẩn phân hoạch.

.21 Phân l
ớp ảnh theo ph
ương pháp ISODAT

hương 6
: Nhận Dạng Ảnh
t kỳ (kết quả nhận dạng
ần nhất dựa v
ào khoảng
ỡng t
1
.
c ñịnh lại v
à tiếp tục xác

ớc trên cho ñến khi

DATA


Chương 6: Nhận Dạng Ảnh




188
6.3 Nhận dạng dựa theo cấu trúc
6.3.1 Biểu diễn ñịnh tính
 Phương pháp nhận dạng logic (dựa vào hàm Bool), nhận dạng các từ có cùng ñộ
dài.
g
a
(x), g
b

(x),…Hàm phân biệt có mọi ký hiệu (a,b,…)
Giả sử ta có từ (a,b,c,e) ñược biểu diễn bằng 1 dãy ký tự X={x
1
,x
2
,x
3
,x
4
}. Tính
các hàm tương ứng 4 ký tự trên
g
a
(X
1
)+g
b
(X
2
)+g
c
(X
3
)+g
e
(X
4
) (“+” = “OR”).
(6.12)


Tính giá trị cực ñại của hàm phân biệt, quyết ñịnh X có thuộc lớp các từ “a,b,c”
hay không.
 Phương pháp ra quyết ñịnh dựa vào cấu trúc. Thủ tục phân loại và nhận dạng
gồm 2 giai ñoạn:
o Xác ñịnh các quy tắc xây dựng (giống nghiên cứu 1 văn phạm trong 1 ngôn
ngữ)
o Xét tập các dạng có sinh ra từ các dạng ñó không?
 Ví dụ: PLD (Picture Language Description)
o Mô hình cấu trúc tương ñương 1 văn phạm G:
G={V
n
, V
t
, p,s}
o Văn phạm sinh ra các mô tả trong ngôn ngữ:
G
A
={V
n
, V
T
, p, s}
V
n
={A,B,C,D,E},
V
T
={a,b,c,d},

s – bắt ñầu

p – tập luật sản sinh

Chương 6: Nhận Dạng Ảnh




189
6.3.2 Các bước nhận dạng
Các ñối tượng ñược biểu diễn bằng 1 câu trong ngôn ngữ L(G). Thao tác phân
lớp là xét 1 ñối tượng có thuộc văn phạm L(G) hay không? Có nghĩa là nó có ñược
sinh ra bởi các luật của văn phạm G không?
 Phân lớp theo cấu trúc cần phải xác ñịnh:
o Tập V
t
chung cho mọi ñối tượng.
o Các quy tắc sinh p (ñể sinh 1 câu và dùng khác nhau ñối với mỗi lớp)
Quá trình học với các câu biểu diễn các ñối tượng mẫu I nhằm xác ñịnh văn
phạm G. Quá trình ra quyết ñịnh: xác ñịnh ñối tượng X (ñược biểu diễn bằng 1 câu I
X
).
Nếu I
X
nhận biết ñược bằng ngôn ngữ L(G
X
), thì ta nói C
k
∈X. Ra quyết ñịnh phân lớp
là dựa vào phân tích cú pháp của văn phạm (G
k

biểu diễn lớp C
k
)
6.3.3 Kết nhóm nhiều bậc
Kết nhóm dạng nhiều bậc: Mỗi tập của nhóm phân vùng ñược tổ chức dạng cây
nhiều bậc. Một cây giống như lưu ñồ ghi lại tần suất sự kết hợp hay phân chia

Hình 6.22 Kết nhóm nhiều bậc
 MIN:
o Hai nhóm giống nhau thì dựa vào 2 ñiểm giống nhau nhất ở 2 nhóm khác
nhau.
1 3 2 5 4 6
0
0.05
0.1
0.15
0.2
1
2
3
4
5
6
1
2
3 4
5

Chương 6: Nhận Dạng Ảnh





190
o Xác ñịnh các cặp ñiểm, bằng một ñường trong ma trận xấp xỉ.
o Hai nhóm giống nhau thì dựa vào 2 ñiểm giống nhau gần nhất ở 2 nhóm
khác nhau.
o Ưu ñiểm của phương pháp kết nhóm MIN: Cần thiết ñối với hình dạng Ellip
o Khuyết ñiểm: Nhạy với nhiễu và tác ñộng bên ngoài
 MAX:
o Hai nhóm giống nhau thì dựa vào 2 ñiểm giống nhau xa nhất ở 2 nhóm khác
nhau.
o Xác ñịnh các cặp ñiểm, bằng một ñường trong ma trận xấp xỉ. Hai nhóm
giống nhau thì dựa vào 2 ñiểm giống nhau nhất ở 2 nhóm khác nhau.
o Ưu ñiểm của phương pháp kết nhóm MAX: Ít ảnh hưởng nhiễu và tác ñộng
bên ngoài
o Khuyết ñiểm: ðịnh hướng ñể phân nhỏ nhóm lớn. Biến nhóm thành dạng
hình cầu
 Trung bình nhóm:
o Xấp xỉ của 2 nhóm là giá trị trung bình xấp xỉ của một cặp các ñiểm trong 2
nhóm


 

 


















(6.13)
o ðiều này cần thiết ñể sử dụng trị trung bình kết hợp cho các bậc từ tổng các
xấp xỉ thích hợp trong nhóm lớn
 Kết hợp giữa phương pháp MIN và phương pháp MAX
o Ưu ñiểm: Ít ảnh hưởng nhiễu và tác ñộng bên ngoài
o Khuyết ñiểm: Biến nhóm thành dạng hình cầu


Chương 6: Nhận Dạng Ảnh




191
6.4 Nhận dạng dùng mạng neural

6.4.1 Giới thiệu mạng neural

a. Neural sinh học
Mạng neural sinh học bao gồm các thành phần
o Nhánh và rễ: ðây là bộ phận tiếp nhận thông tin của tế bào neural.
o Thân thần kinh: Thân thần kinh chứa các nhân và cơ quan tổng hợp protein.
o Dây thần kinh: ðây là phương tiện truyền dẫn tín hiệu giữa các neural.
o Khớp thần kinh: Là bộ phận tiếp xúc của ñầu ra neural với nhánh, rễ của các
neural khác

Hình 6.23 Cấu tạo mạng neural sinh học

Chương 6: Nhận Dạng Ảnh




192
b. Neural nhân tạo
 Khái niệm mạng neural nhân tạo
Các neural sinh học liên kết với nhau thành lớp tạo thành mạng neural sinh
học. Neural nhân tạo là sự mô phỏng neural sinh học. Có nhiều cách kết hợp các
neural nhân tạo thành mạng, mỗi cách kết hợp tạo thành một lớp mạng neural
nhân tạo khác nhau.

Hình 6.24 Cấu tạo mạng neural nhân tạo
 Phân loại mạng neural nhân tạo
Có nhiều cách ñể phân loại mạng neural nhân tạo, tùy theo tiêu chí ñề ra:
o Dựa vào số lượng lớp có trong mạng, ta phân thành:
+ Mạng một lớp
+ Mạng nhiều lớp
o Dựa vào ñường truyền tín hiệu trong mạng, ta phân thành:

+ Mạng truyền thẳng
+ Mạng (phản hồi) truyền ngược
+ Mạng tự tổ chức

Chương 6: Nhận Dạng Ảnh




193

Hình 6.25 Phân loại mạng neural nhân tạo
Trên cơ sở cấu trúc của neural sinh học tổng quát người ta ñề xuất mô hình
neural nhân tạo gồm 3 phần chính: Bộ tổng liên kết ñầu vào, bộ ñộng học tuyến
tính và bộ phi tuyến
 Bộ tổng liên kết ñầu vào
Là bộ tổng hợp các liên kết tại ñầu vào của một phần tử neural, mô tả như
sau:
θ
−=

=
)()(
1
txwtv
k
m
k
k


(6.14)

o v(t): Tổng tất cả các ñầu vào mô tả toàn bộ thế năng tác ñộng ở thân neural.
o x
k
(t): Các ñầu vào từ bên ngoài; với k là chỉ số chạy, k=1,2…m.
o m: Số lượng ñầu vào mô tả tín hiệu vào từ các ñầu nhạy thần kinh hoặc các
neural khác.
o w
k
: Trọng tâm liên kết ngoài giữa các ñầu vào k tới neural hiện tại.
o y(t): Tín hiệu ñầu ra neural.
o θ: Ngưỡng (là hằng số), xác ñịnh ngưỡng kích thích hay ức chế.

Chương 6: Nhận Dạng Ảnh




194
 Bộ ñộng học tuyến tính
ðầu vào của phần ñộng học tuyến tính là v(t), ñầu ra của nó là u(t) gọi là
ñầu ra tương tự. Hàm truyền tương ứng của phần ñộng học tuyến tính có thể mô
tả dưới dạng:
( )
(
)
( )
( ) ( ) ( )
sVsHsUhay

sV
sU
sH ==

(6.15)

Phần này sử dụng hàm quan hệ phi tuyến f(.) cho ñầu ra y, ñể chặn tín hiệu
ở ñầu ra. Các hàm ñầu ra thông thường là các hàm có giới hạn ngưỡng phù hợp
với ñặc ñiểm ñầu ra của neural sinh học. Hàm dạng này thường ñược gọi là hàm
kích hoạt (activation) thể hiện ñặc ñiểm kích hoạt hay ức chế của một neural.






−==

=
θ
m
i
ii
wtxftufy
1
)())((

(6.16)

 Luật học trong mạng neural:

Khái niệm học trong mạng neural ñược hiểu theo hai nghĩa: Học về cấu trúc
và học về tham số.
o Học tham số (Parameter Learning)
Mục tiêu của việc học tham số là thay ñổi, cập nhật các trọng số liên kết.
Hầu hết các luật học tồn tại thuộc kiểu học tham số. Các kiểu học ñiển hình mà
chúng ta sẽ nghiên cứu trong phần trên cũng thuộc dạng học tham số. Thông
thường, luật học tham số ñược chia thành ba dạng chính, ñó là: Học giám sát, học
không giám sát và học củng cố.
o Học có thầy (Học giám sát) Supervised Learning:
Với kiểu học này, tại mỗi thời ñiểm có ñầu vào mạng neural thì ñầu ra
mong muốn của hệ sẽ ñược cho sẵn. Có thể cụ thể hóa như sau: Mạng ñược cung
cấp một tập các mẫu (x(1),d(1)), (x(2),d(2)),… (x(n),d(n)) là các cặp ñầu vào –
ñầu ra mong muốn.

×