Tải bản đầy đủ (.pdf) (30 trang)

Các phương pháp trích chọn đặc trưng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.16 MB, 30 trang )

Pattern Recognition
Các phương pháp trích chọn
đặc
trưng
đặc
trưng
Phạm
Anh
Phương
PhD
Phạm
Anh

Phương
,
PhD
FacultyofInformationTechnology,
Du
y
TanUniversit
y
y
y
Email:
Phone:0914.019.099
Nội dungchính
 Biến đổi toàn cục và khai triểnchuỗi
 Đặctrưng thống kê

Đặ
t


hì h
h
à
hì h
thái

Đặ
c
t
rưng

n
h
h
ọcv
à

n
h
thái
Bi
ế
n đ

itoàncụcvà
khai
triển
chuỗi
khai
triển

chuỗi
 Một tín hiệuliêntụcthường chứanhiềuthôngtinvà
có thể sử dụn
g
để làm đặctrưn
g
cho mục đích
p
hân
g
g
p
lớp.
 Các đặctrưng này cũng có thểđượctríchchọnbằng
cách
xấp
xỉ
các
tín
hiệu
liên
tục
thành
các
tín
hiệu
rời
cách
xấp
xỉ

các
tín
hiệu
liên
tục
thành
các
tín
hiệu
rời
rạc.
 M

tcáchđể biểudiễntínhi

ulàsử d

n
g
t

h
ợp


ụ g
ợp
tuyếntínhcủamột dãy các hàm đơngiảnhơn.
 Các hệ số củatổ hợptuyến tính cung cấptrithức
iải

ã

đủ
hẳ
h
h
á

biế
đổi
g
iải
m
ã
v

a
đủ
,c
hẳ
ng
h
ạnn
h
ư c
á
cp

p
biế

n
đổi
hoặckhaitriểnchuỗi.
 M

tsố biếnd

n
g
khác như các
p

p
d

ch chu
yể
n

ạ g
pp

y
và phép quay là bấtbiến dưới các phép biến đổi
toàn cục và khai triểnchuỗi.
Bi
ế
n đ

itoàncụcvà

khai
triển
chuỗi
khai
triển
chuỗi
Sau đây là mộtsố phép biến đổivàkhaitriểnchuỗi
thường
dùng
để
biểu
diễn
ảnh
được
áp
dụng
trong
thường
dùng
để
biểu
diễn
ảnh
được
áp
dụng
trong
lĩnh vựcnhậndạng:

Biến

đổi
Fourier
:
Một
trong
những
tính
chất
nổi

Biến
đổi
Fourier
:
Một
trong
những
tính
chất
nổi
bậtnhấtcủa phép biến đổi Fourier là khả năng
biểudiễn đốitư

n
g
vớis

tha
y
đổivề các tư thế

ợ g

y
khác nhau (biểudiễnkýtự).
 Biến đổi Wavelet:làmộtdã
y
các k

thuật khai
y

triển cho phép mô tảđặctrưng của ảnh ở các
cấp độ chi tiết khác nhau.
Đặctrưng Haar - like
Đặctrưng Haar‐like do Viola và Jones công bố,gồm4
đặc
trưng

bản
Mỗi
đặc
trưng
Haar
like

sự
kết
hợp
đặc
trưng


bản
.
Mỗi
đặc
trưng
Haar

like

sự
kết
hợp
củahaihaybahìnhchữ nhật"trắng" hay “đen”:

Đặc
trưng
Haar

like

bản

Đặc
trưng
Haar

like

bản

• Đặctrưng cạnh
Đặctrưng Haar - like
• Các đặctrưng đường
• Đặctrưng bao quanh tâm
Đặctrưng Haar - like
 Đặctrưng Haar‐like là sự chênh lệch giữatổng củacác
pixel

các
vùng
đen

các
vùng
trắng
:
pixel

các
vùng
đen

các
vùng
trắng
:
Đặctrưng Haar - like
 Để tính các giá trị của đặctrưng Haar‐like, ta phảitính
tổng
của

các
vùng
điểm
ảnh
trên
ảnh
tổng
của
các
vùng
điểm
ảnh
trên
ảnh
.
 Nhưng để tính toán c ác giá trị củacácđặctrưng Haar‐
like
cho
tất
cả
các
vị
trí
trên
ảnh
đòi
hỏi
chi
phí
tính

like
cho
tất
cả
các
vị
trí
trên
ảnh
đòi
hỏi
chi
phí
tính
toán khá lớn, không đáp ứng đượcchocácứng dụng
đòi hỏitínhthời
g
ian th

c.
g

 Do đóViolavàJonesđưaramộtkháiniệmgọilà“ảnh
tích hợp” (Integral Image)
 Ảnh tích hợpcókíchthướcbằng vớikíchcủa ảnh gốc,
mỗiphầntử của ảnh này đượctínhbằng cách tính
tổng của điểm ảnh phía trên và bên trái củanó.
Đặctrưng Haar - like
 Ảnh tích hợplàảnh có các tính chất sau: giá trị pixel
tại

vị
trí
(
xy
)
bất
kỳ
trong
ảnh
tích
hợp
bằng
với
tổng
tại
vị
trí
(
x
,
y
)
bất
kỳ
trong
ảnh
tích
hợp
bằng
với

tổng
số các pix el thuộchìnhchữ nhật đượctạobởigóctrái
trên
cùng
của
ảnh
(
0
,
0
)

điểm
đang
xét
.
trên
cùng
của
ảnh
(
0
,
0
)

điểm
đang
xét
.

Trong
đó
:
Trong
đó
:

i:ảnh banđầu.
p:
ảnh
tích
hợp
của
i
p:

ảnh
tích
hợp
của
i
.
Đặctrưng Haar - like
 Ví dụ:
Đặctrưng Haar - like
•Saukhiđãtínhđược integral image, việctính
tổng
các
giá
trị

mức
xám
của
một
vùng
D
bất
kỳ
tổng
các
giá
trị
mức
xám
của
một
vùng
D
bất
kỳ
nào đó đượcthựchiện đơngiản theo cách sau:

Với
A
+
B
+
C
+
D


giá
trị
tại
điểm
P
4
A+B


Với
A
+
B
+
C
+
D

giá
trị
tại
điểm
P
4
,
A+B

giá trị tại điểm P2, A+C là giá trị tại điểmP3,vàA


g
iá tr

t

i điểmP1.
g


D
A
B
C
P
1
P
2
P
P
P
3
P
4
Đặctrưng Haar - like
•Vậy, có thể viếtlạibiểuthức tính D như sau:
D
A
B
C
P

1
P
2
P
3
P
4
Mệnh
đề
(
biểu
diễn
duy
nhất
của
đặc
trưng
theo
phép
biến
đổi
Haar
)
:
Biến đổi ảnh 2 chiều thành dãy đặctrưng Wavelet
Mệnh
đề
(
biểu
diễn

duy
nhất
của
đặc
trưng
theo
phép
biến
đổi
Haar
)
:
Cho ma trận vuông A cấp2
n
, n nguyên dương. Theo phương pháp biến
đổi ảnh thành dãy đặctrưng củathuật toán TransformFeature thì dãy đặc
t
th
đ

d
hất
đối
ới
t ậ
A
t
rưng
th
u

đ
ược

d
uy n
hất
đối
v
ới
ma
t
r

n
A
.
9 Ảnh 16×16, mỗivéctơ
đầuvàocó:1+3+4
×
3+
4×4×3+4×4×4×3 = 256
đặctrưng.
9
Ảnh
8
×
8
thì
véc


đầu
Hình 3.9. Histogram của

y
đ

c trưn
g
thu đư

c
9
Ảnh
8
×
8
thì
véc

đầu
vào có 64 đặctrưng.
13
y ặ g ợ
Biến đổi ảnh 2 chiều thành dãy đặctrưng Wavelet
Thuật
toán
TransformFeature
()
Thuật
toán

TransformFeature
()
Input Ma trận vuông (A,n) cấp2
n
.
Output Tập các đặctrưng {F
1
,F
2
, , }
22
F
nn
×
Method
Method
(1) - Khởitạo: Queue = ∅;i=1;
(2) - Tính F
i
=Tổng các điểm đen trong toàn bộ ma trận(A,n);
(
3
)
-
PUSH((A,n),
Queue
)
;
(
3

)
PUSH((A,n),
Queue
)
;
(4) While (Queue ≠∅ )
(5) { - POP(Queue, (A,n));
(
6
)
-if
(
n>1
)
{
n=nDIV2;
()
(
)
{
(7) Chia ảnh thành 4 phần: A
1
,A
2
,A
3
,A
4
;
(8) for (j=1; i ≤ 4; j++) PUSH((A

j
,n), Queue);
(9) }


(10) - GọiS,S1,S2,S3,S4làt

ng các đi

m đen tương ứng
(11) với các khốiA,A
1
,A
2
,A
3
,A
4
;
(12) - F
i+1
=S1+S2;F
i+2
=S2+S3;F
i+3
=S4;
(13)
i
i
+

3
14
(13)
-
i
=
i
+
3
;
(14) }
(15) Return {F};
Bi
ế
n đ

itoàncụcvà
khai
triển
chuỗi
khai
triển
chuỗi
• Phương pháp mô men: ảnh gốcsẽđược thay
thế
bằng
một
tập
các
đặc

trưng
vừa
đủ
để
biểu
thế
bằng
một
tập
các
đặc
trưng
vừa
đủ
để
biểu
diễncácđốitượng bấtbiến đốivới các phép thay
đổitỷ lệ,tịnh tiếnhoặc quay.
• Các mô men đượcxétnhư các dãy khai triển đặc
trưng vì ảnh gốccóthể xây dựng lạimộtcáchđầy
đủ

á
hệ

ô
đủ
t

c

á
c
hệ
s

m
ô
men.
 Khai triển Karhunent-Loeve: phân tích các
t

để
út

hiề

tậ
đặ
t
vec
t
ơ r

ng
để
r
út
gọns

c

hiề
uc

a
tậ
p
đặ
c
t
rưng
bằng cách tạocácđặctrưng mớilàtổ hợp
tuyến
tính
của
các
đặc
trưng
gốc
Đây

phép
tuyến
tính
của
các
đặc
trưng
gốc
.
Đây


phép
biến đổitối ưu trong mộtsố lĩnh vực nén thông
tin.
Khai triển Karhunent-Loeve
• Khai triển Karhunent-Loeve được dùng trong các
bài toán nh

nd

n
g
mẫu: nh

nd

n
g
m

tn
g
ười
,

ạ g

ạ g

g ,

hệ thống OCR củaViện Công nghệ và Tiêu chuẩn
QuốcgiaHoaKỳ (NIST – National Institute of
Standards and Technology of the United States).
• Việc khai triển này đòi hỏisử dụng các thuật toán



có kh

ilượn
g
tính toán r

tlớn nên việcs

dụng các đặctrưng Karhunent-Loeve trong các
bài
toán
nhận
dạng
chữ
không
được
phổ
biến
bài
toán
nhận
dạng
chữ

không
được
phổ
biến
rộng rãi.

Tuy
nhiên
đối
với
đối
tượng
ảnh
lớn
hơn
(
mặt

Tuy
nhiên
,
đối
với
đối
tượng
ảnh
lớn
hơn
(
mặt

người) thì tỏ ra hiệuquả hơn.
Đặctrưng PCA
 Phương pháp phân tích thành phần chính
(PCA‐ Principal Component Analysis) để rút
g
ọnsố chiềucủadữ liệu.
g
 Mục đích củaphương pháp này là biến đổidữ
liệ
từ
khô
i
hiề
khô
i
liệ
u
từ
khô
ng g
i
an n c
hiề
usang
khô
ng g
i
an m
chiều(m<n).
 Thựcchất đây là bài toán tìm véc tơ riêng và

giá
trị
riêng
của
ma
trận
giá
trị
riêng
của
ma
trận
.
Đặc trưng PCA
ThuậttoánPCA:
Input
:
Tập
mẫu
X={
X

R
n
i
=
1N
}
Input
:


Tập
mẫu
X={
X
i

R
n
,
i
=
1
, ,
N
}
Output: Tập đặctrưng Z={Z
i
∈R
m
, i=1, ,N, m<n}
Bước
1
:
Tính
ma
trận
đối
xứng
R

=
E(
XX
T
)
thông
Bước
1
:

Tính
ma

trận
đối
xứng
RE(
XX
)

thông
qua tậpmẫu.
Bước2: Tính các cặp vector riêng và giá trị riêng:
(
λ
1
,u
1
), ,(
λ

n
,u
n
) củaR.
Bước 3: - Tính Z=U
T
X, với U=[u
1
,u
2
, ,u
n
]
L h (< ) t iê t ứ
-
L
ựa c
h
ọn m
(<
n
)
vec
t
or r

ng
t
ương


ng
với m giá trị riêng lớn nhất.
Kếtquả thu được là m thành phầncủaZtương
18
Kết

quả

thu

được



m

thành

phần

của

Z

tương

ứng với m giá trị riêng đã chọn.
Đặctrưng thống kê
 Các đặctrưng thống kê bảo toàn các kiểubiến đổi
đad


n
g
về hình dán
g
của đốitư

n
g
.
ạ g
g
ợ g
 Mặcdùcáckiểu đặctrưng này không thể xây
dựng lại ảnh gốc, nhưng nó đượcsử dụng để thu




nhỏ s

chi

ucủatập đặctrưng nh

mtăng t

c độ
và giảmthiểu độ phứctạp tính toán.


Phân
vùng
(zoning)
:
Khung
ảnh
được
chia
thành

Phân
vùng
(zoning)
:
Khung
ảnh
được
chia
thành
các vùng chồng nhau hoặc không chồng nhau.
Mục
đích
của
việc
phân
vùng
nhằm
thay
thế
các

Mục
đích
của
việc
phân
vùng
nhằm
thay
thế
các
tính chất toàn cụcbằng các tính chấtcụcbộ của
ảnh. Các đặctrưn
g

y
tỏ ra phù hợpvới s

biến
g
y
đổi đadạng trong các chi tiếtcủakýtự viết
tay.
Đặctrưng thống kê
Phân vùn
g
(
Zone
)
Chu tu
yế

n
(
Contour Profile
)
g
()
y
()
Đặctrưng thống kê
• Các giao điểmvàkhoảng cách:Một đặctrưng
thốn
g
kê phổ biếnlàsố
g
iao điểm
g
iữachutu
y
ến
g
g
g
y
của đốitượng vớimột đường thẳng theo một
hướng đặcbiệt nào đó.

đặ
t
à
từ

đ
G
Vk
à


c
đặ
c
t
rưng n
à
y
từ
ng
đ
ược
G
.
V
amva
k
as v
à
các cộng sự áp dụng để phân nhóm sơ bộ các
lớp

tự
hệ
La

Tinh
Hy
Lạp
lớp

tự
hệ
La
Tinh
,
Hy
Lạp
.
•Tương tự, khoảng cách từ biên của khung ảnh
tới điểm đen đầu tiên của đốitư

n
g
trên cùn
g
m

t
ợ g
g

dòng quét cũng đượcsử dụng làm đặctrưng
thống kê. Đặctrưng này có thể mô tả hình dạng

khái quát củachữ,tuynhiênnócũng r


tnhạy
cảmvới nhiễuvàđộ nghiêng củachữ.
Giao điểmvàkhoảng cách
Đặctrưng thống kê
• Các phép chiếu điểm ảnh:Cácđốitượng có thể
được
biểu
diễn
bằng
cách
chiếu
các
điểm
ảnh
lên
được
biểu
diễn
bằng
cách
chiếu
các
điểm
ảnh
lên
các dòng theo các hướng khác nhau.
• Đặctrưn
g


y
ít nhạ
y
cảmvới nhiễu.
g
y
y
• Tuy nhiên, đốivớichữ, để sử dụng tốtlại đặctrưng
này thì cầnchuẩn hóa độ dày của nét chữ.
• Đặctrưng này đượcnhiều nhà nghiên cứusử dụng
rộng rãi trong các hệ thống OCR .
Đặctrưng thống kê
• Đặctrưng hướng:Cácđốitượng là các đoạn
thẳng

hướng
các
cung
hoặc
các
đường
cong
thẳng

hướng
,
các
cung
hoặc
các

đường
cong
.
•Hướng củacácnétđóng vai trò quan trọng trong
việc so sánh sự khác nhau
g
iữacácđốitượn
g
.
g
g
•Cácđốitượng đượcmôtả như các vectơ mà các
phầntử củanólàcácgiátrị thống kê về hướng.
Để
íh
h
á
đ
à
ó
đị h
h ớ

Để
tr
í
c
h
c
h

ọnc
á
c
đ
ặctrưng n
à
y, g
ó
c
đị
n
h
h
ư

ng
của các nét phải được phân chia thành mộtsố
vùng
cố
định

số
các
đoạn
của
nét
trong
mỗi
vùng
cố

định

số
các
đoạn
của
nét
trong
mỗi
vùng góc đượcchọnnhư một giá trịđặctrưng.
Đặctrưng theo hướng
Hiện nay, các đặctrưng hướng đượcápdụng rộng
rãi

chúng

tả
được
hình
dáng
khái
quát
của
rãi

chúng

tả
được
hình

dáng
khái
quát
của
đốitượng theo sự biến đổi đadạng của các nét.

×