Pattern Recognition
Các phương pháp trích chọn
đặc
trưng
đặc
trưng
Phạm
Anh
Phương
PhD
Phạm
Anh
Phương
,
PhD
FacultyofInformationTechnology,
Du
y
TanUniversit
y
y
y
Email:
Phone:0914.019.099
Nội dungchính
Biến đổi toàn cục và khai triểnchuỗi
Đặctrưng thống kê
Đặ
t
hì h
h
à
hì h
thái
Đặ
c
t
rưng
hì
n
h
h
ọcv
à
hì
n
h
thái
Bi
ế
n đ
ổ
itoàncụcvà
khai
triển
chuỗi
khai
triển
chuỗi
Một tín hiệuliêntụcthường chứanhiềuthôngtinvà
có thể sử dụn
g
để làm đặctrưn
g
cho mục đích
p
hân
g
g
p
lớp.
Các đặctrưng này cũng có thểđượctríchchọnbằng
cách
xấp
xỉ
các
tín
hiệu
liên
tục
thành
các
tín
hiệu
rời
cách
xấp
xỉ
các
tín
hiệu
liên
tục
thành
các
tín
hiệu
rời
rạc.
M
ộ
tcáchđể biểudiễntínhi
ệ
ulàsử d
ụ
n
g
t
ổ
h
ợp
ộ
ệ
ụ g
ợp
tuyếntínhcủamột dãy các hàm đơngiảnhơn.
Các hệ số củatổ hợptuyến tính cung cấptrithức
iải
ã
ừ
đủ
hẳ
h
h
á
hé
biế
đổi
g
iải
m
ã
v
ừ
a
đủ
,c
hẳ
ng
h
ạnn
h
ư c
á
cp
hé
p
biế
n
đổi
hoặckhaitriểnchuỗi.
M
ộ
tsố biếnd
ạ
n
g
khác như các
p
hé
p
d
ị
ch chu
yể
n
ộ
ạ g
pp
ị
y
và phép quay là bấtbiến dưới các phép biến đổi
toàn cục và khai triểnchuỗi.
Bi
ế
n đ
ổ
itoàncụcvà
khai
triển
chuỗi
khai
triển
chuỗi
Sau đây là mộtsố phép biến đổivàkhaitriểnchuỗi
thường
dùng
để
biểu
diễn
ảnh
được
áp
dụng
trong
thường
dùng
để
biểu
diễn
ảnh
được
áp
dụng
trong
lĩnh vựcnhậndạng:
Biến
đổi
Fourier
:
Một
trong
những
tính
chất
nổi
Biến
đổi
Fourier
:
Một
trong
những
tính
chất
nổi
bậtnhấtcủa phép biến đổi Fourier là khả năng
biểudiễn đốitư
ợ
n
g
vớis
ự
tha
y
đổivề các tư thế
ợ g
ự
y
khác nhau (biểudiễnkýtự).
Biến đổi Wavelet:làmộtdã
y
các k
ỹ
thuật khai
y
ỹ
triển cho phép mô tảđặctrưng của ảnh ở các
cấp độ chi tiết khác nhau.
Đặctrưng Haar - like
Đặctrưng Haar‐like do Viola và Jones công bố,gồm4
đặc
trưng
cơ
bản
Mỗi
đặc
trưng
Haar
like
là
sự
kết
hợp
đặc
trưng
cơ
bản
.
Mỗi
đặc
trưng
Haar
–
like
là
sự
kết
hợp
củahaihaybahìnhchữ nhật"trắng" hay “đen”:
•
Đặc
trưng
Haar
‐
like
cơ
bản
•
Đặc
trưng
Haar
‐
like
cơ
bản
• Đặctrưng cạnh
Đặctrưng Haar - like
• Các đặctrưng đường
• Đặctrưng bao quanh tâm
Đặctrưng Haar - like
Đặctrưng Haar‐like là sự chênh lệch giữatổng củacác
pixel
ở
các
vùng
đen
và
các
vùng
trắng
:
pixel
ở
các
vùng
đen
và
các
vùng
trắng
:
Đặctrưng Haar - like
Để tính các giá trị của đặctrưng Haar‐like, ta phảitính
tổng
của
các
vùng
điểm
ảnh
trên
ảnh
tổng
của
các
vùng
điểm
ảnh
trên
ảnh
.
Nhưng để tính toán c ác giá trị củacácđặctrưng Haar‐
like
cho
tất
cả
các
vị
trí
trên
ảnh
đòi
hỏi
chi
phí
tính
like
cho
tất
cả
các
vị
trí
trên
ảnh
đòi
hỏi
chi
phí
tính
toán khá lớn, không đáp ứng đượcchocácứng dụng
đòi hỏitínhthời
g
ian th
ự
c.
g
ự
Do đóViolavàJonesđưaramộtkháiniệmgọilà“ảnh
tích hợp” (Integral Image)
Ảnh tích hợpcókíchthướcbằng vớikíchcủa ảnh gốc,
mỗiphầntử của ảnh này đượctínhbằng cách tính
tổng của điểm ảnh phía trên và bên trái củanó.
Đặctrưng Haar - like
Ảnh tích hợplàảnh có các tính chất sau: giá trị pixel
tại
vị
trí
(
xy
)
bất
kỳ
trong
ảnh
tích
hợp
bằng
với
tổng
tại
vị
trí
(
x
,
y
)
bất
kỳ
trong
ảnh
tích
hợp
bằng
với
tổng
số các pix el thuộchìnhchữ nhật đượctạobởigóctrái
trên
cùng
của
ảnh
(
0
,
0
)
và
điểm
đang
xét
.
trên
cùng
của
ảnh
(
0
,
0
)
và
điểm
đang
xét
.
Trong
đó
:
Trong
đó
:
i:ảnh banđầu.
p:
ảnh
tích
hợp
của
i
p:
ảnh
tích
hợp
của
i
.
Đặctrưng Haar - like
Ví dụ:
Đặctrưng Haar - like
•Saukhiđãtínhđược integral image, việctính
tổng
các
giá
trị
mức
xám
của
một
vùng
D
bất
kỳ
tổng
các
giá
trị
mức
xám
của
một
vùng
D
bất
kỳ
nào đó đượcthựchiện đơngiản theo cách sau:
•
Với
A
+
B
+
C
+
D
là
giá
trị
tại
điểm
P
4
A+B
là
•
Với
A
+
B
+
C
+
D
là
giá
trị
tại
điểm
P
4
,
A+B
là
giá trị tại điểm P2, A+C là giá trị tại điểmP3,vàA
là
g
iá tr
ị
t
ạ
i điểmP1.
g
ị
ạ
D
A
B
C
P
1
P
2
P
P
P
3
P
4
Đặctrưng Haar - like
•Vậy, có thể viếtlạibiểuthức tính D như sau:
D
A
B
C
P
1
P
2
P
3
P
4
Mệnh
đề
(
biểu
diễn
duy
nhất
của
đặc
trưng
theo
phép
biến
đổi
Haar
)
:
Biến đổi ảnh 2 chiều thành dãy đặctrưng Wavelet
Mệnh
đề
(
biểu
diễn
duy
nhất
của
đặc
trưng
theo
phép
biến
đổi
Haar
)
:
Cho ma trận vuông A cấp2
n
, n nguyên dương. Theo phương pháp biến
đổi ảnh thành dãy đặctrưng củathuật toán TransformFeature thì dãy đặc
t
th
đ
là
d
hất
đối
ới
t ậ
A
t
rưng
th
u
đ
ược
là
d
uy n
hất
đối
v
ới
ma
t
r
ậ
n
A
.
9 Ảnh 16×16, mỗivéctơ
đầuvàocó:1+3+4
×
3+
4×4×3+4×4×4×3 = 256
đặctrưng.
9
Ảnh
8
×
8
thì
véc
tơ
đầu
Hình 3.9. Histogram của
dã
y
đ
ặ
c trưn
g
thu đư
ợ
c
9
Ảnh
8
×
8
thì
véc
tơ
đầu
vào có 64 đặctrưng.
13
y ặ g ợ
Biến đổi ảnh 2 chiều thành dãy đặctrưng Wavelet
Thuật
toán
TransformFeature
()
Thuật
toán
TransformFeature
()
Input Ma trận vuông (A,n) cấp2
n
.
Output Tập các đặctrưng {F
1
,F
2
, , }
22
F
nn
×
Method
Method
(1) - Khởitạo: Queue = ∅;i=1;
(2) - Tính F
i
=Tổng các điểm đen trong toàn bộ ma trận(A,n);
(
3
)
-
PUSH((A,n),
Queue
)
;
(
3
)
PUSH((A,n),
Queue
)
;
(4) While (Queue ≠∅ )
(5) { - POP(Queue, (A,n));
(
6
)
-if
(
n>1
)
{
n=nDIV2;
()
(
)
{
(7) Chia ảnh thành 4 phần: A
1
,A
2
,A
3
,A
4
;
(8) for (j=1; i ≤ 4; j++) PUSH((A
j
,n), Queue);
(9) }
ổ
ể
(10) - GọiS,S1,S2,S3,S4làt
ổ
ng các đi
ể
m đen tương ứng
(11) với các khốiA,A
1
,A
2
,A
3
,A
4
;
(12) - F
i+1
=S1+S2;F
i+2
=S2+S3;F
i+3
=S4;
(13)
i
i
+
3
14
(13)
-
i
=
i
+
3
;
(14) }
(15) Return {F};
Bi
ế
n đ
ổ
itoàncụcvà
khai
triển
chuỗi
khai
triển
chuỗi
• Phương pháp mô men: ảnh gốcsẽđược thay
thế
bằng
một
tập
các
đặc
trưng
vừa
đủ
để
biểu
thế
bằng
một
tập
các
đặc
trưng
vừa
đủ
để
biểu
diễncácđốitượng bấtbiến đốivới các phép thay
đổitỷ lệ,tịnh tiếnhoặc quay.
• Các mô men đượcxétnhư các dãy khai triển đặc
trưng vì ảnh gốccóthể xây dựng lạimộtcáchđầy
đủ
ừ
á
hệ
ố
ô
đủ
t
ừ
c
á
c
hệ
s
ố
m
ô
men.
Khai triển Karhunent-Loeve: phân tích các
t
iê
để
út
ố
hiề
ủ
tậ
đặ
t
vec
t
ơ r
iê
ng
để
r
út
gọns
ố
c
hiề
uc
ủ
a
tậ
p
đặ
c
t
rưng
bằng cách tạocácđặctrưng mớilàtổ hợp
tuyến
tính
của
các
đặc
trưng
gốc
Đây
là
phép
tuyến
tính
của
các
đặc
trưng
gốc
.
Đây
là
phép
biến đổitối ưu trong mộtsố lĩnh vực nén thông
tin.
Khai triển Karhunent-Loeve
• Khai triển Karhunent-Loeve được dùng trong các
bài toán nh
ậ
nd
ạ
n
g
mẫu: nh
ậ
nd
ạ
n
g
m
ặ
tn
g
ười
,
ậ
ạ g
ậ
ạ g
ặ
g ,
hệ thống OCR củaViện Công nghệ và Tiêu chuẩn
QuốcgiaHoaKỳ (NIST – National Institute of
Standards and Technology of the United States).
• Việc khai triển này đòi hỏisử dụng các thuật toán
ố
ấ
ử
có kh
ố
ilượn
g
tính toán r
ấ
tlớn nên việcs
ử
dụng các đặctrưng Karhunent-Loeve trong các
bài
toán
nhận
dạng
chữ
không
được
phổ
biến
bài
toán
nhận
dạng
chữ
không
được
phổ
biến
rộng rãi.
•
Tuy
nhiên
đối
với
đối
tượng
ảnh
lớn
hơn
(
mặt
•
Tuy
nhiên
,
đối
với
đối
tượng
ảnh
lớn
hơn
(
mặt
người) thì tỏ ra hiệuquả hơn.
Đặctrưng PCA
Phương pháp phân tích thành phần chính
(PCA‐ Principal Component Analysis) để rút
g
ọnsố chiềucủadữ liệu.
g
Mục đích củaphương pháp này là biến đổidữ
liệ
từ
khô
i
hiề
khô
i
liệ
u
từ
khô
ng g
i
an n c
hiề
usang
khô
ng g
i
an m
chiều(m<n).
Thựcchất đây là bài toán tìm véc tơ riêng và
giá
trị
riêng
của
ma
trận
giá
trị
riêng
của
ma
trận
.
Đặc trưng PCA
ThuậttoánPCA:
Input
:
Tập
mẫu
X={
X
∈
R
n
i
=
1N
}
Input
:
Tập
mẫu
X={
X
i
∈
R
n
,
i
=
1
, ,
N
}
Output: Tập đặctrưng Z={Z
i
∈R
m
, i=1, ,N, m<n}
Bước
1
:
Tính
ma
trận
đối
xứng
R
=
E(
XX
T
)
thông
Bước
1
:
Tính
ma
trận
đối
xứng
RE(
XX
)
thông
qua tậpmẫu.
Bước2: Tính các cặp vector riêng và giá trị riêng:
(
λ
1
,u
1
), ,(
λ
n
,u
n
) củaR.
Bước 3: - Tính Z=U
T
X, với U=[u
1
,u
2
, ,u
n
]
L h (< ) t iê t ứ
-
L
ựa c
h
ọn m
(<
n
)
vec
t
or r
iê
ng
t
ương
ứ
ng
với m giá trị riêng lớn nhất.
Kếtquả thu được là m thành phầncủaZtương
18
Kết
quả
thu
được
là
m
thành
phần
của
Z
tương
ứng với m giá trị riêng đã chọn.
Đặctrưng thống kê
Các đặctrưng thống kê bảo toàn các kiểubiến đổi
đad
ạ
n
g
về hình dán
g
của đốitư
ợ
n
g
.
ạ g
g
ợ g
Mặcdùcáckiểu đặctrưng này không thể xây
dựng lại ảnh gốc, nhưng nó đượcsử dụng để thu
ố
ề
ằ
ố
nhỏ s
ố
chi
ề
ucủatập đặctrưng nh
ằ
mtăng t
ố
c độ
và giảmthiểu độ phứctạp tính toán.
Phân
vùng
(zoning)
:
Khung
ảnh
được
chia
thành
Phân
vùng
(zoning)
:
Khung
ảnh
được
chia
thành
các vùng chồng nhau hoặc không chồng nhau.
Mục
đích
của
việc
phân
vùng
nhằm
thay
thế
các
Mục
đích
của
việc
phân
vùng
nhằm
thay
thế
các
tính chất toàn cụcbằng các tính chấtcụcbộ của
ảnh. Các đặctrưn
g
nà
y
tỏ ra phù hợpvới s
ự
biến
g
y
đổi đadạng trong các chi tiếtcủakýtự viết
tay.
Đặctrưng thống kê
Phân vùn
g
(
Zone
)
Chu tu
yế
n
(
Contour Profile
)
g
()
y
()
Đặctrưng thống kê
• Các giao điểmvàkhoảng cách:Một đặctrưng
thốn
g
kê phổ biếnlàsố
g
iao điểm
g
iữachutu
y
ến
g
g
g
y
của đốitượng vớimột đường thẳng theo một
hướng đặcbiệt nào đó.
Cá
đặ
t
à
từ
đ
G
Vk
à
•
Cá
c
đặ
c
t
rưng n
à
y
từ
ng
đ
ược
G
.
V
amva
k
as v
à
các cộng sự áp dụng để phân nhóm sơ bộ các
lớp
ký
tự
hệ
La
Tinh
Hy
Lạp
lớp
ký
tự
hệ
La
Tinh
,
Hy
Lạp
.
•Tương tự, khoảng cách từ biên của khung ảnh
tới điểm đen đầu tiên của đốitư
ợ
n
g
trên cùn
g
m
ộ
t
ợ g
g
ộ
dòng quét cũng đượcsử dụng làm đặctrưng
thống kê. Đặctrưng này có thể mô tả hình dạng
ấ
khái quát củachữ,tuynhiênnócũng r
ấ
tnhạy
cảmvới nhiễuvàđộ nghiêng củachữ.
Giao điểmvàkhoảng cách
Đặctrưng thống kê
• Các phép chiếu điểm ảnh:Cácđốitượng có thể
được
biểu
diễn
bằng
cách
chiếu
các
điểm
ảnh
lên
được
biểu
diễn
bằng
cách
chiếu
các
điểm
ảnh
lên
các dòng theo các hướng khác nhau.
• Đặctrưn
g
nà
y
ít nhạ
y
cảmvới nhiễu.
g
y
y
• Tuy nhiên, đốivớichữ, để sử dụng tốtlại đặctrưng
này thì cầnchuẩn hóa độ dày của nét chữ.
• Đặctrưng này đượcnhiều nhà nghiên cứusử dụng
rộng rãi trong các hệ thống OCR .
Đặctrưng thống kê
• Đặctrưng hướng:Cácđốitượng là các đoạn
thẳng
có
hướng
các
cung
hoặc
các
đường
cong
thẳng
có
hướng
,
các
cung
hoặc
các
đường
cong
.
•Hướng củacácnétđóng vai trò quan trọng trong
việc so sánh sự khác nhau
g
iữacácđốitượn
g
.
g
g
•Cácđốitượng đượcmôtả như các vectơ mà các
phầntử củanólàcácgiátrị thống kê về hướng.
Để
íh
h
á
đ
à
ó
đị h
h ớ
•
Để
tr
í
c
h
c
h
ọnc
á
c
đ
ặctrưng n
à
y, g
ó
c
đị
n
h
h
ư
ớ
ng
của các nét phải được phân chia thành mộtsố
vùng
cố
định
và
số
các
đoạn
của
nét
trong
mỗi
vùng
cố
định
và
số
các
đoạn
của
nét
trong
mỗi
vùng góc đượcchọnnhư một giá trịđặctrưng.
Đặctrưng theo hướng
Hiện nay, các đặctrưng hướng đượcápdụng rộng
rãi
vì
chúng
mô
tả
được
hình
dáng
khái
quát
của
rãi
vì
chúng
mô
tả
được
hình
dáng
khái
quát
của
đốitượng theo sự biến đổi đadạng của các nét.