Tải bản đầy đủ (.pdf) (4 trang)

041_Sử dụng mô hình Maximum Entropy nhận dạng màu da ảnh màu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (369.93 KB, 4 trang )

- 50 -
SỬ DỤNG MÔ HÌNH MAXIMUM ENTROPY NHẬN DẠNG MÀU DA ẢNH MÀU

Nguyễn Tuấn Nghĩa
MSV: 0122006
Email:

Người hướng dẫn: ThS.Đào Kiến Quốc



1. Tổng quan
Xây dựng hai mô hình nhận dạng màu da
ảnh màu với ràng buộc lấy từ tập cơ sở dữ liệu
Compaq. Mỗi mô hình sử dụng entropy cực
đại, mô hình đầu tiên là mô hình Baseline, xem
các pixel là độc lập với nhau. Mô hình thứ hai
là một mô hình Markov ẩn (HHM), nó thêm
vào ràng buộc hai điểm lân cận nhau có quan
hệ xuất hiện màu da và không phải màu da. Cả
hai mô hình đánh giá xác suất mộ
t giá trị màu
là màu da p(y
s
|x), nếu xác suất này cao hơn
một ngưỡng thì giá trị màu đó là màu da và
ngược lại.
2. Giới thiệu
2.1. Định nghĩa
Dò màu da là tìm kiếm trên các pixel màu
da của một ảnh màu. Kết quả là một ảnh nhị


phân cùng kích cỡ, trong đó màu trắng là da,
màu đen là không phải màu da hay còn gọi là
nền.
2.2. Phương thức
Mô hình entropy cực đại là một phương
thức suy ra mô hình thống kê từ tập cơ sở dữ
liệu. Nó th
ực hiện như sau: 1) Trích chọn đặc
trưng 2) Áp đặt các ràng buộc cho mô hình 3)
Xây dựng mô hình phân phối có điều kiện
p(y|x) 4) Thiết lập tham số mô hình 5) Sử dụng
lược đồ để phân lớp màu da và không phải
màu da.
Nhiệm vụ 1,2) chỉ ra các đặc trưng và áp
đặt ràng buộc với tập quan sát từ CSDL
Compaq 3) khi entropy đạt cực đại, chúng ta
có thể tính được phân phối p(y|x) 4) xây dựng
tham số cho mô hình bằng các đặ
c trưng địa
phương 5) bằng cách chọn mẫu theo thuật toán
lấy Gibbs, sử dụng mẫu này tính p(y
s
|x).
3. Mô hình entropy cực đại
3.1. Một số ký hiệu
Gọi tập các giá trị màu là S, giá trị màu tại
pixel s là x
s
, màu da (skinness) của pixel s là y
s


với y
s
= 1 nếu s là pixel màu da và y
s
= 0 nếu y
s

không phải màu da. Ảnh màu là được xem là
một vector của các pixel màu, được ký hiệu là
x và ảnh nhị phân tương ứng được tạo nên bởi
các màu da y
s
là y.
Giả sử biết được phân phối đồng thời của
vector p(x,y), theo công thức Bayes sẽ tính
được phân phối hậu nghiệm p(y|x). Mục tiêu
cuối cùng là tính xác suất một giá trị là màu da
p(y
s
=1|x
s
) từ phân phối hậu nghiệm.
Nhưng chúng ta không biết được phân
phối p(x,y) thay vào đó, có thể sử dụng CSDL
Compaq. Nó là tập mẫu:
{(x
(1)
,y
(1)

),(x
(2)
,y
(2)
),…,(x
(n)
,y
(n)
)}
trong đó 1

i

n=18.696, x
(1)
là một ảnh màu,
y
(1)
là ảnh nhị phân tương ứng, các mẫu là độc
lập với nhau và có xác suất phân phối p(x,y).
Tập các mẫu cũng được xem như tập dữ
liệu học. Xác suất được thiết lập bởi các thiết
lập kinh nghiệm và được ký hiệu bởi q.
Sau đây, trình bày tóm tắt cách xây dựng
mô hình phân phối xác suất màu da với của
một ảnh màu p(y|x).
3.2. Mô hình Baseline
Xây dự
ng mô hình tương ứng ràng buộc
một pixel bởi dữ liệu Compaq:

- 51 -
C
0
:

s

S,

x
s


C,

y
s


{0,1},
p(x
s
,y
s
) = q(x
s
,y
s
)
Trong đó q(x

s
,y
s
) là tỉ lệ pixel với màu x
s

skinness y
s
, trong tập dữ liệu học.
Theo công thức nhân Larange khi mô hình
đạt entropy cực đại, ta có:
p(y|x) = ∏
s∈S
q(y
s
|x
s
) (1)
trong đó: q(y
s
|x
s
) =
ss
1
(|y)(y)
()
s
s
qx q

qx

với q(x
s
) =
1
ss
ys=0
(|y)q(y)
s
qx


Chúng ta tính biểu thức trên bằng hai lược
đồ q(x
s
|y
s
= 1) và q(x
s
|y
s
= 0) tương ứng cho
phân phối của các pixel màu da và không phải
màu da.
3.3. Mô hình Markov ẩn (HMM)
Mô hình Baseline không có được nhiều
chặt chẽ, thực tế cho thấy các vùng da không
đơn thuần phân phối ngẫu nhiên mà nó được
cấu tạo nên bởi các vùng da rộng. Vì vậy, tăng

cường khả năng nhận dạng bằng cách ràng
buộc thêm xác suất xuất hiện màu da cho tất cả
cặp điểm lân cận nhau.
Trong HMM, sử dụng hệ thống 4 lân cận
(là lưới các pixel mà xung quanh mỗi pixel có
4 pixel lân cận), theo dõi màu da của hai điểm
lân cận s, t: (y
s
= a, y
t
= b), khả năng xảy ra
đồng thời màu da hay không phải màu da
p(a,b) với a = 0,1 và b = 0,1 tương ứng là ràng
buộc thuộc tập học.
Giả sử rằng mô hình MaxEnt là đẳng
hướng theo hai hướng ngang và dọc, có nghĩa
rằng q(y
s
,y
t
) = q(y
s'
,y
t'
) theo cùng một hướng.
Ràng buộc HHM như sau:
D: ∀s ~ t ∈ S x S, p(y
s
= 0, y
t

= 0) = q(0, 0)
và p(y
s
= 1, y
t
= 1) = q(1, 1).
Mô hình MaxEnt trong không gian C
0

D
theo phân phối Gibbs là:
p(y|x) =

∈Ss
ss
yxq
xp
yp
)|(
)(
)(
(2)
với p(y)=
0s t st
01
s~t
1
exp ( (1 y )(1 - y) 1 y)
(,)
()

aay
Za a
−+

(3)
, Z(a
0
,a
1
) =
0s t st
ys~t
exp ( (1 y )(1 - y) 1 y)
()
aay−+
∑∑
(4)
Hàm Z(a
0
,a
1
) là hàm phân hoạch để đảm bảo
ràng buộc thỏa mãn.
3.4. Thiết lập tham số
Đối với mô hình Baseline, có thể dễ dàng
tính phân phối p(y|x), tuy nhiên với HMM cần
thiết phải thiết lập hai tham số a
0
và a
1

để thỏa
mãn ràng buộc.
Thiết lập tham số có thể dùng cách tính
xấp xỉ, chúng ta sẽ thuật toán Metropolis lấy
mẫu thỏa mãn (3) mà không cần biết a
0
và a
1
,
sau đó, dùng mẫu này để tính hai tham số theo
công thức sau:
p(Y
s
=1|y
(s)
) =
10 0
(( ) (1) 4 )
s
aan a
φ
+−

Trong đó hàm n
s
(1) số các giá trị y
t
= 1, t~s, rõ
ràng hàm này chỉ nhận 5 giá trị {0,1,2,3,4}. Và
tương ứng với mỗi giá trị của n

s
(1), giá trị
p(Ys=1|y
(s)
) có thể thiết lập được từ ảnh mẫu,
có nghĩa chúng ta phải chỉ ra 5 biểu thức tuyến
tính để tính a
0
và a
1
. Kết quả a
0
=3,76 và
a
1
=3,94.
Bây giờ các tham số đã có, nhiệm vụ cuối
cùng cho một ảnh màu x tìm ảnh y nhị phân,
với màu trắng là da, màu đen không phải là da.
3.5. Nhận dạng màu da
Với một ảnh đầu vào, nhận dạng màu da
yêu cầu phải tính p(y
s
|x) là xác suất tại pixel s
là màu da.
Với mô hình Baseline, chỉ cần thay y
s
=1,
x
s

vào (1), có thể tính được xác suất giá trị màu
x
s
là màu da. Đối với HMM, tính công thức (2)
không phải là dễ dàng vì hàm Z không cố định,
thay vào đó chúng ta sử dụng thuật toán lấy
mẫu Gibbs, lấy dãy tuần tự mẫu sau:
y
1
, y
2
,…, y
n0
,…,y
n

với phân phối bất biến p(y|x).
Sau đó tính trung bình, p(ys|x) được tính bằng
- 52 -
0
()
0
1
1
n
j
s
jn
y
nn

=+



4. Thực nghiệm
Xây dựng hai mô hình Baseline và HMM
để kiểm thử khả năng nhận dạng màu da thì
thấy, khả năng nhận dạng của HMM tốt hơn
Baseline.
5. Định hướng phát triển
HMM có khả năng nhận dạng tốt hơn
Baseline, tuy nhiên do phải lấy mẫu, tốc độ
phụ thuộc vào kích thước ảnh, cỡ mẫu nên tốc
độ chậm hơn nhiều so với Baseline. Nhiệm vụ
sắp tới:

Cải thiện tốc độ tính toán bằng cách giảm
kích cỡ ảnh mà không ảnh hưởng tới nhận
dạng hoặc có thể giảm số chiều của không gian
màu RGB.

Cải thiện khả năng nhận dạng; ở đây,
chúng ta chỉ mới áp đặt ràng buộc cho khả
năng xuất hiện màu da của hai điểm lân cận,
thực tế vùng da còn xuất hiện theo từng nhóm
màu…

Áp dụng vào nhận dạng ảnh khiêu dâm.



























































- 53 -








×