Tải bản đầy đủ (.pdf) (27 trang)

Nghiên cứu nâng cao độ tương phản ánh theo tiếp cận đại số gia tử (tt)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.38 MB, 27 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
_____________________________________________________

NGUYỄN VĂN QUYỀN

NGHIÊN CỨU NÂNG CAO ĐỘ TƢƠNG PHẢN ẢNH
THEO TIẾP CẬN ĐẠI SỐ GIA TỬ

Chuyên ngành: Cơ sở toán học cho tin học
Mã số: 9 46 01 10

TÓM TẮT LUẬN ÁN TIẾN SỸ TOÁN HỌC

Hà Nội, 2018


Công trình đƣợc hoàn thành tại: Học viện Khoa học và Công nghệ Viện Hàn lâm Khoa học và Công nghệ Việt Nam

Ngƣời hƣớng dẫn khoa học 1: TS. Trần Thái Sơn
Ngƣời hƣớng dẫn khoa học 2: PGS.TS. Nguyễn Tân Ân

Phản biện 1: …………………………………………………………………
…………………………………………………………………………………
Phản biện 2: …………………………………………………………………
…………………………………………………………………………………
Phản biện 3: …………………………………………………………………
…………………………………………………………………………………

Luận án được bảo vệ trước Hội đồng chấm luận án tiến sĩ, họp tại Học


viện Khoa học và Công nghệ - Viện Hàn lâm Khoa học và Công nghệ
Việt Nam vào hồi … giờ …, ngày … tháng …. năm ….

Có thể tìm hiểu luận án tại:
1. Thư viện Học viện Khoa học và Công nghệ
2. Thư viện Quốc gia Việt Nam


DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ
[1]

Nguyễn Văn Quyền, Trần Thái Sơn, Nguyễn Tân Ân, Ngô Hoàng
Huy, Đặng Duy An, Một phương pháp mới để nâng cao độ tương phản
ảnh mầu theo hướng tiếp cận trực tiếp, Tạp chí Công nghệ Thông tin và
Truyền thông, Tập V-1 số 17(37), 06-2017, trang 59-74

[2]

Nguyễn Văn Quyền, Ngô Hoàng Huy, Nguyễn Cát Hồ, Trần Thái Sơn,
Xây dựng độ đo thuần nhất và nâng cao độ tương phản ảnh mầu theo
tiếp cận trực tiếp dựa trên đại số gia tử, Tạp chí Công nghệ Thông tin
và Truyền thông, Tập V-21 số 18(38), 12-2017, trang 19-32

[3]

Nguyễn Văn Quyền, Trần Thái Sơn, Nguyễn Tân Ân, “Thiết kế hàm
biến đổi độ xám dạng chữ S tăng cường độ tương phản ảnh sử dụng
ĐSGT”, Kỷ yếu hội thảo quốc gia về nghiên cứu Cơ bản và Ứng dụng
công nghệ thông tin lần thứ 10 (Fair 10), Thành phố Đà Nẵng, 8-2017,
trang 884-897.


[4]

Nguyễn Văn Quyền, Nguyễn Tân Ân, Đoàn Văn Hòa, Hoàng Xuân
Trung, Tạ Yên Thái, Phương pháp xây dựng một histogram mở rộng
cho ảnh đa kênh và ứng dụng, Tạp chí Nghiên cứu Khoa học và Công
nghệ quân sự, số 49, tháng 6-2017, trang 117-131.

[5]

Nguyễn Văn Quyền, Nguyễn Tân Ân, Đoàn Văn Hòa, Tạ Yên Thái,
Hoàng Xuân Trung, Xây dựng độ đo thuần nhất cho ảnh mầu dựa trên
các toán tử t-Norm”, Tạp chí Nghiên cứu Khoa học và Công nghệ quân
sự, số 50, tháng 8-2017, trang 127-137.


MỞ ĐẦU
Nâng cao độ tƣơng phản (ĐTP) ảnh là một vấn đề quan trọng trong xử lý
và phân tích hình ảnh, là một bƣớc cơ bản trong phân tích, phân đoạn ảnh. Nâng
cao độ tƣơng phản ảnh đƣợc phân loại thành hai tiếp cận chính: (1) Các phƣơng
pháp gián tiếp và (2) các phƣơng pháp trực tiếp.
a) Đối với các phƣơng pháp gián tiếp
Có nhiều kỹ thuật đã đề xuất đƣợc tìm thấy trong tài liệu tham khảo.
Phƣơng pháp tăng cƣờng độ tƣơng phản gián tiếp chỉ biến đổi histogram
mà không sử dụng bất kỳ một độ đo tƣơng phản nào.
Trong vài năm gần đây, nhiều nhà nghiên cứu đã áp dụng lý thuyết tập
mờ để phát triển các kỹ thuật mới nhằm nâng cao độ tƣơng phản của ảnh.
Các thuật toán theo tiếp cận mờ thƣờng dẫn đến yêu cầu thiết kế một hàm
biến đổi mức xám dạng chữ S (Hàm liên tục đơn điệu tăng, giảm giá trị mức
xám đầu vào khi đầu vào dƣới ngƣỡng, và ngƣợc lại tăng giá trị mức xám đầu

vào khi đầu vào ở trên ngƣỡng). Tuy nhiên việc lựa chọn hàm thuộc trong suy
diễn hệ luật mờ để tạo ra hàm biến đổi mức xám có dạng chữ S không phải là
việc dễ dàng. Ngay với hệ luật mờ đơn giản sau
R1: If luminance input is dark then luminance output is darker
R2: If luminance input is bright then luminance output is brighter
R3: If luminance input is gray then luminance output is gray
thì kết quả lập luận mờ sử dụng các tập mờ (fuzzy set) là không hiển nhiên và
khá khó khăn để đạt đƣợc hàm biến đổi mức xám dạng chữ S phù hợp.
b) Đối với các phƣơng pháp nâng cao độ tƣơng phản trực tiếp
Trong một thời gian dài cho đến nay hầu nhƣ chỉ có các nghiên cứu của
Cheng và cộng sự là theo hƣớng tiếp cận trực tiếp, các tác giả đã đề xuất một
phƣơng pháp biến đổi độ tƣơng phản tại mỗi điểm ảnh dựa trên định nghĩa một
độ đo thuần nhất cho điểm ảnh. Ngoài ra, Cheng và cộng sự cũng đã đề xuất một
thuật toán sử dụng hàm S-function có tham số để biến đổi ảnh đa cấp xám I đầu
vào sau đó nâng cao độ tƣơng phản của ảnh biến đổi theo phƣơng pháp trực tiếp.
Các thuật toán của Cheng là cơ sở của phép nâng cao độ tƣơng phản các
ảnh đa cấp xám. Tuy vậy các thuật toán này vẫn còn tồn tại một số hạn chế sau
khi áp dụng cho ảnh mầu, ảnh đa kênh…:
(i) Ảnh nâng cao độ tƣơng phản có thể không thay đổi mức độ sáng của
mầu so với ảnh gốc.
(ii) Dùng các ảnh đã đƣợc biến đổi theo phƣơng pháp biến đổi ảnh của
Cheng để nâng cao độ tƣơng phản ảnh có thể làm mất chi tiết của ảnh gốc.
Về độ đo thuần nhất cho điểm ảnh, Cheng đề xuất cách ƣớc lƣợng giá trị
thuần nhất của điểm ảnh đƣợc kết nhập từ các giá trị địa phƣơng Eij, Hij, Vij, R4,ij.
Khi thử nghiệm với ảnh mầu, chúng tôi nhận thấy với phép kết nhập này ảnh kết
quả có thể không trơn .


2


Thực tế giá trị độ thuần nhất của điểm ảnh là một giá trị mờ và chúng ta
có thể áp dụng lập luận mờ để thu nhận giá trị này.
Nếu các đặc trƣng địa phƣơng E , H đƣợc chuyển cho một tiếp cận tính
ij

toán với từ thì công thức kết nhập dạng

ij



T e h E ij , H

ij

 cần phản ánh luật mờ nhƣ

sau:
Nếu

g r a d ie n t

là cao và

e n tr o p y

là cao thì độ thuần nhất là cao

Nếu g r a d i e n t là thấp và e n t r o p y là thấp thì độ thuần nhất là thấp
Nếu chúng ta bổ sung thêm các luật với từ các gia tử nhƣ “rất”, “ít”, “

vừa” v.v .. với các biến ngôn ngữ nhƣ “homogeneity”, “entropy”,“gradient”
v.v... thì các giá trị thuần nhất có thể đƣợc ƣớc lƣợng bằng suy diễn của con
ngƣời và vì thế sẽ mịn hơn.
Do lý thuyết tập mờ không có cơ sở hình thức giữa các quan hệ của biến
ngôn ngữ và các tập mờ và quan hệ thứ tự giữa các từ nên cần xem xét sử dụng
một phƣơng pháp lập luận mờ luôn đảm bảo thứ tự.
Qua khảo sát, phân tích và thực nghiệm chúng tôi đã rút ra kết luận :
Thứ nhất, phép lập luận if-then dựa trên tập mờ rất khó đảm bảo hình
dạng chữ S của hàm biến đổi mức xám. Phép nâng cao độ tƣơng phản theo
hƣớng tiếp cận trực tiếp của Cheng sử dụng một hàm biến đổi mức xám dạng
chữ S không đối xứng, giá trị mức xám biến đổi có thể rơi ra ngoài miền giá trị
của độ xám.
Thứ hai, độ đo thuần nhất của Cheng vẫn còn một vài hạn chế, chẳng hạn
ảnh kết quả có thể không trơn.
Thứ ba, sử dụng trực tiếp thuật toán của Cheng trên kênh ảnh gốc thì độ
sáng của ảnh kết quả có thể ít thay đổi. Để thay đổi đƣợc độ sáng cần phải biến
đổi ảnh gốc trƣớc khi áp dụng phép nâng cao độ tƣơng phản của Cheng. Phép
biến đổi ảnh của Cheng có thể làm mất chi tiết của ảnh gốc.
Vấn đề nghiên cứu của luận án là:
Vấn đề 1: Thiết kế hàm biến đổi mức xám dạng chữ S và đối xứng.
Vấn đề 2: Xây dựng độ đo thuần nhất địa phƣơng của ảnh.
Vấn đề 3: Xây dựng phép mờ hóa ảnh không đánh mất chi tiết ảnh gốc
CHƢƠNG 1.
TỔNG QUAN VỀ NÂNG CAO ĐỘ TƢƠNG PHẢN ẢNH
VÀ TIẾP CẬN ĐẠI SỐ GIA TỬ GIẢI HỆ LUẬT MỜ
Chƣơng này trình bày các khái niệm về đại số gia tử (ĐSGT) và phƣơng
pháp lập luận xấp xỉ dựa trên ĐSGT, giới thiệu tổng quan của các phƣơng pháp
nâng cao độ tƣơng phản ảnh nhƣ một số phƣơng pháp gián tiếp, phƣơng pháp
trực tiếp. Phân tích, đề xuất sử dụng ĐSGT áp dụng nâng cao độ tƣơng phản
theo phƣơng pháp trực tiếp.



3

1.1. Đại số gia tử: một số vấn đề cơ bản
1.1.1. Các khái niệm cơ bản về đại số gia tử
Miền ngôn ngữ X = Dom(X) của một biến ngôn ngữ X có thể đƣợc tiên đề
hóa và đƣợc gọi là đại số gia tử và đƣợc ký hiệu là AX = (X, G, H, ) trong đó
G là tập các phần tử sinh, H là tập các gia tử (hedge) còn “” là quan hệ cảm
sinh ngữ nghĩa trên X. Giả thiết trong G có chứa các phần tử hằng 0, 1, W với ý
nghĩa là phần tử bé nhất, phần tử lớn nhất và phần tử trung hòa (neutral) trong
X. Ta gọi mỗi giá trị ngôn ngữ x  X là một hạng từ (term) trong ĐSGT.
Nếu X và H là các tập sắp thứ tự tuyến tính, khi đó AX = (X, G, H, ) là
ĐSGT tuyến tính. Hơn nữa, nếu đƣợc trang bị thêm hai gia tử tới hạn là  và 
với ngữ nghĩa là cận trên đúng và cận dƣới đúng của tập H(x) khi tác động lên x,
thì ta đƣợc ĐSGT truyến tính đầy đủ, ký hiệu AX = (X, G, H, , , ). Vì trong
luận án chỉ quan tâm đến ĐSGT tuyến tính, kể từ đây nói ĐSGT cũng có nghĩa
là ĐSGT tuyến tính.
Khi tác động gia tử h  H vào phần tử x  X, thì thu đƣợc phần tử ký hiệu
hx. Với mỗi x  X, ký hiệu H(x) là tập tất cả các hạng từ u  X sinh từ x bằng
cách áp dụng các gia tử trong H và viết u = hn…h1x, với hn, …, h1  H.
Tập H gồm các gia tử dƣơng H+ và gia tử âm H-. Các gia tử dƣơng làm
tăng ngữ nghĩa của một hạng, gia tử âm làm giảm ngữ nghĩa của hạng từ. Không
mất tính tổng quát, ta luôn giả thiết rằng H- = {h-1 < h-2 < ... < h-q} và H+ = {h1 <
h2 < ... < hp}.
1.1.2. Các hàm đo trong đại số gia tử tuyến tính
Trong phần này ta sử dụng ĐSGT tuyến tính AX = (X, C, H, ) với C = {c, c+}  {0, 1, W}. H = H-  H+, H- = {h-1, h-2, ..., h-q} thỏa h-1 < h-2 < ... < h-q và
H+ = {h1, h2, ..., hp} thỏa h1< h2 < ... < hp. và h0 = I với I là toán tử đơn vị.
Gọi H(x) là tập các phần tử của X sinh ra từ x bởi các gia tử. Vì vậy, kích
thƣớc của tập H(x) có thể biểu diễn tính mờ của x. Độ đo tính mờ của x, ta ký

hiệu là fm(x), là đƣờng kính của tập f(H(x)) = {f(u) : u  H(x)}.
Định nghĩa 1. Cho AX = (X, G, H, , , ) là một ĐSGT tuyến tính đầy
đủ. Ánh xạ fm : X  [0,1] đƣợc gọi là một đo tính mờ của hạng từ trong X nếu:
(1) fm là đầy đủ, tức là fm(c-) + fm(c+) =1 và hH fm(hu) = fm(u), uX;
(2) fm(x) = 0, với các x thỏa H(x) = {x}. Đặc biệt, fm(0) = fm(W) = fm(1)
= 0;
(3) x,y  X, h  H,

fm ( hx )
fm ( x )



fm ( hy )
fm ( y )

, tỷ số này không phụ thuộc vào x và

y, vì vậy nó đƣợc gọi là độ đo tính mờ của các gia tử và đƣợc ký hiệu bởi (h).
Mệnh đề 1. Với độ đo tính mờ fm và  đã đƣợc định nghĩa trong Định
nghĩa 1, ta có:


4
-

+

(1) fm(c ) + fm(c ) = 1 và  h H
(2) 

(3) 

1

 (h j )  

j q

x X

,

fm ( x )  1 ,

p
j 1

fm ( h x )  fm ( x )

 (h j )  

;

, với ,  > 0 và  +  = 1;

trong đó Xk là tập các hạng từ có độ dài đúng

k

k;

(1.1
(4) fm(hx) = (h).fm(x), và xX, fm(x) = fm(x) = 0;
)
(5) Cho fm(c-), fm(c+) và (h) với hH, khi đó với x = hn...h1c,
  {-,+}, dễ dàng tính đƣợc độ đo tính mờ của x nhƣ sau:
fm(x) = (hn)...(h1)fm(c).
Định nghĩa 2. Một hàm dấu Sign : X  {-1, 0, 1} là một ánh xạ đƣợc
định nghĩa đệ qui nhƣ sau, trong đó h, h'  H và c  {c-, c+}:
(1) Sign(c-) = -1, Sign(c+) = 1;
(2) Sign(hc) = -Sign(c) nếu h âm đối với c; Sign(hc) = Sign(c) nếu (1.2)
h dƣơng đối với c;
(3) Sign(h'hx) = -Sign(hx), nếu h'hx  hx và h' âm đối với h;
Sign(h'hx) = Sign(hx), nếu h'hx  hx và h' dƣơng đối với h;
(4) Sign(h'hx) = 0, nếu h'hx = hx.
Mệnh đề 2. Với mọi gia tử h và phần tử xX nếu sign(hx) =+1 thì hx > x
và nếu sign(hx) = -1 thì hx < x.
Định nghĩa 3. Cho fm là hàm độ đo tính mờ trên X. Một hàm định lƣợng
ngữ nghĩa (SQM) v trên X (kết hợp với fm) đƣợc định nghĩa nhƣ sau:
(1) (W) =  = fm(c-), (c-) =  – .fm(c-) = .fm(c-), (c+) = 
+.fm(c+);
(1.3)
Sign ( j )  ( h ) fm ( x )   ( h x )  ( h x ) fm ( x )  ,
(2)  ( h j x )   ( x )  Sign ( h j x )   ij  Sign

( j)
i
j
j





với mọi j, –q  j  p và j  0, trong đó:
 (h j x) 

1
2

1 



Sign ( h j x ) Sign ( h p h j x )(    )   , 

;

(3) (c-) = 0, (c-) =  = (c+), (c+) = 1, và với mọi j thỏa –
q  j  p, j  0, ta có:
(hjx) = (x) +
Sign ( h j x )



j  Sign ( j )
i  Sign ( j )



1




1

 ( h i ) fm ( x ) 

1  Sign

( h j x )  ( h j ) fm ( x ),

1  Sign

( h j x )  ( h j ) fm ( x ).

2

(hjx) = (x) +
Sign ( h j x )



j  Sign ( j )
i  Sign ( j )

 ( h i ) fm ( x ) 

2

Mệnh đề 3. xX, 0  v(x)  1.
1.1.3. Phép nội suy sử dụng SQM

Chúng ta xem xét vấn đề lập luận mờ đa điều kiện (FMCR) có dạng sau:


5

If X1 = A11 and ... and Xm = A1m then Y = B1
If X1 = A21 and ... and Xm = A2m then Y = B2
..........
(1.4)
If X1 = An1 and ... and Xm = Anm then Y = Bn
trong đó Aij, Bi, j = 1, .., m và i = 1, …, n, không phải là các tập mờ mà là giá trị
ngôn ngữ. Vấn đề suy diễn là với đầu vào cho trƣớc Xj = A0j, j = 1, …, m, mô
hình ngôn ngữ cho (1.4) sẽ hỗ trợ chúng ta tìm đầu ra Y = B0. Không giảm tổng
quát chúng ta có thể giả sử đầu vào là các vector có ngữ nghĩa là giá trị số đã
đƣợc chuẩn hóa về đoạn [0,1].
A0 = (a0,1, …, a0,m), a0,j  [0, 1] với j = 1, 2, … m, và đầu ra là một giá trị
số cũng đƣợc chuẩn hóa trong [0, 1].
Vấn đề FMCR bây giờ đƣợc chuyển vào nội suy bề mặt và đƣợc giải nhờ
sử dụng một phƣơng pháp nội suy nào đó. Trong ĐSGT, phƣơng pháp này đƣợc
thực hiện nhƣ sau:
Bƣớc 1: Xác định ĐSGT cho các biến ngôn ngữ
Xj và Y là: AXj = (Xj, Gj, Cj, Hj, j) và AY = (Y, G, C, H, ) tƣơng ứng.
Tập tất cả các tham số bao gồm, với mỗi j = 1, …, m:
*) m+1 tham số tính mờ: j = fm(cj), and  = fm(c).
*) pj + qj –1 tham số tính mờ của AXj: (hj, qj), ..., (hj, 1), (hj, 1), ..., (hj,
pj).
*) p + q – 1 tham số tính mờ của AY: (hq), ..., (h1), (h1), ..., (hp).
Trong thực hành, các tham số này có thể đƣợc gán bằng kinh nghiệm hoặc
đƣợc xác định nhờ thuật toán tối ƣu chẳng hạn sử dụng giải thuật di truyền.
Giả sử Xj và Y là các SQM của các ĐSGT AXj và AY của các biến ngôn

ngữ Xj và Y tƣơng ứng, j = 1, 2, … m. Gọi
mặt ngôn ngữ và

S n o rm 

 v

X

j

(x j )



j 1, m

, vY ( y )



SL 

 x 
j

j  1, m

, y


 [ 0 , 1]
x j X

j



n


i  1, n



X j Y

là siêu

j 1

m 1

, j 1, m , yY

(1.4) sẽ đƣợc nhúng nhƣ n điểm Ai = (Ai1, …, Aim, Bi) và sau đó, (1.4) mô
tả siêu mặt ngôn ngữ SL trong không gian X1  …  Xm  Y.
Vector (X1, …, Xm, Y) của các SQM Xj, j = 1, …, m, và Y chuyển
siêu mặt ngôn ngữ SL thành Snorm: (X1, …, Xm, Y) : SL  Snorm
Bƣớc 2: Xác định một phƣơng pháp nội suy trên Snorm
Tính các SQM v (A ) , v ( B ) ( j  1, m , i  1, n )

X

Siêu mặt Snorm



j

 v

ij

X

j

Y

(A ij )

i



j 1, m

, vY ( B i )




có thể đƣợc xác định bởi một hàm
i 1, n

kết nhập m-đối fSnorm, v = fSnorm(u1, ..., um), v  [0, 1] và uj  [0, 1],
mãn điều kiện Y(Bi) = fSnorm(X1(Ai1), ..., Xm(Aim)),

i  1, n

.

j  1, m

, thỏa


6

(Chúng ta có thể sử dụng một trong rất nhiều phép nội suy đã có để thực hiện
nội suy)
Bƣớc 3: Tìm đầu ra B0 tƣơng ứng với đầu vào A0 đã chuẩn hóa về [0, 1]:
A0 = (a0,1, …, a0,m), a0,j  [0, 1] for j  1, m



b0  f S n o rm a

, ..., a
0 ,1

0 ,m


  [ 0 , 1]

(1.5)

1.2. Nâng cao độ tƣơng phản ảnh theo tiếp cận của Cheng
1.2.1. Tham số trích rút tự động (từ ảnh đa cấp xám) bằng thuật toán của
Cheng
a. Dải động mức xám: là đoạn [a,c] đƣợc tính dựa trên histogram của ảnh.
b. Phép biến đổi ảnh sử dụng S-function.
S I ( a , b o p t , c )   S  fu n c ( I ( i , j ); a , b o p t , c ) 

I   I ( i , j )

trong đó [a, c] là dải động mức xám là các tham số đƣợc ƣớc lƣợng tự động khi
khảo sát các đỉnh histogram và bopt đƣợc ƣớc lƣợng dựa trên nguyên lý cực đại
fuzzy entropy:
bopt 

a rg m a x  H ( I ; a , b , c )
b [ a  1 , c  1 ]

ở đây H là độ đo fuzzy entropy thông dụng.
c. Tính các tham số địa phƣơng của ảnh xám gốc (hoặc ảnh đã đƣợc biến
đổi) và chuẩn hóa giá trị về đoạn [0,1], gradient Eij, entropy Hij, trung bình độ
lệch chuẩn Vij, và moment bậc 4 R4,ij.
d. Tính độ đo thuần nhất của từng điểm ảnh xám gốc (hoặc ảnh đã đƣợc
biến đổi) dựa trên phép kết nhập 4 giá trị địa phƣơng.
HO
(1.6)

 
,
ij

ij

m a x H O ij

H O ij  E ij * V ij * H ij * R 4 ,ij   1  E ij  *  1  V ij  *  1  H ij  *  1  R 4 ,ij 

Trong đó

(1.7)

đ. Tính độ sáng xung quanh (non-homogeneity gray value) của từng điểm
ảnh xám gốc (hoặc ảnh đã đƣợc biến đổi)



ij



g

( p , q ) W

pq

(1  


pq

)

ij



(1  

( p , q ) W

pq

(1.8)

)

ij

e. Tính số mũ khuếch đại:
 ij   m in 

, trong đó

 m in 

  m ax


  m in  *   ij   m in



(1.9)

 m a x   m in

g k  g1
g m ax  g 1

,  m ax  1 , gk, g1 là các đỉnh của histogram

g. Tính độ tƣơng phản địa phƣơng, và khuếch đại.
C ij 

g ij   ij
g ij   ij

,C

'
ij

 ij

 C ij

t


trong đó t{0.25, 0.5}

(1.10)

h. Tính mức xám đầu ra theo từng điểm ảnh xám gốc (hoặc ảnh đã đƣợc


7

biến đổi) của phép nâng cao ĐTP sử dụng một hàm chữ S không đối xứng:

'

g ij


  ij


 

  ij



1  C ij
1  C ij
'

1  C ij


  ij

'

1  C ij

t

 ij

1  C ij

, g ij   ij

(1.11
)

t

 ij

'

1  C ij

t

 ij


'

  ij

1  C ij

t

 ij

1  C ij

, g ij   ij

i. Nếu sử dụng ảnh biến đổi ở bƣớc c-h thì cần áp dụng biến đổi ngƣợc
của phép biến đổi ảnh để nhận đƣợc điểm ảnh kết quả đầu ra cuối cùng.
Phép nâng cao độ tƣơng phản của Cheng thỏa mãn luật: Tại từng điểm
ảnh trên đó tác động bƣớc c-h, độ thuần nhất điểm ảnh càng cao thì mức độ
nâng tƣơng phản tại điểm ảnh đó càng thấp. (tạm ký hiệu là: RCE-rule of
contrast enhancement).
Do một biến đổi ảnh là đơn điệu tăng, thƣờng bảo toàn cƣờng độ biên ảnh
và giá trị entropy địa phƣơng nên luật RCE nói chung cũng thỏa mãn với ảnh
gốc ngay cả khi trong phép nâng cao độ tƣơng phản trực tiếp có sử dụng một
biến đổi ảnh.
1.2. Một số chỉ số đánh giá độ tƣơng phản ảnh.
1.2.1. Chỉ số entropy trung bình cho nhiều kênh ảnh {I1,I2,…,IK}:
Sử dụng chỉ số entropy thông dụng cho từng ảnh xám, chỉ số đƣợc tính
nhƣ sau:
(1.12)
E ( I )    p ( g ) lo g ( p ( g )) ,

L m ax k

k

k

2

k

g  L m in k
K


E a vg ( I 1, K ) 
def

pk (g ) 

E (Ik )

k 1

trong đó

K

#  I k (i, j )  g 
M *N


và quy ƣớc 0*log2(0) = 0.

Giá trị của chỉ số entropy của kênh ảnh cao thì có thể xem kênh ảnh là
giầu tính chi tiết. Thƣờng kênh ảnh có độ tƣơng phản cao thì kênh ảnh có
histogram tƣơng đối đồng đều, giá trị entropy là cao. Đây chính là nguyên tắc
hiệu chỉnh histogram của các phƣơng pháp nâng cao ĐTP gián tiếp.
1.2.2. Chỉ số fuzzy-entropy trung bình cho nhiều kênh ảnh {I1, I2,…, IK}:
Sử dụng chỉ số fuzzy entropy thông dụng cho từng ảnh xám, chỉ số đƣợc
tính nhƣ sau:
(1.13)
 H (I )
K

k

H

( I 1, K ) 

avg

, trong đó:

k 1

K
Lk

H




(Ik )  

,m a x

   ( g ) lo g

g  Lk

def

g

 (g) 

2

(  ( g ) )   1   ( g )  lo g 2 (1   ( g ) )  * p k ( g )

,m in

g  L k , m in
L k , m a x  L k , m in

và quy ƣớc 0*log2(0) = 0.

,



8

Giá trị fuzzy entropy càng thấp thì độ phân biệt một điểm ảnh của một kênh
ảnh là sáng hoặc tối càng cao, tức là ảnh càng có độ tƣơng phản tối – sáng cao,
các điểm ảnh của kênh ảnh Ik có mức xám tƣơng phản cao với mức sáng “xám”
ở giữa:
I k (i, j ) 

L k , m in  L k , m a x

 H (Ik ) 

2

1.2.3. Chỉ số độ tƣơng phản trực tiếp của một kênh ảnh (lấy trung bình giá trị độ
đo tƣơng phản tại từng điểm ảnh, chỉ số này do nghiên cứu sinh đề xuất)
Chỉ số tƣơng phản của một ảnh xám Ik’ so với một kênh ảnh xám gốc Ik
(Ik’ và Ik có cùng kích thƣớc MxN), chúng đƣợc cho nhƣ sau:
I k ( i , j )   k ,ij
'


CM (Ik , Ik ) 
'

i ,j

I k ( i , j )   k ,ij
'


(1.14)

M * N

, trong đó các giá trị {k,ij} của ảnh xám Ik đƣợc tính bằng công thức (1.8) của
Cheng.
Chỉ số này sẽ đƣợc dùng để đánh giá các thuật toán nâng cao ĐTP theo phƣơng
pháp trực tiếp. Chỉ số độ tƣơng phản trực tiếp càng cao thì kênh ảnh kết quả
đƣợc nâng cao độ tƣơng phản càng mạnh so với kênh ảnh gốc.
CHƢƠNG 2.
BIẾN ĐỔI ẢNH ĐA KÊNH VÀ XÂY DỰNG HÀM BIẾN ĐỔI CHỮ S
THEO TIẾP CẬN ĐẠI SỐ GIA TỬ VÀ ỨNG DỤNG NÂNG CAO
ĐỘ TƢƠNG PHẢN ẢNH ĐA KÊNH
Chƣơng này trình bày về histogram mờ, phƣơng pháp xác định nhiều dải
động mức xám dựa vào histogram mờ - cơ sở để xây dựng phép biến đổi ảnh đa
kênh và phƣơng pháp xây dựng hàm biến đổi độ xám dạng chữ S dựa trên đại số
gia tử.
2.1. Ƣớc lƣợng nhiều dải động mức xám dựa vào phân cụm mờ FCM
Sử dụng phân cụm mờ để ƣớc lƣợng dải động của mức xám của từng kênh
ảnh của ảnh đa kênh. Lƣu ý rằng trong một số biểu diễn màu nhƣ biểu diễn màu
RGB, các kênh ảnh là không độc lập mà có độ tƣơng quan cao, vì thế cách làm
ƣớc lƣợng dải động của từng kênh ảnh độc lập là không hoàn toàn phù hợp trong
trƣờng hợp tổng quát.
Sử dụng phân cụm FCM, việc ƣớc lƣợng dải động mức xám của từng cụm
ảnh là dễ dàng hơn do tính đồng nhất cao của giá trị mức xám trong một cụm.
Với một tổ hợp K kênh ảnh của ảnh I để thuận tiện chúng ta ký hiệu
thành C
I
 { I ,I ,...,I } , sử dụng thuật toán phân cụm mờ FCM phân cụm I
1, K


1

2

K

1, K

cụm, C ≥ 2. Thuật toán lặp FCM cực tiểu hóa hàm mục tiêu:
J (V ,  ) 

2

C


i, j

c 1

 i , j ,c I 1, K ( i , j )  V c
2

 m in

với độ đo khoảng cách Ơcơlit,

(2.1)



9
K

I 1, K ( i , j )  V c





( I k (i, j )  V c ( k ))

2

và các ràng buộc biến nhƣ sau:

k 1

 i , j, c  [ 0 ,1],1  c  C

(i)
(ii)

C



 i , j, c  1,  1  i  M , 1  j  N

(2.2)


c 1

(iii) 

 i , j, c  0 ,  1  c  C

i, j

Nhƣ vậy với FCM chúng ta nhận đƣợc bảng các giá trị độ thuộc từng cụm
cho từng điểm ảnh là   i , j , c  , trong đó 1≤ c ≤C, 1 ≤ i ≤ M và 1 ≤ j ≤ N.
2.2. Histogram mờ với phân cụm FCM
Định nghĩa 2.1. Lƣợc đồ xám mờ.
Giả sử   i , j , c  là bảng độ thuộc thỏa mãn ở công thức (2.2), lƣợc đồ xám
mờ theo từng cụm c chiếu lên kênh Ik của ảnh I (trong một biểu diễn màu), 1  c
 C, 1  k  K, ký hiệu là h đƣợc xác định nhƣ sau:
k

c

k

hc

g 






1

(2.3)

 i , j , c , g  L k , m in ... L k , m a x

2

K



k

( i , j )  g i,j  g i,j , g i,j ,.., g i,j : g i,j  g



Nhận xét:
Khi K = 1, C = L1,max – L1,min + 1 và
Thì

1

h1  g  L

1 ,m in

 1, I 1 ( i , j )  L 1, m in  c  1
 c  1, L 1, m a x  L 1, m in  1,  i , j , c  

0

(g )  H is I ( g )  g  L1, m in , L1, m a x
1

.

Mệnh đề 2.1. Tính chất của lƣợc đồ xám mờ:
(i)  k  1, K , c  1, C , g  [L ,L ] : 0  h ( g )  M * N
k

k ,m in

(ii)
(iii)

k ,m a x

c



k
 k  1, K ,  L k ,m in  g  L k ,m a x :   h c ( g )   H is I ( g )
k
 1 c  C





 k  1, K :

hc ( g )  M * N
k

1  c  C , L k ,m in  g  L k ,m a x

2.3. Thuật toán ƣớc lƣợng nhiều dải động mức xám dựa vào histogram mờ
Ƣớc lƣợng từng vùng mức xám tập trung của histogram mờ. Đây là nguyên
lý để xác định đƣợc nhiều dải động mức xám của một kênh ảnh của ảnh đa kênh.
Thuật toán 2.1: Ƣớc lƣợng C dải động mức xám của một cụm trong một
tổ hợp kênh ảnh sử dụng histogram mờ.
Đầu vào: K kênh của ảnh I (trong một biểu diễn màu), I  { I , ...,I } , tham
1, K

số C N



,C  2

1

K

, ngƣỡng fcut (fcut > 0, đủ nhỏ), M x N là kích thƣớc của ảnh I.

Đầu ra:  B

k ,1 , c


, B k ,2 ,c 

k 1, K ,c 1,C

, trong đó

L k , m in  B k ,1, c  B k , 2 , c  L k , m a x ,  c  1, C , k  1, K

Bƣớc 1: Phân C cụm tập vector dữ liệu  I k ( i , j ) i  1, M , j  1, N , k  1, K bằng thuật toán
FCM chuẩn ta đƣợc V  ,   i , j , c 
C

c

c 1

i  1 , M , j 1 , N , c 1 , C

, theo công thức (2.2).


10

Bƣớc 2: Xác định histogram mờ  h 
k

c

Bƣớc 3:


theo công thức (2.3).

 k  1, K , c  1, C


B k ,1, c  m in  B : B  [L k ,m in ,L k ,m a x ] 


B k ,2 ,c

c 1,C , k 1, K

L k ,m a x
 B
 
k
k
  hc ( g )  f cut  hc ( g )  


g  L k ,m in
 g  L k ,m in
 


 m in  B : B  [B k ,1 , c + 1 ,L k ,m a x ] 


Trả về:  B


k ,1 , c

, B k ,2 ,c 






L k ,m a x



L k ,m ax

hc ( g )  f cut
k

gB


g  L k ,m in

,
(2.4)

 
hc ( g )  


 
k

k 1, K ,c 1,C

Thuật toán 2.1 có độ phức tạp tồi nhất là O(M*N*L), trong đó L là tham số
số lần lặp tối đa của thuật toán FCM chuẩn.
2.4. Biến đổi kênh ảnh
Định nghĩa 2.2: Phép biến đổi kênh ảnh của một tổ hợp kênh trong một
biểu diễn màu của ảnh đầu vào.
Xét K kênh của ảnh I, I  { I , ...,I } trong một biểu diễn màu, C  N , C  2


1, K

là số cụm,  B
thuật toán 1.
Với mỗi
sau:

k ,1 , c

, B k ,2 ,c 

k  1, K




F k ( i , j )  L k , m in 






L

k 1, K ,c 1,C

K

là các dải động mức xám đƣợc xác định nhờ

, chúng ta xác định một biến đổi Fk cho kênh ảnh Ik nhƣ
C

k ,m ax

1

 L k , m in


c 1

 I k ( i , j )  B k ,1 , c
c lip 
 B
 B k ,1 , c
k ,2 ,c


C


 

,





(2.5)

trong đó k  1, K , i  1, M , j  1, N , clip(x) = min{max{x, 0}, 1} và [x] chỉ phần
nguyên của số thực x.
Mệnh đề 2.2. Biến đổi ảnh Fk bảo toàn thứ tự, nghĩa là
I k ( i , j )  I k ( i ', j ')  L k , m in  F k ( i , j )  F k ( i ', j ')  L k , m a x

Nhận xét: Mệnh đề 2.2 nói lên tính chất ảnh kết quả sau khi biến đổi bảo
toàn chi tiết của kênh ảnh đầu vào trong miền giá trị mức xám, không xảy ra
trƣờng hợp các điểm ảnh có gía trị mức xám nhỏ sau khi biến đổi ảnh lại biến
thành các điểm ảnh có giá trị mức xám lớn.
Để so sánh với phƣơng pháp biến đổi ảnh của Cheng, chúng tôi chọn 6 ảnh
minh họa kết quả nhƣ sau:

#1: Kích thƣớc 352x254
#2: Kích thƣớc 256x384

#3: Kích thƣớc 512x384 (trong

tập dữ liệu TID2013)


11

#4: Kích thƣớc 512x384
(trong tập dữ liệu
TID2013)

#5: Kích thƣớc
512x384 (trong tập dữ
liệu TID2013)

#6: Kích thƣớc 633x647
(kênh mầu ảnh viễn thám,
huyện Lạc Thủy Việt
Nam)
Hình 2.1. Ảnh gốc #1 - #6 cho thực nghiệm

(a)

(b)

(c)
(d)
Hình 2.2. Ảnh mờ hóa của ảnh #1,#5 sử dụng biến đổi ảnh của Cheng (a),(c) và
ảnh kết quả sử dụng thuật toán đề xuất 2.1 (b), (d) tƣơng ứng.
Trên hình ảnh mờ hóa của ảnh #1, #5 sử dụng biến đổi của Cheng, chi tiết ảnh ở
các vùng đƣợc đánh dấu hình chữ nhật là bị mất, trong khi đó ảnh biến đổi sử
dụng nhiều dải động ƣớc lƣợng từ phân cụm FCM cho tổ hợp kênh RGB (thuật

toán 2.1) chi tiết ảnh đƣợc giữ tốt hơn.
Bảng 2.1. So sánh giá trị Havg trên kênh R, G và B của các ảnh.
là kết quả của phép mờ hóa – biến đổi ảnh.
Ảnh Độ đo fuzzy entropy trung Độ đo fuzzy entropy trung
bình của Cheng
bình của thuật toán 2.2 đề
xuất
#1
0.4478
0.4950
#2
0.6931
0.7879
#3
0.5736
0.7200


12

#4
0.5822
0.7624
#5
0.6227
0.8157
#6
0.3374
0.3512
2.5. Nâng cao độ tƣơng phản ảnh kết hợp với biến đổi ảnh

Thuật toán 2.1: Nâng cao độ tƣơng phản ảnh màu sử dụng biểu diễn màu HSV.
Đầu vào: Ảnh màu I trong biểu diễn màu RGB, có kích thƣớc M x N.
Tham số C  N , C  2 , ngƣỡng fcut (fcut > 0, đủ nhỏ), d (d x d là kích thƣớc cửa
sổ).
Đầu ra: Ảnh màu RGB Inew, và tùy chọn trả về: CMR, CMG,CMB, Eavg ,
Havg
Bƣớc 1: Gọi (IH, IS, IV) là biểu diễn màu của I trong không gian màu HSV.
Lƣợng hóa để coi các kênh IS,IV nhƣ là các ảnh đa cấp xám.
Bƣớc 2: Với dữ liệu đầu vào là tổ hợp kênh (IS, IV), tham số số cụm là C và
ngƣỡng fcut , gọi thuật toán 2.1 để ƣớc lƣợng các dải động mức xám theo kênh
IS, IV. (xem công thức (2.2), (2.3) và (2.4))
Bƣớc 3: Xác định ảnh biến đổi FS, FV của kênh IS, IV theo công thức (2.5),
định nghĩa 5 với các dải động mức xám đƣợc ƣớc lƣợng từ bƣớc 2 cho mỗi kênh
S và V.
Bƣớc 4: Tính các giá trị mức xám không thuần nhất {δS,ij}, {δV,ij}, số mũ
khuếch đại {S,ij}, {V,ij} tại từng điểm ảnh của kênh FS và kênh FV.
Bƣớc 5: Tính độ tƣơng phản và xác định kênh ảnh xám mới của kênh FS và
kênh FV, F
nhƣ sau:
I
,F
I


S

S ,new

V


V ,new

Với kênh FS và kênh FV: Tính độ tƣơng phản
C S ,ij 

F S ( i , j )   ij ( F S )
F S ( i , j )   ij ( F S )

,

C V ,ij 

FV ( i , j )   ij ( FV )
FV ( i , j )   ij ( FV )

(2.6)

Tính giá trị mức xám mới của kênh S và V:

I S ,n e w


  S ,ij


(i, j )  

  S ,ij




t

 S ,ij

1  C S ,ij
t

 S ,ij

1  C S ,ij

, g S ,ij   S ,ij
I V ,n e w

t

 S ,ij

1  C S ,ij
t

 S ,ij

1  C S ,ij

, g S ,ij   S ,ij


  V ,ij



(i, j )  

  V ,ij



t

 V ,ij

1  C V ,ij
t

 V ,ij

1  C V ,ij

, g V ,ij   V ,ij

(2.7)

t

 S ,ij

1  C V ,ij
t


 V ,ij

1  C V ,ij

, g V ,ij   V ,ij

,
Lƣu ý ở đây kênh S đƣợc đánh chỉ số k = 1, kênh V đƣợc đánh chỉ số k = 2.
Bƣớc 6: Chuyển đổi ảnh (IH, IS,new, IV,new) trong biểu diễn màu HSV về biểu
diễn màu RGB, ta đƣợc ảnh Inew.
Bƣớc 7: Bƣớc tùy chọn, tính các chỉ số khách quan CM{R,G,B}, Eavg và Havg
7.1: Tính các giá trị mức xám không thuần nhất {δR,ij}, {δG,ij}, và {δB,ij} của
kênh IR, IG và IB.
7.2: Tính CMR, CMG, CMB theo công thức (1.18):


13

7.3: Tính Eavg=Eavg{Inew,R, Inew,G, Inew,B} theo công thức (1.19). Tính Havg =
Havg{Inew,R, Inew,G, Inew,B} theo công thức (1.20).
Trả về: Inew, và các tùy chọn đƣợc trả về: CMR, CMG, CMB , Eavg , Havg.
Thuật toán 2.2 có độ phức tạp tƣơng đƣơng thuật toán của Cheng.
2.6. Đánh giá biến đổi ảnh sử dụng thuật toán 2.2
Trong thử nghiệm này, trên từng kênh ảnh riêng rẽ R, G và B chúng tôi
thực hiện phép mờ hóa bằng biến đổi S-function của Cheng.
Thuật toán 2.2 của chúng tôi thực hiện đồng thời cho 3 kênh ảnh R, G và
B, tham số f1, f2 để ƣớc lƣợng khoảng động mức xám [B1,c,k B2,c,k] của từng cụm
c ứng với kênh R, G và B đƣợc xác định dựa trên thực nghiệm, fcut = 0.005.
Thuật toán phân cụm tập vector giá trị điểm ảnh {IR(i, j), IG(i, j), IB(i, j)} sử dụng
số cụm C  [2,10]. Trong thực nghiệm này chúng tôi chọn C = 5.

Bảng 2.2. Kết quả chỉ số ảnh đầu ra của Cheng,
và thuật toán 2.2 đề xuất trên từng kênh ảnh R, G và B.
CMR
CMG
CMB
Ảnh Cheng Thuật toán Cheng Thuật toán Cheng Thuật toán
2.2
2.2
2.2
#1 0.1244
0.1961
0.2511
0.2143
0.2575
0.3373
#2 0.0157
0.0193
0.0320
0.1676
0.1685
0.1728
#3 0.0155
0.0192
0.0543
0.2157
0.2166
0.2351
#4 0.0284
0.0338
0.0570

0.1232
0.1254
0.1385
#5 0.0170
0.0299
0.0352
0.0967
0.1003
0.1033
#6 0.0275
0.0307
0.0375
0.0861
0.0879
0.0870
Bảng 2.3. Kết quả chỉ số ảnh đầu ra của thủ tục 1(gốc), và thuật toán 2 đề
xuất trên từng kênh ảnh R, G và B.
Eavg
Havg
Ảnh
Cheng
Cheng
Thuật toán 2.2
Thuật toán 2.2
#1
5.8446
0.3456
6.1855
0.3077
#2

6.8158
0.8216
7.2568
0.7004
#3
6.9599
0.8001
7.0051
0.6737
#4
7.2337
0.8642
7.4179
0.7947
#5
7.0103
0.8504
7.5376
0.8233
#6
3.0140
0.2868
4.0173
0.2861
2.7. Thiết kế hàm biến đổi mức xám dạng chữ S với toán tử Hint đề xuất
2.7.1. Xây dựng toán tử Hint
Định nghĩa 2.3: Bộ 3 (AX, AY, F) gọi là toán tử Hint nếu:
(i) AX = (X, C, w, H, ), AY = (Y, C, w, H, ) với Dom(X)  Dom(Y), C
– +
= {c , c }, c– = low, c+ = high, H = H-H+, H- = {little}, H+ = {very},  = fm(c-),

1 -  = fm(c+), X = X(little), X = 1 - X = X(very), Y = Y(little), Y = 1 - Y


14

= Y(very), , X, Y  [0,1], vX, vY là hàm định lƣợng ngữ nghĩa của ĐSGT trên
X và Y tƣơng ứng.
(ii)

v Y ( v .l o w )

1

v X (lo w )

(iii) Hàm F : [0,1]  [0,1] đơn điệu tăng thực sự, liên tục (suy ra hàm
ngƣợc của F cũng đơn điệu tăng thực sự, liên tục) và tăng cƣờng tại ngƣỡng :
R1: Nếu x là 0 thì y là 0
R2: Nếu x là c- thì y là cR3: Nếu x là W thì y là W
R4: Nếu x là c+ thì y là c+
R5: Nếu x là 1 thì y là 1
Diễn giải trong miền giá trị số: (a) và (b) tƣơng đƣơng với:
F(vX(c-)) = vY(c-), F() = , F(vX(c+)) = vY(c+)
F(vX(low)) = vY(v.low), F(vX(hight)) = vY(v.high)
Suy ra: F(0) = 0, F() = , F(1) = 1, F        ,
2

X

F 1   X 1  


Y

   1   Y 1   
2

(c) tƣơng đƣơng với

 F (t )  t ,  t : 0  t  

 F (t )  t ,  t :   t  1

Quy ƣớc: Khi AX, AY cố định, để cho gọn chúng ta cũng đồng nhất
FHint.
Nhận xét :
(i)  = X = Y = 0.5  X = Y = 0.5,
m=

vY ( v e r y lo w )

2



v X (lo w )

 2 x s , 0  x s  0 .5
IN T ( x s )  
2
 1  2  1  x s  , 0 .5  x s  1

2

Y

FINT, ở đó

 0 .5 ,

 X

thì (AX, AY, INT) là một Hint.
Y

2

(ii) Khi m =

X

, Y   X

thì một hàm bậc 2, F có đồ thị là parabol đi qua 3 điểm (0; 0), (X, 2Y), (, )
thì bộ 3 (AX, AY, F) không là Hint.
Mệnh đề 2.3: (AX, AY, F) là một Hint, với F đƣợc xác định nhƣ sau:
m=v

Y

(v e ry lo w )


Y

2



v X (lo w )

X

1

,

 g ( x s ), 0  x s  
F ( xs )  
 1  g (1  x s ),   x s  1
2

với hàm g(xs) xác định:
Định lý 2.1: m =

g ( xs ) 

v Y ( v .l o w )
v X (lo w )

Y

ax s


  xs  ax s

2



X

1,

, 0  xs  

ở đây

a 

m 1   x



1  m   X


15

(2.8)

 g c ( ,  X , m )( x s ), 0  x s  
H in t( x s )  

 1  g c (1   ,  X , m )(1  x s ),   x s  1

với hàm gc(, X, m) (xs) xác định nhƣ sau:
=(X,m) =

1 m
lo g 
1 m
1 
lo g 
1 

g c ( xs )  

   xs 
1 

  +xs 
   xs 
1 

  +xs 

X

X
X








1 m
 lo g 
1 m
1 
 lo g 
1 

X
X





X
X







1 m
lo g 
1 m

1 
lo g 
1 

X
X

(2.9)





X
X













 xs




 xs

   xs 
 

  g c ( xs )    xs 

  g c ( xs )

hay





X









  -x s
  -x s










,

0  xs  



, 0 

xs  

,

Khi đó (AX, AY, Hint) là một Hint, ngoài ra Hint thỏa mãn:
H in t( x s )

m ax

xs

( 0 , X  ]

 m in


H in t( x s )

[  X  , ]

 m

xs

,

m ax
[  ,   X  ]

1  H in t(1  x s )
1  xs

 m in
[    X  ,1 ]

1  H in t(1  x s )
1  xs

 m

Nhận xét: Tham số X biểu diễn định lƣợng ngữ nghĩa của biến đầu vào
low thƣờng lấy từ 0.3 – 0.7, trong trƣờng hợp X = m thì AX trùng với AY
Các hàm g, gc ở mệnh đề 2.3 và định lý 2.1 đều thỏa các tính chất sau:
(i) Đơn điệu tăng, khả vi liên tục trên [0,1]
(ii) g(, X, m)(0) = 0, g(, X, m)() = , g(, X, m)( X ) = mX 

0  g(, X, m)(xs)  xs,  0  xs  .
(iii) g(, X, m1)(xs)  g(, X, m2)(xs),  0  xs  , 0 < m1  m2 <
m ax
( 0 , X  ]

g ( , 

X

, m )( x s )

xs

 m in
[  X  , ]

g ( ,

X

, m ) (x s )

 m

xs

Hình 2.3. So sánh đồ thị của hàm biến đổi Cheng và Hint giữa mức xám
đầu vào-đầu ra đã chuẩn hóa về đoạn [0,1], độ sáng xung quanh =0.6, βX=0.6,
=0.5,t=0.5
Nhận xét: Phép nâng cao độ tƣơng phản theo công thức (28) thỏa mãn

luật RCE
2.7.2. Thuật toán đề xuất sử dụng toán tử Hint


16

Trong mục này chúng tôi đề xuất thuật toán để áp dụng toán tử tăng cƣờng
Hint để nâng cao độ tƣơng phản cho ảnh đa kênh. Chi tiết của thuật toán đƣợc
thể hiện nhƣ sau:
Thuật toán 2.3: Nâng cao độ tƣơng phản ảnh đa kênh I = {I1, … IK}
Đầu vào: K kênh của ảnh I (trong một biểu diễn màu), I  { I , ..., I } ,
1, K

tham số C  N



,C  2

1

K

, M x N là kích thƣớc của ảnh I, 1 ... K, các tham số của

đại số gia tử
Đầu ra: Ảnh I’ = {I’1, … IK’}
Bƣớc 1: Phân ảnh I = {I1, … IK} thành C cụm sử dụng thuật toán FCM
Bƣớc 2: Tính histogram mờ của từng kênh ảnh Ik, k = 1 … K sử dụng
công thức (2.3)

Bƣớc 3: Tính độ xám nâng cao trong đoạn [0, 1]
(2.10)

H in t  
,
,   g

NC



g k ,s ,i j 
'

i , j ,c

s ,i j ,c

X

ij

ij

s ,ij , c

c 1
NC




 i , j ,c

c 1

Bƣớc 4: Kết thúc, trả lại ảnh nâng cao {

'

g k ,s ,ij

* (Lk, max – Lk, min) + Lk, min, 1

≤k≤K}
Độ phức tạp thuật toán là O(MN).
2.8. Thực nghiệm, đánh giá
Bảng 2.4. Bảng kết quả so sánh các chỉ số khách quan giữa thuật toán Cheng
và thuật toán 2.3 đề xuất
CMR
CMG
CMB
Eavg
Havg
Image
Đề
Đề
Đề
Đề
Đề
Cheng

Cheng
Cheng
Cheng
Cheng
xuất
xuất
xuất
xuất
xuất
#1 0.1292 0.3067 0.2011 0.4422 0.2550 0.5537 6.0405 6.7621 0.3523 0.4966
#2 0.0166 0.0503 0.0208 0.0982 0.0361 0.0579 7.3196 7.3506 0.8212 0.7707
#3 0.0175 0.0602 0.0209 0.0988 0.0566 0.1491 7.4822 7.6852 0.7999 0.7935
#4 0.0305 0.1002 0.0370 0.1464 0.0598 0.1876 7.4586 7.8066 0.8635 0.7929
#5 0.0179 0.0909 0.0315 0.1741 0.0368 0.1973 7.3038 7.6426 0.8519 0.8419
#6 0.0305 0.0373 0.0338 0.0441 0.0410 0.0548 3.5482 3.7398 0.2850 0.2923

(a)

(b)


17

(c)
(d)
Hình 2.4. (a),(c) Ảnh nâng cao độ tƣơng phản trên từng kênh S và V
riêng rẽ của #5, #4 sử dụng Chengvà biến đổi ngƣợc về biểu diễn mầu RGB
(b),(d) Ảnh nâng cao độ tƣơng phản trên từng kênh S và V riêng rẽ sử
dụng thuật toán 2.3 trên S+V và biến đổi ngƣợc về biểu diễn mầu RGB
CHƢƠNG 3.

XÂY DỰNG ĐỘ ĐO THUẦN NHẤT MỚI THEO TIẾP CẬN ĐẠI SỐ GIA
TỬ VÀ ỨNG DỤNG NÂNG CAO ĐỘ TƢƠNG PHẢN ẢNH ĐA KÊNH
Trong chƣơng này luận án trình bày phƣơng pháp xây dựng độ đo thuần
nhất mới sử dụng phƣơng pháp nội suy giải hệ luật mờ của đại số gia tử, từ đó
đề xuất thuật toán nâng cao độ tƣơng phản ảnh dựa trên độ đo thuần nhất mới.
3.1. Cải tiến độ đo thuần nhất của Cheng
3.1.1. Độ đo thuần nhất với toán tử t-norm
Chúng tôi đã thay thế công thức kết nhập cheng bởi công thức sau:
(3.1)
H O  m ax  E * H ,V * R 
ij

ij

ij

ij

4 ,ij

và nhận thấy rằng công thức (3.1) là phù hợp cho đa dạng ảnh mầu RGB (các
ảnh đã đƣợc nâng cao độ tƣơng phản khi sử dụng công thức (3.1) đều trơn).
Tổng quát hơn, chúng tôi đề xuất phép kết nhập có dạng chung nhƣ sau:
(3.2)
H O  f  E ,V , H , R
  T  T  E , H  , T V , R  
ij

ij


ij

ij

4 , ij

eh

ij

ij

4 , ij

ij

hr

Các đặc trƣng địa phƣơng Vij, R4,ij biến đổi chậm nên ở đây chủ yếu là ảnh
hƣởng của phép kết nhập



T e h E ij , H

ij

 . Trong dạng công thức (3.2), một độ đo

thuần nhất của điểm ảnh mới có thể đƣợc xây dựng dựa trên một toán tử t-norm

Tnorm của lý thuyết tập mờ chẳng hạn nhƣ sau:
(3.3)
H O  m ax T
 E , H  ,V * R 
ij

n o rm

ij

ij

4 ,ij

ij

3.2. Xây dựng độ đo thuần nhất với tiếp cận ĐSGT
Độ đo thuần nhất mới đƣợc xây dựng dựa trên hệ luật khá đơn giản và rõ
ràng nhƣ sau:
Giả sử G ( g r a d ie n t ), E ( e n t r o p y ) và T là các biến ngôn ngữ với miền ngữ
nghĩa giá trị số đƣợc chuẩn hóa về đoạn [0, 1].
HMR( G , E , T ) là tập luật mờ cho
R1: If

G

là very hight AND

E


G

,

E



T

is hight Then

, đƣợc phát biểu nhƣ sau:
T

is very higt


18

R2: If

G

là very low AND

R3: If

G


là hight AND

R4: If

G

là low AND

R5: If

G

là hight AND

R6: If

G

là low AND

R7: If

G

là little hight AND

R8: If

G


là little low AND

R9: If

G

là hight AND

is low Then

E

is very hight Then

E

is very low Then

E

is hight Then

E

is low Then

E

E


T

is very hight

is very low

T

is hight

T

(3.4)

is low

is hight Then

is low Then

E

T

T

is little hight

is little low


T

is little hight Then T is little hight

E

R10: If

G

là low AND

R11: If

G

là very hight AND

E

is very low

T

is little low Then
E

T

is little low


is very hight Then

T

is very very

T

is very very

hight
R12: If

G

là very low AND E is very low Then

T

low
Sử dụng phƣơng pháp lập luận ĐSGT chúng ta xây dựng hàm f=fSnorm cho
hệ luật (3.4) theo 3 bƣớc nhƣ sau:
Bƣớc 1: Thiết lập các đại số gia tử và các tham số tính mờ tƣơng ứng
Ký hiệu AG = ( G , C, w, H, ), AE = ( E , C, w, H, ) và AT = ( T , C, w,
H, ), C = {c–, c+}, c– = low, c+ = hight, H = H-  H+, H- = {little}, H+ = {very},
L ≡ little, V ≡ very.
Đặt
,
, ̅

, ̅
,
̅
̅
̅
̅
̅
̅
,
, trong đó ̅ , ̅ , ̅ , ̅ , ,
 (0, 1).
Mối quan hệ dấu của các gia tử đối với các gia tử khác đƣợc xác định nhƣ
Bảng 3.1 sau:
Bảng 3.1. Mối quan hệ dấu của các gia tử
V
L
V
+
+
L
Từ bảng trên ta có: sign(Vc ) = sign(VIc ) = sign(VI)sign(Ic-) = 1*sign(Ic) = -1
Bảng 3.2. Bảng giá trị độ đo tính mờ và SQM tƣơng ứng với AG, AE, AT
Tham số
For E
For T
For G
U(c+)

 G  1  G




E

 1E

 T  1  T

 U (V)
v U (low)

G  1 G

E 1

 G G

 E E

 TT

vU(V.low) (very low)

 G G

 E E

TT

vU(L.low) (little low)

̅

2

T  1  T

E

2

2

+

 G  G G

̅

+

 E  E E

+


19
 T  TT

vU(hight)


1 G

G

vU(V.hight) (very
hight)
vU(L.hight) (little
hight)

1 G

G

vU(V.V.low) (very
very low)
vU(V.V.hight) (very
very hight)

 G G

1  E

2

1  E

GG

1 G


2

E

-

̅

 E E

-

E

1  E

T

3

1  T  T

3

G

E

TT


3

3

E

T T 

G

3

T

1  T  T

2

̅

1  T 

E

3

E

, trong đó U đóng vai trò của G , E và T .
Bƣớc 2: 2.1: Tính các SQM của các thành phần bên trái và bên phải hệ

luật mờ sử dụng bảng 3.3.
2.2: Với toán tử “và” 2 ngôi AND: A N D : [ 0 , 1]  [ 0 , 1] , AND( G , E ) = G * E ,
ta có mảng các điểm nội suy bề mặt Snorm (ở đây m = 2) của hệ luật (3.4) nhƣ
sau:
Bảng 3.3. Bảng giá trị các mốc nội suy dựa trên toán tử AND của hệ luật (3.4)
Chỉ
số Các điểm nội suy (x,y)[0,1]2 x y
luật
R1
AND ( ̅
̅
R2
AND ( ̅
̅
R3
AND ( ̅
̅
R4
AND ( ̅
̅
R5
AND ( ̅
̅
R6
AND ( ̅
̅
R7
AND ( ̅
̅
R8

AND ( ̅
̅
R9
AND ( ̅
̅
R10
AND ( ̅
̅
R11
AND ( ̅
̅
R12
AND ( ̅
̅
Từ đây có thể sử dụng một phép nội suy đơn giản Snorm nhƣ phép tuyến
tính khúc đoạn trên các mốc nội suy.
Nhận xét:
Cho trƣớc cặp giá trị ngữ nghĩa đầu vào ( G , E )  [0, 1]2, ta xác định giá
trị ngữ nghĩa đầu ra hT [0, 1] nhƣ sau: hT = fSnorm (AND( G , E ));
Hàm fSnorm cho hệ luật (3.4) đƣợc xây dựng nhƣ trên đƣợc ký hiệu là THA,
AND hay gọn hơn THA khi đã cho trƣớc toán tử AND.
2


20

Mệnh đề 3.1: Hàm

T H A : [ 0 , 1]  [ 0 , 1]
2


bảo toàn thứ tự nghĩa là

 a , b , a ', b '  [ 0 ,1] , a  a ', b  b '  T H A ( a , b )  T H A ( a ', b ')

Do fSnorm đƣợc tạo thành từ phép nội suy tuyến tính từng khúc giữa các
mốc nội suy, nên bảo toàn thứ tự THA trên [0, 1]2 .
Sử dụng THA, chúng ta xác định một độ đo thuần nhất của điểm ảnh nhƣ
sau:
(3.5)
H O  T T
 E , H  ,V * R 
ij

ij

HA

ij

4 ,ij

ij

Kỹ thuật xây dựng độ đo thuần nhất sử dụng đại số gia tử đƣợc thực hiện
theo thuật toán 3.1 nhƣ sau:
Thuật toán 3.1. Xác định mức độ thuần nhất tại mỗi điểm ảnh HA-HRM.
Đầu vào: Ảnh đa cấp xám I, có kích thƣớc M x N.
Tham số : g, gr, ep, ep, ho, ho  (0, 1) của đại số gia tử AGr, AEp và
AHo

Đầu ra: Bảng giá trị độ thuần nhất tại mỗi điểm ảnh.
Bƣớc 1: Tính gradient, entropy, độ lệch chuẩn và mô men bậc 4 đƣợc
chuẩn hóa về đoạn [0, 1].
For mỗi điểm ảnh gij
1.1: Tính Eij, Hij, Vij, R4,ij dùng công thức (A.1) đến (A.4) trong phụ lục
(xem [8])
1.2: Tính E  1  E , H  1  H , V  1  V , R  1  R
ij

ij

ij

ij

ij

ij

4 , ij

4 , ij

Bƣớc 2: Với toán tử AND, xây dựng hàm THA cho hệ luật HRM(AGr,
AEp, AHo) của các biến ngôn ngữ Gr( g r a d i e n t ), Ep( e n t r o p y ) và
Ho(homogeneity) với các tham số độ đo mờ g, gr, ep, ep, ho, ho  (0,1)
Bƣớc 3: Tính độ thuần nhất tại từng điểm ảnh
3.1: For mỗi điểm ảnh gij
Tính E H  T  E , H  H O  m i n  E H , V * R 
,

3.2: Chuẩn hóa
ij

HA

ij

ij

For mỗi điểm ảnh gij Tính

ij

 ij =

ij

ij

4 , ij

H O ij
m a x { H O ij }

Trả về: {βij}
Thuật toán 3.1 có độ phức tạp O(M*N).
3.3. Nâng cao độ tƣơng phản ảnh mầu với độ đo thuần nhất đề xuất
Thuật toán 3.2 Nâng cao ĐTP ảnh mầu sử dụng độ đo thuần nhất HAHRM.
Đầu vào: Ảnh mầu I trong biểu diễn mầu RGB, có kích thƣớc M x N.
Tham số C  N , C  2 , ngƣỡng fcut (fcut > 0, đủ nhỏ), d (d x d là kích thƣớc cửa

sổ).



21

Đầu ra: Ảnh mầu RGB Inew, và tùy chọn trả về: CMR, CMG, CMB, Eavg ,
Havg
Bƣớc 1: Gọi (IH, IS, IV) là biểu diễn mầu của I trong không gian mầu
HSV. Lƣợng hóa để coi các kênh IS, IV nhƣ là các ảnh đa cấp xám.
Bƣớc 2: Với dữ liệu đầu vào là tổ hợp kênh (IS, IV), tham số số cụm là C
và ngƣỡng fcut , thực hiện phân cụm FCM để ƣớc lƣợng C dải động mức xám
[Bk,1,c, Bk,2,c] với k{S, V} (xem công thức (2.4)).
Bƣớc 3: Xác định ảnh biến đổi FS, FV của kênh IS, IV theo công thức (2.5).
Bƣớc 4:
4.1: Tính các giá trị thuần nhất của FS, FV sử dụng HA-HRM.
4.2: Tính các giá trị mức xám không thuần nhất {δS, ij}, {δV, ij}, số mũ
khuếch đại {S, ij}, {V, ij} tại từng điểm ảnh của kênh FS và kênh FV.
Bƣớc 5: Tính độ tƣơng phản và xác định kênh ảnh xám mới của kênh FS
và kênh FV, F
nhƣ sau:
I
,F
I
S

S ,new

V


V ,new

Với kênh FS  FS(IS) và kênh FV  FV(IV): Tính độ tƣơng phản
C S ,ij 

F S ( g S ,ij )   ij ( F S )
F S ( g S ,ij )   ij ( F S )

,

C V ,ij 

FV ( g V ,ij )   ij ( FV )
FV ( g V ,ij )   ij ( FV )

(3.6)

Tính giá trị mức xám mới của kênh S và V

I S ,n e w


1
  S ,ij

1

(i, j )  
1


  S ,ij
1


t

 S ,ij

, g S ,ij   S ,ij

C S ,ij

I V ,n e w

t

 S ,ij

C S ,ij
t

 S ,ij

 V ,ij

1  C V ,ij
  V ,ij
, g V ,ij   V ,ij
t
 V ,ij


1

C
V ,ij

(i, j )  
t
 S ,ij
1  C V ,ij

, g V ,ij   V ,ij
t
  V ,ij
 V ,ij
1

C
V ,ij

t

t

 S ,ij

C S ,ij

, g S ,ij   S ,ij


C S ,ij

(3.7)

,
Lƣu ý: kênh S đƣợc đánh chỉ số k = 1, kênh V đƣợc đánh chỉ số k = 2.
Bƣớc 6: Chuyển ảnh (IH, IS,new, IV,new) trong biểu diễn mầu HSV về biểu
diễn mầu RGB, ta đƣợc ảnh Inew.
Bƣớc 7: Bƣớc tùy chọn, tính các chỉ số khách quan CM{R,G,B}, Eavg và Havg
7.1: Tính các giá trị mức xám không thuần nhất {δR,ij}, {δG,ij}, và {δB,ij}
của kênh IR, IG và IB tƣơng ứng.
7.2: Tính CMR, CMG, CMB theo công thức (1.18), cụ thể là:

CM

k



ij

I n e w , k ( i , j )   R , ij
I n e w , k ( i , j )   R , ij

, k  {R , G , B}

M *N

7.3: Tính Eavg = Eavg{Inew,R, Inew,G, Inew,B}, Havg = Havg{Inew,R, Inew,G, Inew,B}
theo công thức (1.12)-(1.14).

Trả về: Inew, và các tùy chọn đƣợc trả về CMR, CMG, CMB , Eavg , Havg.
Không tính đến thuật toán FCM và phép nội suy giải hệ lập luận mờ (3.4)
của ĐSGT, thuật toán 3.2 có độ phức tạp tƣơng đƣơng thuật toán của Cheng.
Mô hình kiến trúc hệ thống đề xuất đƣợc xây dựng nhƣ hình 6:


22

Bắt đầu
Ảnh RGB đầu vào
Chuyển đổi RGB sang HSV
Tính các giá trị
thuần nhất

Biến đổi kênh S
và V

Tính giá trị sáng xung quanh, độ tƣơng phản và
số mũ khuếch đại của S và V.
Tính các giá trị mức xám mới của kênh S và
kênh V
Chuyển đổi ngƣợc HSV về RGB
Kết thúc
Hình 3.1. Lƣu đồ xử lý của các thuật toán đề xuất.
Bảng 3.4. Giá trị chỉ số CMR cho từng ảnh
và các phƣơng pháp kết nhập để tạo giá trị thuần nhất
Độ đo/ảnh
#1
#2
#3

#4
#5
HO1
0.3692 0.1806
0.1688
0.2002
0.2132
HO 2
0.3687 0.1805
0.1687
0.1993
0.2144
HO 3
0.3687 0.1805
0.1687
0.1993
0.2144
HO 4
0.3688 0.1805
0.1687
0.1992
0.2144
HO 5
0.3687 0.1805
0.1686
0.1993
0.2144
HO 6
0.3691 0.1806
0.1687

0.1997
0.2160
HA-HRM
0.3889 0.1813
0.1802
0.2065
0.2161

#6
0.1494
0.1494
0.1450
0.1493
0.1451
0.1454
0.1505

Bảng 3.5. Giá trị chỉ số CMG cho từng ảnh
và các phƣơng pháp kết nhập để tạo giá trị thuần nhất
Độ đo/ảnh
#1
#2
#3
#4
#5
HO 1
0.3780
0.1815
0.1703
0.2016 0.2142

HO 2
0.3773
0.1814
0.1701
0.2007 0.2154
HO 3
0.3773
0.1814
0.1701
0.2007 0.2154
HO 4
0.3774
0.1814
0.1701
0.2006 0.2154
HO 5
0.3774
0.1814
0.1701
0.2006 0.2154

#6
0.1503
0.1503
0.1458
0.1502
0.1459



×