HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
BÙI THỊ HỒNG
KHÔI PHỤC ẢNH MÀU BỊ MỜ VÀ
NHIỄU DỰA VÀO CHUẨN VTV
Chuyên ngành: KHOA HỌC MÁY TÍNH
Mã số : 60.48.01.01
TÓM TẮT LUẬN VĂN THẠC SĨ
Hà Nội - 2013
Luận văn được hoàn thành tại:
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Người hướng dẫn khoa học: TS. Đào Nam Anh
Phản biện 1: ……………………………………………
Phản biện 2: ……………………………………………
Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc
sĩ tại Học viện Công nghệ Bưu chính Viễn thông
Vào lúc: giờ ngày tháng năm
Có thể tìm hiểu luận văn tại:
− Thư viện của Học viện Công nghệ Bưu chính
Viễn thông
1
MỞ ĐẦU
Thông tin ảnh đóng vai trò quan trọng trong hầu hết mọi lĩnh
vực của cuộc sống. Ngày nay, thông tin ảnh được xử lý bằng kỹ thuật
số. Xử lý ảnh (XLA) là một trong những chuyên ngành quan trọng
và lâu đời của Công nghệ thông tin được áp dụng trong các ứng dụng
khác nhau, từ truyền hình đến chụp cắt lớp, từ nhiếp ảnh đến in ấn, từ
robot đến cảm biến từ xa.
Ảnh kỹ thuật số được tạo ra bởi các thiết bị vật lý: máy chụp
ảnh, máy quay phim, các thiết bị X-quang, kính hiển vi điện tử,
radar, và máy siêu âm. Ảnh kỹ thuật số được sử dụng cho nhiều mục
đích, như giải trí, y tế, kinh doanh, công nghiệp, quân sự, dân sự, an
ninh, và khoa học. Trong các mạng máy tính ngày nay, số lượng các
ảnh kỹ thuật số lưu hành tăng lên nhanh chóng và rất lớn. Tuy nhiên,
ảnh có thể bị bóp méo thông qua bởi môi trường tự nhiên như bị mờ,
độ sáng thay đổi, chuyển động, và bởi các tác động của việc sử lý
khác như việc cân bằng biểu đồ xám, làm mịn, nén, tạo nhiễu,
chuyển đổi hình học.
Trong nhiều trường hợp người quan sát hoặc máy tính cần phải
trích xuất thông tin hữu ích từ ảnh. Thường thì những ảnh gốc không
phù hợp cho mục đích và cần được xử lý bằng một cách nào đó. Việc
này gọi là tăng cường ảnh hoặc dựng lại ảnh. Ở đây có các vấn đề cơ
bản là phục hồi ảnhnhiễu và phục hồi ảnh mờ.
Khi ảnh bị xuống cấp do nhiễu ngẫu nhiên thì có thể áp dụng
việc phục hồi ảnh nhiễu. Nhiễu này có thể có nguồn gốc từ các hiệu
chỉnh vật lý của các thiết bị nhìn và các thiết bị ghi cũng như quá
trình xử lý tín hiệu. Phục hồi ảnh nhiễu có nghĩa là lọc, tách nhiễu
với ảnh.
Ph
ục hồi ảnh mờ thường áp dụng trong nhiều lĩnh vực khoa học,
kỹ thuật và người tiêu dùng. Đã có nhiều nghiên cứu phục hồi ảnh
2
mờ có thông tin và phục hồi ảnh mờ thiếu thông tin. Trong khi đã có
một số thành quả nhất định theo hướng này nhưng vẫn còn nhiều khó
khăn, vì nó thuộc về loại bài toán khó đặt vấn đề.
Mục đích chính của luận văn là nắm được tổng quan về xử lý
ảnh số, nắm được các mô hình gây nhiễu ảnh và qui trình khôi phục
ảnh gốc từ ảnh bị nhiễu. Luận văn sẽ tập trung tìm hiểu và trình bày
một phương pháp khôi phục ảnh màu bị nhiễu và bị mờ được đánh
giá là hiệu quả hơn các phương pháp trước đây. Phương pháp này
dựa vào chuẩn biến phân tổng các véctơ (Vectorial Total Variation –
VTV), là phát triển mở rộng từ phương pháp của Chambolle áp dụng
cho ảnh xám.
Ngoài phần mở đầu và kết luận, luận văn được chia làm 3
chương, cụ thể nội dung các chương như sau:
Chương 1: Tổng quan về nhiễu ảnh và khôi phục ảnh
Các khái niệm cơ bản trong xử lý ảnh, Nhiễu, Mờ ảnh. Các mô
hình làm nhiễu, giảm chất lượng ảnh và một số phương pháp khôi
phục ảnh gốc.
Chương 2: Khôi phục ảnh màu bị nhiễu và bị mờ dựa vào
chuẩn VTV
Phân tích thuật toán VTV áp dụng cho ảnh màu bị nhiễu, bị mờ,
hoặc ảnh màu chụp bị rung. Đánh giá khả năng khôi phục màu ảnh
gốc.
Chương 3: Cài đặt thử nghiệm
Cài đặt thuật toán VTV khôi phục ảnh màu nhiễu và mờ trong
môi trường Mathlab. Phân tích kết quả thử nghiệm.
3
CHƯƠNG 1 – TỔNG QUAN VỀ NHIỄU ẢNH VÀ KHÔI
PHỤC ẢNH
Chương này trình bày một số kiến thức liên quan đến mờ, nhiễu
ảnh và trình bày một số phương pháp khôi phục ảnh.
1.1 Mờ ảnh
Những ảnh được định dạng trong phẳng tiêu cự bị mờ bởi công
cụ ảnh và bởi không khí. Nó có thể được được thể hiện như một tích
phân trên ảnh tự nhiên, ký hiệu là :
M (x) = P I =
(1.1)
I – Là ảnh, P (x, y) được gọi là các hàm điểm lan (point – spread
function). Đây là khả năng một Photon có nguồn gốc tại vị trí y trong
mặt phẳng ảnh kết thúc tại vị trí x trong mặt phẳng tiêu cự.
1.2 Nhiễu ảnh
Một nhân tố chính ảnh hưởng tới việc khôi phục ảnh đó là nhiễu
do lỗi. Thực tế dữ liệu đo được chứa dữ liệu dự kiến M
i
cộng với lỗi:
D
i
= M
i
+ N
i
= (H I)
i
+ N
i
=
+ N
i
(1.2)
Lỗi phân thành hai loại. Lỗi có hệ thống là các lỗi tuần hoàn do
các qui trình đo không đúng hoặc hiệu ứng vật lý. Ngoài ra, còn có
loại lỗi ngẫu nhiên. Bởi vì ta không biết được và không thể dự đoán
được sự xuất hiện lỗi ngẫu nhiên. Ta giả sử lỗi ngẫu nhiên được phân
bố theo một qui luật thống kê phân bố. Trong ảnh, hầu hết các phân
bố thống kê gốc thường gặp là Gaussian hoặc dạng phân bố Poisson.
1.3 Phân loại nhiễu, tiêu chí đánh giá tỉ lệ nhiễu, so sánh với
ảnh gốc
1.3.1 Phân loại nhiễu
Trên th
ực tế tồn tại nhiều loại nhiễu, tuy nhiên người ta thường
xem xét ba loại nhiễu chính: Nhiễu cộng, nhiễu nhân và nhiễu xung.
- N
i
– Nhiễu cộng. Nhiễu cộng thường phân bố khắp ảnh.
4
- H – Nhiễu nhân. Nhiễu cộng thường phân bố khắp ảnh
- Nhiễu xung: thường gây đột biến tại một số điểm ảnh.
1.3.2 Tiêu chí đánh giá tỉ lệ nhiễu, so sánh với ảnh gốc
Xem xét một giải pháp thử nghiệm
(y) của phương trình (1.2)
và tính toán số dư so sánh với ảnh gốc:
R
i
= D
i
– M
i
= D
i
–
(1.3)
Mô hình của ảnh là một giải pháp có thể chấp nhận được của bài
toán ngược nếu các số dư phù hợp với sự phân bố thống kê nhiễu.
Sau đó mô hình dữ liệu ước tính tín hiệu trong các phép đo, và các
ước tính về nhiễu. Nếu các số dư biểu diễn cấu trúc có hệ thống hoặc
nếu sự phân bố thống kê của chúng có sự khác nhau đáng kể so với
sự phân bố thống kê gốc thì mô hình ảnh sai. Các ví dụ sẽ bị sai nếu
như trung bình số dư của nó khác không hoặc sự phân bố bị lệch, quá
rộng, hoặc quá hẹp.
1.4 Một số phương pháp khôi phục ảnh gốc
Việc khôi phục ảnh kỹ thuật số giúp cho các ảnh cơ bản ẩn trong
dữ liệu mờ và nhiễu có thể được tiết lộ. Thách thức chính là tính
nhạy để đo độ nhiễu trong dữ liệu đầu vào, dữ liệu vào này có thể bị
khuếch đại mạnh, kết quả là các đối tượng lớn trong ảnh được khôi
phục lại. Phần này tóm tắt các phương pháp khôi phục ảnh.
1.4.1 Khôi phục ảnh không lặp
1.4.1.1 Phương pháp Fourier Deconvolution
Fourier Deconvolution là một trong những phương pháp lâu đời
nhất và là phương pháp nhanh nhất về số lượng của việc
deconvolution ảnh. Nếu nhiễu được bỏ qua thì ảnh có thể được xác
định bằng cách sử dụng một biến riêng biệt của Fourier
Deconvolution,
1.4.1.2 Phương pháp Small-Kernel Deconvolution
5
Đây là một phương sử dụng các kỹ thuật ống (Pipeline), kỹ thuật
ống này có thể được sử dụng trong khôi phục ảnh bằng cách viết các
deconvolution như là các convolution bởi hàm điểm phản ứng nghịch
đảo H
-1
:
I = H
-1
* D (1.5)
1.4.1.3 Phương pháp Lọc Wiener
Lọc tối ưu là lọc mà giảm thiểu sự khác biệt giữa các dữ liệu
nhiễu đã lọc và tín hiệu đúng, lọc đó được gọi là lọc Wiener, được
thể hiện trong không gian Fourier như sau:
Φ
!
"
"
(1.7)
1.4.1.4 Phương pháp Wavelets
Các hàm nổi bật lên từ các nhiệm vụ cho các hàm phổ quang
dao động với sự hỗ trợ cục bộ là các sóng. Các sóng được sử dụng
thường xuyên nhất là những sóng thuộc về một lớp được phát hiện
bởi Daubechies (1988). Chúng phải đáp ứng 3 điều kiện sau: a)
chúng tạo thành một tập hợp trực giao, tập này cho phéo chuyển đổi
dễ dàng giữa các lĩnh vực không gian và quang phổ, b) chúng là
những chuyển đổi bất biến nghĩa là các hàm tương tự có thể được sử
dụng các phần khác nhau của ảnh, và c) chúng không đổi về qui mô
nghĩa là chúng tạo thành một giản đồ trong đó các hàm với bước
sóng lớn hơn là phiên bản qui mô lớn của các hàm với bước sóng
ngắn hơn. Ba yêu cầu này rất quan trọng mà việc chuyển đổi sóng
của n điểm dữ liệu và nghịch đảo của nó có thể được tính theo thứ
bậc trong O (n log
2
n) thao tác, giống như biến đổi Fourier nhanh.
1.4.1.5 Phương pháp Quick Pixon
Ph
ương pháp Quick Pixon là phương pháp áp dụng tương tự như
việc làm mịn Pixon vào dữ liệu thay vì các mô hình của ảnh. Việc
6
làm mịn này có thể được thực hiện một lần trên các dữ liệu đầu vào,
sau đó dữ liệu có thể được deconvolution bằng cách sử dụng phương
pháp Fourier hoặc small – kernel deconvolution.
1.4.2 Khôi phục ảnh lặp
1.4.2.1 Phương pháp thống kê trong khôi phục ảnh
Các phương pháp lặp linh hoạt hơn cho phép có kết quả phù hợp
với dữ liệu. Do đó chúng suy ra một lời giải thích dữ liệu dựa trên
các giá trị tương đối. Cụ thể hơn, ta xem xét một định nghĩa tập các
mô hình tiềm năng của ảnh. Sau đó, với sự giúp đỡ của thông tin
thống kê, ta lựa chọn trong số các mô hình này lấy một mô hình làm
phù hợp nhất với dữ liệu về mặt thống kê.
Có ba thành phần dữ liệu phù hợp. Đầu tiên, phải có một thủ tục
phù hợp để tìm mô hình của ảnh. Việc này được thực hiện bằng cách
giảm thiểu một chức năng giá trị, thường là thêm vào các ràng buộc.
Thứ hai, phải có kiểm tra tính chất của phù hợp – tốt nhất nên có
nhiều test – để xác định xem các phần dư thu được có phù hợp với sự
phân bố thống kê gốc. Thứ ba, ta sẽ ước tính các lỗi còn lại trong mô
hình của ảnh.
1.4.2.2 Phương pháp Maximum Likelihood
Với một mô hình của ảnh đã cho I dẫn đến một mô hình dữ liệu
M. Sự phân bố thống kê gốc của nhiễu sẽ xác định khả năng dữ liệu
cho một mô hình dữ liệu p(D|M). Khi đó xác suất có điều kiện của
dữ liệu cho ảnh là p (D|I). Hầu hết sự phân bố thống kê gốc phổ biến
thường là phân phối Gaussian và phân phối Poisson. Nhiễu trong các
điểm ảnh khác nhau độc lập về mặt thống kê, và xác suất chung của
tất các điểm ảnh là kết quả của xác suất của các điểm ảnh cá nhân.
Xác suất Gaussian là:
P (D|I) =
#
$%&
'
)
-1/2
(
)*
+
),
+
-'.
(1.9)
Và phân bố rời rạc Poisson là
7
P (D|I) =
#
(
),
+
/
*
+
-0
(1.10)
Nếu có sự tương quan giữa các điểm ảnh, p(D|I) là một hàm
được tính toán nhiều hơn.
Trong thực tế, nó thuận tiện hơn để làm việc với hàm dạng
logarithm:
Λ = -2ln[p (D|I)] = - 2
1
23
45
0
(1.11)
Ở đây đẳng thức thứ 2 trong phương trình (1.11) áp dụng dữ liệu
độc lập về mặt thống kê. Các yếu tố của đẳng thức thứ 2 được thêm
vào cho thuận tiện để đồng nhất hàm sự tương đồng với X
2
cho nhiễu
Gaussian và để tạo điều kiện ước tính lỗi giới hạn.
Mục đích của phù hợp dữ liệu là để tìm ra ước tính
tốt nhất của
I sao cho p(D|
) là phù hợp với sự phân bố thống kê gốc. Phương
pháp maximum - likelihood lựa chọn các mô hình của ảnh bằng cách
cực đại hàm likelihood hoặc cực tiểu hàm log - likelihood (phương
trình 1.11). Phương pháp này được biết đến trong thống kê để cung
cấp các ước tính tốt nhất cho một loạt các thông số phù hợp trong
giới hạn trong đó số lượng các tham số được ước tính nhỏ hơn nhiều
so với số lượng các điểm dữ liệu.
1.4.3 Khôi phục có tham số
1.4.3.1 Mô hình tham số đơn giản
Một trong những phương pháp tham số đơn giản nhất là tối thiểu
hóa bình phương nhỏ nhất phù hợp 6
'
, tổng các phần dư được tính
bởi phương sai nghịch đảo của chúng:
6
'
=
1
7
+
.
+
=
1
*
+
),
+
.
+
(1.12)
1.4.3.2
Ước tính lỗi
Cách thuận tiện để ước tính các lỗi của một sự phù hợp với p
tham số đó là vẽ một giới hạn tin cậy trong không gian tham số p
8
chiều, một siêu phẳng xung quanh các giá trị đã phù hợp mà trên đó
có một giá trị không đổi của 6
'
. Nếu 86
'
= 6
'
- 6
'
min
là sự khác
biệt giữa các giá trị của 6
'
trên siêu phẳng và cực tiểu hóa giá trị tìm
được bằng cách phù hợp dữ liệu, khi đó xác suất chi tiết 9 mà các
tham số sẽ được tìm thấy bên ngoài siêu phẳng này bởi cơ hội được
đưa ra bởi một phân bố 6
'
với p bậc tự do.
: ; P (86
'
, p) (1.17)
Phương trình (1.17) là xấp xỉ bởi vì nó chỉ áp dụng cho trường
hợp phù hợp tuyến tính với nhiễu Gaussian.
1.4.3.3 Clean
Clean là một phương pháp lặp mà đã được phát triển cho ảnh vô
tuyến tổng hợp (Hobom 1974), là một ví dụ của khôi phục ảnh tham
số với một cơ chế gắn liền cắt. Các nguồn điểm được phù hợp với
một dữ liệu tại một thời điểm, bắt đầu với các nguồn sáng và xử lý
các nguồn yếu hơn, một quá trình được mô tả như “làm sạch ảnh”.
1.4.4 Khôi phục ảnh không tham số
1.4.4.1 Các bình phương nhỏ nhất không âm
Một điều kiện ràng buộc đơn giản mà làm tăng đáng kể hiệu suất
của một phương pháp maximum-likehood là không cho phép các giá
trị ảnh âm. Tính không âm chắc chắn là một điều kiện cần thiết cho
hầu hết các điểm ảnh.
Các thủ tục mà áp đặt tính không âm bao gồm các thay đổi của
các biến và chỉ đơn giảm là thiết lập các giá trị âm về không sau mỗi
lần lặp. Trong công việc của ta với các chương trình lặp mà cực tiểu
hóa hàm maximum-likehood ta đã tìm ra được (a) một sự thay đổi
của biến có thể gây ra sự hội tụ rất chậm của các giá trị ảnh tập trung
g
ần không và (b) việc thiết lập các giá trị âm tới không sau mỗi lần
lặp không ảnh hưởng đến sự hội tụ và thực sự có thể làm tăng tốc độ
hội tụ.
9
1.4.4.2 Van Citter
Phương pháp van Cittert (1931) là một trong những phương
pháp sớm nhất và là phương pháp lặp đơn giản nhất cho bài toán
khôi phục ảnh trong đó dữ liệu và ảnh được định nghĩa trên cùng một
lưới. Quá trình lặp bắt đầu với ảnh bậc thứ không I
(0)
< 0 tại tất cả
các điểm lưới và quá trình lặp theo:
I
(k+1)
= I
(k)
+ α (D – H I
(k)
) = αD + Q I
(k)
(1.19)
Ở đây Q = 1 – α H, và 1 là nhân nhận dạng. Các lần lặp được
thiết kế để hội tụ tới ảnh deconvoled thay thế liên tiếp vào phương
trình (1.19) tạo ra:
I
(k)
= α
1
=
>
0
?)@
>AB
= H
-1
(1 – Q
k
) D
?C∞
D
E
F
H
-1
D
(1.20)
Ở đây Q
j
là một convolution j lần của hàm Q với chính nó, đẳng
thức thứ hai biểu diễn tổng các chuỗi hình học và giới hạn k C∞ áp
dụng khi Q
k
DC0 trong giới hạn đó.
1.4.4.3 Landweber
Một chương trình lặp khác (Landweber 1951) là
I
(k+1)
= I
(k)
+ αH
T
7
.
(1.21)
Ở đây siêu kịch bản T là toán tử hoán vị, và α là một tham số
dương. Phương pháp này được thiết kế để tối thiểu hóa tổng bình
phương các phần dư bằng cách đảm bảo sự thay đổi tiếp theo trong
ảnh I = I
(k+1)
– I
(k)
theo hướng gradient âm của X
2
đối với I. Tuy
nhiên việc lựa chọn α là tùy ý và phụ thuộc vào ảnh. Nếu nó quá lớn
quá trình lặp có thể vượt quá mức tối thiểu theo hướng gradient âm
và thậm chí dẫn đến các phần dư tồi.
10
1.4.4.4 Richardson-Lucy
Phương pháp Richardson – Lucy được phát triển đặt biệt dành
cho dữ liệu chứa các sự kiện rời rạc và có thể đếm được mà dữ liệu
này là một phân phối Poisson. Hàm log-likelihood năng phi tuyến
(phương trình 1.15) được giảm thiểu lần lặp bằng cách sử dụng điều
chỉnh nhiều lần:
I
(k+1)
= [H
T
(
*
,
G
) ]I
(k)
(1.22)
Các dấu ngoặc vuông bên tay phải của phương trình 1.22 kèm
theo yếu tố mà các lần trước đó I
(k)
được nhân nhiều lần để đưa ra I
(k+1)
mới. Nó là kết quả từ một toán tử chiếu ngược, trong đó tỉ lệ
giữa dữ liệu D và các mô hình dữ liệu của lần lặp trước M
(k)
= HI
(k)
được thực hiện bởi H
T
- các hoán vị (không phải là nghịch đảo) của
hàm điểm phản ứng.
1.4.4.5 Gradient liên hợp
Phương pháp Gradient liên hợp bắt đầu từ một số ảnh ban đầu
I
(0)
, nơi mà nó tính toán gradient âm g
(0)
của hàm log-likelihood đối
với ảnh và thiết lập hướng gradient liên hợp ban đầu h
(0)
= g
(0)
. Sau
đó nó xây dựng một chuỗi các gradient âm g
(k)
và các hướng
gradient liên hợp h
(k)
như sau. Đầu tiên nó tính minimum của hàm
danh sách khả năng theo hướng gradient liên hợp h
(k)
. Thứ hai tại vị
trí minimum nó tính toán gradient tiếp theo g
(k+1)
. Thứ ba gradient
liên hợp mới thành một tổ hợp tuyến tính của hướng gradient liên
hợp cũ và gradient mới.
h
(k+1)
= g
(k+1)
+ H
?
h
?
(1.23)
Hệ số H
?
được chọn để tối ưu hóa tính hội tụ. Ta thường sử dụng
phát minh của Plak & Ribiere (1969).
H
?
1
I
J
GKL
)I
J
G
I
J
GKL
J
1
I
J
G
J
(1.24)
11
ở đây các các tổng là tất cả các điểm ảnh.
1.4.5 Total Variation – Biến phân tổng
Các chương trình chính tắc mà các hàm phạt của nó là các hàm
mịn của ảnh có xu hướng hoạt động kém khi mà ảnh thật cơ bản
chứa các cạnh sắc nét hoặc các gradient dốc. Một hàm phạt khắc
phục vấn đề này là biến phân tổng:
B(I) =
1
M
(1.25)
Phương trình 1.25 có thể được khái quát bằng việc xem xét các
hàm khác của M.
Trong dạng của phương trình 1.25, Biến phân tổng áp dụng cùng
một mức phạt cho cạnh bậc cũng như biến đổi mịn trên cùng một
phạm vi của biên độ ảnh. Việc tăng mức phạt chỉ khi mô hình của
ảnh phát triển các dao động. Đây là một hạn chế nghiêm trọng, buộc
ta phải loại bỏ hàm phạt này trừ khi nó biết trước rằng ảnh có các
cạnh sắc nét.
1.4.6 Maximum Entropy
Phương pháp Maximum Entropy là một nỗ lực để cung cấp một
ưu tiên ảnh mục tiêu tương tự với các nguyên tắc là nền tảng vật lý
thống kê. Nó giả định rằng ảnh được tạo thành từ một số lượng lớn
các lượng tử, mỗi một lượng tử có cường độ q, và đồng khả năng cho
bất kỳ vùng lượng tử tại điểm ảnh bất kỳ, khi đó chúng được phát
các khóa một cách ngẫu nhiên. Xác suất có được một tập cụ thể số
lượng điểm ảnh (n
1
, n
2
,…,n
L
) với n
j
= I
j
/q tỉ lệ với sự giảm
N!/n
1
!n
2
! n
L
!. Trong giới hạn tiệm cận của số lượng tính toán lớn,
các thừa số có thể được xấp xỉ bởi công thức Stirling và thuật toán
của ưu tiên trở thành:
S (I) = ln[p (I)]
;N
1
3
23
3
N
1
+
O
23
P
+
Q
(1.26)
12
Ở đây ta đã giảm một hằng số bình thường hóa tổng thể của p
(I). Ảnh ưu tiên được ta áp dụng maximum entropy. Phương trình
1.26 tương tự với xác suất phân bố không gian của các hạt khí lý
tưởng, thuật toán của nó là entropy Boltzmann. Một entropy ảnh của
mẫu Iln (I) ban đầu được đề xuất bởi Friede (1972).
Có ba vấn đề cơ bản của phương pháp này: a) có các dạng
entropy cạnh tranh, ngay cả đối với cùng một ảnh, b) với một chương
trình entropy bất kỳ thì ảnh maximum entropy không phải là ảnh ưu
tiên, và c) entropy phụ thuộc vào lượng tử q - là tập tùy ý và không
liên quan đến bất kỳ lượng tử vật lý nào tạo nên ảnh. Do những vấn
đề này mà phương pháp maximum entropy đã hướng theo vật lý
thống kê.
1.5 Kết luận chương 1
Chương 1 đã trình bày một số khái niệm cơ bản về mờ và nhiễu
ảnh. Đồng thời trình bày một số phương pháp khôi phục ảnh gốc.
Nếu ta thực hiện được việc giảm tối thiểu độ phức tạp của ảnh
và tạo ra các phần dư có thể chấp nhận được về mặt thống kê thì ảnh
đã được khôi phục là ảnh đáng tin cậy nhất có thể có.
13
CHƯƠNG 2 – KHÔI PHỤC ẢNH MÀU BỊ NHIỄU VÀ BỊ MỜ
DỰA VÀO CHUẨN VTV
Chương này giới thiệu một số kí hiệu, khái niệm liên quan đến
VTV, áp dụng thuật toán tối thiểu VTV vào bài toán xử lý ảnh màu
bị mờ và nhiễu.
2.1 Khái niệm biến phân tổng các vecto (Vectorial Total
Variation – VTV)
Ta hãy xem xét một hàm vecto u (M chiều hoạc đa hướng)
chẳng hạn như ảnh màu hoặc một trường vecto được xác định trên
một miền mở bị chặn Ω R S
T
như sau:
u: Ω U S
,
x U u (x): = (u
1
(x),…,u
M
(x))
ở đây mỗi hàm vô hướng u
i
: Ω US, 1 ≤i ≤ M là một thành
phần của M (có hướng) của hàm giá trị vecto u.
Định nghĩa 2.1.1 (Theo Xavier Bresson and Tony F. Chan[
16]): Cho một hàm giá trị vecto u : Ω US
,
, chuẩn VTV được ký
hiệu là phép đo hữu hạn:
0V
WXV5
YZ[
\
] VM^5_
ΩΩ
} (2.1)
Định nghĩa 2.1.2 (Theo Xavier Bresson and Tony F. Chan [7])
Định nghĩa Không Gian Giá Trị Vecto BV (Ω`S
,
, M ≥ 1.
Ta định nghĩa không gian BV (Ω`S
,
của các hàm giá trị vecto
như là tập các hàm uZ a
@
Ω`S
,
sao cho
0V
] ∞
Ω
ở đây chuẩn
VTV
0V
Ω
được định nghĩa trong Định nghĩa 1 với tập các hàm
pZ
'
. Không gian BV (Ω`S
,
) có chuẩn sau:
V
b
L
Ω`S
c
dV
efΩ`S
c
(2.4)
ở đây V
efΩ`S
c
g
0V
Ω
, là một không gian Banach.
14
2.2 Thuật toán tìm biến phân tổng các vecto
2.2.1 Các mô hình dựa trên biến phân tổng (Total Variation)
Xu hướng của qui trình xử lý ảnh dựa vào các phương pháp
biến thể và phương trình vi phân từng phần (Partial Differential
Equation –PDE) được bắt đầu với mô hình ROF (Rudin-Osher –
Fatemi) [3]:
h3i
u
j
MV
d
@
'
kVNi
b
Ω
'
Ω
(2.5)
Để giải quyết mô hình ROF (2.5) ta có thể giải quyết phương
trình Euler – Lagrange tương ứng:
NjM^l
Mm
Mm
ndk
o
kVNi
p
(2.6)
Để giải quyết phương trình Euler-Lagrange (2.6) nó đã được
đề xuất trong [3].
2.2.2 Mô hình Vectorial Rudin-Osher-Fatemi (VROF)
Mô hình khử nhiễu ảnh Rudin-Osher-Fatemi (ROF) [3] loại bỏ
nhiễu trong các ảnh xám có qui mô trong khi vẫn giữ được các tính
năng chính như các cạnh. Trong trường hợp các ảnh giá trị vecto, mô
hình ROF được mở rộng một cách tự nhiên như sau:
h3i
m
qr
V
W
s
V
s
ef
t
Ω`S
c
u
d
@
'v
iNV
b
Ω`S
c
'
w
(2.8)
ở đây fZa
∞
t
Ω`S
,
u
f:= (f
1,
,f
M
) là ảnh giá trị vecto (nhiễu) đã
cho và iNV
b
Ω`S
c
'
iNV
'
Ω
là chuẩn tin cậy L
2
(fidelity norm), x là tham số điều chỉnh.
Nh
ận xét 2.2.2.1 (Theo kết quả của Xavier Bresson and Tony F.
Chan [7]): Sự tồn tại một giải pháp cho mô hình VROF (2.8).
Mô hình VROF
15
h3i
m
qr
V
W
s
V
s
ef
t
Ω`S
c
u
d
y
$z
iNV
b
Ω`S
c
'
ở đây fZa
∞
Ω`S
,
, có giải pháp trong BV({`S
|
2.2.3 Thuật toán cho VROF tối thiểu
Phần này trình bày thuật toán tìm giải pháp tối thiểu cho mô
hình VROF (2.8). Bằng cách sử dụng định nghĩa đối ngẫu của chuẩn
VTV trong (2.1), mô hình (2.8) có thể được viết lại như sau:
}~•
€
•‚ƒ
„
…@
{< u, M .p_
†
‡`S
ˆ
+
@
'‰
||f – u
†
‡`S
ˆ
'
}
(2.9)
Bằng cách sử dụng Định lý minimax, inf và sup có thể đổi được
hoán đổi cho nhau từ (2.9) là lồi với u và lõm với p và tập {|p| Š 1}
là bị chặn và lồi. Vì vậy (2.9) đầu tiên được tối thiểu hóa theo u bằng
cách sử dụng kỹ thuật Euler-Lagrange, kỹ thuật này cho giải pháp tối
thiểu của mô hình VROF:
u = f - xM .p (2.10)
và theo từng hướng:
‚
•
NxM .p
i
, 1 Š}Š‹
Sao cho :
p
n+1
=
Y
Œ
δ•MM^Y
Œ
)
Ž
λ
@ ••MlM^Y
Œ
)
Ž
λ
n
(2.15)
nghĩa là theo từng hướng:
p
i
n+1
=
Y
+
Œ
δ•MM^Y
+
Œ
)
•
+
v
‘
@ ••
’
1
MM^Y
J
Œ
)
•
J
v
‘
c
J“L
yŠ hŠ /
(2.16)
theo [1] thì sự hội tụ của lược đồ lặp theo (2.15) cũng được chỉ
ra theo
định lý sau:
16
Nhận xét 2.2.3.1 (Theo kết quả của Xavier Bresson and Tony F.
Chan [7]): Cho f Z”
•
{`S
|
, chương trình lặp (2.15) hội tụ tới
giải pháp tối thiểu (2.11) với –— Šy-˜.
2.3 Khôi phục ảnh màu bị nhiễu với Biến phân tổng vecto tối
thiểu
Trong phần 2.2.2, mô hình khử nhiễu màu đã được trình bày là
một mô hình vecto theo đặc trưng RGB của ảnh màu. Trong [6] các
tác giả đã chỉ ra rằng mô hình Chromaticity-Brightness hoặc mô hình
Hue-Saturation-Value (HSV) có thể khôi phục ảnh màu tốt hơn. Mỗi
một mô hình đều có ưu điểm của nó. Các mô hình xử lý cổ điển dựa
trên mô hình màu RGB dễ làm việc, còn mô hình dựa trên CB thì
cho thấy việc kiểm soát màu tốt hơn. Ở đây, mục đích chính của ta là
các ứng dụng của thuật toán đã đề xuất.
2.4 Khôi phục ảnh màu bị mờ với Biến thể tổng vecto tối thiểu
Chúng ta xét ||f-Au||
2
với A: X C X là một toán tử dương và tự
liên tuyến tính (linear self-adjoint) thỏa mãn ||A|| < 1. ||f-Au||
2
này
cho phép giải quyết bài toán khử mờ ảnh. Chúng ta nhớ rằng việc
khử mờ ảnh nhằm mục đích bù đắp sự di chuyển của camera trong
suốt lúc quay. Cho một ảnh màu f bị mờ và nhiễu, mô hình khử mờ
và nhiễu ảnh màu được đề xuất như sau:
Nhận xét 2.4.1 ( Khử mờ ảnh màu – Color Image Deblurring
- Theo kết quả của Xavier Bresson and Tony F. Chan [7]): Cho f
Za
∞
Ω`S
,
, u,v : Ω C S
,
, A : S
,
CS
,
, ||A|| < 1, Au:=
k
@
V
@
^^k
T
V
T
™Ω CS
,
zš_p, ở đây š là tham số tỷ lệ, khi
đó tối thiểu của
V
efΩ`S
c
d
@
'v
||f - Au
b
Ω`S
c
'
(2.18)
được tính thông qua năng lượng qui tắc (reguilarized energy) sau:
17
||u
efΩ`S
c
d
@
'v
|| f – Av
b
Ω`S
c
'
d
@
'›
|| u – v
b
Ω`S
c
'
(2.19)
Do (2.18) là lồi nên tối thiểu được cho bởi
u = (1 - Π
›œ
•žΩ`S
c
)(v)
v = (1 +
v
›
k
Ÿ
k)
-1
(u +
v
›
k
Ÿ
f)
ở đây A
*
là liên hợp của A sao cho A
*
f := (k
@
Ÿ
i
@
k
T
Ÿ
i
T
) : Ω C
S
,
. Và Π
›œ
•žΩ`S
c
là toán tử hình chiếu trực giao trên tập lồi bị
đóng kết hợp với ^
¡¢Ω`S
c
và được định nghĩa như sau:
£
efΩ`S
c
qM^p Z”
'
t
Ω`S
,
u
¤ pZ”
'
t
Ω`S
,¥T
u
™p|Šy}.
2.5 Đánh giá khả năng khôi phục ảnh gốc, phân tích ưu nhược
điểm
Để đánh giá khả năng khôi phục ảnh gốc, phân tích ưu nhược
điểm phương pháp của ta, trước tiên ta hãy tìm hiểu và so sánh nó
với các mô hình khử nhiễu ảnh vecto khác, cụ thể là các mô hình
Sapiro-Ringach and Blomgren-Chan.
2.5.1 Các mô hình Sapiro-Ringach và Blomgren-Chan
Trong [2] Sapiro và Ringach đề xuất một mô hình khuếch tán
ánh sáng không đẳng hướng cho các ảnh vecto dựa trên hình học
Riemannian.
2.5.2 Đánh giá, phân tích ưu nhược điểm
Thuật toán này có nhiều ưu điểm. Đầu tiên, nó tối thiểu chuẩn
TV một cách chính xác không giống như các phương pháp thông
thường. Thứ hai, chương trình số thực hiện quá trình tối thiểu rất dễ
dàng mã hóa. Số các lần lặp để đạt được trạng thái ổn định là thấp,
nó dùng để so sánh một mô hình giảm nhiễu màu nhanh so với các
ph
ương pháp có liên quan khác. Cuối cùng, việc xây dựng tính đối
ngẫu của chuẩn VTV cung cấp các định lý toán học có cơ sở để
chứng minh sự tồn tại của giải pháp tối thiểu.
18
Trong phần 2.5.1 ta đã so sánh phương pháp của ta với các mô
hình giảm nhiễu vecto có liên quan như mô hình của Sapiro và
Ringach. Trong trường hợp của ta, lược đồ khử nhiễu đã đề xuất
được thực hiện nhanh và dễ dàng. Mặt khác, Blomgren và Chan đã
đưa ra một phiên bản khác của chuẩn TV vecto, nó tạo ra việc nhòe
màu ít hơn mô hình của ta.
Mô hình của ta hội tụ nhanh tới kết quả khử nhiễu trong khi mô
hình chuẩn hội tụ chậm hơn do tham số chuẩn tắc. Ngoài ra, chất
lượng của quá trình khử nhiễu là nhỏ hơn so với mô hình của ta cũng
do tham số chuẩn tắc. Cuối cùng, một ưu điểm của phương pháp của
ta đó là đưa ra được một chương trình tối thiểu về mặt số học mà có
thể dễ dàng mã hóa.
2.6 Kết luận chương 2
Trong chương này, ta đã trình bày thuật toán chính qui cho các
ảnh màu/vecto dựa trên định nghĩa đối ngẫu của chuẩn VTV. Với
thuật toán này ta có thể mở rộng với các mô hình vecto khác nhau,
nó tạo ra các kết quả hữu ích, các kết quả này tốt hơn so với các
phương pháp tiêu chuẩn trong nhiều trường hợp.
19
CHƯƠNG 3 – CÀI ĐẶT THỬ NGHIỆM
3.1 Cài đặt thuật toán VTV khôi phục ảnh màu bị nhiễu và mờ
trong môi trường Mathlab
3.1.1 Giới thiệu bài toán
Khôi phục ảnh là một lĩnh vực nghiên cứu quan trọng trong
xử lý ảnh. Nó được xem như là bước tiền xử lý cho các nhiệm vụ xử
lý ảnh khác, như phân đoạn ảnh. Khôi phục ảnh bao gồm nhiều vấn
đề như khử nhiễu, khử mờ, xóa bớt các đối tượng nhỏ trong ảnh
(impainting),….Ở đây ta chỉ tập trung vào vấn đề khử nhiễu và khử
mờ. Để giải quyết vấn đề này, lược đồ tối thiểu VTV đã được đề
xuất.
Từ đó đặt ra bài toán khử nhiễu và mờ ảnh như sau: với một
ảnh đầu vào bị nhiễu và bị mờ một cách ngẫu nhiên, sau đó áp dụng
kỹ thuật khử nhiễu và khử mờ đã đề xuất để đưa ra ảnh mới mà
nhiễu ảnh và mờ ảnh đã được giảm bớt.
3.1.2 Môi trường cài đặt và chương trình
Chương trình được cài đặt và thực hiện trên môi trường
Matlab.Chương trình có tham khảo mã nguồn của Xavier Bresson
and Tony F. Chan [7]. Song em đã nghiên cứu và chỉnh sửa, cải tiến
mã nguồn để phù hợp với bài toán luận văn.
3.2 Phân tích kết quả thử nghiệm
3.2.1 Kết quả thử nghiệm
Không gian màu sử dụng trong chương trình là không gian
màu RGB, do khuôn dạng của nó là định dạng phổ biến của ảnh số.
Tập ảnh thử nghiệm
Tập ảnh thử nghiệm gồm 20 ảnh JPGE, tập ảnh này là ảnh
tôi tập hợp từ Internet. Các ảnh đầu vào đại diện cho các loại ảnh
khác nhau:
Ảnh động vật, Ảnh phong cảnh, Ảnh con người.
20
Một số kết quả minh họa
Khử nhiễu
a) b) c)
Hình 3.1 Khử nhiễu ảnh màu
Hình 3.1 Ảnh kích cỡ 240 x 240. a) Ảnh gốc. b) Ảnh Nhiễu
(SNR = 5,2477). c) Ảnh đã khử nhiễu với thuật toán đã đề xuất (SNR
= 18,3739), số lần lặp = 196, thời gian = 5.673483s.
Khử mờ
(a) (b)
(c) (d)
Hình 3.6 Khử nhiễu và mờ ảnh màu
21
Hình 3.6 thể hiện quá trình khử nhiễu và mờ ảnh màu. (a)
Ảnh gốc. (b) Ảnh bị mờ. (c) Ảnh bị mờ và nhiễu (SNR =5,6701). (d)
Ảnh đã khử mờ và nhiễu với thuật toán đã đề xuất (SNR = 7,9752).
Quá trình thực hiện mất t = 1.893222s và số lần lặp là 39 lần. Ảnh cỡ
240 x 240.
3.2.2 Kết quả đạt được
Chương trình đã chạy thử nghiệm với các bức ảnh khác nhau.
Các kết quả thu được đều cho thấy chạy tốt và ảnh thu được đã giảm
nhiễu và mờ đáng kể.
3.3 Kết luận chương 3
Chương 3 xây dựng thuật toán VTV tối thiểu để khử mờ và
nhiễu ảnh. Thực nghiệm trên tập các ảnh khác nhau và cho thấy kết
quả được cải thiện đáng kể.
22
KẾT LUẬN VÀ KIẾN NGHỊ
Luận văn này mô tả lý thuyết và kết quả thử nghiệm một
phương pháp khôi phục ảnh màu bị nhiễu và bị mờ dựa vào chuẩn
biến phân tổng véctơ (VTV).
Các kết quả đạt được trong luận văn:
• Nghiên cứu tổng quan về kỹ thuật xử lý ảnh: khử
mờ, khử nhiễu ảnh dựa vào chuẩn VTV.
• Ứng dụng chuẩn VTV vào bài toán khử mờ, khử
nhiễu ảnh.
Kiến nghị và hướng nghiên cứu tiếp theo:
• Thử nghiệm trên tập ảnh có kích thước lớn và đa
dạng chủ đề hơn.
• Hiện tại bài toán mới chỉ áp dụng cho ảnh trong
không gian 2 chiều và áp dụng với ảnh RGB. Mở
rộng bài toán cho ảnh màu đặc trưng CB
(Chromaticity-Brightness Representation).
Tuy nhiên trong quá trình thực hiện, với thời gian không có
nhiều, năng lực chuyên môn, điều kiện thực nghiệm còn hạn chế, nên
việc đánh giá tổng hợp các phương pháp còn khiếm khuyết. Tôi rất
mong nhận được sự đóng góp ý kiến của các Thầy Cô cùng bạn bè
đồng nghiệp.