Tải bản đầy đủ (.pdf) (63 trang)

Nghiên cứu thuật toán khử nhiễu ảnh dựa trên phương pháp biến phân

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (4.06 MB, 63 trang )

VŨ ĐÌNH KHÔI

ĐẠI HỌC ĐÀ NẴNG
TRƢỜNG ĐẠI HỌC BÁCH KHOA

TRẦN HỮU LỘC
---------------------------------------

VŨ ĐÌNH KHÔI

LUẬN VĂN THẠC SĨ KỸ THUẬT ĐIỆN TỬ

C
C

R
L
T.

NGHIÊN CỨU THUẬT TOÁN KHỬ NHIỄU
ẢNH DỰA TRÊN PHƢƠNG PHÁP BIẾN PHÂN

U
D

LUẬN VĂN THẠC SĨ KỸ THUẬT ĐIỆN TỬ

NĂM 2019
Đà Nẵng – Năm 2019



ĐẠI HỌC ĐÀ NẴNG
TRƢỜNG ĐẠI HỌC BÁCH KHOA
---------------------------------------

VŨ ĐÌNH KHÔI

C
C

R
L
T.

NGHIÊN CỨU THUẬT TOÁN KHỬ NHIỄU ẢNH
DỰA TRÊN PHƢƠNG PHÁP BIẾN PHÂN

U
D

Chuyên nghành: KỸ THUẬT ĐIỆN TỬ
Mã số: 8520203

LUẬN VĂN THẠC SĨ KỸ THUẬT ĐIỆN TỬ

NGƯỜI HƯỚNG DẪN KHOA HỌC:
TS. PHAN TRẦN ĐĂNG KHOA

Đà Nẵng – Năm 2019



LỜI CAM ĐOAN
Tôi cam đoan đây là công trình nghiên cứu của riêng tôi. Nội dung công trình
luận văn “Nghiên cứu thuật toán khử nhiễu ảnh dựa trên phƣơng pháp biến
phân”; các số liệu và kết quả nêu trong luận văn là trung thực và chưa từng được ai
công bố trong bất kỳ công trình nào khác.

Học viên cao học

Vũ Đình Khôi

C
C

R
L
T.

U
D

I


1

MỤC LỤC
CHƢƠNG 1: GIỚI THIỆU TỔNG QUAN ...................................................... 7
1.1. Đặt vấn đề ............................................................................................................. 7
1.2. Các phương pháp xử lý ảnh .................................................................................. 9
1.2.1. Phương pháp hình thái học ............................................................................ 9

1.2.2. Phân tích phổ .................................................................................................. 9
1.2.3. Phân tích đa phân giải .................................................................................. 10
1.2.4. Phương pháp dựa trên mô hình ngẫu nhiên ................................................. 11
1.2.5. Phương pháp biến phân ................................................................................ 12
1.2.6. Phương trình đạo hàm riêng ........................................................................ 12
1.2.7. Mối liên hệ giữa các phương pháp ............................................................... 12

C
C

1.3. Các thuật toán khử nhiễu phổ biến...................................................................... 13
1.3.1. Bộ lọc trung bình .......................................................................................... 13

R
L
T.

1.3.2. Bộ lọc Gauss ................................................................................................. 13

U
D

1.3.3. Bộ lọc trung vị .............................................................................................. 14
1.3.4. Bộ lọc Wiener ............................................................................................... 14
1.4. Mục tiêu nghiên cứu............................................................................................ 15

CHƢƠNG 2: THUẬT TOÁN KHỬ NHIỄU ẢNH DỰA TRÊN PHƢƠNG
PHÁP BIẾN PHÂN .......................................................................................... 16
2.1. Hàm năng lượng .................................................................................................. 16
2.2. Hàm lồi ................................................................................................................ 18

2.3. Functional ............................................................................................................ 20
2.4. Đạo hàm Gâteaux ................................................................................................ 20
2.5. Phương trình Euler-Lagrange.............................................................................. 21
2.6. Thuật toán Gradient Descent ............................................................................... 21
2.7. Toán tử gradient và divergence rời rạc ............................................................... 23
2.8. Thuật toán khử nhiễu ảnh sử dụng tổng biến phân ............................................. 24

CHƢƠNG 3: KẾT QUẢ THỰC NGHIỆM VÀ ĐÁNH GIÁ ....................... 26
3.1. Mô tả thực nghiệm .............................................................................................. 26
3.2. Tiêu chí đánh giá ................................................................................................. 27
3.3. Kết quả và đánh giá thuật toán TV-GD .............................................................. 27


2
3.3.1. Ảnh hưởng của tham số ............................................................................. 27
3.3.2. Ảnh hưởng của số vòng lặp .......................................................................... 29
3.3.3. Ảnh hưởng của hệ số ................................................................................. 31
3.4. Kết quả so sánh các thuật toán ............................................................................ 33
3.4.1. Kết quả định lượng ....................................................................................... 33
3.4.2. Đánh giá chủ quan........................................................................................ 37

KẾT LUẬN ........................................................................................................ 42
TÀI LIỆU THAM KHẢO ................................................................................ 43
PHỤ LỤC ........................................................................................................... 45
Chương trình thuật toán khử nhiễu dựa trên phương pháp biến phân sử dụng tổng
biến phân .................................................................................................................... 45

C
C


U
D

R
L
T.


3
NGHIÊN CỨU THUẬT TOÁN KHỬ NHIỄU ẢNH DỰA TRÊN PHƢƠNG
PHÁP BIẾN PHÂN
Học viên: Vũ Đình Khôi. Chuyên ngành: Kỹ thuật điện tử
Mã số: CH678. Khóa: 36. Trường Đại học Bách khoa – Đại học Đà Nẵng.
Tóm tắt: Khử nhiễu ảnh là một trong các vấn đề nghiên cứu quan trọng trong
lĩnh vực xử lý ảnh. Trong luận văn này, chúng tôi nghiên cứu thuật toán khử nhiễu ảnh
bằng phương pháp biến phân. Thuật toán tìm nghiệm ảnh khử nhiễu bằng cách tối
thiểu hóa hàm mục tiêu bao gồm thành phần đo khoảng cách giữa ảnh khử nhiễu và
ảnh nhiễu và thành phần đo độ mượt của ảnh thông qua tổng biến phân. Quá trình tối
ưu được thực hiện bởi phương pháp Gradient Descent. Trong phần thực nghiệm, thuật
toán nghiên cứu được đánh giá và so sánh với các thuật toán khử nhiễu phổ biến khác
dựa trên các tiêu chí đánh giá PSNR, SSIM và đánh giá chủ quan. Kết quả thực
nghiệm cho thấy, thuật toán khử nhiễu ảnh bằng phương pháp biến phân cho kết quả
tốt hơn so với các thuật toán khác.

C
C

Từ khóa: khử nhiễu ảnh, phương pháp biến phân, tổng biến phân, gradient
descent.


R
L
T.

U
D

VARIATIONAL METHOD BASED DENOISING ALGORITHM
Student: Vu Dinh Khoi. Major of Master program: Electrical engineering.
Student code: CH678. Course: K36. The University of Science and Technology – The
University of Danang.
Abstract: Image denoising is an important research problem in the field of
digital image processing. In this thesis, we study a denoising algorithm based on
variational method. The algorithm search the denoised image by minimizing the
energy function, which consists of two terms – the fitting term measuring the distance
between the denoised image and the noisy image and the regularization term
measuring the smoothness of the denoised image using the total variation. The
optimization process is based on the Gradient Descent method. In the experiments, the
algorithm is compared with widely used denoising algorithms based on criteria PSNR,
SSIM and visual quality. The experimental results show that the variational method
based denoising algorithm outperforms other competing methods.
Key words: image denoising, variational method, total variation, gradient
descent.


4

DANH SÁCH CÁC KỸ HIỆU, CHỮ VIẾT TẮT
PSNR
SSIM

MSE
VM
PDE
GD

TV-GD
AF
GF
MF
WF
Sob-GD

Peak Signal-to-Noise Ratio
Structural Similaritykj
Mean Squared Error

Tỉ số tín hiệu cực đại trên nhiễu

Variational method
Partial Differential Equation

Phương pháp biến phân
Phương trình đạo hàm riêng

Gradient Descent
Total variation – Gradient
Descent
Average Filter
Gauss Filter
Median Filter

Wiener Filter
Sobolev - Gradient Descent

Thuật toán Gradient Descent

Hệ số tương đồng cấu trúc

Sai số bình phương trung bình

Bộ lọc trung bình
Bộ lọc Gauss
Bộ lọc trung vị
Bộ lọc Wiener

U
D

R
L
T.

C
C


5

DANH MỤC BẢNG BIỂU
Thứ tự


Nôi dung tên bảng biểu

Trang

Bảng 3.1:

Sự phụ thuộc của PSNR và SSIM vào số giá trị của tham số

34

Bảng 3.2:

PSNR và SSIM của 6 thuật toán

35

Bảng 3.3:

PSNR và SSIM của 6 thuật toán

36

Bảng 3.4:

PSNR và SSIM của 6 thuật toán

37

Bảng 3.5:


PSNR và SSIM của 6 thuật toán

38

C
C

U
D

R
L
T.


6

DANH MỤC HÌNH
Thứ tự

Nôi dung tên hình

Hình 1.1.

Quá trình gây nhiễu ảnh và khử nhiễu

8

Hình 1.2.


Ảnh tách đường biên

9

Hình 1.3.

Một số toán tử hình thái học [6]

10

Hình 1.4.

Biến đổi Fourier đối với các bộ lọc [6]

11

Hình 1.5.

Biến đổi wavelet đối với ảnh [6]

12

Hình 1.6.

Mối liên hệ giữa các phương pháp

14

Hình 1.7.


Hàm Gauss với các giá trị

Hình 1.8.

Bộ lọc trung vị [6]

Hình 2.1.

Ba hàm khác nhau có cùng giá trị tổng biến phần bằng 2 [2]

Hình 2.2.

Hàm lồi [5]

Hình 2.3.

Ví dụ về các hàm lồi

21

Hình 2.4.

Minh họa phương pháp GD [5]

24

Hình 2.5.

So sánh 2 hàm | | và √


26

Hình 3.1.

Các ảnh thực nghiệm

27

Hình 3.2.

Sự phụ thuộc của ảnh khử nhiễu vào giá trị của tham số

29

Hình 3.3.
Hình 3.4.

Trang



C
C

khác nhau [6]

R
L
T.


U
D

15
16
20
21

| | với các giá trị khác nhau

Sự phụ thuộc của (a) hàm năng lượng, (b) PSNR và (c)
SSIM vào số vòng lặp
Ảnh
và ảnh khử nhiễu với giá trị của tham số khác
nhau

30
33

Hình 3.5.

Kết quả khử nhiễu của 6 thuật toán

)

40

Hình 3.6.

Kết quả khử nhiễu của 6 thuật toán


)

42


7
CHƢƠNG 1: GIỚI THIỆU TỔNG QUAN

Chương này trình bày tổng quan về bài toán khử nhiễu ảnh, các phương
pháp xử lý ảnh và thuật toán khử nhiễu ảnh phổ biến.
1.1. Đặt vấn đề
Khử nhiễu ảnh (image denoising) là một trong các vấn đề nghiên cứu
quan trọng trong lĩnh vực xử lý ảnh và là một bước tiền xử lý cần thiết cho nhiều
ứng dụng. Trong quá trình thu nhận, truyền và ghi dữ liệu, hình ảnh sẽ bị nhiễu
do khiếm khuyết trong cấu tạo của thiết bị thu phát hình ảnh hoặc do môi trường
bên ngoài. Do đó, việc khử các hiệu ứng nhiễu là cần thiết nhằm phục vụ cho
các bước xử lý ảnh tiếp theo.
Gọi là ảnh gốc (không nhiễu) và là ảnh nhiễu của được gây ra bởi
nhiễu . Quá trình khử nhiễu được mô hình hóa đơn giản như sau
(1.1)
trong đó, toán tử có thể là phép cộng hoặc nhân.
Trong luận văn này, chúng ta xem xét nhiễu cộng Gauss. Mô hình nhiễu
như sau
(1.2)
trong đó,
là nhiễu Gauss với giá trị trung bình
và độ lệch
chuẩn . Quá trình gây nhiễu ảnh bởi nhiễu Gauss được thể hiện ở Hình 1.1.


C
C

R
L
T.

U
D

Hình 1.1. Quá trình gây nhiễu ảnh và khử nhiễu [1]
Để hiểu rõ hơn tầm quan trọng của việc khử nhiễu trong phân tích ảnh, ta
xem một ví dụ về ảnh hưởng của khử nhiễu đến thuật toán tách đường biên
(edge detection) cho ảnh siêu âm. Thuật toán tách đường biên phổ biến là toán
tử Sobel có dạng như sau [3]:
(

)

(

)

(1.3)


8

Toán tử Sobel được áp dụng với ảnh thông qua phép chập:
với độ lớn tại pixel

được xác định bởi


(

)



(1.4)

Giá trị
lớn tại các vị trí gần đường biên và nhỏ tại các vùng có độ
sáng đồng nhất. Hình 1.2 cho thấy rằng, việc khử nhiễu ảnh giúp cho việc tách
đường biên trở nên tốt hơn, cụ thể là các đường biên nét hơn và các đường biên
gây ra bởi nhiễu giảm đi đáng kể.

C
C

R
L
T.

U
D

(a) Ảnh gốc và ảnh tách đường biên

(b) Ảnh khử nhiễu và ảnh tách đường biên

Hình 1.2. Ảnh tách đường biên [2]
Trong thực tế, chúng ta gần như không thể xác định các loại nguồn gây
nhiễu, cũng như các tham số liên quan. Điều này dẫn đến vấn đề khử nhiễu ảnh


9

trở thành bài toán ngược (inverse problem) với nghiệm chỉ có thể là gần đúng và
không duy nhất. Một thuật toán khử nhiễu tốt đòi hỏi phải giảm được nhiễu
tương đương với làm mượt ảnh, tuy nhiên đồng thời phải giữ cho các chi tiết của
ảnh như đường biên không bị mất đi.
1.2. Các phƣơng pháp xử lý ảnh
Mục này trình bày các phương pháp xử lý ảnh chính. Mỗi phương pháp
đều có ưu điểm và nhược điểm, và việc áp dụng phương pháp nào tùy thuộc vào
bài toán cụ thể cũng như cấu trúc dữ liệu của ảnh được cho [2].
1.2.1. Phương pháp hình thái học
Do ảnh ghi nhận thông tin của đối tượng nên xử lý ảnh xem xét vấn đề
liên quan đến đối tượng trên ảnh. Một đối tượng có thể được xác định bởi hàm
đặc trưng nhị phân:
(1.5)
Toán tử hình thái là phép biến đổi giữa các đối tượng
(1.6)
thường mang tính cục bộ, tức một pixel thuộc sẽ được xác định bởi các
pixel lân cận của trong .
Một số toán tử hình thái học cơ bản như dilation, erosion, closing,
opening,… (Hình 1.3). Dựa trên các toán tử cơ bản này, ta có thể tách các đặc
trưng quan trọng trong ảnh như đường biên (edge), điểm đặc trưng (feature
point) để phục vụ cho các bài toán phát hiện, nhận dạng,…

C

C

R
L
T.

U
D

(a) Ảnh gốc

(b) Toán tử Erosion

(d) Toán tử Opening

(c) Toán tử Dilation

(e) Toán tử Closing

Hình 1.3. Một số toán tử hình thái học [6]
1.2.2. Phân tích phổ


10

Phân tích phổ và phương pháp đại diện cho trường phái này là biến đổi
Fourier là một trong những công cụ phân tích ảnh mạnh nhất trong xử lý ảnh cổ
điển. Biến đổi Fourier là phép biến đổi một hàm trong miền thời gian sang miền
tần số. Thông tin về tần số đóng vai trò quan trọng trong việc thiết kế các bộ lọc.
Hình 1.4 cho thấy biến đổi Fourier đối với các bộ lọc, qua đó ta có thể

thấy được tính chất của từng bộ lọc.

C
C

R
L
T.

U
D

Hình 1.4. Biến đổi Fourier đối với các bộ lọc [6]
1.2.3. Phân tích đa phân giải
Nhược điểm của biến đổi Fourier là không có tính cục bộ do đó không
hiệu quả trong việc tách các đặc trưng quan trọng của ảnh như điểm đặc trưng,
tức các điểm ảnh có sự khác biệt so với các điểm ảnh lân cận. Trong khi đó, các
nghiên cứu về nhận thức của con người cho thấy chúng ta có khả năng xác định
các đặc trưng rất hiệu quả. Biến đổi wavelet giải quyết nhược điểm của biến đổi
Fourier bằng cách phân tích ảnh ở các các độ phân giải khác nhau. Nhờ đó, biến
đổi wavelet là một công cụ hữu hiệu trong biểu diễn ảnh và nén ảnh. Hình 1.5
biểu diễn biến đổi wavelet đối với ảnh ở các độ phân giải khác nhau. Tại mỗi độ
phân giải, biến đổi wavelet cho 2 thành phần: chi tiết và xấp xỉ của ảnh. Các bài
toán xử lý ảnh khai thác thông tin ở các độ phân giải khác nhau để tạo ra các
thuật toán chính xác và ổn định hơn.


11

C

C

R
L
T.

U
D

Hình 1.5. Biến đổi wavelet đối với ảnh [6]
1.2.4. Phương pháp dựa trên mô hình ngẫu nhiên
Mỗi pixel là giá trị đo lường cường độ sáng đến từ không gian xung
quanh. Do đó, các phương pháp dựa trên mô hình ngẫu nhiên sẽ hiệu quả hơn
các hướng tiếp cận dựa trên mô hình xác định. Có 2 nguyên nhân dẫn đến bản
chất ngẫu nhiên của ảnh:
- Ảnh tự nhiên có thể phân chia thành 2 thành phần: thành phần lý tưởng
(mang tính chất xác định) và thành phần ngẫu nhiên (ví dụ như nhiễu);
- Ảnh tự nhiên có thể được xem như mẫu của một trường ngẫu nhiên.
Một số phương pháp ngẫu nhiên để xử lý ảnh bao gồm suy luận Bayes,
mô phỏng Monte-Carlo, thuật toán EM (Expectation Maximization),… Trong
đó, phương pháp Bayes đóng vai trò nền tảng trong các phương pháp ngẫu
nhiên. Gọi là thông tin quan sát được, và là đặc trưng ẩn thuộc . Suy luận
Bayes được biểu diễn như sau:


12

|

|


(1.7)

| thường được gọi là mô hình
trong đó,
là xác suất tiền nghiệm;
thông tin, biểu diễn phân bố xác suất của nếu biết .
Nếu không có bất kỳ thông tin biết trước về , ta có
̂
|
(1.8)
được gọi là ước lượng Maximum Likelihood (ML).
Tuy nhiên, trong xử lý ảnh, do số chiều không gian của ảnh là lớn nên
thông tin biết trước về ảnh là rất quan trọng để đảm bảo thu được kết quả
nghiệm ổn định. Khi đó, ta có ước lượng Maximum A Posterior (MAP) như sau:
̂
|
|
(1.9)
Suy luận Bayes nêu trên được sử dụng phổ biến trong nhiều bài toán xử lý
ảnh.
1.2.5. Phương pháp biến phân
Phương pháp biến phân (variational method) là một lĩnh vực trong toán
giải tích, sử dụng biến phân (variation), tức một sự thay đổi nhỏ của hàm, để tìm
cực trị của hàm đó. Ở đây, hàm (functional) được định nghĩa là ánh xạ từ tập các
hàm đến tập số thực. Hàm thông thường được biểu diễn thông qua tích phân của

C
C


U
D

R
L
T.

các hàm và đạo hàm của chúng, ví dụ
. Hàm dùng để

tìm cực trị của hàm thường là phương trình Euler-Lagrange.
Trong ước lượng MAP đã được trình bày ở trên, ta có thể biến đổi thành
bài toàn tối thiểu hóa hàm năng lượng sau:
[ | ]
[ | ]
[ ]
(1.10)
Nếu và thuộc không gian hàm như không gian Sobolev hoặc không
gian biến phân chặn (Bounded Variation) thì bài toán sẽ được đưa về hướng tiếp
cận của phương pháp biến phân.
1.2.6. Phương trình đạo hàm riêng
Phương trình đạo hàm riêng (Partial Differential Equation, viết tắt là
PDE) là công cụ hiệu quả để mô hình hóa các quá trình động và cân bằng trong
vật lý như quá trình khuếch tán. PDE được ứng dụng rộng rãi trong xử lý ảnh do
nhiều bài toán liên quan đến phương pháp biến phân có thể được giải bằng
phương trình Euler-Lagrange thường được mô tả dưới dạng phương trình vi
phân.
1.2.7. Mối liên hệ giữa các phương pháp
Theo như trình bày tóm tắt các phương pháp ở trên, có thể thấy rằng các
phương pháp có mối liên hệ với nhau. Hình 1.6 mô tả mối liên hệ giữa các

phương pháp.


13

Hình 1.6. Mối liên hệ giữa các phương pháp

C
C

1.3. Các thuật toán khử nhiễu phổ biến
Mục này giới thiệu một số thuật toán khử nhiễu phổ biến, bao gồm bộ lọc
trung bình, bộ lọc Gauss, bộ lọc trung vị, bộ lọc Wiener và thuật toán biến phân
sử dụng thành phần ổn định hóa Sobolev.
1.3.1. Bộ lọc trung bình
Bộ lọc trung bình là bộ lọc tuyến tính, hoạt động như một bộ lọc thông
thấp. Bộ lọc trung bình sử dụng cửa sổ là trung bình của các pixel trong cửa sổ.
Ví dụ về cửa sổ của bộ lọc trung bình có kích thước
như sau [3]:

R
L
T.

U
D

(

)


Để lọc ảnh, ta thực hiện phép chập bộ lọc và ảnh. Giá trị điểm ảnh của
ảnh đầu ra là giá trị trung bình của tất cả các điểm ảnh trong cửa sổ lọc. Việc
tính toán này khá đơn giản với hai bước gồm tính tổng các thành phần trong cửa
sổ lọc và sau đó chia tổng này cho số các phần tử của cửa sổ lọc.
1.3.2. Bộ lọc Gauss
Khác với bộ lọc trung bình, các trọng số của các thành phần trong cửa sổ
của bộ lọc Gauss thay đổi theo vị trí, được mô tả bởi hàm Gauss [3]

với


là giá trị trung bình; là độ lệch chuẩn.
Đồ thị của hàm Gauss được thể hiện ở Hình 1.7.

(1.11)


14

Hình 1.7. Hàm Gauss với các giá trị



khác nhau [6]

Ví dụ về cửa sổ của bộ lọc Gauss:
(

)


C
C

Có thể thấy rằng, thành phần của cửa sổ xa vị trí trung tâm có giá trị nhỏ
hơn. Điều này là hợp lý vì các pixel lân cận pixel trung tâm phải có tầm quan
trọng lớn hơn các pixel ở xa.
1.3.3. Bộ lọc trung vị
Bộ lọc trung vị là bộ lọc phi tuyến. Hoạt động của bộ lọc trung vị như sau:
ta sử dụng một cửa sổ lọc quét qua lần lượt từng điểm ảnh của ảnh đầu vào. Tại
mỗi vị trí của cửa sổ, ta sắp xếp các điểm ảnh trong cửa sổ này theo thứ tự; sau
đó, gán điểm ảnh có giá trị nằm chính giữa của dãy giá trị điểm ảnh đã được sắp
xếp ở trên cho giá trị điểm ảnh đang xét. Mô tả hoạt động của bộ lọc trung vị ở
Hình 1.8.

R
L
T.

U
D

Hình 1.8. Bộ lọc trung vị [6]
1.3.4. Bộ lọc Wiener


15

Xem xét ảnh và nhiễu là các đại lượng ngẫu nhiên. Mục tiêu của việc tìm
ảnh khử nhiễu là tối thiểu hóa sai số bình phương trung bình giữa ảnh khử nhiễu

ước lượng và ảnh nhiễu [3]. Hàm mục tiêu này được biểu diễn như sau
̂) }
(1.12)
{(
với

là giá trị trung bình.
Giả sử rằng ảnh và nhiễu là độc lập, và cường độ sáng của các pixel trong
ảnh ước lượng và ảnh nhiễu phụ thuộc tuyến tính. Từ đó, ta có
|

̂
|

[

|

(1.13)

|

]
với

– năng lượng phổ của nhiễu và ảnh nhiễu;

– biến đổi Fourier của ảnh nhiễu và hàm gây nhiễu.
1.3.5. Thuật toán khử nhiễu sử dụng thành phần ổn định hóa Sobolev
Thuật toán tìm nghiệm ảnh bằng cách tối thiểu hóa hàm năng lượng được

xây dựng dựa trên các ràng buộc đối với ảnh khử nhiễu. Gọi là ảnh gốc và là
ảnh nhiễu của . Hàm năng lượng có dạng như sau [1]

C
C

U
D

R
L
T.

( ∫

∫ |

|

)

(1.14)

với
là gradient của ảnh; là không gian ảnh.
1.4. Mục tiêu nghiên cứu
Qua các nghiên cứu tổng quan nêu trên, chúng tôi chọn phương pháp biến
phân để giải quyết bài toán khử nhiễu do phương pháp này có mối liên hệ với
phương pháp ngẫu nhiên và phương pháp PDE, qua đó ta có thể xây dựng và
giải mô hình một cách chặt chẽ dựa trên nền tảng toán học.

Mục tiêu nghiên cứu: Nghiên cứu, thực thi và đánh giá thuật toán khử
nhiễu ảnh dựa trên phương pháp biến phân.
Để thực hiện được mục tiêu này, ta cần giải quyết một số vấn đề sau:
- Xây dựng mô hình ảnh khử nhiễu
- Giải bài toán tối ưu từ mô hình
- Xây dựng thuật toán dưới dạng rời rạc


16
CHƢƠNG 2: THUẬT TOÁN KHỬ NHIỄU ẢNH DỰA TRÊN PHƢƠNG PHÁP
BIẾN PHÂN

Chương này trình bày hàm năng lượng của bài toán khử nhiễu ảnh dựa
trên phương pháp biến phân và phương pháp giải bài toán tối ưu liên quan bằng
thuật toán Gradient Descent.
2.1. Hàm năng lƣợng
Xét bài toán khử nhiễu ảnh với nhiễu Gauss. Theo phương pháp biến
phân, trước tiên, ta cần xây dựng hàm năng lượng từ bài toán đặt ra để mô hình
hóa ảnh khử nhiễu. Một trong các hướng tiếp cận để xây dựng hàm năng lượng
là dựa trên Suy luận Bayes (Bayesian inference).
Gọi là ảnh gốc và là ảnh bị nhiễu. Phân bố xác suất hợp của và
được viết như sau:
|
|
(2.1)
Từ đây, ta có thể suy ra mối quan hệ giữa 2 phân bố xác suất điều kiện
| và
| như sau:
|
(2.2)

|

C
C

R
L
T.

biểu thức này được gọi là Định lý Bayes, trong đó
| được gọi là xác suất
hậu nghiệm của nếu biết ;
là xác suất tiền nghiệm của , tức thông tin
| là xác
biết trước về và được gọi là prior;
là xác suất biên của ;
suất của nếu biết và được gọi là likelihood (tạm dịch là khả năng).
Phương pháp Maximum A Posteriori (MAP) ước lượng như là mode
của xác suất hậu nghiệm
| :
̂
|
(2.3)
Áp dụng Định lý Bayes, ta có:
|
(2.4)
̂
|

U

D

Vì mẫu số của biểu thức trên không phụ thuộc vào nên
|
̂
(2.5)
Như vậy, phương pháp MAP ước lượng bằng cách tối đa hóa tích giữa
khả năng và xác suất tiền nghiệm theo biến .
Giả sử rằng ảnh và có cùng kích thước gồm pixel. Đối với mỗi
pixel , cường độ sáng được mô hình bằng cường độ sáng gốc cộng với
nhiễu Gauss.
(2.6)
trong đó,
là nhiễu Gauss với giá trị trung bình
và độ lệch
chuẩn .


17

|

Như vậy, xác suất

được biểu diễn như sau:

|

(2.7)


Giả sử rằng nhiễu trên các pixel là độc lập, tức nhiễu của các pixel không
| đối với toàn bộ các pixel
phụ thuộc lẫn nhau. Từ đó, ta thu được xác suất
|

|



|





(2.8)

Đối với xác suất tiền nghiệm
, giả sử rằng xác suất
thỏa mãn
thuộc tính Markov, tức
chỉ phụ thuộc vào các pixel lân cận. Từ đó, ta có
thể biểu diễn
như sau:
|
(2.9)
|


C

C

Xác suất tiền nghiệm
đặc trưng cho thông tin biết trước về ảnh gốc
. Nhận định rằng, ảnh tự nhiên có thể được mô hình hóa bởi các vùng có cường
độ sáng đồng nhất được giới hạn bởi các đường biên (edge). Do đó, ta có thể sử
dụng thông tin biết trước về ảnh gốc là tính mượt của ảnh được thể hiện thông
qua sự biến thiên cường độ sáng của các pixel lân cận [4]

R
L
T.

U
D
|


Kết hợp khả năng
|
nghiệm
|

|

|



(2.10)


|

và xác suất tiền nghiệm





|

, ta có xác suất hậu
(2.11)

|

| , ta có thể tối thiểu hóa hàm
Thay vì tối đa hóa phân bố xác suất
logarithm với dấu âm của xác suất này do hàm logarithm là hàm đơn điệu. Như
vậy, ta thu được hàm năng lượng như sau

|



|

|

∑|


|

(2.12)

Bài toán khử nhiễu được quy về bài toán tối ưu hóa hàm năng lượng theo

̂

(∑

|

|

∑|

|)

(2.13)


18

Theo lý thuyết về rời rạc hóa ảnh, ta có gradient rời rạc của ảnh có thể
được định nghĩa như sau:
(2.14)
Kết hợp với việc rút gọn các hằng số, biểu thức (2.13) có thể được viết lại
như sau
̂


∑|

( ∑

|)

(2.15)

trong đó, thành phần thứ nhất của hàm năng lượng đo lường “độ trung thực”
(fidelity) của ảnh khử nhiễu so với ảnh nhiễu , và được gọi là tổng biến phân
(
[4]; và thành phần thứ hai được gọi là thành phần ổn định
hóa (regularization term), đặc trưng cho độ mượt của ảnh khử nhiễu. Nói cách
khác, để tìm ảnh khử nhiễu, ta đi tìm nghiệm ảnh ̂ thỏa mãn 2 điều kiện là gần
giống với ảnh nhiễu nhưng đồng thời phải có gradient thấp, tức phải loại bỏ
nhiễu; tham số được gọi là trọng số ổn định hóa, thể hiện đóng góp của thành
phần ổn định hóa vào hàm năng lượng.
Dạng liên tục của hàm năng lượng có thể được biểu diễn như sau:

C
C

U
D

( ∫
với

R

L
T.
∫ |

|

)

(2.16)

là miền không gian ảnh.
Hình 2.1 mô tả 3 hàm khác nhau có cùng giá trị tổng biến phân.

Hình 2.1. Ba hàm khác nhau có cùng giá trị tổng biến phần bằng 2 [2]
2.2. Hàm lồi
Một hàm số
được gọi là hàm lồi (convex) nếu

[ ]:
.
Như vậy, một hàm được gọi là hàm lồi nếu ta nối hai điểm bất kỳ của hàm
thì sẽ được một đoạn thẳng nằm ở phía trên hoặc nằm trên hàm đó. Hình 2.2
minh họa một hàm lồi theo định nghĩa nêu trên.


19

Hình 2.2. Hàm lồi [5]

nếu


Một hàm số


[

được gọi là hàm lồi nghiêm ngặt (strict convex)
]:
.

C
C

R
L
T.

U
D

Hình 2.3. Ví dụ về các hàm lồi
Hàm lồi có ý nghĩa quan trọng trong bài toán tối ưu. Các hàm lồi nghiêm
ngặt chỉ có một điểm cực tiểu duy nhất. Bên cạnh đó, các hàm lồi có nhiều tính
chất thuận lợi hơn trong việc xây dựng và giải các hàm năng lượng trong bài
toán tối ưu.
Xét hàm năng lượng của bài toán khử nhiễu được mô tả ở (2.3) và (2.4).
Thành phần
của hàm năng lượng là hàm lồi nghiêm ngặt, còn thành
phần ổn định hóa | | là một hàm lồi (Hình 2.3). Tuy nhiên, hàm | | không
khả vi tại vị trí

. Điều này khiến cho việc sử dụng các phương pháp giải
bài toán tối ưu như Gradient Descent trở nên không khả thi. Một trong các
hướng giải quyết vấn đề này là mượt hóa hàm | | sẽ được trình bày ở mục 2.7.
Ngoài ra, ta có thể sử dụng thành phần ổn định hóa với tính chất làm mượt
ảnh nhưng đồng thời có dạng hàm lồi. Một trong số đó là thành phần ổn định
hóa Sobolev | | [1]. Khi đó, hàm năng lượng được biểu diễn như sau:


20

∫ |

( ∫

|

(2.17)

)

Thành phần ổn định hóa Sobolev | | cho phép khử nhiễu nhưng lại có
xu hướng làm mượt đường biên mạnh hơn so với hàm tổng biến phân | |. Chi
tiết về so sánh giữa các thành phần ổn định hóa được trình bày ở Chương 3.
2.3. Functional
Functional là ánh xạ từ không gian vector đến trường số thực [1]. Không
gian vector là một không gian hàm, ví dụ hàm . Do đó, functional được hiểu là
hàm của hàm. Để đơn giản, trong luận văn này thuật ngữ functional được gọi là
hàm.
Trong giới hạn của luận văn này, ta xem xét dạng hàm tổng quát của hàm
năng lượng được mô tả ở (2.15) và (2.16). Xét hàm có dạng sau (được gọi là

hàm mật độ Lagrange):
(2.18)

với

C
C

là đạo hàm của hàm .

R
L
T.

Đối với hàm năng lượng (2.16):

U
D


ta có

∫ |

|

có đạo hàm

(2.19)


|

2.4. Đạo hàm Gâteaux
Tương tự như hàm số thực trong không gian
vị trí

|

, hàm

đạt cực trị tại

. Do đó, ta cần định nghĩa của đạo hàm của hàm.

Trước tiên, ta có đạo hàm của hàm
nghĩa như sau [1]:

theo hướng

được định

|

(2.20)

Đạo hàm có hướng

| có thể được biểu diễn như là hình chiếu của

đạo hàm của hàm lên hướng đó:

|







Xét hàm có dạng sau:


(2.21)


21

với

là đạo hàm của hàm .

Lưu ý rằng, hàm năng lượng (2.15) và (2.16) có dạng tổng quát nêu trên.
Theo định nghĩa, đạo hàm của hàm
được xác định như sau:
]

∫[
Áp dụng xấp xỉ Taylor và tích phân từng phần với điều kiện biên |
, ta có:
|


∫(

)

So sánh với biểu thức (2.21), ta có đạo hàm của

theo :
(2.22)

Áp dụng biểu thức đạo hàm cho hàm năng lượng của bài toàn khử nhiễu
(2.16), ta có đối với:
(2.23)
| |

C
C

Đạo hàm

R
L
T.

được biểu diễn như sau:

trong đó, với mọi

U
D


,

(

|

|

)

(2.24)

là toán tử phân kỳ

(divergence).
2.5. Phƣơng trình Euler-Lagrange
Điều kiện cần thiết để hàm
đạt được cực trị là sự biến thiên của hàm
này theo bất cứ hướng
nào đều phải bằng 0. Từ biểu thức (2.22), ta có:
(2.25)
Phương trình trên được gọi là phương trình Euler-Lagrange.
Đối với hàm năng lượng (2.16), ta có phương trình Euler-Lagrange như
sau:
(

|

|


)

(2.26)

2.6. Thuật toán Gradient Descent
Để tìm được cực trị của bài toán tối ưu, ta cần giải phương trình EulerLagrange. Tuy nhiên, phương trình này không cho nghiệm được biểu diễn cụ
thể. Thay vào đó, ta cần sử dụng các phương pháp tính để tìm nghiệm. Một
trong các phương pháp được sử dụng rộng rãi để giải các toán tối ưu là thuật
toán Gradient Descent (GD).


22

Ta lấy hàm một biến để làm ví dụ trình bày về thuật toán GD. Biết rằng,
để tìm cực trị của hàm, ta cần xác định vị trí tại đó đạo hàm của hàm bằng 0.
Bên cạnh đó, có thể nhận thấy rằng đạo hàm tại một điểm cho thông tin về độ
dốc của hàm và dựa vào đó ta có thể ước lượng hướng dịch chuyển để tìm cực
trị của hàm. Hình 2.4 minh họa ý tưởng của thuật toán GD.

C
C

Hình 2.4. Minh họa phương pháp GD [5]

R
L
T.

Ta có thể mở rộng thuật toán GD cho hàm nhiều biến. Gọi
là hàm số thực. Thuật toán GD được biểu diễn bởi phương trình vi phân sau:


U
D
{

(2.27)

Dạng rời rạc của thuật toán GD như sau:
(2.28)
được gọi là tốc độ học.
Phương trình (2.27) và (2.28) cho thấy giá trị đạo hàm được sử dụng để
thay đổi giá trị biến nhằm tìm đến điểm cực trị.
Tương tự, ta xét hàm
với đạo hàm theo :

với

Áp dụng thuật toán GD, ta có:
{
Đối với hàm năng lượng (2.16), ta có thuật toán Euler-Lagrange được
biểu diễn như sau:
(2.29)
(
)
| |


×