TRƯNG ĐI HC BCH KHOA H NI
VIỆN CÔNG NGHỆ THÔNG TIN V TRUYỀN THÔNG
BO CO BI TẬP LỚN
Môn học: Xử lý ảnh
ĐỀ TÀI:
Tìm hiểu về các phép lọc số, khảo sát và xây dựng thử nghiệm
các ứng dụng của phép lọc trên miền tần số với xử lý ảnh màu.
Giáo viên hướng dẫn: PGS.TS. Nguyễn Thị Hoàng Lan
Sinh viên thực hiện:
Nguyễn Khánh Hưng 20081279 TTM-K53
Nguyễn Lê Hoài Nam 20081819 TTM-K53
Phan Văn Trường 20082846 TTM-K53
H Ni 4/2012
2
LI GIỚI THIỆU 4
I. KHÁI QUÁT VỀ ẢNH, ẢNH SỐ 5
II. TÌM HIỂU VỀ CÁC PHÉP LC SỐ 7
1. Khái quát về phép lọc ảnh 7
2. Các bộ lọc số 7
2.1. Định nghĩa và mô hình 7
2.2. Phân loại bộ lọc 8
2.3. Các bộ lọc thông dụng 9
2.3.1. Bộ lọc trung bình 9
2.3.2. Lọc thông thấp 10
2.3.3. Lọc đồng hình (Homomorphic Filtering) 11
III. KHẢO SÁT VÀ XÂY DỰNG THỬ NGHIỆM CÁC ỨNG DỤNG
CỦA PHÉP LC TRÊN MIỀN TẦN SỐ. 12
1. Cơ sở lý thuyết 12
1.1. Hạn chế của xử lý ảnh trên miền không gian 12
1.2. Phép biến đổi Fourier và miền tần số 13
1.3. Phép biến đổi Fourier rời rạc - DFT 14
1.4. Biến đổi Fast Fourier (FFT) 25
2. Ứng dụng của phép lọc trên miền tần số 31
2.1. Làm trơn ảnh 32
2.1.1. Lọc tần số thấp Ideal 32
2.1.2. Lọc tần số thấp Butterworth 34
2.1.3. Lọc tần số thấp Gauss 35
3
2.2. Làm sắc ảnh 35
2.2.1. Lọc tần số cao Ideal 36
2.2.2. Lọc tần số cao Butterworth 36
2.2.3. Bộ lọc tần số cao Gauss 37
3. Xây dựng thử nghiệm các ứng dụng của phép lọc trên miền tần số
37
3.1. Giao diện 37
3.2. Cài đặt 38
3.3. Chức năng và sử dụng 39
3.4. Thử nghiệm ứng dụng 40
IV. KẾT LUẬN 45
PHÂN CHIA CÔNG VIỆC 46
TÀI LIỆU THAM KHẢO 47
4
LI GIỚI THIỆU
Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ. Nó là một ngành khoa
học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát triển của nó rất
nhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đặc biệt là máy tính chuyên
dụng riêng cho nó. Xử lý ảnh là một quá trình liên tục. Đầu tiên là thu nhận ảnh từ
camera, vệ tinh hay các bộ cảm ứng,…Tiếp theo tín hiệu lấy vào sẽ được số hóa
thành tín hiệu số và chuyển qua giai đoạn xử lý, phân tích hay lưu trữ lại. Việc xử lý
ảnh chính là tăng cường ảnh, tức là làm cho ảnh trở nên đẹp hơn, tốt hơn và rõ hơn.
Có nhiều phương pháp cải thiện chất lượng ảnh nhưng ở đây chúng tôi chủ yếu tập
trung nghiên cứu về các phương pháp lọc ảnh. Tuy đã cố gắng hết sức nhưng bài
viết chắc chắn không thể tránh khỏi những sai sót. Vì vậy rất mong cô góp ý bổ
sung giúp chúng tôi hoàn thiện đề tài.
Nhóm sinh viên:
Nguyễn Khánh Hưng
Nguyễn Lê Hoi Nam
Phan Văn Trường
5
I. KHÁI QUÁT VỀ ẢNH, ẢNH SỐ
Ảnh có thể được hiểu là thông tin (về đường nét, hình khối, màu sắc…) của
vật thể hay quang cảnh được chiếu sáng mà con người cảm nhận và quan sát được
bằng mắt và hệ thống thần kinh thị giác
Đối tượng chính của xử lý ảnh chính là ảnh chụp tự nhiên. Quá trình xử lý ảnh
được hiểu là xử lý nội dung thông qua dữ liệu ảnh, qua đó nâng cao chất lượng ảnh
hiển thị hay đạt được một yêu cầu cảm quan nào đó.
Ảnh thông thường được hiểu là dữ liệu trên một mặt phẳng ảnh, ta còn gọi là
ảnh đơn (Image), hay ảnh tĩnh. Ngoài ảnh đơn, ta còn gặp dạng chuỗi các ảnh được
chụp liên tiếp nhau thông qua mối quan hệ về thời gian, ảnh đó gọi là chuỗi ảnh,
(hay ảnh động, phim). Ở đây ta chỉ quan tâm đến đối tượng là ảnh đơn. Ảnh đơn
biểu diễn dữ liệu ảnh thông qua (các) hàm độ chói của các biến tọa độ trong mặt
phẳng ảnh: I(x,y)
Đối với ảnh đơn màu, hay ảnh đa mức xám, dữ liệu ảnh được biểu diễn dưới
dạng một hàm độ chói I(x,y). Với các giá trị I(x,y), x, y là các số thực, và ta có 0 ≤
I(x,y) ≤ L
MAX
. Với ảnh màu, dữ liệu ảnh được biểu diễn thông qua 3 hàm độ chói
của 3 màu cơ bản R (đỏ), G (xanh lá), B (xanh lam): I
R
(x,y), I
G
(x,y) , I
B
(x,y).
Ảnh số là một dạng biểu diễn, lưu trữ và thể hiện ảnh tĩnh. Ảnh số thực chất là
ảnh chụp (mặt phẳng ảnh gồm vô số điểm với vô số các giá trị màu khác nhau)
thông qua quá trình lấy mẫu (rời rạc hóa về không gian) và lượng tử hóa (rời rạc
hóa về mặt giá trị dữ liệu). Ảnh số được biểu diễn dưới dạng một ma trận điểm ảnh
I[m,n] (m ϵ [0 M], n ϵ [0 N]) , mỗi phần tử của ma trận đó gọi là một điểm ảnh –
pixel. Trong đó giá trị của mỗi điểm ảnh lại phụ thuộc vào từng loại ảnh:
Ảnh nhị phân: một điểm ảnh chỉ nhận 2 mức giá trị nên cần 1 bit lưu trữ.
Ảnh đa mức xám: giá trị điểm ảnh được chia thành 256 mức [0 255] nên ta
cần 8 bits/pixel.
Với ảnh màu: tùy thuộc vào số lượng màu, chất lượng màu mà ta cần 8, 16, 24
bits/pixel. Với hệ màu cơ bản RGB ta cần 3*8 = 24 bits/pixel.
Đến đây việc xử lý ảnh trở thành việc xử lý các phần tử của ma trận điểm ảnh.
6
Một bức ảnh số được biểu diễn bởi một ma trận điểm ảnh I[m,n], trong đó một
điểm ảnh được đặc trưng bởi tọa độ [m, n] và giá trị màu I. Như vậy, các phép xử lý
ảnh có thể tác động vào tọa độ của các điểm ảnh, làm thay đổi vị trí của các điểm
ảnh, hình khối trong ảnh, ta gọi đó là các phép xử lý về hình học. Bên cạnh tác động
vào tọa độ của các điểm ảnh, các phép xử lý ảnh cũng có tác động đến giá trị màu I
của các điểm ảnh, ta gọi đó là các phép xử lý về nội dung. Nhìn chung các phép xử
lý hình học không làm thay đổi nội dung của ảnh và được ứng dụng phổ biến trong
quá trình hiển thị hình ảnh. Các phép xử lý về nội dung tác động làm thay đổi các
thành phần về mặt giá trị màu của điểm ảnh, từ đó mang lại những hiệu quả về cảm
nhận khác nhau.
Các phép xử lý về nội dung được
biêu diễn thông qua mô hình như sau:
X[m, n] là ma trận điểm ảnh ban
đầu, sau quá trình xử lý dữ liệu F, ta
nhận được ma trận điểm ảnh Y[m, n]. Tùy thuộc vào F mà ta có ma trận kết quả
Y[m, n] khác nhau.
Việc xử lý ảnh màu cũng như xử lý ảnh đa mức xám. Với ảnh màu chúng ta
xử riêng 3 màu cơ bản R (đỏ), G (xanh lá), B (xanh lam): I
R
(x,y), I
G
(x,y) , I
B
(x,y).
Xử lý dữ liệu
ảnh (F)
X[m,n]
Y[m,n]
7
II. TÌM HIỂU VỀ CC PHÉP LC SỐ
1. Khái quát về phép lọc ảnh
Phép lọc ảnh được sử dụng nhiều trong xử lý ảnh, được dùng trong giảm
nhiễu, làm nét ảnh, cũng như trong phát hiện cạnh, biên ảnh. Các phép lọc ảnh chủ
yếu được sử dụng để ngăn chặn các tần số cao trong hình ảnh, như làm mịn ảnh hay
tần số thấp như phát hiện cạnh trong hình ảnh. Các bộ lọc có thể chia làm 2 loại
theo phép toán : lọc tuyến tính và lọc phi tuyến. Phép lọc tuyến tính là các phép lọc
có bản chất là lọc tần số như lọc trung bình, lọc thông thấp, lọc thông cao, lọc đạo
hàm. Ngược lại các phép lọc phi tuyến bao gồm lọc trung vị, lọc đồng hình, lọc với
k láng giềng gần nhất, lọc hạng r ….
Các phép lọc ảnh đều sử dụng cách xử lý cục bộ, tức là điểm ảnh đầu ra chỉ
chịu ảnh hưởng của 1 số điểm ảnh lân cận theo kĩ thuật mặt nạ. Người ta cũng sử
dụng phép nhân chập rời rạc để thực hiện bộ lọc.
Lọc không gian thông thường được thực hiện để khử nhiễu hoặc thực hiện một
số kiểu nâng cao ảnh.
2. Các bộ lọc số
2.1. Định nghĩa và mô hình
Một hình ảnh có thể được lọc trong miền tần số hoặc trong miền không gian.
Trong kĩ thuật lọc miền không gian ta sử dụng một mặt nạ, tổ hợp điểm ảnh từ ảnh
hưởng của các điểm lân cận. Trong miền không gian ta sẽ dùng phép nhân chập tín
hiệu ảnh đầu vào với bộ lọc số :
Y(m, n) = H(k, l) * X(m, n) Với K * L << M * L
Ma trận lọc H:
Hình 1: Ma trận lọc 3* 3
8
Ma trận bộ lọc còn được gọi là ma trận hạt nhân. Các ma trận hạt nhân có thể
có nhiều kích thước tùy ý, phổ biến nhất là ma trận 3*3 (hình 1), ngoài ra trong các
trường hợp cụ thể có thể sử dụng các bộ lọc 5*5 hay 7*7. Bộ lọc trong miền không
gian với ma trận hạt nhân khá trực quan và dễ thực hiện. Nó phù hợp với cảm quan
của chúng ta. Tuy nhiên cũng chính vì khá đơn giản nên nó không có được sự tinh
tế. Mặt nạ thường có các giá trị dương và đối xứng, nhưng không nhất thiết phải
như vậy. Nó có thể được chọn theo một phương pháp nào đó mà không thể trực
quan và một trong các phương pháp đó là lọc trên miền tần số .
Phương pháp lọc trên miền tần số đơn giản là thực hiện các phép biến đổi
ảnh trên miền tần số. Các tín hiệu đầu vào, đầu ra của ảnh, các bộ lọc đều được biến
về miền tần số.
Y(u, v) = X(u, v) * H(u, v)
Với Y(u, v) = DFT(Y(m, n));
X(u, v) * H(u, v) = DFT (X(m,n ) * H(k,l))
Bộ lọc trên miền tần số có 2 loại là bộ lọc thông thấp và thông cao. Bộ lọc
thông thấp thường được sử dụng để làm mờ ảnh, giảm nhiễu, bộ lọc thông cao thì
được sử dụng để làm sắc nét cạnh, biên làm cho ảnh rõ nét hơn. Thực ra bản chất
của phép lọc số đều sử dụng lọc tần số, chỉ là thực hiện trên miền không gian hay
miền tần số mà thôi.
2.2. Phân loại bộ lọc
Gồm có 2 loại:
- Bộ lọc đáp ứng xung hữu hạn (FIR)
9
- Bộ lọc đáp ứng xung vô hạn (IIR)
2.3. Các bộ lọc thông dụng
2.3.1. Bộ lọc trung bình
Các bộ lọc trung bình thường được sử dụng để giảm nhiễu trong một hình ảnh.
Tuy nhiên, nó giải quyết được vấn đề tốt hơn.
Nguyên lý:
Mỗi điểm ảnh được thay thế bằng trung bình trọng số của các điểm lân cận:
Với a(k, l) = 1/N
w
, trong số N
w
là số điểm trong cửa sổ. Giá trị mới của điểm
ảnh được thay bằng trung bình cộng các điểm rơi vào cửa sổ W
Nếu điểm ảnh được thay thế bằng trung bình cộng của điểm đó với trung bình
cộng của 4 điểm lân cận kề, ta có:
10
Hình 2:Ma trận đầu vo
Trên hình 2, giá trị pixel trung tâm không đại diện cho các điểm xung quanh
nó, vì vậy ta sẽ thay thế bằng giá trị trung bình của các điểm lân cận:
Điểm lân cận: 124, 126, 127, 125, 123, 119, 115, 120, 150
Giá trị trung bình:
= 125
Như vậy giá trị 150 sẽ được thay thế bởi giá trị trung bình 125. Ở đây sử dụng
cửa sổ 3 x 3. Nếu dùng cửa sổ lớn hơn sẽ tạo ảnh có độ mịn hơn.
2.3.2. Lọc thông thấp
Lọc thông thấp thường được sử dụng để làm trơn nhiễu.
Với kỹ thuật lọc trên miền không gian người ta hay dùng một số mặt nạ lọc có
dạng sau:
Ta dễ dàng nhận thấy khi b = 1, H
b
chính là mặt nạ lọc H
t1
(lọc trung bình).
Để hiểu rõ hơn bản chất khử nhiễu cộng của bộ lọc này, ta viết lại phương trình thu
nhận ảnh dưới dạng:
11
Trong đó η[m, n] là nhiễu cộng có phương sai σ
2
n
. Như vậy, theo cách tính của
lọc trung bình ta có:
Như vậy nhiễu cộng trong ảnh đã giảm đi N
w
lần.
2.3.3. Lọc đồng hình (Homomorphic Filtering)
Kỹ thuật lọc này hiệu quả với ảnh có nhiễu nhân. Thực tế, ảnh quan sát được
gồm ảnh gốc nhân với một hệ số nhiễu. Gọi X*(m, n) là ảnh thu được, X(m, n) là
ảnh gốc và η(m, n) là nhiễu, như vậy:
X(m, n) = X*(m,n) * η(m, n)
Lọc đồng hình thực hiện lấy logarit của ảnh quan sát. Do vậy ta có kết quả
sau: log(X(m, n)) = log(X*(m,n)) + log(η(m, n))
Rõ ràng, nhiễu nhân có trong ảnh sẽ bị giảm. Sau quá trình lọc tuyến tính, ta
chuyển về ảnh cũ bằng phép biến đổi hàm e mũ.
2.3.4. Lọc thông cao
Lọc thông cao dùng làm nổi bật các chi tết có tần số thấp. Các phần tử có tần
số không gian cao sẽ sáng hơn, còn các phần tử có tần số không gian thấp sẽ đen.
Kỹ thuật lọc thông cao cũng được thực hiện nhờ thao tác nhân chập. Các mặt nạ hay
được dùng như:
12
III. KHẢO ST V XÂY DỰNG THỬ NGHIỆM CC ỨNG DỤNG CỦA
PHÉP LC TRÊN MIỀN TẦN SỐ.
1. Cơ sở lý thuyết
1.1. Hạn chế của xử lý ảnh trên miền không gian
Phần trên chúng ta đã nêu những ứng dụng của phương pháp lọc trên miền
không gian. Biện pháp xử lý ảnh trên miền không gian là khá trực quan.Trên miền
không gian, độ xám tại một pixel trong ảnh mới bằng một biểu thức tuyến tính giữa
độ xám của các pixel kế cận trong ảnh cũ. Như vậy, để làm các chi tiết trên ảnh trơn
hơn, ta có thể tính độ xám tại pixel (x,y) trên ảnh mới bằng trung bình cộng độ xám
của chính nó và 8 pixel lân cận trong ảnh cũ.
(1.1)
Nếu muốn làm các chi tiết trên ảnh nối bật hơn, ta có thể tính độ xám tại pixel
(x, y) trên ảnh mới bằng một trung bình có trọng số độ xám của chính nó và 8 pixel
lân cận trong ảnh cũ, trong đó trọng số ứng với f(x,y) là lớn nhất, chẳng hạn:
(1.2)
Nói tóm lại, xử lý ảnh trên miền không gian là một phương pháp rất trực
quan, phù hợp với cảm giác tự nhiên của chúng ta: nhìn vào các biểu thức (1.1) và
(1.2), ta cũng hình dung được phần nào về ảnh kết quả.
Tuy nhiên, cũng chính do tính đơn giản như trên mà phương pháp xử lý ảnh
trên mà phương pháp xử lý trên miền không gian là không được tinh tế. Chẳng hạn
hệ số của mặt nạ (filter mask) thường được chọn là dương.
Dĩ nhiên, trong một số trường hợp, mặt nạ có thể chứa các hệ số âm. Một thí
dụ khác là các mặt nạ thường là ma trận đối xứng. Hiển nhiên ta thấy rằng mặt nạ
không nhất thiết phải là ma trận đối xứng. Hơn nữa, các hệ số của mặt nạ cũng
không nhất thiết nguyên hay hữu tỷ. Đối với các trường hợp như vậy, các hệ số phải
được chọn bằng một phương pháp nào đó, chứ không còn bằng trực quan như trước
đây.
13
Phương pháp xử lý ảnh trên miền tần số là một trong số đó. Sự can thiệp sâu
sắc của toán học cho ta những đối tượng, những đại lượng ẩn dưới lớp vỏ trực quan
của ảnh. Do đó, nếu chỉ đơn thuần quan sát, phân tích ảnh bằng thị giác thì ta không
dễ gì cảm nhận được các đại lượng này. Thay vì thao tác trực tiếp trên độ xám của
các pixel (trường độ xám), ta sẽ thao tác, xử lý trên các đối tượng mới này.
1.2. Phép biến đổi Fourier và miền tần số
Biến đổi Fourrier cho một tín hiệu có thể hình dung như sau:
Phép biển đổi Fourier đi từ miền không gian (liên tục hay rời rạc) tới miền tần
số luôn luôn liên tục. Khai triển phân tích một hàm f của trường độ xám bất kì thành
tổng của vô hạn các sóng dạng sin hay cos. Một sóng có tần số càng cao thì dao
động càng dày đặc gây nên sự biến đổi đột ngột giá trị của f. Chính các thành phần
này gây sự xáo trộn mạnh mẽ cho giá trị của hàm f do đó làm giảm tính trơn của f.
Mặt khác tín hiệu nhiễu là tín hiệu có biên độ thấp và tần số cao. Vì tính chất này
nên Fourier đã được ứng dụng vào lọc ảnh trên miền tần số.
Biến đổi Fourrier cho một tín hiệu một chiều gồm một cặp biến đổi:
- Biến đổi thuận: chuyển sự biểu diễn từ không gian thực sang không gian tần
số (phổ và pha). Các thành phần tần số này được gọi là các biểu diễn trong không
gian Fourrier của tín hiệu.
- Biến đổi ngược: chuyển đổi sự biểu diễn của đối tượng từ không gian Fourier
sang không gian thực.
Không gian một chiều
Cho một hàm f(x) liên tục. Biến đổi Fourrier của f(x), kí hiệu F(u), u biểu diễn
tần số không gian, được định nghĩa:
trong đó:
f(x): biểu diễn biên độ tín hiệu
e
-2πixu
: biểu diễn pha.
14
Biến đổi ngược của F(u) cho f(x) được định nghĩa:
Không gian hai chiều
Cho f(x,y) hàm biểu diễn ảnh liên tục trong không gian 2 chiều, cặp biến đổi
Fourier cho f(x,y) được định nghĩa:
- Biến đổi thuận
u, v biểu diễn tần số
- Biến đổi ngược
1.3. Phép biến đổi Fourier rời rạc - DFT
Ý tưởng của việc áp dụng khai triển Fourier nằm ở chỗ ta muốn phân tích một
hàm hai biến f = f(x, y) bất kì thành tổng của vô hạn các sóng dạng sin hay cos. Tuy
nhiên, không nhất thiết chỉ có khai triển Fourier mới cho ta một cách phân tích như
vậy. Hơn nữa, trường độ xám f mà ta đang xét là hàm bậc thang, tức là có hữu hạn
giá trị nên f hoàn toàn có thể được phân tích thành sóng một cách đơn giản hơn. Ta
bắt đầu xét cách phân tích “đơn giản hơn” này dưới dạng một chiều để thấy rõ ý
tưởng.
Gọi g là một hàm có miền xác định rời rạc như sau
g: {0,1,….,M – 1}R
Khi đó hàm G:{0,1, ,M – 1}C xác định bởi
Được gọi là biến đổi Fourier rời rạc (DFT) của g.
Công thức (1.3) cho thấy mỗi hàm rời rạc g đều có DFT. Hơn nữa, khi biết
DFT của g là G, ta có thể tìm ngược trở lại g bằng công thức:
15
Công thức (1.3) và (1.4) cho thấy sự tương ứng 1 – 1 giữa một hàm rời rạc
và DFT của nó. Khi biết g ta có thể tìm được G và ngược lại. Tuy nhiên, điều đặc
biệt lại nằm ở công thức (1.4). Ta biết rằng:
Nên (1.4) được viết lại như sau:
Vì G là hàm nhận giá trị phức nên ta có thể biểu diễn nó dưới dạng
G(u) = R(u) – i I(u)
Trong đó R và I chỉ nhận các giá trị thực. Thế vào (1.5), ta được
Hay
Vì g chỉ nhận giá trị thực nên phần ảo ở hai vế bằng 0. Do đó
16
Rõ ràng (1.6) là một sự phân tích hàm g thành tổng của các sóng sin hay cos.
Chú ý rằng tổng ở đây là tổng hữu han, chứ không phải tổng vô hạn (chuỗi) như
khai triển Fourier mà ta đã xét ở mục trước.
Mỗi sóng thành phần là
và
. Ứng với mỗi u, các
sóng này đều có chu kì là
, tức là có tần số là
. Do đó, khi u càng lớn (tức là càng
gần M) thì tần số dao động của các sóng này càng cao. Tiếp theo, ta xét biên độ của
các sóng này. Từ (1.3), ta có
Vì
và
là hai sóng cùng tần số (sóng kết hợp) nên
tổng hợp của hai sóng này cũng có dạng sin hoặc cos. Do G(u) = R(u) –i I(u)
Nên
Vì vậy
Gọi
là góc thỏa
Khi đó
Do đó (1.6) được viết lại như sau
17
Công thức (1.9) cho ta thấy g có thể phân tích được thành tổng của M sóng có
biên độ dương. Mỗi sóng như vậy có tần số là
, với . Ta
mong muốn rằng khi u càng lớn thì biên độ các sóng trên càng nhỏ.
Theo công thức (1.9) thì biên độ của sóng ứng với u = 0 là
. Ở (1.3),
ta có
, tức là tổng của g. Ta sẽ chứng mình rằng
Điều cần chứng minh tương đương với
Hay
Với
,
Khai triển 2 vế của (1.10) ta có được bất đẳng thức tương đương:
Áp dụng bất đẳng thức Bunhyakovski-Cauchy-Schwarz, ta có
Mà
nên ta có ngay điều phải chứng minh.
18
Như vậy, sóng ứng với u = 0 có biên độ lớn nhất. Nếu quan sát kĩ (1.7) và
(1.8), ta sẽ phát hiện ra một tính chất đặc biệt nữa của G.
Theo (1.7), thay u bởi M – u ta được
Theo (1.8), thay u bởi M - u, ta được
Do đó, với mọi , ta có
Vì vậy nên
Điều đó có nghĩa là đồ thị của
đối xứng qua đường thẳng
.
Do đó, thật ra chỉ cần biết
với
là có thể suy ra giá trị của
các
với
.
Do đó, ta cũng có thể chấp nhận rằng các sóng
chỉ
đóng vai trò là nhiễu khi u khá gần
.
Trên đây ta vừa đưa ra một cách biểu diễn sóng cho hàm một biến g. Ở đó,
một số sóng đóng góp lớn vào giá trị tổng của G ( khi u gần 0 hoặc gần M), trong
khi một số sóng khác chỉ đóng vai trò nhiễu (khi u gần
). Trên tinh thần đó, ta
cũng có một cách khai triển tương tự cho trường hợp hàm hai biến.
19
Ứng với mỗi , lấy Fourier rời rạc theo biến y của f(x, y) ta
được
Tiếp tục lấy Fourier rời rạc theo biến x của
, ta được
Như vậy, ta có thể biến đổi Fourier rời rạc cho hàm hai biến f(x,y) là
với u = 0,1,…,M-1 , v = 0,1,…,N-1.
Tương tự như trường hợp một chiều, ta cũng có thể tìm lại f nếu biết DFT của
nó bằng công thức
Nếu viết
Thì (1.12) được viết lại thành
Do f là giá trị thực nên phần ảo của vế phải bằng 0. Ta có
20
Gọi
là góc thỏa
Ta có
Như vậy, hàm hai biến f cũng được phân tích thành tổng của MN sóng dạng
sin hay dạng cos, mà không cần đến khai triển Fourier cho hàm hai biến.
Tiếp theo, ta xét biên độ của các sóng này, tức là
. Đẳng thức (1.11)
có thể được viết lại thành
Do đó
Từ (1.14) suy ra
Từ (1.15) suy ra
21
Do đó
Hay
Như vậy hàm
đối xứng qua đường thẳng
Từ (1.11) ta có
Tức F(0,0) là giá trị tổng của f. Ta chứng minh được rằng
Như vậy,
đạt giá trị lớn nhất tại (0, 0). Điều đó có nghĩa là trong các
sóng thành phần của f, sóng có biên độ lớn nhất là sóng ứng với (u, v)=(0, 0), và
biên độ này bằng giá trị tổng của f.
Dưới đây là biểu đồ độ cao của hàm F(u,v) với
Hình 4: Đồ thị hm |F|
22
Theo Hình 4 thì
càng nhỏ khi (u, v) càng gần
. Do đó, các
song ứng với (u, v) gần
có biên độ nhỏ (và do đó chỉ đóng vai trò nhiễu), còn
các sóng ứng với (u, v) gần (0, 0), hay (M, 0), hay (0, N), hay (M, N) thì có biên độ
lớn. Tiếp theo, ta xét khả năng vận dụng biến đổi DFT hai chiều ở (1.11) và (1.12)
vào việc xử lý ảnh. Hàm f giờ đây là trường độ xám, trong đó f(x, y) là độ xám của
ảnh tại pixel có tọa độ là (x, y).
Giả sử ta muốn là trơn ảnh, tức là làm trơn hàm f. Công thức (1.14) gợi ý rằng
kết quả ảnh g sẽ có dạng
Trong đó H(u,v) khá nhỏ khi (u, v) gần
để làm giảm biên độ của các
nhiễu này. Ở đây, từ giảm có thể hiểu theo nghĩa H(u,v) = 1 khi (u, v) khá gần(0, 0),
hoặc (M, 0), hoặc (0, N), hoặc (M, N), còn khi (u, v) khá gần
. Để tiện cho việc tính toán sau này, ta dùng phép biến đổi sau
Khi đó
khá bé khi (u,v) xa
.
Phép biến đổi này tương đương với phép biến đổi trên miền ảnh (tức là đổi
ảnh) sau:
Thật vậy,
23
Công thức (1.18) được biến đổi thành
Sự biến đổi này chỉ là sự dời điểm sáng nhất trên
từ (0,0) sang
mà thôi.( Hình 5)
Hình 5: Trước khi dời trục v sau khi dời trục
Ảnh thu được ở (1.19) là ảnh kết hợp của ảnh đã được đổi biến. Do đó, ảnh
kết quả ứng với f là g phải thỏa mãn:
Tức là
Nếu đặt
thì (1.19) được viết lại thành:
Trong đó
được cho bởi (1.13) nhưng thay R và I bằng
và
Nếu gọi
là phần thực của DFT ngược của G thì áp dụng (1.14) với , ta có
24
Trong đó
được cho bởi (1.13) nhưng thay F bởi G và thay R và I lần lượt
là Re(G) và –Im(G).
Vì
Nên với giả thiết h(u,v) thực, ta có
Do đó
Do đó, nếu
thì
Từ (1.21) và (1.23) ta suy ra
Do đó (1.22) được viết lại thành
So sánh với (1.20) ta suy ra
. Điều đó có nghĩa là ở (1.19)
chính là phần thực của biến đổi DFT ngược của
. Như
vậy, với hạn chế rằng hàm lọc H là thực và không âm thì quy trình xử lý ảnh được
viết như sau:
1.Đổi ảnh:
2.Lập biến đổi DFT hai chiều
của
.
3.Tạo một lọc không âm H(u,v).
25
*Nếu muốn làm trơn ảnh
*Nếu muốn làm sắc ảnh:
4.Tính
.
5.Tìm , là phần thực của biến đổi DFT ngược của G.
6.Ảnh kết quả
Quy trình xử lý ảnh màu như sau:
Hình 6: Quá trình xử lý ảnh mu trên miền tần số
1.4. Biến đổi Fast Fourier (FFT)
Trên tinh thần đánh giá độ phức tạp của thuật toán, chúng tôi chỉ nêu ý tưởng
và phân tích chi phí của thuật toán chứ không đi sâu vào chi tiết của nó. Để thấy ý
tưởng của FFT, ta xét trường hợp hai một biến f và với M cái dạng lũy thừa cơ số 2
Giả sử DFT của hàm một biến f là F