Tải bản đầy đủ (.docx) (59 trang)

Cải thiện chất lượng ảnh dựa trên các bộ lọc không gian

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (11.86 MB, 59 trang )

LỜI CAM ĐOAN
Tôi xin cam đoan đây là kết quả nghiên cứu của riêng tôi. Các kết quả đưa
ra là trung thực và chưa từng được ai công bố trong bất kỳ một tài liệu nào khác.
Tôi xin cam đoan tất cả những thông tin được trích dẫn trong luận văn đã
được ghi rõ nguồn gốc.
Hải Phòng, ngày 07 tháng 9 năm 2015

1


LỜI CẢM ƠN
Để hoàn thành cuốn luận văn tốt nghiệp này, tôi xin được gửi lời cảm ơn
đến toàn thể các thầy cô thuộc khoa Công nghệ thông tin đã tận tình giảng dạy
trong suốt thời gian vừa qua đặc biệt là thầy TS. Nguyễn Duy Trường Giangngười luôn nhiệt tình và nghiêm khắc trong quá trình dạy và hướng dẫn để tôi có
thể hoàn thành cuốn luận văn này.
Một lần nữa, tôi xin chân thành cảm ơn!

MỤC LỤC
LỜI CAM ĐOAN...................................................................................................i
LỜI CẢM ƠN.......................................................................................................ii
2


DANH MỤC TỪ VIẾT TẮT VÀ KÝ HIỆU........................................................v
DANH MỤC CÁC BẢNG...................................................................................vi
DANH MỤC CÁC HÌNH...................................................................................vii
MỞ ĐẦU...............................................................................................................1
1. Tính cấp thiết của đề tài...............................................................................1
2. Mục tiêu của đề tài.......................................................................................2
3. Đối tượng và phạm vi nghiên cứu................................................................2
4. Phương pháp nghiên cứu.............................................................................2


5. Dự kiến kết quả đạt được.............................................................................2
CHƯƠNG I: GIỚI THIỆU CHUNG VỀ XLA VÀ NHỮNG...............................3
ỨNG DỤNG CỦA NÓ..........................................................................................3
1.1. Giới thiệu chung.......................................................................................3
1.2. Ứng dụng của XLA...................................................................................5
1.3. Các vấn đề cơ bản trong XLA..................................................................7
1.3.1. PEL và ảnh số.....................................................................................7
1.3.2. Độ phân giải của ảnh..........................................................................8
1.3.4. Mức xám của ảnh...............................................................................9
1.3.5. Tăng cường ảnh..................................................................................9
1.3.6. Khôi phục ảnh...................................................................................10
1.3.7. Phân tích ảnh....................................................................................11
1.3.8. Nén ảnh.............................................................................................12
CHƯƠNG II: CÁC BỘ LỌC KHÔNG GIAN....................................................13
2.1. Lọc song phương....................................................................................13
2.1.1. Giới thiệu..........................................................................................14
2.1.2. Ý tưởng.............................................................................................16
2.1.3. Trường hợp Gaussian.......................................................................18
2.1.4. Lọc song phương so với phạm vi.....................................................19
2.1.5. Lọc song phương với ảnh đen trắng.................................................21
2.1.6. Lọc song phương với ảnh màu.........................................................24
2.2. Bộ lọc NLM............................................................................................26
2.2.1. Giới thiệu..........................................................................................26
3


2.2.2. Phương pháp nhiễu...........................................................................28
2.2.3. Bộ lọc Gaussian................................................................................28
2.2.4. Lọc lân cận.......................................................................................28
2.2.5. Thuật toán NLM...............................................................................29

2.3. So sánh hiệu quả của các bộ lọc.............................................................32
2.4. Bộ lọc làm sắc nét tuyến tính (Linear sharpen)......................................35
2.4.1. Mục đích và ý nghĩa.........................................................................35
2.4.2. Bộ lọc làm sắc nét tuyến tính...........................................................35
2.5. Kỹ thuật cân bằng màu...........................................................................38
2.5.1. Giới thiệu..........................................................................................38
2.5.2. Giả thiết Gray World........................................................................38
CHƯƠNG 3: CHƯƠNG TRÌNH THỬ NGHIỆM VỚI CÁC BỘ LỌC KHÔNG
GIAN VÀ KỸ THUẬT CÂN BẰNG MÀU.......................................................40
3.1. Mục đích.................................................................................................40
3.2. Xây dựng chương trình thử nghiệm........................................................40
3.2.1. Giới thiệu về OpenCV......................................................................40
3.2.2. Các bước tiến hành...........................................................................41
3.3. Kết quả thực nghiệm...............................................................................46
3.3.1. Một số hình ảnh cho các bộ lọc không gian và kỹ thuật cân bằng
màu với ảnh đen trắng trong chương trình thực nghiệm...............................46
3.3.2. Một số hình ảnh cho các bộ lọc không gian và kỹ thuật cân bằng
màu với ảnh màu trong chương trình thực nghiệm.......................................48
KẾT LUẬN.........................................................................................................51
TÀI LIỆU THAM KHẢO...................................................................................52

DANH MỤC TỪ VIẾT TẮT VÀ KÝ HIỆU
Chữ viết tắt

Diễn giải
4


NLM


Bộ lọc Non local-mean

PEL

Điểm ảnh (Picture Element)

CNTT

Công nghệ thông tin

XLA

Xử lý ảnh

DANH MỤC CÁC BẢNG
Số bảng
2.1

Tên bảng
Báo cáo lỗi trung bình
5

Trang
35


6


DANH MỤC CÁC HÌNH

Số hình

Tên hình

Số trang

1.1

Quá trình xử lý ảnh

4

1.2

Nhận dạng biển số xe

5

1.3

Hình ảnh mạch trước và sau khi được làm nổi

6

1.4

Ứng dụng của XLA trong công nghiệp

6


1.5

Ảnh giấu tin

7

1.6

Sự phân bố PEL

8

1.7

Độ tương phản của ảnh

10

1.8

Khôi phục ảnh

11

1.9

Kết quả của một phép dò biên

12


2.1

Ví dụ về hoạt động của bộ lọc không gian

13

2.2

Lọc song phương

18

2.3

Biểu đồ cường độ ảnh

20

2.4

Lọc song phương với các sigma khác nhau

22

2.5

Ví dụ về lọc song phương

23


2.6

Lọc song phương với ảnh đen trắng

23

2.7

Lọc song phương với ảnh màu

25

2.8

Lọc song phương với ảnh màu

26

2.9

Sơ đồ NLM

30

2.10

Sự phân bố trọng số trong NLM

31


2.11

Thực nghiệm về lọc nhiễu trên kết cấu tự nhiên

33

2.12

Thực nghiệm về lọc nhiễu trên kết cấu tự nhiên

33

2.13

Thực nghiệm về lọc nhiễu trên kết cấu tự nhiên

35

2.14

Bộ lọc linear sharpen

36

2.15

Ví dụ cho ứng dụng của OpenCV

37


2.16

Cân bằng màu Gray-world

39

3.1

Ứng dụng của OpenCV về dò cạnh

40

3.2

Thực nghiệm với ảnh đen trắng

46

3.3

Cân bằng màu với ảnh đen trắng

47

3.4

Thực nghiệm với ảnh màu

49


3.5

Cân bằng màu với ảnh màu

50

7


MỞ ĐẦU
1. Tính cấp thiết của đề tài
Công nghệ thông tin (CNTT) đang giữ một vai trò quan trọng không chỉ
trong các ngành công nghiệp, quân sự, nghiên cứu, giải trí…mà ngay cả trong
đời sống và nhu cầu ngày ngày của con người. Có rất nhiều các chuyên ngành
khác nhau trong công nghệ công tin và trong số đó XLA là một chuyên ngành
quan trọng và đã có từ rất lâu đời.
Xử lý ảnh (XLA) là một lĩnh vực mang tínhcông nghệvà khoa học. Nó là
một ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ
phát triển của nó rất nhanh, thu hút các trung tâm nghiên cứu, ứng dụng, đặc biệt
là máy tính chuyên dụng dành riêng cho nó.XLA được ứng dụng để đáp ứng nhu
cầu thiết yếu của con người và xã hội. Các ứng dụng nổi bật của XLA như nhận
dạng vân tay, phục chế ảnh, giám sát thực thể, nhận dạng khuôn mặtdựng ảnh
3D…đã đem lại nhiều lợi ích trong nhiều lĩnh vực.
Con người thu nhận thông tin bằng thị giác, vì thế bất cứ ai cũng mong
muốn thu nhận được hình ảnh có chất lượng tốt. Để có được những hình ảnh
như vậy, bức ảnh ban đầu phải trải qua rất nhiều công đoạn và rất nhiều các kỹ
thuật được sử dụng để thay đổi và giúp nó có chất lượng tốt hơn như làm trơn,
làm sắc nét, lọc nhiễu, cân bằng màu…. Tiêu biểu và quan trọng trong số đó là
sử dụng các bộ lọc không gian.
Hình ảnh thu được từ các thiết bị thu nhận số như camera, camcoder

thường bị ảnh hưởng bởi các nhiễu và điều kiện sáng nên có thể bị mờ, quá tối
hoặc quá sáng hoặc không nhấn mạnh được đối tượng chụp. Điều đó gây khó
khăn rất nhiều cho các công tác học tập, nghiên cứu và ứng dụng thực tiễn, nó
khiến cho hiệu quả công việc giảm và độ chính xác không cao đặc biệt là trong
các lĩnh vực đòi hỏi sự tỉ mỉ và chính xác. Để khắc phục điều này, các bộ lọc
không gian như lọc song phương, lọc Nonlocal-mean (NLM) và Linear sharpen
cùng kỹ thuật cân bằng màu sắc là những giải pháp tốt.

1


Xuất phát từ thực tế đó, tôi lựa chọn đề tài: “Cải thiện chất lượng ảnh dựa
trên các bộ lọc không gian”. Đây là vấn đề đã và đang được quan tâm và hứa
hẹn sẽ được tiếp tục phát triển trong tương lai phù hợp với thực tiễn và cuộc
sống, đặc biệt là trong giai đoạn đất nước đang từng bước phát triển và đi lên,
CNTT đang thực sự bùng nổ như ngày nay.
2. Mục tiêu của đề tài
Mục tiêu của đề tài là sử dụngcác bộ lọc không gian, kỹ thuật cân bằng
màu để nâng cao chất lượng hình ảnh từ các ảnh tĩnh và video. Từ một bức ảnh
đầu vào với chất lượng hình ảnh kém như bị nhiễu, mờ, không sắc nét, màu sắc
xa với thực tế, sau khi sử dụng các bộ lọc không gian và kỹ thuật cân bằng màu
sẽ đưa ra một kết quả tốt hơn: sắc nét, mượt,đảm bảo được các đường nét ban
đầu không mất đi và màu sắc gần hơn với thực tế.
3. Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu của đề tài:


Các bộ lọc không gian: Lọc song phương, NLM, Linear sharpen tập

trung chủ yếu vào các thuật toán được sử dụng trong bộ lọc và cách thức hoạt

động của chúng.


Kỹ thuật cân bằng màu sắc

Phạm vi nghiên cứu:


Dựa trên các lý thuyết chung về XLA để giải thích và đưa ra những

phương pháp cụ thể.


Lý thuyết về các bộ lọc không gian và các khái niệm liên quan



Chương trình thử nghiệm

4. Phương pháp nghiên cứu
Trước tiên, nghiên cứu sẽ đưa ra các lý thuyết về XLA và các bộ lọc không
gian, kỹ thuật cân bằng màu được đề cập đến.Dựa trên nền tảng lý thuyết để xây
dựng một chương trình thử nghiệmvới ảnh tĩnh và video.
5. Dự kiến kết quả đạt được
Đưa ra được kết quả nghiên cứu về mặt lý thuyết: Ý nghĩa và ứng dụng của
XLA nói chung và các bộ lọc không gian, kỹ thuật cân bằng màu nói riêng trong
2


khoa học công nghệ và đời sống.Đưa ra được kết quả của việc áp dụng lý thuyết

trên vào các hình ảnh thực tế thông qua chương trình thử nghiệm.
CHƯƠNG I: GIỚI THIỆU CHUNG VỀ XLA VÀ NHỮNG
ỨNG DỤNG CỦA NÓ
1.1. Giới thiệu chung
Khoảng hơn mười năm trở lại đây, XLA đã được đưa vào giảng dạy trong
chương trình đại học ở nước ta. Nó là môn học có liên quan đến nhiều lĩnh vực
và cần nhiều kiến thức cơ sở khác nhau. Đầu tiên là xử lý tín hiệu số, đây là một
môn học cơ bản cho xử lý tín hiệu chung, các khái niệm về các bộ lọc hữu
hạn,tích chập, các biến đổi Fourier, Laplace, … Thứ hai, các công cụ toán như
đại số tuyến tính, sác xuất thống kê. Bên cạnh đó là một số kiến thức cần thiết
như trí tuệ nhân tao, mạng nơ ron nhân tạo cũng được nhắc đến trong quá trình
phân tích và nhận dạng ảnh. Tiền đề của các phương pháp XLA là các ứng dụng:
nâng cao chất lượng ảnh và phân tích ảnh. Ứng dụng đi đầu được biết đến là
nâng cao chất lượng ảnh báo truyền qua cáp từ London đến NewYork từ những
năm 1920.
Nâng cao chất lượng ảnh có liên quan đến việc phân bố mức sáng và độ
phân giải của ảnh. Nâng cao chất lượng ảnh phát triển vào khoảng những năm
1955. Điều này là vì sau chiến tranh thế giới thứ hai, máy tính phát triển nhanh
tạo điều kiện thuận lợi cho quá trình XLA số phát triển. Năm 1964, máy tính đã
có khả năng xử lý, nâng cao chất lượng ảnh từ mặt trăng và vệ tinh Ranger 7 của
Mỹ cụ thể là: làm nổi đường biên, lưu ảnh. Từ năm 1964 đến nay, các phương
tiện nâng cao và xử lý nâng cao chất lượng, nhận dạng ảnh đã phát triển không
ngừng. Các phương pháp tri thức nhân tạo như các thuật toán xử lý cải
tiến,mạng nơ ron nhân tạo, các công cụ nén ảnh đã ngày càng được áp dụng
rộng rãi và gặt hái được nhiều kết quả khả quan. Trước đây ảnh thu qua Camera
là các ảnh tương tự (loại Camera ống CCIR). Gần đây, với sự phát triển của
công nghệ, ảnh được lấy ra từ camera là ảnh đen trắng hoặc màu, sau đó nó
được chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử lý tiếp theo. (Ví dụ điển
3



hình là máy ảnh số). Mặt khác, ảnh cũng có thể tiếp nhận qua vệ tinh, có thể
được quét từ ảnh chụp bằng máy quét ảnh.
Quá trình XLA:

Thu nhận ảnh

Cơ sở tri thức

Biến đổi ảnh

Nhận dạng và
nội suy

Cơ sở tri thức

Cơ sở tri thức

Hình 1.1: Quá trình XLA


Thu nhận ảnh: Ảnh có thể được nhận qua camera màu hoặc đen trắng.

Thường ảnh nhận qua camera là ảnh tương tự (camera ống chuẩn CCIR với tần
số 1/25, 25 dòngmỗi ảnh), cũng có loại camera đã số hoá (như loại CCD) là loại
photodiot tạo cường độ sáng tại mỗi PEL. Thường dùng nhất là camera loại quét
dòng, ảnh tạo ra có dạng hai chiều. Chất lượng một ảnh thu được phụ thuộc chủ
yếu vào thiết bị thu và môi trường (ánh sáng, phong cảnh)
 Biến đổi ảnh: Sau bước thu nhận, ảnh được biến đổi bằng việc sử dụng
các kỹ thuật nâng cao chất lượng ảnh để thu được ảnh có chất lượng tốt, chứa

đựng nhiều thông tin và có thể quan sát bằng mắt.
 Nhận dạng và nội suy ảnh: Nhận dạng ảnh là quá trình xác định ảnh.
Quá trình này thu được bằng cách so sánh với mẫu chuẩn đã được học (hoặc
lưu) từ trước. Nội suy là phán đoán dựa trên ý nghĩa trên cơ sở nhận dạng. Ví
dụ: một loạt nét gạch ngang và chữ số trên phong bì có thể được nội suy thành
loại mã điện thoại. Có nhiều cách phân loai ảnh khác nhau về ảnh. Theo lý
thuyết về nhận dạng, các mô hình toán học về ảnh được phân loại theo hai dạng
4


nhận dạng ảnh cơ bản: Nhận dạng theo cấu trúc vànhận dạng theo tham số. Một
số đối tượng nhận dạng phổ biến hiện nay được áp dụng trong khoa học và công
nghệ là: nhận dạng văn bản (Text),nhận dạng ký tự (chữ in, chữ ký điện tửchữ
viết tay), nhận dạng mã vạch, nhận dạng vân tay, nhận dạng mặt người…
Ảnh là một đối tượng khá phức tạp về độ sáng tối, đường nét, dung lượng
PEL, môi trường để thu ảnh phong phú kèm theo nhiễu. Trong nhiều khâu phân
tích và XLA ngoài việc đơn giản hóa các phương pháp toán học đảm bảo tiện lợi
cho xử lý, người ta mong muốn học hỏi quy trình tiếp nhận và XLA theo cách
của con người. Trong các bước xử lý đó, nhiều khâu đã xử lý theo các phương
pháp trí tuệ con người. Vì vậy, ở đây các cơ sở tri thức được phát huy.
1.2. Ứng dụng của XLA
XLA có ứng dụng trong việc lưu trữ dữ liệu, tra cứu thông tin: Để giảm
dung lượng lưu trữ ảnh, ảnh được nén dưới dạng *.jpg, *tif...
Ứng dụng trong việc nhận dạng: Nhận dang khuôn mặt, vân tay, chữ số, ký
tự, biển số xe…Ứng dụng trong việc xác thực: Xác thực đăng nhập windown 8
bằng hình ảnh…

Hình 1.2: Nhận dạng biển số xe
Trong y học, XLA cũng có vai trò rất quan trọng trong việc đưa ra những
hình ảnh có chất lượng cao, rõ nét, giúp cho việc chẩn đoán bệnh khách quan,

nhanh chóng và chính xác hơn. Trong đó, việc làm nổi các chi tiết trong ảnh là
một trong những ứng dụng quan trọng và có ỹ nghĩa.

5


Hình 1.3: Hình ảnh mạch trước và sau khi được làm nổi (từ trái qua phải)
Trong công nghiệp, XLA có ứng dụng trong việc xấy dựng các hệ thống
máy nhìn công nghiệp để kiểm tra và điều khiển các sản phẩm: Hệ thống phân
tích hình ảnh nhằm phát hiện bọt khí bên trong vật thể được đúc bằng nhựa, phát
hiện các linh kiện không đạt tiêu chuẩn trong sản xuất, từ camera quan sát, đếm
được sản phẩm dựa vào hệ thống đếm sản phẩm.

Hình 1.4: Ứng dụng của XLA trong công nghiệp
6


XLA còn có ứng dụng hiệu quả trong việc dấu dữ liệu để phục vụ cho việc
trao đổi thông tin mật. Cụ thể như : Dấu tin trong ảnh, dấu video trong ảnh hay
dấu ảnh trong ảnh.

Hình 1.5: Ảnh giấu tin : Ảnh bên trái là được giấu tin, đoạn văn bản bên
phải là đoạn văn bản được giấu trong ảnh
1.3.

Các vấn đề cơ bản trong XLA
1.3.1. PEL và ảnh số
Gốc của ảnh hay gọi là ảnh tự nhiê là ảnh liên tục về độ sáng và không

gian. Để xử lý bằng máy tính (số) thì hình ảnh cần phải được số hoá. Sự biến đổi

gần đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về độ sáng
(mức xám)và vị trí (không gian) gọi là số hóa ảnh. Khoảng cách giữa các PEL
này được thiết lập sao cho mắt người không thể phân biệt được ranh giới giữa
chúng. Mỗi một điểm như vậy gọi là điểm ảnh (PEL: Picture Element) hay gọi
tắt là Pixel. Trong phạm vi ảnh hai chiều, mỗi pixel ứng với tọa độ (x, y).
Định nghĩa: PEL (pixel) là một phần tử có toạ độ (x, y) của ảnh số với độ
màu hoặc xám nhất định. Kích thước và khoảng cách giữa các PEL đó được
chọn phù hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức
xám (hoặc màu) của ảnh số gần như ảnh thật. Mỗi một phần tử trong ma trận
được xem là một phần tử ảnh.
Ảnh số là tập hợp các PEL với mức xám phù hợp dùng để mô tả ảnh gần
với ảnh thật.

7


1.3.2. Độ phân giải của ảnh
Định nghĩa: Độ phân giải của ảnh là mật độ PEL được ấn định trên một ảnh
số.
Theo định nghĩa, khoảng cách giữa các PEL phải được thiết lập sao cho
mắt người thấy được sự liên tục của ảnh. Việc lựa chọn khoảng cách phù hợp tạo
nên một mật độ phân bố, đó chính là độ phân giải và được phân bố theo trục y
và trong không gian hai chiều.
Ví dụ: Độ phân giải của ảnh trên màn hình CGA là một lưới điểm theo
chiều ngang màn hình: 320 điểm theo chiều dọc * 200 PEL (320*200). Thực tế
là, cùng màn hình CGA 12 inh ta nhận thấy mịn hơn màn hình CGA 17 inh độ
phân giải 320*200. Lý do là vì cùng một mật độ (độ phân giải) nhưng diện tích
màn hình rộng hơn thì độ mịn (liên tục của các PEL) kém hơn.

8



Hình 1.6: Sự phân bố PEL: Số lượng PEL phân bố tăng dần trên cùng một
kích thước ảnh
1.3.4.

Mức xám của ảnh

Một PEL (một pixel) có hai đặc trưng cơ bản là độ xám của nóvà vị trí (x,
y) của PEL. Dưới đây là một số khái niệm và thuật ngữ thường được đề cập tới
trong XLA.
Định nghĩa: Mức xám của PEL là cường độ sáng của PEL được gán bằng
giá trị số tại điểm đó.
 Các thang giá trị mức xám thông thường: 16, 32, 64, 128, 256. Mức 256
là mức phổ dụng nhất.
 Ảnh đen trắng: là ảnh có hai màu trắng và đen(không chứa màu khác)
với mức xám ở các PEL có thể khác nhau.
 Ảnh nhị phân: ảnh chỉ có 2 mức trắng đen phân biệt tức là dùng 1 bit
mô tả 21 mức khác nhau. Nói theo một cách khác: mỗi PEL của ảnh nhị phân
chỉ có thể là 1 hoặc 0.
 Ảnh màu: trong phạm vi lý thuyết ba màu RBG(Red, Blue, Green) để
tạo nên thế giới màu, người ta thường dùng 3 byte để mô tả mức màu, khi đó các
giá trị màu: 28*3=224≈ 16,7 triệu màu.
1.3.5. Tăng cường ảnh
Tăng cường ảnh là việc giảm nhiễu ảnh, tăng độ tương phản giữa các cấu
trúc. Các kỹ thuật tăng cường ảnh còn tăng cường các thuộc tính cảm nhận làm
cho ảnh tốt lên, tiện phục vụ cho các xử lý tiếp theo.
Các kỹ thuật tăng cường ảnh gồm kỹ thuật phi tuyến, tuyến tính, thích
nghi, cố định, kỹ thuật dựa vào pixel hay kỹ thuật đa mức. Các kỹ thuật được
chia làm hai nhóm: Nhóm tăng cường ảnh trong miền không gian và nhóm phục

hồi ảnh trong miền tần số.
Các thao tác chính: Làm sắc nét đường biên, lọc phi tuyến, lọc tuyến tính,
phóng to, thu nhỏ, làm trơn, thay đổi độ tương phản, sửa đổi mức xám đồ…
9


 Thay đổi độ tương phản: Trong thực tế, khi hai đối tượng có cùng độ sáng
đặt ở hai nền khác nhau thì sẽ cho ta những cảm nhận khác nhau. Chính vì vậy,
độ tương phản thể hiện sự thay đổi độ sáng của đối tượng so với nền, hiểu theo
một cách khác thì độ tương phản là độ nổi của PEL so hay một vùng ảnh so với
nền. Do điều kiện sáng tối khác nhau hay do biến động của bộ cảm nhận ảnh
mà ảnh của độ tương phản khác nhau. Để thay đổi độ tương phản của ảnh thì ta
phải thay đỏi biên độ trên toàn dải bằng cách biến đổi tuyến tính biên độ đầu
vào hay phi tuyến.
 Lọc tuyến tính: Bao gồm lọc thông thấp, đồng hình và trung bình, loại lọc
này được dùng cho các loại nhiễu phân bố khắp ảnh (nhiễu cộng và nhiễu
nhân).
 Lọc phi tuyến: Bao gồm lọc trung vị, giả trung vị và lọc ngoài. Loại lọc
này dùng cho các loại nhiễu gây đột biến tại một PEL (nhiễu xung).

a
b
Hình 1.7: Độ tương phản của ảnh. a: ảnh có độ tương phản cao, b:
ảnh có độ tương phản thấp
1.3.6. Khôi phục ảnh
Mục đích: Khôi phục lại ảnh ban đầu, loại bỏ các biến dạng ra khỏi ảnh tùy
theo nguyên nhân gây ra biến dạng. Kỹ thuật được sử dụng để khôi phục lại hình
ảnh như làm giảm mờ, nhiễu và áp dụng các bộ lọc tuyến tính, không gian…để
có được ảnh gần nhất với ảnh gốc. Nguyên nhân gây ra sự suy giảm ảnh có rất
nhiều và khôi phục ảnh là một trong những lĩnh vực quan trọng trong xử lý hình

ảnh. Nguyên nhân của sự suy giảm thường bao gồm mờ và nhiễu. Mờ có thể do
đối tượng trong hình ảnh bị mất nét khi phơi sáng, trong khi chuyển động mờ có
thể được gây ra khi một đối tượng di chuyển so với máy ảnh khi phơi sáng. Mục
đích của phục hồi hình ảnh là để " bù" hoặc "khôi phục" sai hỏng- những cái đã
10


làm suy giảm hình ảnh. Suy giảm có nhiều hình thức như chuyển động làm mờ,
nhiễu, mất tiêu cự camera... Trong trường hợp như làm mờ chuyển động, có thể
đưa ra một ước lượng rất tốt so với mờ thực tế và "khôi phục" mờ để khôi phục
lại hình ảnh gốc. Trường hợp ảnh bị lỗi bởi nhiễu, có thể thực hiện bù nhiễu.

Hình 1.8: Khôi phục ảnh. Từ trái qua phải: phần ảnh trước và sau khi được khôi phục
1.3.7. Phân tích ảnh
Mục đích: Đưa ra ra các đặc trưng của ảnh, xây dựng mối quan hệ giữa
chúng dựa vào các đặc trưng cục bộ.Tìm biên, tách biên, , phân vùng ảnh,làm
mảnh đường biên và phân loại đối tượng là các thao tác chính trong phân tích
ảnh. Các phương pháp chính là phát hiện biên cục bộ, dò biên theo quy hoạch
động, phân vùng theo miền đồng nhất, phân vùng dựa theo đường biên.
Như chúng ta biết, biên là vẫn đề chủ yếu trong phân tích ảnh vì các kỹ thuật
phân đoạn ảnh dựa trên biên là chủ yếu. Tập hợp các điểm biên tạo lên biên của
hình ảnh, mỗi PEL có thể xem là điểm biên nếu có sự thay đổi mức xám đột
ngột ở đó. Có hai phương pháp phát hiện biên chính là: Phát hiện biên gián tiếp
và phát hiện biên trực tiếp.
Biên ảnh là những vùng có cường độ tương phản mạnh, dò biên giúp lọc ra
những thông tin hữu ích trong ảnh mà vẫn giữ được những thuộc tính cấu trúc
của hình ảnh. Gradient và Laplacian là hai phương pháp dò biên cơ bản.
Gradient dò biên bằng việc tìm kiếm giá trị lớn nhất và giá trị bé nhất trong đạo
hàm bậc nhất của ảnh, còn Laplacian thì tìm kiếm các vạch không trong đạo
hàm bậc hai của ảnh.


11


Hình 1.9:Kết quả của một phép dò biên
1.3.8. Nén ảnh
Nén ảnh là một kỹ thuật mã hoá các ảnh số hoá để giảm số lượng các bit
dữ liệu cần thiết để biểu diễn ảnh, giảm đi chi phí trong việc lưu trữ ảnh và chi
phí về mặt thời gian để truyền ảnh đi xa trong truyền thông nhưng vẫn đảm bảo
được chất lượng của ảnh.
Nén ảnh thực hiện được là do: thông tin trong bức ảnh không phải là ngẫu
nhiên mà có trật tự, tổ chức.Vì thế nếu làm rõ được trật tự, cấu trúc đó thì sẽ biết
phần thông tin nào quan trọng nhất trong bức ảnh để biểu diễn và gửi đi với số
lượng bit ít hơn so với ảnh gốc mà vẫn đảm thông tin có được một cách đầy đủ.
Ở bên nhận quá trình giải mã sẽ sắp xếp và tổ chức lại được bức ảnh xấp xỉ gần
chính xác so với ảnh gốc nhưng vẫn thỏa mãn chất lượng yêu cầu.
Nén ảnh có được bằng cách loại bỏ các phần dư thừa trong ảnh đã được số
hoá. Dư thừa có thể là dư thừa về cấp xám, dư thừa thông tin về không gian hay
dư thừa về thời gian.
Có hai phương pháp nén ảnh cơ bản là: Nén không mất thông tin, nén mất thông
tin
 Nén mất thông tin: Khai thác các thông tin dư thừa và các thông tin
không liên quan
 Nén không mất thông tin: Khai tác các thông tin dư thừa
Hiện nay có một số chuẩn nén hay dùng như: JPEG, MPEG…

12


CHƯƠNG II: CÁC BỘ LỌC KHÔNG GIAN

Trong quá trình XLA chúng ta có thể sử dụng các mặt nạ không gian
nhằm làm thay đổi cấu trúc ảnh gọi là các bộ lọc không gian.
Một bộ lọc không gian là một hoạt động ảnh mà trong đó mỗi giá trị PEL
bị thay thế bởi một hàm của cường độ các PEL trong vùng lân cận của

Hình 2.1: Ví dụ về hoạt động của bộ lọc không gian
Bên cạnh việc giảm nhiễu, làm mượt hình ảnh,các bộ lọc không gian còn
làm sắc nét các chi tiết và giữ lại những cấu trúc đẹp trong hình ảnh. Dưới đây là
các bộ lọc được đề cập đến trong đề tài.
2.1.

Lọc song phương
Song phương là một bộ lọc vừa làm mượt ảnh đồng thời vẫn giữ được các

đường nét của ảnh bằng sự kết hợp phi tuyến tính của các giá trị PEL lân cận.
Phương pháp này không lặp đi lặp lại, cục bộ và đơn giản. Nó kết hợp các mức
mức xám hoặc màu sắc dựa trên cả sự mật thiết hình học và tương tự về trắc
quang của chúng, và ưu tiên giá trị gần hơn giá trị xa trong cả miền và phạm vi.
Ngược lại với các bộ lọc hoạt động riêng biệt trên ba dải của một ảnh màu, bộ
lọc song phương có thể thực thi các số liệu cơ bản về nhận thức màu CIE-Lab,
làm mịn màu, và giữ gìn các đường nét để phù hợp với nhận thức của con người.
Ngoài ra, trong sự tương phản với việc lọc tiêu chuẩn, lọc song phương không
tạo ra màu sắc ảo dọc theo các đường nét trong ảnh màu mà làm giảm màu sắc
ảo xuất hiện trong hình ảnh ban đầu.
13


2.1.1. Giới thiệu
Lọc có lẽ là hoạt động cơ bản nhất của XLA và thị giác máy tính. Trong ý
nghĩa rộng của thuật ngữ "lọc", các giá trị của hình ảnh được lọc tại một điểm là

một hàm của các giá trị ảnh đầu vào trong một tập hợp giá trị lân cận của cùng
một vị trí. Đặc biệt, lọc thông thấp Gaussian tính toán trung bình các giá trị PEL
được đánh trọng số trong một tập hợp giá trị lân cận, trong đó, trọng số giảm
theo khoảng cách từ khu trung tâm lân cận. Mặc dù những lời giải thích chính
thức và mang tính định lượng về việc suy giảm trọng số đã được đưa ra, theo
trực giác hình ảnh thường thay đổi từ từ trong không gian, vì thế các PEL gần
nhau có thể có các giá trị tương tự, và vì vậy việc tính trung bình chúng là thích
hợp. Giá trị nhiễu làm hỏng các PEL ở gần nó là có ít tương quan lẫn nhau hơn
so với giá trị tín hiệu, vì vậy nhiễu được lấy trung bình trong khi tín hiệu được
giữ nguyên. Các giả định về các biến thể không gian thất bại tại các đường nét
những cái bị làm mờ đi bởi bộ lọc thông thấp. Nhiều nỗ lực đã được cống hiến
để giảm ảnh hưởng không mong muốn này. Một câu hỏi đặt ra là: Làm thế nào
chúng ta có thể ngăn chặn việc trung bình hóa trên các đường nét, trong khi vẫn
trung bình hóa trong các khu vực cần làm mịn?
Sự khuếch tán bất đẳng hướng là một câu trả lời phổ biến: biến hình ảnh
cục bộ được đo tại mọi điểm, và giá trị PEL được tính trung bình từ các vùng
lân cận nơi mà kích thước và hình dạng của nó phụ thuộc vào biến cục bộ.
Phương pháp khuếch tán tính trung bình trên các vùng miền được mở rộng bằng
cách giải quyết từng phần phương trình vi phân, và được lặp đi lặp lại. Việc lặp
đi lặp lại có thể làm tăng các vấn đề về tính ổn định và tùy thuộc vào hiệu quả
của kỹ thuật tính toán. Một phương pháp không lặp đi lặp lại được đề xuất cho
việc duy trì độ mịn của đường nét.
Nếu ba dải màu sắc hình ảnh được lọc riêng rẽ ra từ một cái khác, màu sắc
bị hỏng gần đường biên ảnh. Trong thực tế, các dải khác nhau có mức độ khác
nhau của sự tương phản, và chúng được làm mịn khác nhau. Làm mịn tách biệt
xáo trộn sự cân bằng màu sắc, và sự kết hợp màu sắc không mong đợi xuất hiện.
Nhưng với bộ lọc song phương, nó có thể hoạt động trên ba dải cùng một lúc,
14



và có thể đưa ra một cách rõ ràng rằng màu sắc nào là tương tự và màu sắc nào
là không .
Ý tưởng lọc song phương cơ bản là để thực hiện trong phạm vi của một
hình ảnh những gì mà các bộ lọc truyền thống làm trong phạm vi của nó. Hai
PEL có thể được gép với nhau để chiếm vị trí không gian kế bên, hoặc có thể là
tương tự như nhau để có các giá trị kế bên, có thể trong một cách có ý nghĩa về
mặt nhận thức. Việc gắn kết liên quan đến vùng lân cận trong miền, tương tự với
vùng lân cận trong phạm vi. Lọc truyền thống là lọc miền, thực thi việc gắn kết
bằng việc đánh trọng số các giá trị PEL với hệ số dưới với khoảng cách. Tương
tự như vậy, chúng tôi xác định phạm vi lọc mà trong đó trung bình giá trị PEL
với trọng số phân rã không giống nhau. Lọc phạm vi là phi tuyến vì trọng số
của chúng phụ thuộc vào cường độ hoặc màu sắc hình ảnh. Tính toán, chúng có
vẻ gì phức tạp hơn các bộ lọc tiêu chuẩn không tách rời. Nhưng quan trọng nhất,
chúng có thể giữ lại các đường nét hình ảnh.
Miền không gian vẫn là một khái niệm rất quan trọng. Trong thực tế, chúng
ta thấy rằng lọc phạm vi tự nó làm biến dạng bản đồ màu sắc của hình ảnh. Khi
kết hợp lọc phạm vi và miền, thấy rằng sự kết hợp là khá thú vị. Đó gọi là lọc
song phương. Do lọc song phương giả định một khái niệm rõ ràng về khoảng
cách trong phạm vi và trong giới hạn chức năng ảnh, chúng có thể được áp dụng
cho bất kỳ chức năng nào khi mà hai khoảng cách có thể được xác định. Đặc
biệt, bộ lọc song phương có thể được áp dụng cho ảnh màu dễ dàng như áp dụng
cho ảnh đen trắng. Các không gian màu CIE-Lab tạo ra không gian màu sắc với
một phương pháp có ý nghĩa nhận thức tương tự màu sắc, trong đó khoảng cách
Euclide ngắn tương quan mạnh mẽ với màu sắc mà con người có thể phân biệt.
Vì vậy, nếu chúng ta sử dụng số liệu này trong bộ lọc song phương, hình ảnh sẽ
được làm mịn và đường nét được giữ theo cách đó được điều chỉnh tới cách thể
hiện của con người. Chỉ có màu sắc tương tự về nhận thức được tính trung bình
với nhau, và chỉ những đường nét có tính nhận thức và có thể nhìn thấy mới
được giữ lại. Các khái niệm về lọc song phương sẽ được đề cập dưới đây.


15


2.1.2. Ý tưởng
Một bộ lọc miền thông thấp áp dụng cho hình ảnh f (x) đưa ra một hình ảnh
được xác định như sau:
Trong đó c (; x) đo sự tương đồng về mặt hình học giữa trung tâm vùng lân
cận x và một điểm gần đó .Phông chữ đậm cho f và h nhấn mạnh thực tế rằng cả
hình ảnh đầu vào vàđầu ra có thể đa băng tần. Nếu bộ lọc thông thấp giữ lại các
thành phần dc của tín hiệu thông thấp chúng ta có được:
Nếu bộ lọc là thay đổi bất biến, c (; x) chỉ là một hàm của sự khác biệt
vector , và là không đổi.
Lọc phạm vi được định nghĩa tương tự:
Ngoại trừ rằng đo sự tương quang giữa các PEL ở trung tâm vùng ảnh x và
của một điểm gần đó. Như vậy, các hàm tương tự s hoạt động trong phạm vi của
hàm hình ảnh f, trong khi hàm ghép c hoạt động trong miền của f. Việc chuẩn
hóa hằng số (2) được thay thế bởi:
Trái với những gì xảy ra với các hàm tương đồng c, chuẩn hóa cho các hàm
tương tự s phụ thuộc vào hàm hình ảnh f. Chúng ta nói rằng các hàm tương tự s
là không thiên vị nếu nó chỉ phụ thuộc vào sự khác biệt . Sự phân bố không gian
của các cường độ ảnh không có vai trò trong lọc phạm vi được thực hiện bởi
chính nó. Kết hợp cường độ từ toàn bộ ảnh, tuy nhiên, làm ít hơn, vì giá trị hình
ảnh xa x nên không ảnh hưởng đến giá trị cuối cùng tại x. Ngoài ra, lọc phạm vi
chỉ đơn thuần là thay đổi bản đồ màu của một hình ảnh, và do đó ít được sử
dụng . Các giải pháp thích hợp là kết hợp lọc miền và lọc phạm vi, qua đó thực
thi cả hai miền hình học và trắc quang. Lọc kết hợp có thể được mô tả như sau:
Với chuẩn hóa

16



Kết hợp lọc miền và phạm vi sẽ được thể hiện như lọc song phương. Nó
thay thế các giá trị PEL tại x với trung bình của các giá trị PEL tương tự lân cận.
Trong khu vực được làm mịn, giá trị PEL trong một vùng tương đồng nhỏ
tương tự như các khu khác, và các hàm tương tự được chuẩn hóa s là giống
nhau. Như một hệ quả, các bộ lọc song phương đóng vai trò cơ bản như một bộ
lọc miền tiêu chuẩn, những khác biệt tương quan yếu giữa các giá trị PEL gây ra
bởi nhiễu.
Bây giờ một ranh giới rõ ràng giữa một vùng tối và vùng sáng, như trong
hình 2.2(a). Khi bộ lọc song phương được tập trung, nói rằng, trên một PEL ở
bên sáng của đường biên, các hàm tương tự s của các giá trị giả định gần 1 cho
các PEL trên cùng một bên, và gần 0 cho các PEL ở bên tối. Các hàm tương tự
được thể hiện trong hình 2.2(b) cho một bộ lọc hỗ trợ

tập trung hai PEL bên

phải của các bước trong hình 2.2(a). Việc chuẩn hóa thuật ngữ đảm bảo rằng
các trọng số cho tất cả các PEL tăng thêm một. Kết quả là, các bộ lọc thay thế
các PEL sáng trung tâm bằng trung bình của các PEL sáng trong vùng lân cận
của nó, và về cơ bản bỏ qua các PEL tối. Ngược lại, khi bộ lọc tập trung vào một
PEL tối, các PEL sáng được bỏ qua thay thế. Vì vậy, như thể hiện trong hình
2.2(c), việc lọc được thực hiện tốt tại các ranh giới, nhờ vào thành phần của lọc
miền, và các cạnh sắc nét được giữ lại đồng thời, nhờ thành phần của lọc phạm
vi.

Hình 2.2: Lọc song phương. (a) Một bước cấp độ màu xám 100 bị nhiễu
loạn bởi nhiễu Gaussian với các mức xám. (b) Kết hợp trọng số tương tự cho
một vùng lân cận tập trung hai PEL-bên phải của bước (a). Các thành phần

17



của lọc phạm vi ngăn chặn hiệu quả các PEL trên bên tối. (c) Bước (a) sau khi
lọc song phương với = 50 mức xám và = 5 PEL.
2.1.3. Trường hợp Gaussian
Một trường hợp đơn giản và quan trọng của lọc song phương là lọc
Gaussian thay đổi bất biến, trong đó cả hai hàm tương đồng và hàm tương tự
là những hàm Gaussian của khoảng cách Euclide giữa các đối số đó. Cụ thể hơn,
c là đối xứng xuyên tâm
Trong đó :
là khoảng cách Euclide giữa . Hàm tương tự s là hoàn toàn giống như c:
Trong đó :
là một phương pháp đo phù hợp của khoảng cách giữa hai giá trị cường độ
và f. Trong các trường hợp vô hướng, điều này có thể đơn giản là chênh lệch
tuyệt đối của sự khác biệt PEL hay vì nhiễu tăng với cường độ ảnh, một phiên
bản phụ thuộc cường độ của nó.
Sự mở rộng hình học trong miền được lựa chọn dựa trên số lượng mong
muốn của lọc thông thấp. Một lượng lớn sẽ làm mờ nhiều hơn, có nghĩa là, nó
kết hợp các giá trị từ vị trí xa hình ảnh. Ngoài ra, nếu một hình ảnh được thu nhỏ
hoặc phóng to, phải được điều chỉnh cho phù hợp để có được kết quả tương
đương. Tương tự như vậy, sự mở rộng trắc quang trong phạm vi hình ảnh được
thiết lập để đạt được số lượng mong muốn các PEL được kết hợp. Có thể nói,
PEL có giá trị gần hơn với cái khác được trộn lẫn với nhau và giá trị xa hơn thì
không. Nếu ảnh bị khuếch đại hoặc suy giảm, phải được điều chỉnh cho phù
hợp để kết quả không thay đổi.

18



×