Tải bản đầy đủ (.pdf) (59 trang)

Cải thiện chất lượng ảnh dựa trên các bộ lọc không gian

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.06 MB, 59 trang )

LỜI CAM ĐOAN
Tôi xin cam đoan đây là kết quả nghiên cứu của riêng tôi.Các kết quả đƣa
ra là trung thực và chƣa từng đƣợc ai công bố trong bất kỳ một tài liệu nào khác.
Tôi xin cam đoan tất cả những thông tin đƣợc trích dẫn trong luận văn đã
đƣợc ghi rõ nguồn gốc.
Hải Phòng, ngày 07 tháng 9 năm 2015

i


LỜI CẢM ƠN
Để hoàn thành cuốn luận văn tốt nghiệp này, tôi xin đƣợc gửi lời cảm ơn
đến toàn thể các thầy cô thuộc khoa Công nghệ thông tin đã tận tình giảng dạy
trong suốt thời gian vừa qua đặc biệt là thầy TS. Nguyễn Duy Trƣờng Giangngƣời luôn nhiệt tình và nghiêm khắc trong quá trình dạy và hƣớng dẫn để tôi có
thể hoàn thành cuốn luận văn này.
Một lần nữa, tôi xin chân thành cảm ơn!

ii


MỤC LỤC
LỜI CAM ĐOAN................................................................................................... i
LỜI CẢM ƠN ....................................................................................................... ii
DANH MỤC TỪ VIẾT TẮT VÀ KÝ HIỆU ....................................................... v
DANH MỤC CÁC BẢNG................................................................................... vi
DANH MỤC CÁC HÌNH ................................................................................... vii
MỞ ĐẦU ............................................................................................................... 1
1. Tính cấp thiết của đề tài ............................................................................... 1
2. Mục tiêu của đề tài ....................................................................................... 2
3. Đối tƣợng và phạm vi nghiên cứu ............................................................... 2
4. Phƣơng pháp nghiên cứu ............................................................................. 2


5. Dự kiến kết quả đạt đƣợc ............................................................................. 2
CHƢƠNG I: GIỚI THIỆU CHUNG VỀ XLA VÀ NHỮNG .............................. 3
ỨNG DỤNG CỦA NÓ ......................................................................................... 3
1.1. Giới thiệu chung ....................................................................................... 3
1.2. Ứng dụng của XLA .................................................................................. 5
1.3. Các vấn đề cơ bản trong XLA .................................................................. 7
1.3.1. PEL và ảnh số ..................................................................................... 7
1.3.2. Độ phân giải của ảnh .......................................................................... 8
1.3.4. Mức xám của ảnh ............................................................................... 9
1.3.5. Tăng cƣờng ảnh .................................................................................. 9
1.3.6. Khôi phục ảnh .................................................................................. 10
1.3.7. Phân tích ảnh .................................................................................... 11
1.3.8. Nén ảnh............................................................................................. 12
CHƢƠNG II: CÁC BỘ LỌC KHÔNG GIAN ................................................... 13
2.1. Lọc song phƣơng .................................................................................... 13
2.1.1. Giới thiệu .......................................................................................... 14
2.1.2. Ý tƣởng ............................................................................................. 16
2.1.3. Trƣờng hợp Gaussian ....................................................................... 18
2.1.4. Lọc song phƣơng so với phạm vi ..................................................... 19
2.1.5. Lọc song phƣơng với ảnh đen trắng ................................................. 21
iii


2.1.6. Lọc song phƣơng với ảnh màu ......................................................... 24
2.2. Bộ lọc NLM ............................................................................................ 26
2.2.1. Giới thiệu .......................................................................................... 26
2.2.2. Phƣơng pháp nhiễu ........................................................................... 28
2.2.3. Bộ lọc Gaussian ................................................................................ 28
2.2.4. Lọc lân cận ....................................................................................... 28
2.2.5. Thuật toán NLM ............................................................................... 29

2.3. So sánh hiệu quả của các bộ lọc ............................................................. 32
2.4. Bộ lọc làm sắc nét tuyến tính (Linear sharpen) ...................................... 35
2.4.1. Mục đích và ý nghĩa ......................................................................... 35
2.4.2. Bộ lọc làm sắc nét tuyến tính ........................................................... 35
2.5. Kỹ thuật cân bằng màu ........................................................................... 38
2.5.1. Giới thiệu .......................................................................................... 38
2.5.2. Giả thiết Gray World ........................................................................ 38
CHƢƠNG 3: CHƢƠNG TRÌNH THỬ NGHIỆM VỚI CÁC BỘ LỌC KHÔNG
GIAN VÀ KỸ THUẬT CÂN BẰNG MÀU ...................................................... 40
3.1. Mục đích ................................................................................................. 40
3.2. Xây dựng chƣơng trình thử nghiệm ....................................................... 40
3.2.1. Giới thiệu về OpenCV ...................................................................... 40
3.2.2. Các bƣớc tiến hành ........................................................................... 41
3.3. Kết quả thực nghiệm............................................................................... 46
3.3.1. Một số hình ảnh cho các bộ lọc không gian và kỹ thuật cân bằng
màu với ảnh đen trắng trong chƣơng trình thực nghiệm .............................. 46
3.3.2. Một số hình ảnh cho các bộ lọc không gian và kỹ thuật cân bằng
màu với ảnh màu trong chƣơng trình thực nghiệm ...................................... 48
KẾT LUẬN ......................................................................................................... 51
TÀI LIỆU THAM KHẢO ................................................................................... 52

iv


DANH MỤC TỪ VIẾT TẮT VÀ KÝ HIỆU
Chữ viết tắt

Diễn giải

NLM


Bộ lọc Non local-mean

PEL

Điểm ảnh (Picture Element)

CNTT

Công nghệ thông tin

XLA

Xử lý ảnh

v


DANH MỤC CÁC BẢNG
Số bảng
2.1

Tên bảng
Báo cáo lỗi trung bình

vi

Trang
35



DANH MỤC CÁC HÌNH
Số hình

Tên hình

Số trang

1.1

Quá trình xử lý ảnh

4

1.2

Nhận dạng biển số xe

5

1.3

Hình ảnh mạch trƣớc và sau khi đƣợc làm nổi

6

1.4

Ứng dụng của XLA trong công nghiệp


6

1.5

Ảnh giấu tin

7

1.6

Sự phân bố PEL

8

1.7

Độ tƣơng phản của ảnh

10

1.8

Khôi phục ảnh

11

1.9

Kết quả của một phép dò biên


12

2.1

Ví dụ về hoạt động của bộ lọc không gian

13

2.2

Lọc song phƣơng

18

2.3

Biểu đồ cƣờng độ ảnh

20

2.4

Lọc song phƣơng với các sigma khác nhau

22

2.5

Ví dụ về lọc song phƣơng


23

2.6

Lọc song phƣơng với ảnh đen trắng

23

2.7

Lọc song phƣơng với ảnh màu

25

2.8

Lọc song phƣơng với ảnh màu

26

2.9

Sơ đồ NLM

30

2.10

Sự phân bố trọng số trong NLM


31

2.11

Thực nghiệm về lọc nhiễu trên kết cấu tự nhiên

33

2.12

Thực nghiệm về lọc nhiễu trên kết cấu tự nhiên

33

2.13

Thực nghiệm về lọc nhiễu trên kết cấu tự nhiên

35

2.14

Bộ lọc linear sharpen

36

2.15

Ví dụ cho ứng dụng của OpenCV


37

2.16

Cân bằng màu Gray-world

39

3.1

Ứng dụng của OpenCV về dò cạnh

40

3.2

Thực nghiệm với ảnh đen trắng

46

3.3

Cân bằng màu với ảnh đen trắng

47

3.4

Thực nghiệm với ảnh màu


49

3.5

Cân bằng màu với ảnh màu

50

vii


MỞ ĐẦU
1. Tính cấp thiết của đề tài
Công nghệ thông tin (CNTT) đang giữ một vai trò quan trọng không chỉ
trong các ngành công nghiệp, quân sự, nghiên cứu, giải trí…mà ngay cả trong
đời sống và nhu cầu ngày ngày của con ngƣời.Có rất nhiều các chuyên ngành
khác nhau trong công nghệ công tin và trong số đó XLA là một chuyên ngành
quan trọng và đã có từ rất lâu đời.
Xử lý ảnh (XLA) là một lĩnh vực mang tínhcông nghệvà khoa học. Nó là
một ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhƣng tốc độ
phát triển của nó rất nhanh, thu hút các trung tâm nghiên cứu, ứng dụng, đặc biệt
là máy tính chuyên dụng dành riêng cho nó.XLA đƣợc ứng dụng để đáp ứng nhu
cầu thiết yếu của con ngƣời và xã hội. Các ứng dụng nổi bật của XLA nhƣ nhận
dạng vân tay, phục chế ảnh, giám sát thực thể, nhận dạng khuôn mặtdựng ảnh
3D…đã đem lại nhiều lợi ích trong nhiều lĩnh vực.
Con ngƣời thu nhận thông tin bằng thị giác, vì thế bất cứ ai cũng mong
muốn thu nhận đƣợc hình ảnh có chất lƣợng tốt. Để có đƣợc những hình ảnh
nhƣ vậy, bức ảnh ban đầu phải trải qua rất nhiều công đoạn và rất nhiều các kỹ
thuật đƣợc sử dụng để thay đổi và giúp nó có chất lƣợng tốt hơn nhƣ làm trơn,
làm sắc nét, lọc nhiễu, cân bằng màu…. Tiêu biểu và quan trọng trong số đó là

sử dụng các bộ lọc không gian.
Hình ảnh thu đƣợc từ các thiết bị thu nhận số nhƣ camera, camcoder
thƣờng bị ảnh hƣởng bởi các nhiễu và điều kiện sáng nên có thể bị mờ, quá tối
hoặc quá sáng hoặc không nhấn mạnh đƣợc đối tƣợng chụp. Điều đó gây khó
khăn rất nhiều cho các công tác học tập, nghiên cứu và ứng dụng thực tiễn, nó
khiến cho hiệu quả công việc giảm và độ chính xác không cao đặc biệt là trong
các lĩnh vực đòi hỏi sự tỉ mỉ và chính xác. Để khắc phục điều này, các bộ lọc
không gian nhƣ lọc song phƣơng, lọc Nonlocal-mean (NLM) và Linear sharpen
cùng kỹ thuật cân bằng màu sắc là những giải pháp tốt.
Xuất phát từ thực tế đó, tôi lựa chọn đề tài: “Cải thiện chất lƣợng ảnh dựa
trên các bộ lọc không gian”. Đây là vấn đề đã và đang đƣợc quan tâm và hứa
1


hẹn sẽ đƣợc tiếp tục phát triển trong tƣơng lai phù hợp với thực tiễn và cuộc
sống, đặc biệt là trong giai đoạn đất nƣớc đang từng bƣớc phát triển và đi lên,
CNTT đang thực sự bùng nổ nhƣ ngày nay.
2. Mục tiêu của đề tài
Mục tiêu của đề tài là sử dụngcác bộ lọc không gian, kỹ thuật cân bằng
màu để nâng cao chất lƣợng hình ảnh từ các ảnh tĩnh và video. Từ một bức ảnh
đầu vào với chất lƣợng hình ảnh kém nhƣ bị nhiễu, mờ, không sắc nét, màu sắc
xa với thực tế, sau khi sử dụng các bộ lọc không gian và kỹ thuật cân bằng màu
sẽ đƣa ra một kết quả tốt hơn: sắc nét, mƣợt,đảm bảo đƣợc các đƣờng nét ban
đầu không mất đi và màu sắc gần hơn với thực tế.
3. Đối tƣợng và phạm vi nghiên cứu
Đối tượng nghiên cứu của đề tài:


Các bộ lọc không gian: Lọc song phƣơng, NLM, Linear sharpen tập


trung chủ yếu vào các thuật toán đƣợc sử dụng trong bộ lọc và cách thức hoạt
động của chúng.


Kỹ thuật cân bằng màu sắc

Phạm vi nghiên cứu:


Dựa trên các lý thuyết chung về XLA để giải thích và đƣa ra những

phƣơng pháp cụ thể.


Lý thuyết về các bộ lọc không gian và các khái niệm liên quan



Chƣơng trình thử nghiệm

4. Phƣơng pháp nghiên cứu
Trƣớc tiên, nghiên cứu sẽ đƣa ra các lý thuyết về XLA và các bộ lọc không
gian, kỹ thuật cân bằng màu đƣợc đề cập đến.Dựa trên nền tảng lý thuyết để xây
dựng một chƣơng trình thử nghiệmvới ảnh tĩnh và video.
5. Dự kiến kết quả đạt đƣợc
Đƣa ra đƣợc kết quả nghiên cứu về mặt lý thuyết: Ý nghĩa và ứng dụng của
XLA nói chung và các bộ lọc không gian, kỹ thuật cân bằng màu nói riêng trong
khoa học công nghệ và đời sống.Đƣa ra đƣợc kết quả của việc áp dụng lý thuyết
trên vào các hình ảnh thực tế thông qua chƣơng trình thử nghiệm.


2


CHƢƠNG I: GIỚI THIỆU CHUNG VỀ XLA VÀ NHỮNG
ỨNG DỤNG CỦA NÓ
1.1. Giới thiệu chung
Khoảng hơn mƣời năm trở lại đây, XLA đã đƣợc đƣa vào giảng dạy trong
chƣơng trình đại học ở nƣớc ta.Nó là môn học có liên quan đến nhiều lĩnh vực
và cần nhiều kiến thức cơ sở khác nhau. Đầu tiên là xử lý tín hiệu số, đây là một
môn học cơ bản cho xử lý tín hiệu chung, các khái niệm về các bộ lọc hữu
hạn,tích chập, các biến đổi Fourier, Laplace, … Thứ hai, các công cụ toán nhƣ
đại số tuyến tính, sác xuất thống kê. Bên cạnh đó là một số kiến thức cần thiết
nhƣ trí tuệ nhân tao, mạng nơ ron nhân tạo cũng đƣợc nhắc đến trong quá trình
phân tích và nhận dạng ảnh. Tiền đề của các phƣơng pháp XLA là các ứng
dụng: nâng cao chất lƣợng ảnh và phân tích ảnh. Ứng dụng đi đầu đƣợc biết đến
là nâng cao chất lƣợng ảnh báo truyền qua cáp từ London đến NewYork từ
những năm 1920.
Nâng cao chất lƣợng ảnh có liên quan đến việc phân bố mức sáng và độ
phân giải của ảnh. Nâng cao chất lƣợng ảnh phát triển vào khoảng những năm
1955.Điều này là vì sau chiến tranh thế giới thứ hai, máy tính phát triển nhanh
tạo điều kiện thuận lợi cho quá trình XLA số phát triển. Năm 1964, máy tính đã
có khả năng xử lý, nâng cao chất lƣợng ảnh từ mặt trăng và vệ tinh Ranger 7 của
Mỹ cụ thể là: làm nổi đƣờng biên, lƣu ảnh. Từ năm 1964 đến nay, các phƣơng
tiện nâng cao và xử lý nâng cao chất lƣợng, nhận dạng ảnh đã phát triển không
ngừng. Các phƣơng pháp tri thức nhân tạo nhƣ các thuật toán xử lý cải
tiến,mạng nơ ron nhân tạo, các công cụ nén ảnh đã ngày càng đƣợc áp dụng
rộng rãi và gặt hái đƣợc nhiều kết quả khả quan. Trƣớc đây ảnh thu qua Camera
là các ảnh tƣơng tự (loại Camera ống CCIR). Gần đây, với sự phát triển của
công nghệ, ảnh đƣợc lấy ra từ camera là ảnh đen trắng hoặc màu, sau đó nó
đƣợc chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử lý tiếp theo. (Ví dụ điển

hình là máy ảnh số).Mặt khác, ảnh cũng có thể tiếp nhận qua vệ tinh, có thể
đƣợc quét từ ảnh chụp bằng máy quét ảnh.

3


Quá trình XLA:

Thu nhận ảnh

Biến đổi ảnh

Cơ sở tri
thức

Cơ sở tri
thức

Nhận dạng và
nội suy

Cơ sở tri
thức

Hình 1.1: Quá trình XLA


Thu nhận ảnh: Ảnh có thể đƣợc nhận qua camera màu hoặc đen trắng.

Thƣờng ảnh nhận qua camera là ảnh tƣơng tự (camera ống chuẩn CCIR với tần

số 1/25, 25 dòngmỗi ảnh), cũng có loại camera đã số hoá (nhƣ loại CCD) là loại
photodiot tạo cƣờng độ sáng tại mỗi PEL. Thƣờng dùng nhất là camera loại quét
dòng, ảnh tạo ra có dạng hai chiều. Chất lƣợng một ảnh thu đƣợc phụ thuộc chủ
yếu vào thiết bị thu và môi trƣờng (ánh sáng, phong cảnh)
 Biến đổi ảnh: Sau bƣớcthu nhận, ảnh đƣợc biến đổi bằng việc sử dụng
các kỹ thuật nâng cao chất lƣợng ảnh để thu đƣợc ảnh có chất lƣợng tốt, chứa
đựng nhiều thông tin và có thể quan sát bằng mắt.
 Nhận dạng và nội suy ảnh: Nhận dạng ảnh là quá trình xác định ảnh.
Quá trình này thu đƣợc bằng cách so sánh với mẫu chuẩn đã đƣợc học (hoặc
lƣu) từ trƣớc. Nội suy là phán đoán dựa trên ý nghĩa trên cơ sở nhận dạng. Ví
dụ: một loạt nét gạch ngang và chữ số trên phong bì có thể đƣợc nội suy thành
loại mã điện thoại. Có nhiều cách phân loai ảnh khác nhau về ảnh. Theo lý
thuyết về nhận dạng, các mô hình toán học về ảnh đƣợc phân loại theo hai dạng
nhận dạng ảnh cơ bản: Nhận dạng theo cấu trúc vànhận dạng theo tham số. Một
số đối tƣợng nhận dạng phổ biến hiện nay đƣợc áp dụng trong khoa học và công

4


nghệ là: nhận dạng văn bản (Text),nhận dạng ký tự (chữ in, chữ ký điện tửchữ
viết tay), nhận dạng mã vạch, nhận dạng vân tay, nhận dạng mặt ngƣời…
Ảnh là một đối tƣợng khá phức tạp về độ sáng tối, đƣờng nét, dung lƣợng
PEL, môi trƣờng để thu ảnh phong phú kèm theo nhiễu. Trong nhiều khâu phân
tích và XLA ngoài việc đơn giản hóa các phƣơng pháp toán học đảm bảo tiện lợi
cho xử lý, ngƣời ta mong muốn học hỏi quy trình tiếp nhận và XLAtheo cách
của con ngƣời. Trong các bƣớc xử lý đó, nhiều khâu đã xử lý theo các phƣơng
pháp trí tuệ con ngƣời. Vì vậy, ở đây các cơ sở tri thức đƣợc phát huy.
1.2. Ứng dụng của XLA
XLA có ứng dụng trong việc lƣu trữ dữ liệu, tra cứu thông tin: Để giảm
dung lƣợng lƣu trữ ảnh, ảnh đƣợc nén dƣới dạng *.jpg, *tif...

Ứng dụng trong việc nhận dạng: Nhận dang khuôn mặt, vân tay, chữ số, ký
tự, biển số xe…Ứng dụng trong việc xác thực: Xác thực đăng nhập windown 8
bằng hình ảnh…

Hình 1.2: Nhận dạng biển số xe
Trong y học, XLA cũng có vai trò rất quan trọng trong việc đƣa ra những
hình ảnh có chất lƣợng cao, rõ nét, giúp cho việc chẩn đoán bệnh khách quan,
nhanh chóng và chính xác hơn. Trong đó, việc làm nổi các chi tiết trong ảnh là
một trong những ứng dụng quan trọng và có ỹ nghĩa.

5


Hình 1.3: Hình ảnh mạch trước và sau khi được làm nổi (từ trái qua phải)
Trong công nghiệp, XLA có ứng dụng trong việc xấy dựng các hệ thống
máy nhìn công nghiệp để kiểm tra và điều khiển các sản phẩm: Hệ thống phân
tích hình ảnh nhằm phát hiện bọt khí bên trong vật thể đƣợc đúc bằng nhựa, phát
hiện các linh kiện không đạt tiêu chuẩn trong sản xuất, từ camera quan sát, đếm
đƣợc sản phẩm dựa vào hệ thống đếm sản phẩm.

Hình 1.4: Ứng dụng của XLA trong công nghiệp
6


XLA còn có ứng dụng hiệu quả trong việc dấu dữ liệu để phục vụ cho việc
trao đổi thông tin mật. Cụ thể nhƣ : Dấu tin trong ảnh, dấu video trong ảnh hay
dấu ảnh trong ảnh.

Hình 1.5: Ảnh giấu tin : Ảnh bên trái là được giấu tin, đoạn văn bản bên
phải là đoạn văn bản được giấu trong ảnh

1.3.

Các vấn đề cơ bản trong XLA
1.3.1. PEL và ảnh số
Gốc của ảnh hay gọi là ảnh tự nhiê là ảnh liên tục về độ sáng và không

gian. Để xử lý bằng máy tính (số) thì hình ảnh cần phải đƣợc số hoá.Sự biến đổi
gần đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về độ sáng
(mức xám)vàvị trí (không gian) gọi là số hóa ảnh. Khoảng cách giữa các PEL
này đƣợc thiết lập sao cho mắt ngƣời không thể phân biệt đƣợc ranh giới giữa
chúng. Mỗi một điểm nhƣ vậy gọi là điểm ảnh (PEL: Picture Element) hay gọi
tắt là Pixel. Trong phạm vi ảnh hai chiều, mỗi pixel ứng với tọa độ (x, y).
Định nghĩa: PEL (pixel) là một phần tử có toạ độ (x, y) của ảnh số với độ
màu hoặc xám nhất định. Kích thƣớc và khoảng cách giữa các PEL đó đƣợc
chọn phù hợp sao cho mắt ngƣời cảm nhận sự liên tục về không gian và mức
xám (hoặc màu) của ảnh số gần nhƣ ảnh thật.Mỗi một phần tử trong ma trận
đƣợc xem là một phần tử ảnh.
Ảnh số là tập hợp các PEL với mức xám phù hợp dùng để mô tả ảnh gần
với ảnh thật.

7


1.3.2. Độ phân giải của ảnh
Định nghĩa: Độ phân giải của ảnh là mật độ PEL đƣợc ấn định trên một ảnh
số.
Theo định nghĩa, khoảng cách giữa các PEL phải đƣợc thiết lập sao cho
mắt ngƣời thấy đƣợc sự liên tục của ảnh. Việc lựa chọn khoảng cách phù hợp
tạo nên một mật độ phân bố, đó chính là độ phân giải và đƣợc phân bố theo trục
y và trong không gian hai chiều.

Ví dụ: Độ phân giải của ảnh trên màn hình CGA là một lƣới điểm theo
chiều ngang màn hình: 320 điểm theo chiều dọc * 200 PEL (320*200). Thực tế
là, cùng màn hình CGA 12 inh ta nhận thấy mịn hơn màn hình CGA 17 inh độ
phân giải 320*200. Lý do là vì cùng một mật độ (độ phân giải) nhƣng diện tích
màn hình rộng hơn thì độ mịn (liên tục của các PEL) kém hơn.

Hình 1.6: Sự phân bố PEL: Số lượng PEL phân bố tăng dần trên cùng một
kích thước ảnh

8


1.3.4. Mức xám của ảnh
Một PEL (một pixel) có hai đặc trƣng cơ bản là độ xám của nóvà vị trí (x,
y) của PEL.Dƣới đây là một số khái niệm và thuật ngữ thƣờng đƣợc đề cập tới
trong XLA.
Định nghĩa: Mức xám của PEL là cƣờng độ sáng của PEL đƣợc gán bằng
giá trị số tại điểm đó.
 Các thang giá trị mức xám thông thƣờng: 16, 32, 64, 128, 256. Mức 256
là mức phổ dụng nhất.
 Ảnh đen trắng: là ảnh có hai màu trắng và đen(không chứa màu khác)
với mức xám ở các PEL có thể khác nhau.
 Ảnh nhị phân: ảnh chỉ có 2 mức trắng đen phân biệt tức là dùng 1 bit
mô tả 21 mức khác nhau. Nóitheo một cách khác: mỗi PEL của ảnh nhị phân chỉ
có thể là 1 hoặc 0.
 Ảnh màu: trong phạm vi lý thuyết ba màu RBG(Red, Blue, Green) để
tạo nên thế giới màu, ngƣời ta thƣờng dùng 3 byte để mô tả mức màu, khi đó các
giá trị màu: 28*3=224≈ 16,7 triệu màu.
1.3.5. Tăng cƣờng ảnh
Tăng cƣờng ảnh là việc giảm nhiễu ảnh, tăng độ tƣơng phản giữa các cấu

trúc. Các kỹ thuật tăng cƣờng ảnh còn tăng cƣờng các thuộc tính cảm nhận làm
cho ảnh tốt lên, tiện phục vụ cho các xử lý tiếp theo.
Các kỹ thuật tăng cƣờng ảnh gồm kỹ thuật phi tuyến, tuyến tính, thích
nghi, cố định, kỹ thuật dựa vào pixel hay kỹ thuật đa mức. Các kỹ thuật đƣợc
chia làm hai nhóm: Nhóm tăng cƣờng ảnh trong miền không gian và nhóm phục
hồi ảnh trong miền tần số.
Các thao tác chính: Làm sắc nét đƣờng biên, lọc phi tuyến, lọc tuyến tính,
phóng to, thu nhỏ, làm trơn, thay đổi độ tƣơng phản, sửa đổi mức xám đồ…
 Thay đổi độ tƣơng phản: Trong thực tế, khi hai đối tƣợng có cùng độ sáng
đặt ở hai nền khác nhau thì sẽ cho ta những cảm nhận khác nhau. Chính vì vậy,
độ tƣơng phản thể hiện sự thay đổi độ sáng của đối tƣợng so với nền, hiểu
9


theomột cách khác thì độ tƣơng phản là độ nổi của PEL so hay một vùng ảnh so
với nền. Do điều kiện sáng tối khác nhau hay do biến động của bộ cảm nhận
ảnh mà ảnh của độ tƣơng phản khác nhau. Để thay đổi độ tƣơng phản của ảnh
thì ta phải thay đỏi biên độ trên toàn dải bằng cách biến đổi tuyến tính biên độ
đầu vào hay phi tuyến.
 Lọc tuyến tính: Bao gồm lọc thông thấp, đồng hình và trung bình, loại lọc
này đƣợc dùng cho các loại nhiễu phân bố khắp ảnh (nhiễu cộng và nhiễu
nhân).
 Lọc phi tuyến: Bao gồm lọc trung vị, giả trung vị và lọc ngoài. Loại lọc
này dùng cho các loại nhiễu gây đột biến tại một PEL (nhiễu xung).

a
b
Hình 1.7: Độ tương phản của ảnh. a: ảnh có độ tương phản cao, b:
ảnh có độ tương phản thấp
1.3.6. Khôi phục ảnh

Mục đích: Khôi phục lại ảnh ban đầu, loại bỏ các biến dạng ra khỏi ảnh tùy
theo nguyên nhân gây ra biến dạng. Kỹ thuật đƣợc sử dụng để khôi phục lại hình
ảnh nhƣ làm giảm mờ, nhiễu và áp dụng các bộ lọc tuyến tính, không gian…để
có đƣợc ảnh gần nhất với ảnh gốc.Nguyên nhân gây ra sự suy giảm ảnh có rất
nhiều và khôi phục ảnh là một trong những lĩnh vực quan trọng trong xử lý hình
ảnh.Nguyên nhân của sự suy giảm thƣờng bao gồm mờ và nhiễu. Mờ có thể do
đối tƣợng trong hình ảnh bị mất nét khi phơi sáng, trong khi chuyển động mờ có
thể đƣợc gây ra khi một đối tƣợng di chuyển so với máy ảnh khi phơi sáng. Mục
đích của phục hồi hình ảnh là để " bù" hoặc "khôi phục" sai hỏng- những cái đã
làm suy giảm hình ảnh. Suy giảm có nhiều hình thức nhƣ chuyển động làm mờ,
nhiễu, mất tiêu cự camera... Trong trƣờng hợp nhƣ làm mờ chuyển động, có thể

10


đƣa ra một ƣớc lƣợng rất tốt so với mờ thực tế và "khôi phục" mờ để khôi phục
lại hình ảnh gốc.Trƣờng hợp ảnh bị lỗi bởi nhiễu, có thể thực hiện bù nhiễu.

Hình 1.8: Khôi phục ảnh. Từ trái qua phải: phần ảnh trước và sau khi được khôi phục
1.3.7. Phân tích ảnh
Mục đích: Đƣa ra ra các đặc trƣng của ảnh, xây dựng mối quan hệ giữa
chúng dựa vào các đặc trƣng cục bộ.Tìm biên, tách biên, , phân vùng ảnh,làm
mảnh đƣờng biên và phân loại đối tƣợng là các thao tác chính trong phân tích
ảnh. Các phƣơng pháp chính là phát hiện biên cục bộ, dò biên theo quy hoạch
động, phân vùng theo miền đồng nhất, phân vùng dựa theo đƣờng biên.
Nhƣ chúng ta biết, biên là vẫn đề chủ yếu trong phân tích ảnh vì các kỹ thuật
phân đoạn ảnh dựa trên biên là chủ yếu.Tập hợp các điểm biên tạo lên biên của
hình ảnh, mỗi PEL có thể xem là điểm biên nếu có sự thay đổi mức xám đột
ngột ở đó. Có hai phƣơng pháp phát hiện biên chính là: Phát hiện biên gián tiếp
và phát hiện biên trực tiếp.

Biên ảnh là những vùng có cƣờng độ tƣơng phản mạnh, dò biên giúp lọc ra
những thông tin hữu ích trong ảnh mà vẫn giữ đƣợc những thuộc tính cấu trúc
của hình ảnh.Gradient và Laplacian là hai phƣơng pháp dò biên cơ bản. Gradient
dò biên bằng việc tìm kiếm giá trị lớn nhất và giá trị bé nhất trong đạo hàm bậc
nhất của ảnh, còn Laplacian thì tìm kiếm các vạch không trong đạo hàm bậc hai
của ảnh.

11


Hình 1.9:Kết quả của một phép dò biên
1.3.8. Nén ảnh
Nén ảnh là một kỹ thuật mã hoá các ảnh số hoá để giảm số lƣợng các bit
dữ liệu cần thiết để biểu diễn ảnh, giảm đi chi phí trong việc lƣu trữ ảnh và chi
phí về mặt thời gian để truyền ảnh đi xa trong truyền thông nhƣng vẫn đảm bảo
đƣợc chất lƣợng của ảnh.
Nén ảnh thực hiện đƣợc là do: thông tin trong bức ảnh không phải là ngẫu
nhiên mà có trật tự, tổ chức.Vì thế nếu làm rõ đƣợc trật tự, cấu trúc đó thì sẽ biết
phần thông tin nào quan trọng nhất trong bức ảnh để biểu diễn và gửi đi với số
lƣợng bit ít hơn so với ảnh gốc mà vẫn đảm thông tin có đƣợc một cách đầy đủ.
Ở bên nhận quá trình giải mã sẽ sắp xếp và tổ chức lại đƣợc bức ảnh xấp xỉ gần
chính xác so với ảnh gốc nhƣng vẫn thỏa mãn chất lƣợng yêu cầu.
Nén ảnh có đƣợc bằng cách loại bỏ các phần dƣ thừa trong ảnh đã đƣợc số
hoá.Dƣ thừa có thể là dƣ thừa về cấp xám, dƣ thừa thông tin về không gian hay
dƣ thừa về thời gian.
Có hai phƣơng pháp nén ảnh cơ bản là: Nén không mất thông tin, nén mất thông
tin
 Nén mất thông tin: Khai thác các thông tin dƣ thừa và các thông tin
không liên quan
 Nén không mất thông tin: Khai tác các thông tin dƣ thừa

Hiện nay có một số chuẩn nén hay dùng nhƣ: JPEG, MPEG…

12


CHƢƠNG II: CÁC BỘ LỌC KHÔNG GIAN
Trong quá trình XLA chúng ta có thể sử dụng các mặt nạ không gian
nhằm làm thay đổi cấu trúc ảnh gọi là các bộ lọc không gian.
Một bộ lọc không gian là một hoạt động ảnh mà trong đó mỗi giá trị
PEL𝐼(𝑢, 𝑣) bị thay thế bởi một hàm của cƣờng độ các PEL trong vùng lân cận
của (𝑢, 𝑣)

Hình 2.1: Ví dụ về hoạt động của bộ lọc không gian
Bên cạnh việc giảm nhiễu, làm mƣợt hình ảnh,các bộ lọc không gian còn
làm sắc nét các chi tiết và giữ lại những cấu trúc đẹp trong hình ảnh.Dƣới đây là
các bộ lọc đƣợc đề cập đến trong đề tài.
2.1.

Lọc song phƣơng
Song phƣơng là một bộ lọc vừa làm mƣợt ảnh đồng thời vẫn giữ đƣợc các

đƣờng nét của ảnh bằng sƣ̣ k ết hợp phi tuyến tính của các giá trị PEL lân
cận.Phƣơng pháp này không lặp đi lặp lại, cục bộ và đơn gi ản. Nó kết hợp các
mức mức xám hoặc màu sắc dựa trên cả sƣ̣ mật thiết hình học và tƣơng tự về
trắc quang của chúng, và ƣu tiên giá trị gần hơn giá trị xa trong cả miền và phạm
vi. Ngƣợc lại với các bộ lọc hoạt động riêng biệt trên ba dải c ủa một ảnh màu,
bộ lọc song phƣơng có thể thực thi các số liệu cơ bản về nhận thức màu CIELab, làm mịn màu, và giữ gìn các đƣờng nét đ ể phù hợp với nhận thức của con
ngƣời. Ngoài ra, trong sự tƣơng phản với việc lọc tiêu chuẩn, lọc song phƣơng
không tạo ra màu sắc ảo d ọc theo các đƣờng nét t rong ảnh màu mà làm giảm
màu sắc ảo xuất hiện trong hình ảnh ban đầu.

13


2.1.1. Giới thiệu
Lọc có lẽ là hoạt động cơ bản nhất của XLA và thị giác máy tính . Trong ý
nghĩa rô ̣ng của thuật ngữ "lọc", các giá trị của hình ảnh đƣợc lọc tại một điểm là
một hàm của các giá trị ảnh đầu vào trong một tâ ̣p hơ ̣p giá tri ̣lân câ ̣n c ủa cùng
một vị trí. Đặc biệt, lọc thông thấp Gaussian tính toán trung bình các giá trị PEL
đƣợc đánh trọng số trong một tâ ̣p hơ ̣p giá tri ̣lân câ ̣n , trong đó, trọng số giảm
theo khoảng cách từ khu trung tâm lân câ ̣n . Mặc dù những lời giải thích chính
thức và mang tính định lƣợng về việc suy giảm trọng số đã đƣợc đƣa ra, theo
trực giác hình ảnh thƣờng thay đổi từ từ trong không gian, vì thế các PEL gầ n
nhau có thể có các giá trị tƣơng tự, và vì vậy việc tiń h trung bình chúng là thích
hợp. Giá trị nhiễu làm hỏng các PEL ở gần nó là có ít tƣơng quan lẫn nhau hơn
so với giá trị tín hiệu, vì vậy nhiễu đƣ ợc lấy trung bình trong khi tín hiệu đƣợc
giữ nguyên. Các giả định về các biến thể không gian thất bại tại các đƣờng nét
những cái bị làm mờ đi bởi bộ lọc thông thấp.Nhiều nỗ lực đã đƣợc cống hiến để
giảm ảnh hƣởng không mong muốn này. Một câu hỏi đặt ra là: Làm thế nào
chúng ta có thể ngăn chặn viê ̣c trung bình hóa trên các đƣờng nét , trong khi vẫn
trung bình hóa trong các khu vực cần làm mịn?
Sự khuếch tán bất đẳng hƣớng là một câu trả lời phổ biến: biến hình ảnh
cục bộ đƣ ợc đo tại mọi điểm, và giá trị PEL đƣợc tính trung bình từ các vùng
lân cận nơi mà kích thƣớc và hình dạng của nó phụ thuộc vào biến cu ̣c bô ̣ .
Phƣơng pháp khuếch tán tính trung bình trên các vùng miền đƣợc mở rộng bằng
cách giải quyết từng phần phƣơng trình vi phân , và đƣợc lặp đi lặp lại. Viê ̣c lặp
đi lặp lại có thể làm tăng các v ấn đề về tính ổn định và tùy thuộc vào hiệu quả
của kỹ thuật tính toán. Một phƣơng pháp không lặp đi lặp lại đƣợc đề xuất cho
việc duy trì độ mịn của đƣờng nét.
Nếu ba dải màu sắc hình ảnh đƣợc lọc riêng rẽ ra từ một cái khác, màu sắc
bị hỏng gần đƣờng biên ảnh. Trong thực tế, các dải khác nhau có mức độ khác

nhau của sự tƣơng phản, và chúng đƣợc làm mịn khác nhau. Làm mịn tách biệt
xáo trộn sự cân bằng màu sắc, và sự kết hợp màu sắc không mong đơ ̣i xuất hiện.
Nhƣng với bộ lọc song phƣơng, nó có thể hoạt động trên ba dải cùng m ột lúc,
14


và có thể đƣa ra một cách rõ ràng rằng màu sắc nào là tƣơng t ự và màu sắc nào
là không .
Ý tƣởng lọc song phƣơng cơ bản là để thực hiện trong phạm vi của một
hình ảnh những gì mà các bộ lọc truyền thống làm trong phạm vi của nó. Hai
PEL có thể đƣợc gép với nhau để chiếm vị trí không gian kế bên, hoặc có thể là
tƣơng tự nhƣ nhau để có các giá trị kế bên, có thể trong một cách có ý nghĩa về
mặt nhận thức. Việc gắn kết liên quan đến vùng lân cận trong miền, tƣơng tự với
vùng lân cận trong phạm vi. Lọc truyền thống là lọc miền, thực thi việc gắn kết
bằ ng việc đánh trọng số các giá trị PEL với hệ số dƣới với khoảng cách.Tƣơng
tự nhƣ vậy, chúng tôi xác định phạm vi lọc mà trong đó trung bình giá tri ̣ PEL
với tr ọng số phân rã không giống nhau. Lọc phạm vi là phi tuy ến vì trọng số
của chúng phụ thuộc vào cƣờng độ hoặc màu sắc hình ảnh. Tính toán, chúng có
vẻ gì phức tạp hơn các bộ lọc tiêu chuẩn không tách rời.Nhƣng quan trọng nhất,
chúng có thể giữ lại các đƣờng nét hình ảnh.
Miền không gian vẫn là một khái niệm rất quan trọng. Trong thực tế, chúng
ta thấy rằ ng lọc phạm vi tự nó làm biến dạng bản đồ màu sắc của hình ảnh. Khi
kết hợp lọc phạm vi và miền, thấy rằ ng s ự kết hợp là khá thú v ị. Đó gọi là lọc
song phƣơng. Do lọc song phƣơng giả định một khái niệm rõ ràng về khoảng
cách trong phạm vi và trong giới ha ̣n chức năng ảnh, chúng có thể đƣợc áp dụng
cho bất kỳ chức năng nào khi mà hai kho ảng cách có thể đƣợc xác định. Đặc
biệt, bộ lọc song phƣơng có thể đƣợc áp dụng cho ảnh màu dễ dàng nhƣ áp dụng
cho ảnh đen trắng. Các không gian màu CIE-Lab tạo ra không gian màu sắc với
một phƣơng pháp có ý nghĩa nhâ ̣n thƣ́c tƣơng t ự màu sắc, trong đó khoảng cách
Euclide ngắn tƣơng quan mạnh mẽ với màu sắc mà con ngƣời có thể phân bi ệt.

Vì vậy, nếu chúng ta sử dụng số liệu này trong bộ lọc song phƣơng, hình ảnh sẽ
đƣợc làm mịn và đƣờng nét đƣ ợc giữ theo cách đó đƣ ợc điều chỉnh tới cách thể
hiê ̣n của con ngƣời. Chỉ có màu sắc tƣơng tự về nhận thức đƣợc tính trung bình
với nhau, và chỉ nhƣ̃ng đƣờng nét có tiń h nh ận thức và có th ể nhìn thấy mới
đƣợc giữ lại. Các khái niệm về lọc song phƣơng sẽ đƣợc đề cập dƣới đây.

15


2.1.2. Ý tƣởng
Một bộ lọc miền thông thấp áp dụng cho hình ảnh f (x) đƣa ra một hình ảnh
đƣợc xác định nhƣ sau:
𝒉 𝒙 =

𝑘𝑑−1





𝑥

𝒇 𝛿 𝑐 𝛿, 𝒙 𝑑𝛿

(2.1)

−∞ −∞

Trong đó c (𝛿; x) đo sƣ̣ tƣơng đồ ng về mă ̣t hiǹ h ho ̣c gi ữa trung tâm vùng
lân cận x và một điểm gần đó 𝛿 .Phông chƣ̃ đâ ̣m cho f và h nh ấn mạnh thực tế

rằng cả hình ảnh đầu vào vàđầu ra có thể đa băng tần. Nếu bộ lọc thông thấp giữ
lại các thành phần dc của tín hiệu thông thấp chúng ta có đƣợc:


𝑘𝑑 𝒙 =



𝑐 𝛿, 𝒙 𝑑𝛿

(2.2)

−∞ −∞

Nếu bộ lọc là thay đổi bất biến, c (𝛿; x) chỉ là một hàm của sự khác biệt
vector 𝛿 − 𝑥, và 𝑘𝑑 là không đổi.
Lọc phạm vi đƣợc định nghĩa tƣơng tự:
𝒉 𝒙 =

𝑘𝑑−1 (𝑥)





𝒇 𝛿 𝑠(𝒇 𝛿 , 𝒇 𝑥 )𝑑𝛿

(2.3)

−∞ −∞


Ngoại trừ rằng 𝑠(𝑓 𝛿 , 𝑓 𝑥 ) đo sự tƣơng quang giữa các PEL ở trung tâm
vùng ảnh x và c ủa một điểm gần đó. Nhƣ vậy, các hàm tƣơng tự s hoạt động
trong phạm vi của hàm hình ảnh f, trong khi hàm ghép c hoạt động trong miền
của f. Việc chuẩn hóa hằng số (2) đƣợc thay thế bởi:


𝑘𝑟 𝒙 =



𝑠 𝑓(𝛿), 𝑓(𝒙 )𝑑𝛿

(2.4)

−∞ −∞

Trái với những gì xảy ra với các hàm tƣơng đồ ng c, chuẩ n hóa cho các hàm
tƣơng tự s phụ thuộc vào hàm hình ảnh f. Chúng ta nói rằng các hàm tƣơng tự s
là không thiên vị nếu nó chỉ phụ thuộc vào sự khác biệt 𝑓 𝜉 − 𝑓(𝑥). Sự phân
bố không gian của các cƣờng độ ảnh không có vai trò trong lọc phạm vi đƣợc
thực hiện bởi chính nó. Kết hợp cƣờng độ từ toàn bộ ảnh, tuy nhiên, làm ít hơn,
vì giá trị hình ảnh xa x nên không ảnh hƣởng đến giá trị cuối cùng tại x. Ngoài
ra, lọc phạm vi chỉ đơn thuần là thay đổi bản đồ màu của một hình ảnh, và do đó
ít đƣợc sử dụng . Các giải pháp thích hợp là kết hợp lọc miền và lọc phạm vi,

16


qua đó thực thi cả hai miền hình học và trắc quang. Lọc kết hợp có thể đƣợc mô

tả nhƣ sau:
𝐡 𝐱 =k

−1





(𝐱)

f δ c δ, 𝐱 s 𝐟 δ , 𝐟 𝐱 dδ

(2.5)

−∞ −∞

Với chuẩ n hóa




𝑘 𝑥 =

𝑐 𝛿, 𝑥 𝑠 𝑓 𝛿 , 𝑓 𝛿 , 𝑓 𝑥

(2.6)

−∞ −∞


Kết hợp lọc miền và phạm vi sẽ đƣợc thể hiện nhƣ lọc song phƣơng. Nó
thay thế các giá trị PEL tại x với trung bình của các giá trị PEL tƣơng tự lân
cận.Trong khu vực đƣợc làm miṇ , giá trị PEL trong một vùng tƣơng đồ ng nh ỏ
tƣơng tự nhƣ các khu khác, và các hàm tƣơng tự đƣợc chuẩ n hóa 𝑘 −1 s là giố ng
nhau. Nhƣ một hệ quả, các bộ lọc song phƣơng đóng vai trò cơ bản nhƣ một bộ
lọc miền tiêu chuẩn, những khác biệt tƣơng quan yếu giữa các giá trị PEL gây ra
bởi nhiễu.
Bây giờ một ranh giới rõ ràng giữa một vùng tối và vùng sáng, nhƣ trong
hình 2.2(a). Khi bộ lọc song phƣơng đƣợc tập trung, nói rằng, trên một PEL ở
bên sáng của đƣ ờng biên, các hàm tƣơng tự s của các giá trị giả định gần 1 cho
các PEL trên cùng một bên, và gần 0 cho các PEL ở bên tối. Các hàm tƣơng tự
đƣợc thể hiện trong hình 2.2(b) cho một bộ lọc hỗ trợ 23 × 23 tập trung hai
PEL bên phải của các bƣớc trong hình 2.2(a). Việc chuẩn hóa thuật ngữ 𝑘(𝑥)
đảm bảo rằng các trọng số cho tất cả các PEL tăng thêm một. Kết quả là, các bộ
lọc thay thế các PEL sáng trung tâm bằng trung bình của các PEL sáng trong
vùng lân cận của nó, và về cơ bản bỏ qua các PEL tối. Ngƣợc lại, khi bộ lọc tập
trung vào một PEL tối, các PEL sáng đƣợc bỏ qua thay thế. Vì vậy, nhƣ thể hiện
trong hình 2.2(c), viê ̣c l ọc đƣợc thực hiện tốt tại các ranh giới, nhờ vào thành
phần của lọc miền, và các cạnh sắc nét đƣợc giữ lại đồng thời, nhờ thành phần
của lọc phạm vi.

17


Hình 2.2: Lọc song phương. (a) Một bước cấp độ màu xám 100 bị nhiễu
loạn bởi nhiễu Gaussian với 𝜎 = 10 các mức xám. (b) Kết hợp trọng số tương
tự 𝑐 𝛿, 𝑥 𝑠 𝑓 𝛿 , 𝑓 𝑥

cho một vùng lân cận 23 × 23 tập trung hai PEL-bên


phải của bước (a). Các thành phần của lọc phạm vi ngăn chặn hiệu quả các
PEL trên bên tối. (c) Bước (a) sau khi lọc song phương với 𝜎𝑟 = 50 mức xám và
𝜎𝑑 = 5 PEL.
2.1.3. Trƣờng hợp Gaussian
Một trƣờng hợp đơn giản và quan trọng của lọc song phƣơng là lọc
Gaussian thay đổi bất biến, trong đó cả hai hàm tƣơng đồ ng 𝑐(𝛿, 𝑥) và hàm
tƣơng tự 𝑠(𝜙, 𝑓) là những hàm Gaussian của khoảng cách Euclide giữa các đối
số đó. Cụ thể hơn, c là đối xứng xuyên tâm
𝑐 𝜉, 𝑥 = 𝑒

1 𝑑 𝜉 ,𝑥
2 𝜎𝑑

− (

)2

(2.7)

Trong đó :
𝑑 𝜉, 𝑥 = 𝑑 𝜉 − 𝑥 = | 𝜉 − 𝑥 |
là khoảng cách Euclide giữa 𝜉 𝑣à 𝑥. Hàm tƣơng tự s là hoàn toàn giống nhƣ c:
𝑠 𝜉, 𝑥 = 𝑒

1 𝛿 𝑓(𝜉 ),𝑓(𝑥) 2
)
2
𝜎𝑟

− (


(2.8)

Trong đó :
𝛿 𝜙, 𝑓 = 𝛿 𝜙 − 𝑓 = 𝜙 − 𝑓

(2.9)

là một phƣơng pháp đo phù hợp của khoảng cách giữa hai giá trị cƣờng độ
𝜙 và f. Trong các trƣờng hợp vô hƣớng, điều này có thể đơn giản là chênh lệch
tuyệt đối của sự khác biệt PEL hay vì nhiễu tăng với cƣờng độ ảnh, một phiên
bản phụ thuộc cƣờng độ của nó.

18


×