Tải bản đầy đủ (.pdf) (68 trang)

XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG CÁC KỸ THUẬT NÂNG CAO CHẤT LƯỢNG VÀ NÉN ẢNH

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.58 MB, 68 trang )

Đồ án tốt nghiệp đại học Mục lục
Nguyễn Phương Hiền – D04VT2
i

MỤC LỤC

MỤC LỤC I
DANH MỤC HÌNH VẼ IV
DANH MỤC BẢNG BIỂU VI
THUẬT NGỮ VIẾT TẮT VII
LỜI NÓI ĐẦU A
CHƯƠNG 1 TỔNG QUAN ẢNH SỐ VÀ CÁC KĨ THUẬT NÂNG CAO CHẤT
LƯỢNG ẢNH 1
1.1 TỔNG QUAN VỀ ẢNH SỐ 1
1.2 CÁC KĨ THUẬT NÂNG CAO CHẤT LƯỢNG ẢNH 1
1.2.1 Biến đổi mức xám 1
1.2.1.1 Biến đổi âm bản 2
1.2.1.2 Biến đổi log 2
1.2.1.3 Biến đổi hàm mũ 3
1.2.1.4 Giãn độ tương phản 3
1.2.1.5 Kĩ thuật cắt theo mức 4
1.2.2 Cân bằng mức xám 5
1.2.3 So sánh mức xám 6
1.2.4 Chèn nhiễu 6
1.2.5 Lọc ảnh 7
1.2.5.1 Lọc làm mịn ảnh 8
a. Lọc không gian tuyến tính 8
b. Lọc không gian phi tuyến 8
c. Lọc trung bình 8
d. Lọc thông thấp miền tần số 9
1.2.5.2 Lọc sắc nét ảnh 9


a. Lọc thông cao 9
b. Lọc tần số từ không gian 10
1.2.5 Các kĩ thuật làm nổi đường biên ảnh 10
1.3 KẾT LUẬN CHƯƠNG 1 11
CHƯƠNG 2 CÁC KĨ THUẬT NÉN ẢNH 12
Đồ án tốt nghiệp đại học Mục lục
Nguyễn Phương Hiền – D04VT2
ii

2.1 TỔNG QUAN VỀ NÉN ẢNH 12
2.1.1 Giới thiệu chung về nén ảnh số 12
2.1.2 Sơ đồ khối hệ thống nén ảnh điển hình 13
2.1.3 Phân loại các kỹ thuật nén 13
2.1.4 Các nguyên tắc khi nén ảnh 14
2.1.5 Dư thừa số liệu 14
2.1.5.1 Dư thừa mã (Coding Redundancy) 15
2.1.5.2 Dư thừa trong pixel ( Interpixel Redudancy) 16
2.1.5.3 Dư thừa tâm sinh lý (Psychovisual Redudancy) 16
2.1.6 Giới thiệu một số kỹ thuật sử dụng trong nén ảnh 17
2.1.6.1 Mã hoá dựa trên phép biến đổi DCT 17
a. Biến đổi DCT thuận và nghịch 17
b. Lượng tử và giải lượng tử 19
c. Mã hóa và giải mã 19
2.1.6.2 Kỹ thuật mã hoá băng con 20
a. Ý tưởng mã hoá băng con 20
b. Mã hoá băng con 20
2.1.6.3 Biến đổi Wavelet trong nén ảnh 22
a. Biến đổi Wavelet 1-D 23
b. Biến đổi Wavelet rời rạc 2-D 24
2.1.7 Các tiêu chuẩn nén ảnh 26

2.2. GIỚI THIỆU JPEG VÀ JPEG2000 26
2.2.1 JPEG 26
2.2.1.1 Giới thiệu sơ lược 26
2.2.1.2 Sơ đồ khối 27
2.2.2 JPEG2000 28
2.2.2.1 Giới thiệu sơ lược 28
2.2.2.2 Sơ đồ khối bộ mã hóa và bộ giải mã JPEG 2000 28
2.2.3 So sánh JPEG và JPEG2000 29
2.3 KẾT LUẬN CHƯƠNG 2 31
CHƯƠNG 3 CHƯƠNG TRÌNH MÔ PHỎNG 32
3.1 NGÔN NGỮ MATLAB 32
Đồ án tốt nghiệp đại học Mục lục
Nguyễn Phương Hiền – D04VT2
iii

3.1.1 Sơ lược lịch sử Matlab 32
3.1.2 Đặc điểm của Matlab và các ứng dụng 34
3.2 CHƯƠNG TRÌNH MÔ PHỎNG SỬ DỤNG MATLAB 35
3.2.1 Giao diện chương trình mô phỏng 35
3.2.2 Nâng cao chất lượng ảnh 36
3.2.2.1 Biến đổi mức xám 36
a. Biến đổi mức xám sử dụng hàm imadjust 37
b. Biến đổi âm bản 38
c. Biến đổi log 39
d. Biến đổi hàm mũ 39
e. Biến đổi giãn độ tương phản 40
f. Kĩ thuật cắt theo mức 41
3.2.2.2 Cân bằng mức xám 41
3.2.2.3 So sánh mức xám 42
3.2.2.4 Chèn nhiễu 43

3.2.2.5 Lọc ảnh 44
a. Lọc làm mịn ảnh 45
b. Lọc sắc nét ảnh 51
3.2.2.6 Các kĩ thuật làm nổi đường biên ảnh 53
3.2.3 Nén ảnh 54
3.2.3.1 Nén ảnh dùng mã hóa Huffman 54
3.2.3.2 Nén ảnh dùng mã dự đoán không tổn thất 54
3.2.3.3 Nén ảnh JPEG dùng biến đổi DCT 54
3.2.3.4 Nén ảnh JPEG2000 55
3.3 KẾT LUẬN CHƯƠNG 3 56
KẾT LUẬN 57
TÀI LIỆU THAM KHẢO 58



Đồ án tốt nghiệp đại học Danh mục hình vẽ
Nguyễn Phương Hiền – D04VT2
iv

DANH MỤC HÌNH VẼ

Hình 1.1 Biến đổi âm bản 2
Hình 1.2 Đồ thị hàm log 3
Hình 1.3 Đồ thị hàm mũ 3
Hình 1.4 Biến đổi giãn độ tương phản 4
Hình 1.5 Đồ thị kĩ thuật cắt theo mức 4
Hình 1.6 Biểu đồ hàm s = T(r) 5
Hình 1.7 Cơ chế lọc không gian 7
Hình 1.8 Đường biên của ảnh 10
Hình 2.1 Sơ đồ khối một hệ thống nén ảnh điển hình 13

Hình 2.2 Mô hình mã hóa dự đoán không tổn thất bao gồm bộ mã hóa và bộ giải mã 16
Hình 2.3 Sơ đồ mã hóa và giải mã dùng biến đổi DCT 17
Hình 2.4 Các bước của quá trình mã hóa biến đổi DCT đối với 1 khối 18
Hình 2.5 a) Băng lọc phân tích; b) Hai bộ lọc thông thấp và thông cao c) Phần vùng
trong miền tần số; d) Băng lọc tổng hợp 21
Hình 2.6 Sơ đồ khối phân tích tín hiệu mức j 23
Hình 2.7 Sơ đồ biến đổi ngược Wavelet mức j 24
Hình 2.8 Sơ đồ phân tích Wavelet rời rạc 2-D 25
Hình 2.9 Sơ đồ biến đổi ngược Wavelet rời rạc 2-D 25
Hình 2.10 Sơ đồ khối bộ mã hóa và giải mã JPEG dựa trên biến đổi DCT 27
Hình 2.11 Sơ đồ khối bộ mã hóa và bộ giải mã JPEG 2000 28
Hình 2.12 So sánh JPEG, JPEG2000 29
Hình 2.13 Tỉ lệ nén của JPEG2000 và JPEG 30
Hình 2.14 Minh hoạ tính năng ROI 31
Hình 3.1 Giao diện chương trình nâng cao chất lượng và nén ảnh 36
Hình 3.2 Giao diện chương trình biến đổi ảnh xám 37
Hình 3.3 Đồ thị của các giá trị trong hàm imadjust 38
Hình 3.4 Ảnh âm bản 39
Hình 3.5 Ảnh biến đổi hàm log 39
Hình 3.6 Ảnh biến đổi hàm mũ 40
Đồ án tốt nghiệp đại học Danh mục hình vẽ
Nguyễn Phương Hiền – D04VT2
v

Hình 3.7 Ảnh giãn độ tương phản 40
Hình 3.8 Ảnh cắt theo mức không nền và có nền 41
Hình 3.9 Ảnh cân bằng và biểu đồ 42
Hình 3.10 Hai ảnh xám gần giống nhau 42
Hình 3.11 Ảnh xám thu được trước và sau khi cân bằng 43
Hình 3.12 Ảnh chèn nhiễu salf & pepper 43

Hình 3.13 Giao diện chương trình mô phỏng các phương pháp chèn và lọc nhiễu 44
Hình 3.14 Ảnh lọc sử dụng bộ lọc trung bình 47
Hình 3.15 Ảnh thu được nhờ bộ lọc Laplace có giá trị -4 và -8 ở chính giữa 48
Hình 3.16 Ảnh lọc không gian phi tuyến 49
Hình 3.17 Ảnh lọc trung vị 3x3 50
Hình 3.18 Ảnh lọc trung bình 50
Hình 3.19 Ảnh lọc thông thấp 51
Hình 3.20 Ảnh lọc thông cao cơ bản 51
Hình 3.21 Ảnh lọc emphasis cao tần 52
Hình 3.22 Ảnh lọc tần số từ không gian 53
Hình 3.23 Giao diện nén ảnh JPEG và JPEG2000 55
Đồ án tốt nghiệp đại học Danh mục bảng biểu
Nguyễn Phương Hiền – D04VT2
vi

DANH MỤC BẢNG BIỂU

Bảng 2.1 Số bit mỗi pixel 30
Bảng 3.1 Các bộ lọc đặc biệt 45
Đồ án tốt nghiệp đại học Thuật ngữ viết tắt
Nguyễn Phương Hiền – D04VT2
vii

THUẬT NGỮ VIẾT TẮT

Thuật ngữ Tên tiếng Anh Tiếng Việt
D
DCT Discrete Cosin Transform Biến đổi cosin rời rạc
DFT Discrete Fourier Transform Biến đổi Fourier rời rạc
DWT

Discrete Wavelet Transform
Biến

đổi

Wavelet rời rạc

F

FFT Fast Fourier Transform Biến đổi Fourier nhanh
I
IEEE Institute of Electrical and
Electronic Enginee
Học viện kĩ nghệ điện và điện
tử
IPT Image Processing Toolbox Hộp công cụ xử lí ảnh
ISO International Organization for
Standardization
Tổ chức chuẩn hóa quốc tế
J
JPEG Joint Photo Graphic Experts
Group
Liên hiệp các nhóm chuyên
gia về hình ảnh
M
MIT Massachusetts Institute of
Technology
Học viện Công nghệ
Massachusetts
MPEG Motion Picture Experts

Group
Nhóm chuyên gia về hình ảnh
động
MSE Mean Square Error Lỗi trung bình quân phương
P
PSNR Peak Signal-to-Noise Ratio Tỷ số tín hiệu đỉnh trên nhiễu
Q
QMF Quadrature Mirror Filter Bộ lọc gương cầu phương
Đồ án tốt nghiệp đại học Thuật ngữ viết tắt
Nguyễn Phương Hiền – D04VT2
viii

S
SBC Subband Coding Mã hóa băng con
SNR Signal-to-Noise Ratio Tỷ số tín hiệu trên nhiễu
R
RLC Run Length Coding Mã hoá loạt dài
RMSE Root Mean Square Error Lỗi trung bình quân phương
chuẩn
ROI Region of Interest Mã hoá ảnh theo vùng
V
VLC Variable Length Coding Mã hóa với độ dài mã thay đổi
W
WIC Wavelet Image Compession Nén ảnh sử dụng Wavelet


Đồ án tốt nghiệp đại học Lời nói đầu
Nguyễn Phương Hiền – D04VT2
a


LỜI NÓI ĐẦU

Trong nhiều thập kỷ gần đây, cùng với sự tiến bộ của khoa học kỹ thuật, sự phát
triển
mạnh mẽ của máy tính và sự ra đời của Internet thì nhu cầu các dịch vụ
dữ liệu truyền trên mạng là rất lớn, nhất là dữ liệu

đa phương tiện. Ảnh số ra đời
khiến cho nhu cầu của con
người về chất lượng ảnh cũng ngày càng tăng cao. Con
người sử dụng ảnh số cho nhiều mục đích, nhiều lĩnh vực khác nhau, từ nghệ thuật, y
học cho tới thiên văn học, địa lý,…Vì vậy ảnh số phải được xử lí sao cho phù hợp với
từng mục đích cụ thể. Xuất phát từ nhu cầu đó của con người, nhiều kỹ thuật xử lí ảnh
số ra đời. Xử lí ảnh số mặc dù là một khoa học còn tương đối mới mẻ so với nhiều
ngành khoa học khác nhất là trên quy mô công nghiệp, song nó đã đem lại nhiều lợi
ích. Xử lí ảnh số bao gồm việc tìm tòi nghiên cứu về các kĩ thuật nén ảnh để đảm bảo
tiết kiệm băng thông truyền dẫn,
giảm bớt không gian lưu trữ để truyền thông tin trên
mạng một cách dễ dàng và nhanh chóng. Ngoài ra, các
thuật toán nhằm nâng cao chất
lượng ảnh cũng là một vấn đề đòi hỏi sự đầu tư nghiên cứu. Các thuật toán, các phép
biến đổi nâng cao chất lượng ảnh mà chúng ta đã biết như tạo ảnh âm bản, chèn nhiễu,
tăng, giãn độ tương phản, biến đổi logic số học, phép lọc…
Các kỹ thuật nén sử dụng phép biến

đổi

Fourier

(FT), biến


đổi cosine rời rạc
(DCT), biến

đổi

Wavelet

(DWT)

có nhiều

ưu điểm không chỉ trong xử lí

ảnh mà
còn nhiều

ứng dụng khác. Bằng chứng là sự ra

đời của chuẩn nén

JPEG

(DCT) và
JPEG2000 (dựa trên

DWT) đang được sử dụng rất rộng rãi.
Với mục tiêu xây dựng chương trình mô phỏng, minh họa cho các kĩ thuật nâng
cao chất lượng và nén ảnh, em quyết định chọn đề tài này để làm đồ án tốt nghiệp.
Đồ án của em chia làm 3 chương:

-

Chương 1 giới thiệu tổng quan về ảnh số và các kĩ thuật nâng cao chất lượng
ảnh như biến đổi ảnh xám, biến đổi âm bản, các phương pháp lọc ảnh nhiễu
-

Chương 2 giới thiệu về kĩ thuật nén ảnh và đi sâu vào 2 chuẩn nén ảnh JPEG
và JPEG2000.
-

Chương 3 giới thiệu tổng quan về ngôn ngữ lập trình Matlab và chương trình
mô phỏng kĩ thuật nâng cao chất lượng và nén ảnh bằng Matlab.
Đồ án tốt nghiệp đại học Lời nói đầu
Nguyễn Phương Hiền – D04VT2
b

Em xin chân thành cảm ơn thầy giáo, ThS. Nguyễn Xuân Hoàng đã nhiệt tình
hướng dẫn, tạo điều kiện giúp đỡ em hoàn thành đồ án này.
Hà nội, tháng 11 năm 2008
Sinh viên
Nguyễn Phương Hiền

Đồ án tốt nghiệp đại học Chương 1: Nâng cao chất lượng ảnh
Nguyễn Phương Hiền – D04VT2
1

CHƯƠNG 1
TỔNG QUAN ẢNH SỐ VÀ CÁC KĨ THUẬT NÂNG CAO CHẤT
LƯỢNG ẢNH


Lịch sử của xử lí ảnh bắt nguồn từ việc nâng cao chất lượng hình ảnh được truyền
qua giữa đường cáp London và NewYork vào năm 1920. Lúc ấy xử lí ảnh chỉ đơn giản
là xử lí phân bố các mức sáng (mức xám và độ phân giải của ảnh). Việc nâng cao chất
lượng ảnh bằng các phương pháp xử lí để truyền ảnh số được nghiên cứu liên tục 35
năm sau đó. Do kỹ thuật máy tính ngày càng phát triển, nên xử lí ảnh và nâng cao chất
lượng ảnh cũng phát triển rất nhanh.
Trong chương này, ta tìm hiểu về một số kĩ thuật nâng cao chất lượng ảnh như
biến đổi ảnh xám, các phương pháp lọc nhiễu, làm nổi đường biên ảnh Các kĩ thuật
này hiện nay đang được ứng dụng rộng rãi trong nhiều lĩnh vực.
1.1 Tổng quan về ảnh số
Hình ảnh tĩnh có thể được biểu diễn bởi hàm 2 chiều f(x,y), trong đó x và y là tọa
độ không gian phẳng (2 chiều). Khi xét ảnh “đen-trắng”, giá trị hàm f tại một điểm
được xác định bởi tọa độ (x, y) được gọi là độ chói (mức xám) của ảnh tại điểm này.
Nếu x, y và f là các giá trị rời rạc, ta gọi ảnh đó là ảnh số. Xử lí ảnh số là quá trình
biến đổi ảnh số trên máy tính. Như vậy, ảnh số được tạo ra bởi một số hữu hạn các
điểm ảnh, mỗi điểm ảnh nằm tại một vị trí nhất định và có một giá trị nhất định. Một
điểm ảnh trong một ảnh còn được gọi là một pixel.
1.2 Các kĩ thuật nâng cao chất lượng ảnh
Hệ thống thị giác là cơ quan cảm nhận hình ảnh quang học tương đối hoàn hảo,
cho phép con người cảm nhận được hình ảnh quang học trong thiên nhiên. Ứng dụng
quan trọng nhất của nâng cao chất lượng ảnh là biến đổi tính chất của ảnh số nhằm tạo
cảm nhận về sự gia tăng chất lượng hình ảnh quang học.
1.2.1 Biến đổi mức xám
Hàm biến đổi mức xám có công thức như sau:
s = T(r) (1.1) [2]
Đồ án tốt nghiệp đại học Chương 1: Nâng cao chất lượng ảnh
Nguyễn Phương Hiền – D04VT2
2

trong đó r: mức xám ảnh vào f(x, y)

s: mức xám ảnh ra g(x, y)
T: hàm biến đổi mức xám.
1.2.1.1 Biến đổi âm bản
Âm bản của một ảnh có các mức xám trong khoảng [0, L-1] được tạo ra nhờ phép
biến đổi âm. Phép biến đổi này ứng dụng rất nhiều trong các phim ảnh trong y học.
Hàm sử dụng trong ảnh âm bản như sau:
f (u) = L − u (1.2) [7]
trong đó L: mức xám cao nhất
u: mức xám của ảnh vào
f(u): hàm biến đổi mức xám của ảnh vào.

Hình 1.1 Biến đổi âm bản [7]
Phép biến đổi này phù hợp cho việc nâng cao các chi tiết trắng hoặc xám nằm
trong vùng tối của ảnh, đặc biệt là khi vùng tối chiếm phần lớn kích thước ảnh.
1.2.1.2 Biến đổi log
Các biến đổi log được thực hiện bằng cách sử dụng công thức:
s = c.log (1 + r) (1.3)
trong đó r: mức xám ảnh vào
c: hằng số
s: mức xám ảnh ra.
Đồ án tốt nghiệp đại học Chương 1: Nâng cao chất lượng ảnh
Nguyễn Phương Hiền – D04VT2
3


Hình 1.2 Đồ thị hàm log
1.2.1.3 Biến đổi hàm mũ
Phép biến đổi theo hàm mũ có công thức cơ bản như sau:
s = c.
g

r
(1.4)
trong đó r: mức xám ảnh vào
s: mức xám ảnh ra
c và g: các hằng số dương.

Hình 1.3 Đồ thị hàm mũ
1.2.1.4 Giãn độ tương phản
Hàm biểu diễn trong hình 1.4 được gọi là một hàm biến đổi giãn độ tương phản
bởi vì nó nén các mức đầu vào thấp hơn m thành một khoảng hẹp các mức tối trên ảnh
Đồ án tốt nghiệp đại học Chương 1: Nâng cao chất lượng ảnh
Nguyễn Phương Hiền – D04VT2
4

ra; tương tự, nó nén các giá trị phía trên m thành một băng hẹp các mức sáng trên đầu
ra. Kết quả ra là một ảnh có độ tương phản cao hơn.

Hình 1.4 Biến đổi giãn độ tương phản
1.2.1.5 Kĩ thuật cắt theo mức
Kỹ thuật này dùng 2 phép ánh xạ khác nhau cho trường hợp có nền và không nền.
- Có nền:
î
í
ì
££
=
khácu
buakhiL
uf )(
(1.5) [7]

- Không nền:
î
í
ì
££
=
khác
buakhiL
uf
0
)(
(1.6) [7]
Đồ thị tương ứng của các hàm này như sau:

Hình 1.5 Đồ thị kĩ thuật cắt theo mức
Biến đổi này cho phép phân đoạn một số mức xám từ phần còn lại của ảnh. Nó có
tác dụng khi nhiều đặc tính khác nhau của ảnh nằm trên nhiều miền mức xám khác
nhau.
Đồ án tốt nghiệp đại học Chương 1: Nâng cao chất lượng ảnh
Nguyễn Phương Hiền – D04VT2
5

1.2.2 Cân bằng mức xám
Ảnh có mức xám từ [0, L-1] sẽ có biểu đồ mức xám là:
h(r
k
) = n
k
(1.7) [2]
với r

k
là mức xám thứ k và n
k
là số pixel trong ảnh có cùng mức xám là r
k
.
Có thể chuẩn hóa bằng cách chia n
k
cho tổng số pixel của cả ảnh. Biểu đồ chuẩn
hóa sẽ là: p(r
k
)= n
k
/n, n là tổng số pixel của cả ảnh. p(r
k
) phản ánh xác suất xuất hiện
của mức xám r
k
. Chú ý là tổng các thành phần biểu đồ chuẩn hóa phải bằng 1.
Biểu đồ có thể coi là phản ánh xấp xỉ xác suất xuất hiện của các giá trị mức xám
trong ảnh. Biểu đồ chính là nền tảng của đa số kỹ thuật xử lí miền không gian, còn có
thể sử dụng cho các kỹ thuật nén ảnh, phân rã ảnh… Vận dụng biểu đồ có hiệu quả rất
tốt đối với nâng cao chất lượng ảnh.
Đối với các ảnh có mức xám quá tập trung ở vùng tối hoặc vùng trắng, chúng ta
có thể sử dụng phương pháp cân bằng mức xám của ảnh để phân tán biểu đồ xám.
Ta định nghĩa hàm s như sau bằng T(r), r thuộc [0, 1] thỏa mãn các điều kiện sau:
- T(r) đơn trị và đơn điệu tăng trên [0, 1] (a)
- 0 ≤ T(r) ≤ 1 với 0 ≤ r ≤ 1 (b)
với s và T(r) là mức xám ảnh ra và biến đổi T của mức xám ảnh vào.
Điều kiện (a) để đảm bảo tồn tại quá trình biến đổi ngược và điều kiện đơn điệu

tăng để đảm bảo ảnh sau khi biến đổi không bị thay đổi thứ tự mức xám (trắng thành
đen và ngược lại).

Hình 1.6 Biểu đồ hàm s = T(r)
Đồ án tốt nghiệp đại học Chương 1: Nâng cao chất lượng ảnh
Nguyễn Phương Hiền – D04VT2
6

Với p
r
(w) là xác suất của mức xám w:
s = T(r) =
ò
r
r
dwwp
0
)(
(1.8) [2]
Với trường hợp r là rời rạc (tín hiệu số), ta có:
p
r
(r
k
) =
n
n
k
k = 0, 1, 2, , L – 1 (1.9) [2]
s

k
= T(r
k
) =
å
=
k
j
jr
rp
0
)(

=
å
=
k
j
k
n
n
0
k = 0, 1, 2, , L – 1 (1.10) [2]
Kết quả của quá trình biến đổi này là ảnh ra có phân bố biểu đồ đồng đều.
Phương pháp này gọi là cân bằng biểu đồ.
1.2.3 So sánh mức xám
Có những ảnh khi quan sát ta khó có thể phân biệt được sư khác nhau giữa hai
ảnh xám. Để có thể so sánh hai ảnh một cách rõ ràng chúng ta có thể sử dụng phép trừ
hai ảnh này cho nhau: mức xám của điểm ảnh thu được sẽ bằng mức xám của điểm
ảnh trên ảnh thứ nhất trừ cho mức xám trên điểm ảnh thứ hai. Kĩ thuật này thường

được dùng trong dự báo thời tiết và trong y học.
1.2.4 Chèn nhiễu
Khi truyền ảnh đi trên một kênh truyền nào đó thì sẽ có ảnh hưởng của nhiễu,
việc loại bỏ nhiễu sẽ đưa ra ảnh có chất lượng cao hơn. Thông thường, người ta xét
đến 3 loại nhiễu chính:
• Nhiễu cộng: Nhiễu cộng thường phân bố khắp ảnh. Nếu gọi ảnh quan sát (ảnh
thu được) là X
qs
, ảnh gốc là X
gốc
, nhiễu là η, ảnh thu được có thể biểu diễn bởi:
X
qs
= X
gốc
+ η (1.11) [7]
• Nhiễu nhân: Nhiễu nhân thường phân bố khắp ảnh và ảnh thu được sẽ biểu diễn
bởi:
X
qs
= X
gốc
* η (1.12) [7]
• Nhiễu xung: Nhiễu xung thường gây đột biến tại một số điểm ảnh.
Đồ án tốt nghiệp đại học Chương 1: Nâng cao chất lượng ảnh
Nguyễn Phương Hiền – D04VT2
7

1.2.5 Lọc ảnh
Phương pháp lọc ảnh có khá nhiều ứng dụng để xử lí ảnh xám với các mục đích

khác nhau: làm mịn ảnh, tăng độ nét của ảnh… Ta xét đến hai khái niệm lọc không
gian và lọc tần số. Lọc trong miền không gian là nhân chập một ảnh xám f(x, y) với 1
mặt nạ lọc h(x, y) (là một ma trận H kích thước nhỏ) để tạo ra ảnh mới. Trên thực tế,
tích chập không gian thường được đơn giản hóa bằng cách sử dụng các mặt nạ nhỏ,
giữ lại các đặc điểm nổi bật của các ảnh. Với f(x, y) là ảnh vào, g(x, y) là ảnh ra, h(x,
y) là mặt nạ lọc, ta có:
g(x, y) = f(x, y) ⊗ h(x, y) (1.13)
Ta cũng có thể làm tương tự trong miền tần số bằng cách nhân F(u, v) với H(u,
v), đây chính là biến đổi Fourier của lọc không gian. Người ta thường gọi H(u, v) là
hàm truyền đạt. Tùy thuộc ma trận sử dụng mà ta nhận được các kết quả khác nhau.
G(u, v) = F(u, v) H(u, v) (1.14)
với F(u, v), G(u, v) là biến đổi Fourier của ảnh vào và ảnh ra, H(u, v) là hàm truyền đạt
của bộ lọc.

Hình 1.7 Cơ chế lọc không gian
Đồ án tốt nghiệp đại học Chương 1: Nâng cao chất lượng ảnh
Nguyễn Phương Hiền – D04VT2
8

1.2.5.1 Lọc làm mịn ảnh
Ý tưởng của phương pháp lọc làm mịn là thay giá trị của một pixel bằng giá trị
mức xám trung bình của các pixel trong mặt nạ. Phương pháp này sẽ giúp loại bỏ các
chi tiết không liên quan trước khi thực hiện tách các đối tượng trong ảnh. Chi tiết ở
đây là nhóm các pixel có kích thước rất nhỏ so với mặt nạ. Tuy nhiên phương pháp
này tạo ra tác dụng không mong muốn là làm giảm độ nét của ảnh.
a. Lọc không gian tuyến tính
Lọc không gian tuyến tính là quá trình lọc mà các phép toán thực hiện trên các
pixel của các vùng lân cận là tuyến tính.
Với lọc tuyến tính, đáp ứng được đưa ra bởi phép cộng các hệ số của bộ lọc nhân
với pixel ảnh tương ứng trong vùng được quét bởi mặt nạ.

Ví dụ cho lọc tuyến tính với mặt nạ 3x3, đáp ứng R tại điểm (x,y):
R = w(- 1, - 1) f(x - 1, y - 1) + w(- 1, 0) f(x - 1, y) +…+ w(0, 0) f(x, y) + +
w(1, 0) f(x + 1, y) + w(1, 1) f(x + 1, y + 1) (1.15)
b. Lọc không gian phi tuyến
Đối với lọc phi tuyến thì giá trị của đáp ứng R không đơn thuần là tổng của các
tích của hệ số bộ lọc với các giá trị pixel tương ứng, mà nó còn phụ thuộc vào bản thân
giá trị của các pixel.
Lọc thống kê thứ tự là lọc phi tuyến trong đó đáp ứng R của bộ lọc được tạo ra
dựa trên thứ tự của các pixel trong vùng được quét bởi mặt nạ.
Điển hình cho loại này là lọc trung vị. Giống như tên gọi của nó, trong phép lọc
trung vị, giá trị mức xám của pixel sẽ được thay thế bởi mức xám trung bình của các
pixel lân cận nó. Phương pháp này được sử dụng khá phổ biến để giảm nhiễu, đặc biệt
là loại nhiễu xung (impulse noise hay còn gọi là saft-and-pepper noise).
c. Lọc trung bình
Do có nhiều loại nhiễu can thiệp vào quá trình xử lí ảnh nên cần có nhiều bộ lọc
thích hợp. Trường hợp tổng quát có thể dùng phương pháp lọc trung bình với các bộ
lọc có kích thước khác nhau, mỗi điểm ảnh được thay thế bằng trung bình trọng số của
các điểm lân cận và được định nghĩa như sau:
Đồ án tốt nghiệp đại học Chương 1: Nâng cao chất lượng ảnh
Nguyễn Phương Hiền – D04VT2
9

v(m, n) =
å
å

Welk
lnkmylka ),(),(
),(
(1.16) [7]

Nếu trong kỹ thuật lọc trên, ta dùng các trọng số như nhau, phương trình trên sẽ
trở thành:
v(m, n) =
N
1
å
å

Welk
lnkmy ),(
),(
(1.17) [7]
với y(m, n) là ảnh đầu vào, v(m, n) là ảnh đầu ra và a(k, l) là cửa sổ lọc, a
k,l
= 1/N
w

N
w
là số điểm ảnh trong cửa sổ lọc W.
d. Lọc thông thấp miền tần số
Về cơ bản, ý tưởng lọc trong miền tần số là lựa chọn một hàm truyền đạt để nhân
với F(u, v), tạo ra một ảnh mới. Ví dụ, ta có một hàm truyền đạt mà khi nhân hàm này
với một F(u, v) trung tâm sẽ làm suy giảm các thành phần cao tần của F(u, v), trong
khi đó việc loại bỏ các tần số thấp gần như không thay đổi.
1.2.5.2 Lọc sắc nét ảnh
Mục đích của lọc làm sắc nét ảnh là làm nổi bật các chi tiết nhỏ hoặc chi tiết bị
mờ, có thể do nhiễu hoặc do quá trình thu nhận ảnh. Các kĩ thuật lọc làm sắc nét đều là
lọc miền tần số.
a. Lọc thông cao

Lọc thông thấp làm mờ một ảnh, ngược lại, lọc thông cao lọc sắc nét ảnh nhờ làm
suy giảm các thành phần tần thấp và loại bỏ gần hết các thành phần cao tần của biến
đổi Fourier.
Lọc thông cao cơ bản
Cho hàm truyền đạt H
lp
(u, v) của 1 bộ lọc thông thấp, ta thu được hàm truyền đạt
của bộ lọc thông cao tương ứng nhờ sử dụng:
H
hp
(u,v) = 1 – H
lp
(u,v) (1.18) [2]
Lọc emphasis cao tần
Các bộ lọc thông cao như trên sẽ làm giảm giá trị trung bình của ảnh tới 0. Như ta
đã thấy ở trên, ảnh lọc nét hơn nhưng lại tối hơn nhiều so với ảnh gốc. Một phương
pháp giải quyết vấn đề này là chèn thêm vào một offset để lọc thông cao. Khi offset
Đồ án tốt nghiệp đại học Chương 1: Nâng cao chất lượng ảnh
Nguyễn Phương Hiền – D04VT2
10

kết hợp với việc nhân bộ lọc với một số lớn hơn 1 thì phương pháp này được gọi là lọc
emphasis cao tần bởi vì phép nhân làm nổi rõ các tần số cao.
Emphasis cao tần có hàm truyền đạt:
H
hfe
(u,v) = a + bH
hp
(u,v) (1.19) [2]
trong đó a là offset, b là số nhân và H

hp
(u, v) là hàm truyền đạt của bộ lọc thông cao.
Để có kết quả lọc cao hơn, sau khi lọc emphasis cao tần ta nên sử dụng phương pháp
cân bằng biểu đồ.
b. Lọc tần số từ không gian
Thông thường, lọc trong miền không gian có hiệu suất tính toán cao hơn lọc miền
tần số khi các bộ lọc nhỏ. Định nghĩa nhỏ khá phức tạp, nó phụ thuộc vào các hệ số
lọc, kích thước của bộ đệm, các dữ liệu phức hợp được xử lí như thế nào. Tuy nhiên,
khi đem ra so sánh, ta thấy bộ lọc sử dụng thuật toán FFT có thể nhanh hơn là một bộ
lọc trong miền không gian. Do đó, người ta nhận thấy nên chuyển lọc không gian
thành kĩ thuật lọc miền tần số tương đương chứa ưu điểm của cả hai phương pháp này.
1.2.5 Các kĩ thuật làm nổi đường biên ảnh
Làm nổi biên ảnh là vấn đề quan trọng trong phân tích ảnh. Trước hết, ta cần tìm
hiểu về khái niệm biên ảnh. Một điểm ảnh được coi là nằm trên đường biên nếu tại vị
trí điểm ảnh đó có sự thay đổi đột ngột của mức xám. Như vậy, đường biên là đường
nối các điểm ảnh nằm trong khu vực ảnh có thay đổi đột ngột về độ chói, đường biên
thường ngăn cách hai vùng ảnh có các mức xám gần như không đổi.

Hình 1.8 Đường biên của ảnh
Trong trường hợp lí tưởng, độ chói giữa hai vùng ảnh thay đổi đột ngột hoặc tăng
dần đều. Tuy nhiên trên thực tế, mức xám giữa các vùng ảnh thay đổi tương đối ngẫu
nhiên. Chính vì vậy quá trình phát hiện đường biên thường không đơn giản và kết quả
thường không hoàn toàn chính xác.
Đồ án tốt nghiệp đại học Chương 1: Nâng cao chất lượng ảnh
Nguyễn Phương Hiền – D04VT2
11

1.3 Kết luận chương 1
Kết thúc chương 1, một số kĩ thuật nâng cao chất lượng ảnh như biến đổi ảnh
xám (biến đổi âm bản, biến đổi hàm log, hàm mũ), lọc nhiễu (lọc thông thấp, thông

cao, lọc phi tuyến, tuyến tính, lọc trung vị,…), làm nổi biên ảnh đã được đề cập đến.
Trên thực tế, nâng cao chất lượng ảnh còn rất nhiều vấn đề đáng chú ý khác như các kĩ
thuật làm trơn ảnh, tách nhiễu, khử nhiễu, làm trơn biên, khuếch đại ảnh, lọc đồng
hình, lọc ngoài, lọc giả trung vị
Đồ án tốt nghiệp đại học Chương 2: Các kĩ thuật nén ảnh
Nguyễn Phương Hiền – D04VT2
12

CHƯƠNG 2
CÁC KĨ THUẬT NÉN ẢNH

Cùng với sự phát triển mạnh mẽ của máy tính và sự ra đời của Internet thì việc
tìm một phương pháp nén ảnh để giảm bớt không gian lưu trữ thông tin và truyền
thông tin trên mạng nhanh chóng đang là một yêu cầu cấp thiết. Trong những năm gần
đây, có rất nhiều các phương pháp đã và đang được nghiên cứu rộng rãi để thực hiện
nén ảnh. Tất cả đều với một mục đích chung là làm thế nào để biểu diễn một ảnh với ít
bit nhất để có thể tối thiểu hoá dung lượng kênh truyền và không gian lưu trữ trong khi
vẫn giữ được tính trung thực của ảnh. Điều này tương đương với việc biểu diễn ảnh có
độ tin cậy cao nhất với tốc độ bit nhỏ nhất.
2.1 Tổng quan về nén ảnh
2.1.1 Giới thiệu chung về nén ảnh số
Thông thường, ảnh đen trắng chưa nén được biểu diễn bằng 8 bit/pixel và ảnh
màu là 24 bit/pixel. Các kỹ thuật nén hiện nay cho phép dung lượng ảnh được nén
giảm 30 đến 50 lần so với ảnh gốc mà ảnh vẫn giữ được độ trung thực cao. Độ trung
thực của ảnh được đánh giá dựa trên tiêu chí như lỗi trung bình quân phương (MSE)
hoặc tỷ số tín hiệu trên nhiễu (SNR) giữa ảnh gốc và ảnh nén.
Những phương pháp thường (như Compress trong hệ UNIX) không đem lại hiệu
quả: tỷ lệ nén dữ liệu cho hình ảnh không quá 2:1. Nhưng với những phương pháp
chuyên dụng có thể đạt tới 30:1. Hai phương pháp nén hình ảnh nổi tiếng nhất hiện
nay là của nhóm chuyên gia về hình ảnh động (Motion Picture Experts Group -

MPEG) và liên hiệp các nhóm chuyên gia về hình ảnh (Joint Photo Graphic Experts
Group - JPEG). Những phương pháp này đã trở thành chuẩn công nghiệp. Những
nhược điểm cơ bản của các phương pháp này là sự mất mát thông tin và hiệu quả nén
không cao đối với những hình ảnh phức tạp.
Tất cả các phương pháp nén ảnh đều dựa trên một nguyên lý đơn giản: trong dữ
liệu có nhiều phần tử thừa và nén ảnh dựa trên cơ sở tìm ra những phần tử đó và loại
bỏ chúng.
Đồ án tốt nghiệp đại học Chương 2: Các kĩ thuật nén ảnh
Nguyễn Phương Hiền – D04VT2
13

Các phương pháp thông dụng hiện nay như biến đổi cosin rời rạc, nén ảnh
Wavelet (WIC) phải dùng đến biến đổi toán học và xấp xỉ các mối tương quan giữa
các pixel. Với các phương pháp này ta có thể nén ảnh tới tỷ lệ 20:1 – 30:1. Nhưng
những ảnh này (vì bị mất thông tin) chỉ là những ảnh gần đúng với ảnh ban đầu, ngoài
ra còn có thể xuất hiện biến dạng hình ảnh.
2.1.2 Sơ đồ khối hệ thống nén ảnh điển hình

Hình 2.1 Sơ đồ khối một hệ thống nén ảnh điển hình
- Khối biến đổi: Thường dùng phép biến đổi cosin rời rạc để tập trung năng lượng tín
hiệu vào một số lượng nhỏ các hệ số khai triển để thực hiện phép nén hiệu quả hơn là
dùng tín hiệu nguyên thủy.
- Khối lượng tử: Tạo ra một lượng kí hiệu giới hạn cho ảnh nén với hai kĩ thuật:
lượng tử vô hướng (thực hiện lượng tử hóa cho từng phần dữ liệu) và lượng tử vector
(thực hiện lượng tử hóa một lần một khối dữ liệu). Quá trình này không thuận nghịch.
- Khối mã hóa: Gán một từ mã, một dòng bit nhị phân cho mỗi kí hiệu, số nguyên
gần nhất.
2.1.3 Phân loại các kỹ thuật nén
Có nhiều cách phân loại các phương pháp nén khác nhau. Cách thứ nhất dựa vào
nguyên lý nén. Cách này phân các phương pháp nén thành hai họ lớn:

- Nén ảnh không mất thông tin (nén không tổn hao): Với phương pháp này sau khi
giải nén ta khôi phục được chính xác ảnh gốc. Các phương pháp nén này bao gồm mã
hoá Huffman, mã hoá thuật toán…
- Nén ảnh có mất thông tin (nén có tổn hao): Ảnh giải nén có một sự sai khác nhỏ so
với ảnh gốc. Các phương pháp này bao gồm:
Ø Lượng tử hoá vô hướng: PCM và DPCM.
Ø Lượng tử hoá vector.
Ø Mã hoá biến đổi: biến đổi cosin rời rạc (DCT), biến đổi Fourier nhanh
(FFT).
Đồ án tốt nghiệp đại học Chương 2: Các kĩ thuật nén ảnh
Nguyễn Phương Hiền – D04VT2
14

Ø Mã hoá băng con.
Ngoải ra, ta có thể phân loại dựa vào cách thức thực hiện nén. Theo cách này,
người ta cũng phân thành hai họ: Phương pháp nén dữ liệu không gian và phương
pháp sử dụng mã hóa biến đổi. Hoặc cũng có thể phân loại dựa vào lý thuyết mã hóa.
Cách này cũng phân các phương pháp nén thành hai họ: Các phương pháp nén thế hệ
thứ nhất (gồm các phương pháp mà mức độ tính toán là đơn giản, thí dụ việc lấy mẫu,
gán từ mã, ) và các phương pháp nén thế hệ thứ hai (dựa vào độ bão hòa của tỷ lệ
nén).
2.1.4 Các nguyên tắc khi nén ảnh
Một tính chất chung nhất của tất cả các ảnh số đó là tương quan giữa các pixel ở
cạnh nhau lớn, điều này dẫn đến dư thừa thông tin để biểu diễn ảnh. Dư thừa thông tin
sẽ làm cho việc mã hoá không tối ưu. Do đó công việc cần làm để nén ảnh là phải tìm
được các biểu diễn ảnh với tương quan nhỏ nhất để giảm thiểu độ dư thừa thông tin
của ảnh. Thực tế, có hai kiểu dư thừa thông tin được phân loại như sau:
- Dư thừa trong miền không gian: tương quan giữa các giá trị pixel của ảnh, điều này
có nghĩa rằng các pixel lân cận của ảnh có giá trị gần giống nhau (trừ những pixel ở
giáp đường biên ảnh).

- Dư thừa trong miền tần số: Tương quan giữa các mặt phẳng màu hoặc dải phổ khác
nhau.
Trọng tâm của các nghiên cứu về nén ảnh là tìm cách giảm số bit cần để biểu
diễn ảnh bằng việc loại bỏ dư thừa trong miền không gian và miền tần số càng nhiều
càng tốt.
2.1.5 Dư thừa số liệu
Nén số liệu là quá trình giảm lượng số liệu cần thiết để biểu diễn cùng một lượng
thông tin cho trước. Cần phải phân biệt giữa số liệu và thông tin. Thực tế, số liệu và
thông tin không đồng nghĩa với nhau. Số liệu (tín hiệu) chỉ là phương tiện dùng để
truyền tải thông tin. Cùng một lượng thông tin cho trước có thể biểu diễn bằng các
lượng số liệu khác nhau.
Trong nén ảnh số, có ba loại dư thừa số liệu có thể được nhận dạng và phân biệt.
Đồ án tốt nghiệp đại học Chương 2: Các kĩ thuật nén ảnh
Nguyễn Phương Hiền – D04VT2
15

2.1.5.1 Dư thừa mã (Coding Redundancy)
Nếu các mức của tín hiệu video được mã hóa bằng các symbol nhiều hơn cần
thiết (tuyệt đối) thì kết quả là có độ dư thừa mã. Để giảm độ dư thừa mã, trong nén ảnh
thường sử dụng các mã VLC như mã Huffman, mã RLC Lượng thông tin về hình
ảnh có xác suất thấp hơn.
Nguyên lý cơ bản của việc nén ảnh này là các từ mã có độ dài biến đổi, cho phép
gán các từ mã ngắn nhất cho các mức xám có tần suất xuất hiện nhiều nhất trong ảnh.
Câu hỏi được đặt ra là: Cần bao nhiêu bit để thay thế cho các mức xám trong một ảnh.
Đó là, liệu có tồn tại dữ liệu nhỏ đủ để mã hóa đầy đủ một ảnh mà không gây ra tổn
thất?
Ý tưởng này là khởi đầu cho việc thông tin có thể được xử lí giống như cách xử lí
xác suất. Với giả định này, một sự kiện ngẫu nhiên E với xác suất P(E) có chứa lượng
thông tin:
I(E) = log

)(
1
EP
= – log P(E) (2.1) [2]
Nếu P(E) = 1 (sự kiện luôn luôn đúng) thì I(E) = 0 và không có thông tin nào
trong nó. Vì không có sự không chắc chắn nào liên quan tới sự kiện nên sẽ không có
thông tin được truyền tải thông báo rằng sự kiện đó đã xảy ra. Cho một tập hợp các sự
kiện ngẫu nhiên gốc rời rạc {a
1
, a
2
, …, a
j
} có xác suất tương ứng là {P(a
1
), P(a
2
), …,
P(a
j
)}, lượng thông tin trung bình trên mỗi đầu ra (hay còn gọi là entropy) là:
H = –
å
=
J
j
jj
aPaP
1
)(log)(

(2.2) [2]
Nếu một ảnh nhận được là một mẫu “nguồn mức xám”, chúng ta có thể mô hình
hóa các xác suất kí hiệu của nguồn bằng cách sử dụng một ma trận mức xám của ảnh
này và tính toán giá trị xấp xỉ (gọi là xấp xỉ thứ tự ưu tiên: first-order estimate) của
entropy gốc:

~
H
= –
å
=
L
k
krkr
rPrP
1
)(log)( (2.3) [2]
Giá trị xấp xỉ được tính toán bởi hàm entropy (với giả thiết mỗi mức xám được
mã hóa độc lập) có biên thấp hơn nhờ việc loại bỏ dư thừa mã.

×