Tải bản đầy đủ (.pdf) (85 trang)

Nghiên cứu đánh giá hiệu quả các phép biến đổi đa tỉ lệ và ứng dụng trong xử lý ảnh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (5.06 MB, 85 trang )

ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH

TRƯỜNG ĐẠI HỌC BÁCH KHOA
------

LUẬN VĂN THẠC SĨ

NGHIÊN CỨU ĐÁNH GIÁ HIỆU QUẢ CÁC
PHÉP BIẾN ĐỔI ĐA TỈ LỆ VÀ ỨNG DỤNG
TRONG XỬ LÝ ẢNH

HV:

DƯƠNG TẤN VŨ

GVHD:

PGS. TS. LÊ TIẾN THƯỜNG

TP. HỒ CHÍ MINH, NĂM 2013


CƠNG TRÌNH ĐƯỢC HỒN THÀNH TẠI TRƯỜNG
ĐẠI HỌC BÁCH KHOA - ĐHQG – HCM
Cán bộ hướng dẫn khoa học: PGS. TS. Lê Tiến Thường…………………………………………….

Cán bộ chấm nhận xét 1: TS. Võ Trung Dũng……………………………………………………….

Cán bộ chấm nhận xét 2: TS. Hoàng Trang…………………………………………………………..

Luận văn thạc sĩ được bảo vệ tại Trường Đại học Bách Khoa, ĐHQG Tp. HCM ngày 30 tháng 12


năm 2013.
Thành phần Hội đồng đánh giá luận văn thạc sĩ bao gồm:
1. PGS. TS. LÊ TIẾN THƯỜNG.
2. TS. HOÀNG TRANG.
3. TS. VÕ TRUNG DŨNG.
4. TS. HỒNG MINH TRÍ.
5. TS. VÕ NGUYÊN QUỐC BẢO.
Xác nhận của Chủ Tịch Hội đồng đánh giá LV và Trưởng Khoa quản lý chuyên ngành sau khi
luận văn đã được sửa chửa.

CHỦ TỊCH HỘI ĐỒNG

TRƯỞNG KHOA


N/C đánh giá các phép biến đổi đa tỉ lệ và ứng dụng trong xử lý ảnh

GVHD: PGS. TS. Lê Tiến Thường

ĐẠI HỌC QUỐC GIA TP.HCM

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM

TRƯỜNG ĐẠI HỌC BÁCH KHOA

Độc lập -Tự do -Hạnh phúc

NHIỆM VỤ LUẬN VĂN THẠC SĨ
Họ tên học viên:


DƯƠNG TẤN VŨ

MSHV: 12140061

Ngày, tháng, năm sinh:

12/11/1988

Nơi sinh: Quảng Nam

Chuyên ngành:

Kỹ Thuật Điện Tử

Mã số: 605270

I. TÊN ĐỀ TÀI: NGHIÊN CỨU ĐÁNH GIÁ HIỆU QUẢ CÁC PHÉP BIẾN ĐỔI ĐA TỈ LỆ VÀ
ỨNG DỤNG TRONG XỬ LÝ ẢNH
NHIỆM VỤ VÀ NỘI DUNG: Tìm hiểu, phân tích, nghiên cứu các giải thuật đa tỉ lệ (Wavelets,
Ridgelets, Curvelets, Contourlets) và xem xét một cách tồn diện các cơng trình liên quan đến ứng
dụng vào xử lý ảnh: triệt nhiễu. Nhờ đó có thể đưa ra một đánh giá chính xác về các cơng trình liên
quan, tổng hợp và phát triển các ý tưởng để xây dựng phương pháp tương ứng cho việc xử lý ảnh
được tốt và phù hợp cho từng loại ảnh. Tiếp theo, luận văn sẽ thực hiện mô phỏng hệ thống được
thiết kế bằng phần mềm MATLAB và so sánh kết quả với các phương pháp khác, nhằm đưa ra kết
luận, đánh giá cũng như có hướng phát triển cho các cơng trình nghiên cứu tiếp theo.
II. NGÀY GIAO NHIỆM VỤ:

24/06/2013

III. NGÀY HOÀN THÀNH NHIỆM VỤ:


22/11/2013

IV. CÁN BỘ HƯỚNG DẪN:

PGS. TS. LÊ TIẾN THƯỜNG
Tp. HCM, ngày tháng năm 2013

CÁN BỘ HƯỚNG DẪN

CHỦ NHIỆM BỘ MÔN ĐÀO TẠO

TRƯỞNG KHOA KỸ THUẬT ĐIỆN TỬ

Nhiệm vụ luận văn

3

HVTH: Dương Tấn Vũ


N/C đánh giá các phép biến đổi đa tỉ lệ và ứng dụng trong xử lý ảnh

GVHD: PGS. TS. Lê Tiến Thường

LỜI CẢM ƠN
---****--Trước tiên, tôi xin gửi lời cám ơn chân thành đến PGS.TS. Lê Tiến
Thường vì đã cho tôi cơ hội được làm việc trong lĩnh vực xử lý ảnh, với
những hướng dẫn tận tình và đầy kinh nghiệm của thầy, cũng như những
lời động viên, khuyến khích tơi trong suốt q trình thực hiện luận văn. Sự

tận tình của thầy vừa là nguồn động lực vừa tạo cho chúng tơi sự ham
thích nghiên cứu khoa học. Chúng tôi luôn trân trọng những hướng dẫn và
gợi ý rất chuyên môn, sự kiên nhẫn và đặc biệt là sự thân thiện của thầy.

Kế đến, tôi cũng xin được tri ân quý thầy cô khoa Điện- Điện tử, đặc biệt
là Bộ môn Viễn thông đã vung đấp cho chúng tôi nền tảng kiến thức để có
thể thực hiện luận văn này.

Cuối cùng, tơi xin cám ơn gia đình và bạn bè đã giúp đỡ tôi trong suốt thời
gian qua.

Thành phố Hồ Chí Minh, tháng 09 năm 2013
DƯƠNG TẤN VŨ

Lời cảm ơn

4

HVTH: Dương Tấn Vũ


N/C đánh giá các phép biến đổi đa tỉ lệ và ứng dụng trong xử lý ảnh

GVHD: PGS. TS. Lê Tiến Thường

MỤC LỤC
NHIỆM VỤ LUẬN VĂN THẠC SĨ ..................................................................................................... 3
LỜI CẢM ƠN ....................................................................................................................................... 4
MỤC LỤC ............................................................................................................................................. 5
DANH MỤC HÌNH .............................................................................................................................. 6

ABSTRACT .......................................................................................................................................... 8
TÓM TẮT LUẬN VĂN ........................................................................................................................ 9
CHƯƠNG 0.

ĐẶT VẤN ĐỀ ......................................................................................................... 10

CHƯƠNG I.

CƠ SỞ LÝ THUYẾT ............................................................................................... 13

I.

Khái niệm cơ bản về xử lý ảnh. ................................................................................................... 13

1.

Ảnh và pixel: ................................................................................................................................ 13

2.

Ảnh màu và các hệ màu: .............................................................................................................. 14

3.

Các loại định dạng ảnh. ................................................................................................................ 17

4.

Kết luận ........................................................................................................................................ 18


II. Các phép biến đổi đa tỉ lệ ............................................................................................................. 19
1.

Biến đổi Wavelets. ....................................................................................................................... 19

2.

Biến đổi Ridgelets. ....................................................................................................................... 25

3.

Biến đổi Curvelets........................................................................................................................ 37

4.

Biến đổi Contourlets .................................................................................................................... 49

5.

So sánh đánh giá các phép biến đổi đa tỉ lệ trong xử lý ảnh ........................................................ 62

CHƯƠNG II.
I.

ỨNG DỤNG CÁC PHÉP BIẾN ĐỔI ĐA TỈ LỆ VÀO XỬ LÝ ẢNH .................... 64

Wavelets ....................................................................................................................................... 64

II. Ridgelets ...................................................................................................................................... 71
III. Curvelets ...................................................................................................................................... 73

IV. Contourlets ................................................................................................................................... 76
V. So sánh kết quả ............................................................................................................................ 78
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ĐỀ TÀI............................................................................. 82
TÀI LIỆU THAM KHẢO ................................................................................................................... 84

Mục lục

5

HVTH: Dương Tấn Vũ


N/C đánh giá các phép biến đổi đa tỉ lệ và ứng dụng trong xử lý ảnh

GVHD: PGS. TS. Lê Tiến Thường

DANH MỤC HÌNH
Hình 1. Một kết quả triệt nhiễu của nghiên cứu [19]. a) Ảnh nhiễu và b) Ảnh triệt nhiễu sử dụng
Curvelets. ............................................................................................................................ 11
Hình 2. Ảnh nhiễu và ảnh triệt nhiễu bằng Ridgelets bị hiện tượng “wrap-around” trong nghiên cứu
[9]. ...................................................................................................................................... 11
Hình 3. Tọa độ hệ thống màu RGB. ................................................................................................ 15
Hình 4. Hệ màu CMY và CMYK .................................................................................................... 15
Hình 5. Quan hệ giữa các hệ màu RGB và CMY ............................................................................ 16
Hình 6. Mặt phẳng màu CbCr tại Y=0.5 ........................................................................................... 16
Hình 7. Minh họa lưới dyadic với các giá trị của m và n ................................................................. 22
Hình 8. Hàm  (t ) của biến đổi Haar............................................................................................... 23
Hình 9. Hàm  (t ) của biến đổi Meyer ............................................................................................ 23
Hình 10.


Hàm  (t ) của biến đổi Daubechies n với n=2,3,7,8 ...................................................... 24

Hình 11.

Ví dụ về xử lý ảnh bằng Wavelets: Triệt nhiễu. a) ảnh gốc, b) ảnh nhiễu, c) ảnh triệt
nhiễu bằng Wavelets. ...................................................................................................... 25
Biến đổi Ridgelet rời rạc ................................................................................................. 27
Ví dụ về lát cắt Fourier rời rạc với hệ số trung bình tốt nhất .......................................... 35
Tập hợp tối ưu của các vector trung bình cho FRAT với kích thước p = 31 .................. 35
Các quá trình của phép biến đổi Curvelets thế hệ thứ nhất. ............................................ 38
Sơ đồ của phép biến đổi Curvelet First generation. ........................................................ 38
Q trình phân tích khơng gian trong mỗi băng con. ...................................................... 39
Một hình được phân tách thành nhiều băng con khác nhau. ........................................... 41
Biến đổi Ridgelet là cốt lõi của biến đổi Curvelet .......................................................... 42
(a) Một Curvelet với bề rộng 2-j và chiều dài 2-j/2 và (b) một số Curvelet ở độ giãn là 2
và những hướng khác nhau. ............................................................................................ 43
Curvelet ở những tỉ lệ khác nhau (a, b, c, d, e, f) trong một hướng được chỉ ra trong miền
không gian và miền tần số với bên trái và bên phải tương ứng. ...................................... 46
Các Curvelet sẽ lấp đầy không gian bởi những cái nêm (phần được bôi đen) ở trong
miền tần số. ..................................................................................................................... 47
Wrapping Curvelet ở miền tần số bằng các cửa sổ hình chữ nhật như trên. ................... 47
Các bước của q trình biến đổi Curvelet based Wrapping ............................................ 48
Mơ hình cấu trúc của phép biến đổi Contourlets ............................................................ 51
Vẽ đường cong bằng Wavelets và bằng Contourlets. ..................................................... 51
Bộ lọc Laplace Pyramids và bộ lọc Directional Filter Bank ........................................... 52
Quá trình phân tích ảnh. .................................................................................................. 53
Bộ lọc tổng hợp tín hiệu. ................................................................................................. 53
Mặt phẳng chia miền tần số theo các hướng. .................................................................. 54
Bộ lọc hai kênh quincunx................................................................................................ 54
Phép toán Shearing ảnh ................................................................................................... 55

Cấu trúc cây của DFB chia ảnh làm các hướng. ............................................................. 55
(a) Các không gian con đa tỉ lệ và đa hướng được tạo ra bởi cấu trúc Contourlets. (b)

Hình 12.
Hình 13.
Hình 14.
Hình 15.
Hình 16.
Hình 17.
Hình 18.
Hình 19.
Hình 20.
Hình 21.
Hình 22.
Hình 23.
Hình 24.
Hình 25.
Hình 26.
Hình 27.
Hình 28.
Hình 29.
Hình 30.
Hình 31.
Hình 32.
Hình 33.
Hình 34.

(l )

lưới nhúng của khơng gian con W j ,kj ............................................................................. 56

Hình 35.
Hình 36.

Biên ảnh khơi phục trơn hơn so với Wavelets ................................................................ 57
Mơ hình chia 4 và chia 8 hướng dùng Contourlets ......................................................... 57

Danh mục hình

6

HVTH: Dương Tấn Vũ


N/C đánh giá các phép biến đổi đa tỉ lệ và ứng dụng trong xử lý ảnh

GVHD: PGS. TS. Lê Tiến Thường

Hình 37. Cấu trúc phân tích hình cây của Contourlet .................................................................... 57
Hình 38. Ví dụ về biến đổi Contourlets ......................................................................................... 58
Hình 39. Bộ lọc khơng lấy mẫu băng con hai kênh ....................................................................... 60
Hình 40. Tháp khơng lấy mẫu con ................................................................................................. 60
Hình 41. Mặt phẳng miền tần số được phân tích ........................................................................... 61
Hình 42. Băng lọc có hướng khơng lấy mẫu con ........................................................................... 61
Hình 43. Đáp ứng tần số của hai bộ lọc sau khi đã lấy mẫu lên .................................................... 61
Hình 44. Ví dụ 4 hướng miền tần số .............................................................................................. 62
Hình 45. Contourlet khơng lấy mẫu con ........................................................................................ 62
Hình 46. Biến đổi DWT 2 mức. ..................................................................................................... 65
Hình 47. Ngưỡng cứng và ngưỡng mềm........................................................................................ 66
Hình 48. Ảnh gốc và ảnh nhiễu...................................................................................................... 67
Hình 49. Các hệ số nhiễu và hệ số ngưỡng .................................................................................... 67

Hình 50. Ảnh nhiễu và ảnh triệt nhiễu cứng (Giap_general). SNR=19.4 ...................................... 68
Hình 51. Ảnh nhiễu và ảnh triệt nhiễu cứng (dhbk). SNR=19.6.................................................... 68
Hình 52. Ảnh nhiễu và ảnh triệt nhiễu cứng (cameraman). SNR=22.1 ......................................... 68
Hình 53. Ảnh nhiễu và ảnh triệt nhiễu cứng (Barbara). SNR=18.5 ............................................... 68
Hình 54. Các giá trị SNR của triệt nhiễu cứng ứng với các giá trị mức ngưỡng T ........................ 69
Hình 55. Các giá trị PSNR của triệt nhiễu cứng ứng với các giá trị mức ngưỡng T...................... 69
Hình 56. Ảnh nhiễu và ảnh triệt nhiễu mềm (Giap_general). SNR=19.8 ...................................... 70
Hình 57. Ảnh nhiễu và ảnh triệt nhiễu mềm (dhbk). SNR=20.4 ................................................... 70
Hình 58. Ảnh nhiễu và ảnh triệt nhiễu mềm (cameraman). SNR=22.7 ......................................... 70
Hình 59. Ảnh nhiễu và ảnh triệt nhiễu mềm (Barbara). SNR=19.7 ............................................... 70
Hình 60. Các giá trị SNR của triệt nhiễu mềm ứng với các giá trị mức ngưỡng T ........................ 71
Hình 61. Các giá trị PSNR của triệt nhiễu mềm ứng với các giá trị mức ngưỡng T ..................... 71
Hình 62. So sánh các giải thuật triệt nhiễu với ảnh 257 x 257....................................................... 72
Hình 63. Ridgelets và hiện tượng “bọc-quanh” (wrap-around) ..................................................... 73
Hình 64. Ảnh triệt nhiễu bằng Curvelets (Giap_general). SNR=22.3 ........................................... 74
Hình 65. Ảnh triệt nhiễu bằng Curvelets (dhbk). SNR=20.6 ......................................................... 74
Hình 66. Ảnh triệt nhiễu bằng Curvelets (cameraman). SNR=24.3 .............................................. 74
Hình 67. Ảnh triệt nhiễu bằng Curvelets (Barbara). SNR=21.1 .................................................... 75
Hình 68. Các giá trị SNR của triệt nhiễu bằng Curvelets ứng với các giá trị mức ngưỡng ........... 75
Hình 69. Các giá trị PSNR của triệt nhiễu bằng Curvelets ứng với các giá trị mức ngưỡng ......... 76
Hình 70. Ảnh nhiễu và ảnh triệt nhiễu sử dụng Contourlets (Giap_general). SNR=19.2 .............. 76
Hình 71. Ảnh nhiễu và ảnh triệt nhiễu sử dụng Contourlets (dhbk). SNR=22.2 ........................... 76
Hình 72. Ảnh nhiễu và ảnh triệt nhiễu sử dụng Contourlets (cameraman). SNR=22 .................... 77
Hình 73. Ảnh nhiễu và ảnh triệt nhiễu sử dụng Contourlets (Barbara). SNR=17.8....................... 77
Hình 74. Các giá trị SNR của triệt nhiễu bằng Contourlets ứng với các giá trị mức ngưỡng ........ 77
Hình 75. Các giá trị PSNR của triệt nhiễu bằng Contourlets ứng với các giá trị mức ngưỡng...... 78
Hình 76. So sánh giá trị SNR, PSNR và thời gian xử lý của các giải thuật triệt nhiễu. ................. 78
Hình 77. So sánh tỉ số SNR của các giải thuật ............................................................................... 79
Hình 78. So sánh tỉ số PSNR của các giải thuật............................................................................. 79
Hình 79. So sánh khả năng xử lý đường cong của các phép biến đổi trên ảnh Giap_general: a)

Wavelets ngưỡng cứng, b) Wavelets ngưỡng mềm, c) Curvelets, d) Contourlets. ............................. 80

Danh mục hình

7

HVTH: Dương Tấn Vũ


N/C đánh giá các phép biến đổi đa tỉ lệ và ứng dụng trong xử lý ảnh

GVHD: PGS. TS. Lê Tiến Thường

ABSTRACT
The multiscale transforms have long been applied in digital signal processing due to their
advantages such as: the ability to analyze the frequencies at a point of time (space), the
ability to handle the curves .... Although there are many related researches, but there is no
research to be able to evaluate and synthesize the results and effectiveness of the
mutiscale transforms, include Wavelets, Ridgelets, Curvelets, Contourlets in image
processing. In this thesis, in turn the multiscale transforms and related research in image
processing will be researched. Then getting the core elements of image processing using
multiscale transforms, building the corresponding ideas for a good image processing and
suitable for each kind of images.

Các phép biến đổi đa tỉ lệ từ lâu đã được áp dụng rất nhiều vào trong xử lý số tín hiệu
nhờ các ưu điểm của chúng như: khả năng phân tích tần số tại một điểm thời gian (không
gian), khả năng xử lý các đường cong....Mặc dù đã có rất nhiều các cơng trình liên quan,
nhưng vẫn chưa có một cơng trình nào có khả năng đánh giá và tổng hợp các kết quả
cũng như tính hiệu quả của các phương pháp biến đổi đa tỉ lệ, bao gồm Wavelets,
Ridgelets, Curvelets, Contourlets trong xử lý ảnh. Trong luận văn này, tôi thực hiện việc

lần lượt nghiên cứu các phép biến đổi đa tỉ lệ và các cơng trình liên quan trong xử lý ảnh.
Nhờ đó rút ra được các yếu tố cốt lõi trong xử lý ảnh bằng các phép biến đổi đa tỉ lệ, xây
dựng ý tưởng tương ứng cho việc xử lý ảnh được tốt và phù hợp cho từng loại ảnh.

Abstract

8

HVTH: Dương Tấn Vũ


N/C đánh giá các phép biến đổi đa tỉ lệ và ứng dụng trong xử lý ảnh

GVHD: PGS. TS. Lê Tiến Thường

TÓM TẮT LUẬN VĂN
Trong những năm gần đây, cùng với sự phát triển như vũ bão của khoa học công nghệ, kỹ thuật xử
lý ảnh cũng đạt được những tiến bộ vượt bậc. Trước đây phép biến đổi Fourier được sử dụng một
cách rộng rãi, nhưng nó cũng có một nhược điểm cơ bản, đó là ta khơng thể biết được rằng tại một
điểm a thì có các thành phần tần số nào. Một phép biến đổi tốt hơn biến đổi Fourier phải là phép
biến đổi có đầy đủ tính năng của biến đổi Fourier và có khả năng xác định xem tại điểm a bất kỳ
trong ảnh có thành phần tần số nào. Phép biến đổi Wavelets ra đời đã khắc phục được các nhược
điểm của biến đổi Fourier trong phân tích tín hiệu. Biến đổi Wavelets dù chỉ làm việc với các tín
hiệu một chiều (liên tục hoặc rời rạc) nhưng có thể cho ta một hàm số hai biến hoặc một tập các cặp
giá trị W (a,b) minh họa các thành phần tần số khác nhau tại điểm t. Tuy vậy, biến đổi wavelets
cũng thể hiện các hạn chế khi phân tích các đặc điểm cong tồn tại phổ biến trong ảnh. Nguyên nhân
là vì các hệ số của biến đổi wavelets hai chiều chỉ chứa thơng tin vị trí ở các tỉ lệ khác nhau, và
hồn tồn khơng có thơng tin biểu diễn hướng hay góc. Nghĩa là các hệ số wavelets khơng thể xác
định được quan hệ thể hiện là một đoạn thẳng hay đoạn cong. Các giải thuật đa tỉ lệ khác là
Ridgelets, Curvelets và Contourlets sẽ giải quyết được vấn đề này.

Luận văn này sẽ tập trung vào hai vấn đề chính, đó là tìm hiểu, phân tích, nghiên cứu các giải thuật
đa tỉ lệ (Wavelets, Ridgelets, Curvelets, Contourlets) và xem xét một cách tồn diện các cơng trình
liên quan đến ứng dụng vào xử lý ảnh: triệt nhiễu. Nhờ đó có thể đưa ra một đánh giá chính xác về
các cơng trình liên quan, tổng hợp và phát triển các ý tưởng để xây dựng phương pháp tương ứng
cho việc xử lý ảnh được tốt và phù hợp cho từng loại ảnh. Tiếp theo, luận văn sẽ thực hiện mô
phỏng hệ thống được thiết kế bằng phần mềm MATLAB và so sánh kết quả với các phương pháp
khác. Cuối cùng là kết luận và hướng phát triển đề tài.

Tổng quan đề tài

9

HVTH: Dương Tấn Vũ


N/C đánh giá các phép biến đổi đa tỉ lệ và ứng dụng trong xử lý ảnh

CHƯƠNG 0.

GVHD: PGS. TS. Lê Tiến Thường

ĐẶT VẤN ĐỀ

Trong những năm gần đây, cùng với sự phát triển của mạng dữ liệu trên nền internet, nhu cầu chia
sẻ ảnh cũng ngày càng phát triển. Cùng với nhu cầu đó, vấn đề đặt ra là làm thế nào tìm được một
kỹ thuật xử lý ảnh tốt, có khả năng xử lý tốt mọi loại ảnh cũng ngày càng cấp thiết.
Mục đích của luận văn là trình bày một số kỹ thuật xử lý ảnh phổ biến hiện nay. Đó là các phép
biến đổi Wavelets, Ridgelets, Curvelets, Contourlets. Mỗi phép biến đổi có một ưu, nhược riêng.
Trước đây, biến đổi Wavelets được giới thiệu như sự cải tiến của biến đổi Fourier và ngày càng
được ứng dụng rộng rãi trong nhiều lĩnh vực [10]. Lý do chính là dữ liệu biến đổi Wavelets biểu

diễn được thơng tin trong cả miền tần số và không gian (trong khi biến đổi Fourier chỉ thể hiện
trong miền tần số) nhờ vào xây dựng thông tin tần số xuất hiện ở các tỉ lệ và vị trí khác nhau[3],
[22].
Tiêu biểu các cơng trình nghiên cứu ở nước ngồi về Wavelets như của tác giả Daubechies [2] hay
[6] với những nền tảng chung về Wavelets. Hay của tác giả J.-L.Starck [1], [5] và tác giả D.L.
Donoho [23], [24], [25], [26] trình bày về ứng dụng của Wavelets vào xử lý ảnh. Tuy vậy, biến đổi
wavelets cũng thể hiện các hạn chế khi phân tích các đặc điểm cong tồn tại phổ biến trong ảnh
[17]. Nguyên nhân là vì các hệ số của biến đổi wavelets hai chiều chỉ chứa thông tin vị trí ở các tỉ
lệ khác nhau, và hồn tồn khơng có thơng tin biểu diễn hướng hay góc.
Chính vì lý do này, một loạt các phép biến đổi khác được phát triển nhằm khắc phục nhược điểm
này như phép biến đổi Ridgelets, Contourlets hay Curvelets. Ở nước ngoài, rất nhiều nghiên cứu
đã được đưa ra dựa trên các phép biến đổi này như của tác giả J.-L. Starck [4] hay Minh N. Do và
Martin Vetterli [7], [8], [9], [20], [21] hoặc [11]… Cịn ở Việt Nam thì một loạt các cơng trình
nghiên cứu của PGS.TS Lê Tiến Thường và các cộng sự trong thời gian gần đây [28], [29, [30]...
Một trong những phép biến đổi mới được đưa ra là Ridgelets, được giới thiệu bởi Candes và
Donoho [27], [12], [13] và họ đã chứng tỏ được khả năng xử lý có hiệu quả của giải thuật này với
các thành phần cạnh. Theo sau là một loạt các nghiên cứu của J.-L. Starck [4], Minh N. Do, and
Martin Vetterli [9] và nhiều tác giả khác [14], [15], [16]. Biến đổi này có thể trình bày một cách có
hiệu quả ba thơng số: tỉ lệ, vị trí và hướng của ảnh [11]. Tuy nhiên biến đổi này lại vấp phải một
vấn đề, đó là bị hiện tượng “wrap-around” [9].
Một trong những phép biến đổi tiếp theo đạt được những thành công nhất định là phép biến đổi
Curvelets với một loạt các nghiên cứu mạnh mẽ cả trong và ngoài nước. Ở ngoài nước là các
nghiên cứu của các tác giả J.-L. Starck [4], [19] và trong nước là các tác giả Hoàng Anh Ngọ,
Đặt vấn đề

10

HVTH: Dương Tấn Vũ



N/C đánh giá các phép biến đổi đa tỉ lệ và ứng dụng trong xử lý ảnh

GVHD: PGS. TS. Lê Tiến Thường

Nguyễn Ngọc Hải [18] và đặc biệt là các nghiên cứu gần đây của PGS.TS Lê Tiến Thường và các
cộng sự [28], [30] đã thể hiện khả năng xử lý tốt của phép biến đổi này, đây là một phép biến đổi
đầy tiềm năng.

a)

b)

Hình 1. Một kết quả triệt nhiễu của nghiên cứu [19]. a) Ảnh nhiễu và b) Ảnh triệt
nhiễu sử dụng Curvelets.

Hình 2. Ảnh nhiễu và ảnh triệt nhiễu bằng Ridgelets bị hiện tượng “wrap-around”
trong nghiên cứu [9].
Một phép biến đổi khác là Contourlets cũng được nghiên cứu mạnh mẽ trong thời gian gần đây

Đặt vấn đề

11

HVTH: Dương Tấn Vũ


N/C đánh giá các phép biến đổi đa tỉ lệ và ứng dụng trong xử lý ảnh

GVHD: PGS. TS. Lê Tiến Thường


như của các tác giả Minh N. Do và Martin Vetterli [20], [21], PGS.TS Lê Tiến Thường và các
cộng sự [29]. Đây cũng là một phép biến đổi hứa hẹn trong tương lai.
Tuy nhiên từ trước đến nay vẫn chưa có một tài liệu nào có đánh giá cụ thể và so sánh khả năng xử
lý ảnh của các phép biến đổi này. Luận văn sẽ dùng kết quả thực nghiệm của một ứng dụng xử lý
ảnh cơ bản, đó là triệt nhiễu, để đánh giá hiệu quả xử lý của các phép biến đổi. Thông số đánh giá
là SNR, PSNR và hiệu ứng thị giác. Đặc biệt luận văn sẽ có đánh giá khả năng xử lý đường cong
của mỗi phép biến đổi, đây là vấn đề mà phép biến đổi Wavelets xử lý khơng tốt. Ngồi ra, luận
văn còn đánh giá thời gian xử lý của mỗi phép biến đổi, qua đó thể hiện được hiệu suất tiêu tốn tài
nguyên của các phép biến đổi. Thông qua các kết quả thực nghiệm thu được, luận văn sẽ có đánh
giá khả năng xử lý của mỗi phép biến đổi. Điều này hứa hẹn sẽ đem lại một cái nhìn tổng qt và
giúp người đọc có đánh giá của riêng mình mỗi khi lựa chọn một phép biến đổi nào để ứng dụng
trong xử lý ảnh.

Đặt vấn đề

12

HVTH: Dương Tấn Vũ


N/C đánh giá các phép biến đổi đa tỉ lệ và ứng dụng trong xử lý ảnh

CHƯƠNG I.

GVHD: PGS. TS. Lê Tiến Thường

CƠ SỞ LÝ THUYẾT

Trong những năm 80 của thế kỷ trước, biến đổi wavelets được giới thiệu như sự cải tiến của biến
đổi Fourier và ngày càng được ứng dụng rộng rãi trong nhiều lĩnh vực. Lý do chính là dữ liệu biến

đổi wavelets biểu diễn được thơng tin trong cả miền tần số và không gian (trong khi biến đổi
Fourier chỉ thể hiện trong miền tần số) nhờ vào xây dựng thông tin tần số xuất hiện ở các tỉ lệ và vị
trí khác nhau. Trong xử lý ảnh, khái niệm đa tỉ lệ đóng góp rất nhiều vào các kỹ thuật phân rã hay
phân tích ảnh như Wavelets, Ridgelets... ta có thể nhận xét là các thông tin ảnh xuất hiện ở một số tỉ
lệ nhất định là khác nhau. Nhận xét này có thể quan sát được ở lĩnh vực bản đồ, trong đó một số chi
tiết chỉ xuất hiện ở tỉ lệ nhỏ, nhưng không xuất hiện ở tỉ lệ lớn và ngược lại. Hoặc trong ảnh sinh
học, chúng ta có thể khai thác và phân tích thơng tin ở mức độ phân tử hay tế bào. Từ nhận xét trên,
ta thấy kỹ thuật đa tỉ lệ rất thích hợp trong các bài tốn phân tích hình ảnh ở các tỉ lệ khác nhau.
Đặc biệt phương pháp dựa trên biến đổi đa tỉ lệ tỏ ra rất thích hợp khi chất lượng ảnh khơng tốt.
I. Khái niệm cơ bản về xử lý ảnh.
Chương này nêu lên các khái niệm cơ bản trong lĩnh vực xử lý ảnh như ảnh số, pixel, hệ màu,
các định dạng ảnh,…Xử lý ảnh hiện nay đã trở nên phổ biến, do đó các khái niệm này khơng q
xa lạ.
1. Ảnh và pixel:
1.1. Ảnh tương tự
Một bức ảnh là một hàm số độ sáng hai chiều f(x,y) , trong đó (x,y) là tọa độ không gian
của ảnh, và giá trị f tại tọa độ (x,y) biểu thị cho giá trị độ sáng tại tọa độ đó. Ta có:

0  f ( x, y)  

f ( x, y)  i( x, y)r ( x, y)

(1.1)

Trong đó i( x, y) : : hàm số biểu thị giá trị của nguồn sáng tác động lên cảm biến, hay nơi
thu nhận ảnh.

0  i( x, y)  
r(x,y) : hàm số biểu thị độ phản chiếu của vật thể với nguồn sáng lên cảm biến.


0  r ( x, y)  1 : giá trị 0 nghĩa là nguồn sáng bị hấp thụ hoàn toàn, trong khi giá trị 1 nghĩa
là nguồn sáng hoàn toàn xuyên qua vật đến cảm biến.

Cơ sở lý thuyết

13

HVTH: Dương Tấn Vũ


N/C đánh giá các phép biến đổi đa tỉ lệ và ứng dụng trong xử lý ảnh

GVHD: PGS. TS. Lê Tiến Thường

1.2. Ảnh số và pixel:
Ảnh số là một bức ảnh f(x,y) được lượng tử và rời rạc hóa cả về tọa độ không gian lẫn độ
sáng.

 f (0, 0)
 f (1, 0)
f ( x, y )  

...

 f ( M  1, 0)

f (0,1)

...


f (1,1)

...

...

...

f ( M  1,1) ...

f (0, N  1) 
f (1, N  1) 
A

...

f ( M  1, N  1) 

(1.2)

Ma trận được gọi là một bức ảnh số với kích thước MxN của bức ảnh tương tự f(x,y),
mỗi phần tử trong ma trận A được gọi là một điểm ảnh số, hay pixel. Giá trị của mỗi
pixel được gọi là mức xám G của pixel đó. Mức xám G thuộc khoảng thang xám [Lmin,
max]

.

Để có thể số hóa một bức ảnh tương tự sang ảnh số, ta sẽ đặt bức ảnh tương tự f(x,y) lên
một lưới của mặt phẳng tọa độ Oxy. Các tọa độ lúc này sẽ được số hóa để có kích thước
MxN trong khi độ sáng sẽ được lượng tử để cho ra mức xám G.

Thông thường M=2m, N=2n , G=2k và bức ảnh sẽ có dung lượng MxNxG.
Cùng một bức ảnh tương tự f(x,y), khi được số hóa, thì chất lượng của bức ảnh số sẽ phụ
thuộc vào độ lớn của M, N, G. Nếu khoảng cách giữa các điểm ảnh và các mức xám quá
lớn, mà giá trị M, N, G quá nhỏ thì chất lượng bức ảnh số sẽ kém và ngược lại.

2. Ảnh màu và các hệ màu:
Một hệ thống màu là một hệ thống mà mỗi điểm trong đó được tương ứng duy nhất với một
màu. Các hệ thống màu khác nhau sẽ được định hướng theo phần cứng (màn hình màu hoặc
máy in) hoặc phụ thuộc vào ứng dụng.
Các hệ màu cơ bản đối với xử lý ảnh là RGB, CMY/CMYK, YUV.
Phần này sẽ nêu tóm lược về các hệ thống màu này.
1.3. Hệ màu RGB:
Hệ màu RGB là một hệ màu dựa theo tọa độ Descartes. Không gian của màu là một hình
khối lập phương với ba giá trị màu là red, green và blue nằm ở ba góc của hệ tọa độ và
ba màu cyan, megenta và yellow nằm ở ba góc khác của khối lập phương.

Cơ sở lý thuyết

14

HVTH: Dương Tấn Vũ


N/C đánh giá các phép biến đổi đa tỉ lệ và ứng dụng trong xử lý ảnh

GVHD: PGS. TS. Lê Tiến Thường

Hình 3. Tọa độ hệ thống màu RGB.
Màu black là cơ bản, nằm ở gốc tọa độ, còn màu White nằm ở góc xa nhất so với gốc tọa
độ. Các mức xám được đề cập ở phần 1.2 thuộc đường thẳng nối liền giữa hai điểm black

và white.
Mỗi điểm màu khác nhau trong khối lập phương được định nghĩa bằng vector từ nó đến
gốc tọa độ, và là sự kết hợp của ba màu cơ bản R, G, B. Các giá trị của màu R, G, B được
chuẩn hóa giá trị trong khoảng [0,1].
Số bit dùng để biểu diễn một pixel được gọi là độ sâu của điểm ảnh (pixel depth). Giả sử
mỗi điểm thành phần R, G, B được mã hóa bằng 8 bit thì ta nói hệ màu RGB có độ sâu là
24 (24=8x3). Các ảnh dùng hệ màu này thường được gọi là full-color image. Số lượng
màu tổng cộng là (28)3 = 224=16777216 màu.
Hệ màu RGB là hệ màu thường dùng trong màn hình màu.
1.4. Hệ màu CMY/CMYK:
Hệ màu CMY sử dụng các màu Cyan, Magenta và Yellow làm ba màu cơ bản. Các loại
máy in thường sử dụng hệ màu này. Sự chuyển đổi giữa 2 hệ màu RGB và CMY là:
 C  1  R 
 M   1  G 
    
 Y  1  B 

(1.3)

Hình 4. Hệ màu CMY và CMYK
Cơ sở lý thuyết

15

HVTH: Dương Tấn Vũ


N/C đánh giá các phép biến đổi đa tỉ lệ và ứng dụng trong xử lý ảnh

GVHD: PGS. TS. Lê Tiến Thường


Hình 5. Quan hệ giữa các hệ màu RGB và CMY
Người ta sử dụng hệ màu CMYK để tạo một hệ màu tối hơn (K biểu thị màu đen)
 C '   C  K 
 M '   M    K  , K  min C , M , Y
     
 Y '   Y   K 

(1.4)

1.5. Hệ màu YUV (YCbCr):
Hệ màu này được dùng đầu tiên cho video hệ PAL analog, tuy nhiên bây giờ nó được
dùng cho chuẩn CCIR 601 của video số. Nó tách riêng thành phần độ sáng từ thông tin về
màu sắc và thành phần độ sáng được mã hóa trong Y thành hai thành phần màu bluedifference (Cb) và red-difference (Cr).
Y  0.299 R  0.587G  0.114 B

Cb  B  Y


Cr  R  Y


(1.5)

Y  0.299 R  0.587G  0.114 B

U  0.565( B  Y )


V  0.713( R  Y )



(1.6)

Hình 6. Mặt phẳng màu CbCr tại Y=0.5
Cơ sở lý thuyết

16

HVTH: Dương Tấn Vũ


N/C đánh giá các phép biến đổi đa tỉ lệ và ứng dụng trong xử lý ảnh

GVHD: PGS. TS. Lê Tiến Thường

3. Các loại định dạng ảnh.
3.1 BMP
BMP hay còn gọi là bitmap là một dạng tập tin hình ảnh phổ biến. Đặc điểm nổi bật của
định dạng này là ảnh khơng bị nén bởi bất kỳ một thuật tốn nào. Do đó thơng thường,
ảnh bitmap có dung lượng lớn hơn so với các định dạng khác.
Cấu trúc của ảnh BMP gồm:
Bitmap header (14 bytes): giúp nhận dạng file ảnh bitmap.
Bitmap information (40 bytes): chứa các thông tin cơ bản về ảnh như số bit/pixel, kích
thước, vị trí bắt đầu vùng data ảnh, v.v…
Color palette: định nghĩa các màu được sử dụng trong ảnh.
Bitmap data: lưu dữ liệu ảnh.
3.2 GIF
GIF (Graphics Interchange Format) là một kiểu định dạng ảnh ra đời từ năm 1987 bởi
hãng CompuServe, sử dụng thuật toán nén khơng tổn hao LZW. Ảnh GIF có độ dài tối đa

8 bit, được đánh chỉ số (index) trong bảng màu cho phép tạo nền trong suốt.
3.3 JPEG/JFIF/JPEC 2000
JPEG (Join Photographic Experts Group) là sự kết hợp của CCITT và ISO bắt đầu từ
tháng 6 năm 1987 đến 1991. JPEG là một phương pháp nén. Nhược điểm chính của
JPEG là các ảnh được nén bằng thuật tốn có tổn hao, thơng tin có thể bị mất nhiều khi
hệ số nén lớn. Tuy nhiên, đối với hình ảnh có chất lượng màu cao như “High color” thì
việc mất mát dữ liệu là không đáng kể. File ảnh nén JPEG thường được lưu trữ dưới định
dạng file JFIF (JPEG File Interchange Format). Gần như tất cả các camera số có thể lưu
ảnh dưới dạng JPEG, có hỗ trợ 8 bit mỗi màu (3 màu 24 bit tổng cộng).
JPEG 2000 là một chuẩn nén ảnh cho phép cả nén không tổn hao và nén tổn hao. Phương
pháp nén ảnh ở JPEG 2000 khác so với JPEG/JFIF; nó cải thiện chất lượng ảnh và hệ số
nén, nhưng bù lại yêu cầu nhiều phép tính tốn hơn. JPEG 2000 cũng thêm vào các tính
năng bị thiếu trong JPEG. JPEG 2000 không phổ biến như JPEG, nhưng nó được sử dụng
rất nhiều trong các chương trình chỉnh sửa phim chuyên nghiệp.
3.4 Exif
Exif (Exchangeable image file format) là một chuẩn định dạng file giống với định dạng
JFIF với sự mở rộng TIFF; nó được kết hợp trong phần mềm tạo file JPEG có trong nhiều
camera. Mục đích của nó là để ghi lại và chuẩn hóa việc trao đổi dữ liệu hình ảnh giữa

Cơ sở lý thuyết

17

HVTH: Dương Tấn Vũ


N/C đánh giá các phép biến đổi đa tỉ lệ và ứng dụng trong xử lý ảnh

GVHD: PGS. TS. Lê Tiến Thường


máy ảnh số và phần mềm chỉnh sửa ảnh. Dữ liệu được ghi lại bao gồm các thiết lập
camera, ngày giờ, tốc độ màn sập (shutter), thông tin màu sắc, kích cỡ ảnh,…
3.5 TIFF
TIFF (Tag Image File Format) là định dạng chủ yếu để lưu trữ ảnh bao gồm cả đồ thị lẫn
hình ảnh. Định dạng này được xây dựng đầu tiên bởi hãng Aldus kết hợp với Microsoft
để dùng cho kỹ thuật in Postscript. TIFF là định dạng thơng dụng cho các ảnh có dải tần
màu rộng và sâu, phát triển song song với các máy quét ảnh do đó ngày càng trở thành
một định dạng hữu dụng trong in ấn vì vừa bảo tồn thơng tin vì sử dụng các giải thuật
nén không tổn hao LZW, ZIP… vừa giảm dung lượng.
3.6 RAW
Định dạng RAW là một trong những tùy chọn trong các máy ảnh số. Định dạng này
thường sử dụng thuật tốn nén ảnh khơng tổn hao, và tạo ra ảnh có dung lượng nhỏ hơn
nhiều so với định dạng TIFF. Mặc dù có một tiêu chuẩn của định dạng file raw (ISO
12234-2, TIFF/EP), các định dạng raw được sử dụng bởi nhiều camera khơng được chuẩn
hóa, mỗi camera khác nhau sẽ cho một định dạng raw khác nhau.
3.7 PNG
PNG (Portable Network Graphics) là định dạng tập tin hình ảnh cũng có đặc điểm là nén
khơng tổn hao, được ra đời với mục đích tạo nên một chuẩn mực mới cho ảnh sử dụng
trong đồ họa web, cải thiện và thay thế ảnh GIF.
3.8 PPM/PGM/PBM/PNM
Họ định dạng Netpbm bao gồm định dạng PPM (Portable Pixmap), PGM (Portable
Graymap) và PBM (Portable bitmap). Các định dạng này là thuần túy ASCII hoặc là tập
tin nhị phân raw với header ASCII, cung cấp các chức năng cơ bản chuyển đổi mặt phẳng
điểm ảnh (pixmap), mặt phẳng độ xám (graymap) và mặt phẳng bit (bitmap) giữa các nền
tảng (platform) khác nhau. Một vài ứng dụng xem các định dạng này một cách chung, gọi
là PNM (Portable Any Map)
3.9 WEBP
Định dạng WebP là định dạng hình ảnh mới, sử dụng thuật tốn nén tổn hao. Định dạng
này được thiết kế bởi Google để giảm kích cỡ file nhằm mục đích tăng tốc độ load trang
web. Mục đích chính của WebP là thay thế JPEG để trở thành định dạng chính của hình

ảnh trên các trang web.
4. Kết luận
Chương 1 đã cung cấp một số kiến thức cơ bản về xử lý ảnh, về pixel (điểm ảnh), các hệ màu
Cơ sở lý thuyết

18

HVTH: Dương Tấn Vũ


N/C đánh giá các phép biến đổi đa tỉ lệ và ứng dụng trong xử lý ảnh

GVHD: PGS. TS. Lê Tiến Thường

và các định dạng ảnh khác nhau trên máy tính. Đây là những kiến thức căn bản để bước vào
bộ môn xử lý ảnh.
II. Các phép biến đổi đa tỉ lệ
1. Biến đổi Wavelets.
1.1 Biến đổi Wavelets liên tục (CWT)
Biến đổi Wavelets liên tục (Continuous Wavelets Transform - CWT) của một hàm f(t)
được bắt đầu từ một hàm Wavelets mẹ (mother Wavelet) ψ (t ) . Hàm Wavelets mẹ ψ (t )
có thể là bất kỳ một hàm số thực hoặc phức liên tục nào thoả mãn các tính chất sau đây:
Tích phân suy rộng trên tồn bộ trục t của hàm ψ (t ) là bằng 0. Tức là:


  (t )dt  0

(1.7)




Tích phân năng lượng của hàm trên toàn bộ trục t là một số hữu hạn, tức là:


  (t )

2

dt  

(1.8)



Điều kiện (1.8) có nghĩa là hàm ψ (t ) phải là một hàm bình phương khả tích nghĩa là hàm
ψ (t ) thuộc khơng gian L2 (R) các hàm bình phương khả tích.
Sau khi hàm Wavelets ψ (t ) được lựa chọn, biến đổi Wavelets liên tục của một hàm bình
phương khả tích f (t ) được tính theo cơng thức:


W(a, b) 



f (t )

1
a




 t b 
dt
 a 

*

(1.9)

Biến đổi này là một hàm của hai tham số thực a và b. Dấu * ký hiệu là liên hiệp phức của ψ
(t ) . Nếu chúng ta định nghĩa một hàm  a ,b (t ) theo biểu thức:

 a ,b (t ) 

1
a

 t b 

 a 

*

(1.10)

f (t ) a ,b (t )dt

(1.11)

chúng ta có thể viết được:



W(a, b) 





Theo tốn học ta gọi đây là tích vơ hướng của hai hàm f (t ) và  a ,b (t ) .
Cơ sở lý thuyết

19

HVTH: Dương Tấn Vũ


N/C đánh giá các phép biến đổi đa tỉ lệ và ứng dụng trong xử lý ảnh

Giá trị

1
a

GVHD: PGS. TS. Lê Tiến Thường

là hệ số chuẩn hoá để đảm bảo rằng tích phân năng lượng của hàm  a ,b (t ) sẽ

độc lập với a và b :







(t ) dt    (t ) dt
2

a ,b



2

(1.12)



Với mỗi giá trị của a thì  a ,b (t ) là một bản sao của  0,b (t ) được dịch đi b đơn vị trên trục
thời gian. Do đó b được gọi là tham số dịch.
Đặt tham số dịch b = 0 ta thu được:
1

 a ,0 (t ) 

a

t
 

 

a

(1.13)

điều đó cho thấy rằng a là tham số tỷ lệ.
Khi a >1 thì hàm Wavelets sẽ được trải rộng cịn khi 0 < a <1 thì hàm sẽ được co lại. Sau
đây chúng ta sẽ định nghĩa phép biến đổi ngược của biến đổi Wavelets liên tục. Gọi Ψ(ω )
là biến đổi Fourier của ψ (t ):


 ( )    (t )e jt dt

(1.14)



Nếu W (a,b) là biến đổi CWT của f (t ) bằng hàm Wavelets ψ (t ) , thì biến đổi ngược của
biến đổi CWT sẽ được tính như sau:
 

f (t ) 

1
1
W (a, b) a ,b (t )dadb


C   a 2

(1.15)


với giá trị của C được định nghĩa là:


C





 ( )



2

d

(1.16)

Biến đổi CWT chỉ tồn tại nếu C dương và hữu hạn. Do đó C được gọi là điều kiện tồn tại
của biến đổi Wavelets. Cùng với hai điều kiện đã nêu ở trên, đây là điều kiện thứ 3 mà một
hàm cần phải thoả mãn để có thể được lựa chọn làm hàm Wavelets.Chúng ta có thể xem
biến đổi CWT như là một ma trận hai chiều các kết quả của phép tính tích vơ hướng giữa
hai hàm f (t ) và  a ,b (t ) . Các hàng của ma trận tương ứng với các giá trị của a và các cột
tương ứng với các giá trị của b do cách tính biến đổi Wavelets theo tích vơ hướng đã trình
Cơ sở lý thuyết

20


HVTH: Dương Tấn Vũ


N/C đánh giá các phép biến đổi đa tỉ lệ và ứng dụng trong xử lý ảnh

GVHD: PGS. TS. Lê Tiến Thường

bày ở trên:


f (t ), g (t ) 



f (t ) g * (t )dt  f (t ), a ,b (t ) 







f (t ) a ,b (t )dt

(1.17)



1.2 Biến đổi Wavelets rời rạc (DWT)
Việc tính tốn các hệ số Wavelets tại tất cả các tỉ lệ là một cơng việc hết sức phức tạp. Nếu

tính tốn như vậy sẽ tạo ra một lượng dữ liệu khổng lồ. Để giảm thiểu cơng việc tính tốn
người ta chỉ chọn ra một tập nhỏ các giá trị tỉ lệ và các vị trí để tiến hành tính tốn. Hơn
nữa nếu việc tính tốn được tiến hành tại các tỷ lệ và các vị trí trên cơ sở luỹ thừa cơ số 2
thì kết quả thu được sẽ hiệu quả và chính xác hơn rất nhiều. Q trình chọn các tỷ lệ và các
vị trí để tính tốn như trên tạo thành lưới nhị tố (dyadic). Một phân tích như trên hồn tồn
có thể thực hiện được nhờ biến đổi Wavelets rời rạc (DWT). Do đó, việc tính tốn biến đổi
DWT thực chất là sự rời rạc hoá biến đổi Wavelets liên tục (CWT); việc rời rạc hoá được
thực hiện với sự lựa chọn các hệ số a và b như sau:

a  2m ; b  2m n; (m,n ∈ Z)

(1.18)

Tiếp cận toán học cho DWT được dựa trên sự thật rằng hàm f(t) có thể được trình bày một
cách tuyến tính là:

f (t )   ak k (t )

(1.19)

k

Trong đó ak là hệ số phân tích và  k là các hàm phân tích, cịn được gọi là các hàm cơ sở,
nếu phép phân tích là duy nhất. Nếu các hàm cơ sở là trực giao, thì các hệ số có thể được
ước lượng từ phương trình sau:
ak  f (t ), k (t )   f (t ) k (t )dt

(1.20)

Trong đó f(t) được cho từ cơng thức đầu tiên ở trên. Ví dụ, các hàm phân tích trực giao cho

biến đổi Fourier là sin(kw0t) và cos(kw0t).

1.3 Các tính chất của hàm wavelet
Tất cả chúng ta đều biết rằng biến đổi Fourier là một biến đổi đã và đang được áp dụng rộng
rãi trong nhiều ngành khoa học và kỹ thuật khác nhau. Biến đổi Fourier chuyển một hàm tín
hiệu từ miền thời gian sang miền tần số. Sử dụng biến đổi Fourier ta có thể biết được trong
tín hiệu f (t ) có các thành phần tần số nào. Tuy nhiên biến đổi Fourier có một nhược điểm
Cơ sở lý thuyết

21

HVTH: Dương Tấn Vũ


N/C đánh giá các phép biến đổi đa tỉ lệ và ứng dụng trong xử lý ảnh

GVHD: PGS. TS. Lê Tiến Thường

cơ bản là với một tín hiệu f (t ) ta không thể biết được rằng tại một thời điểm t thì tín hiệu có
các thành phần tần số nào. Một phép biến đổi tốt hơn biến đổi Fourier phải là phép biến đổi
có đầy đủ tính năng của biến đổi Fourier và có khả năng xác định xem tại một thời điểm t
bất kỳ trong tín hiệu f(t ) có thành phần tần số nào. Phép biến đổi Wavelets ra đời đã khắc
phục được các nhược điểm của biến đổi Fourier trong phân tích tín hiệu. Biến đổi Wavelets
dù chỉ làm việc với các tín hiệu một chiều (liên tục hoặc rời rạc) nhưng sau khi biến đổi
xong ta thu được một hàm số hai biến hoặc một tập các cặp giá trị W(a,b) minh họa các
thành phần tần số khác nhau của tín hiệu xảy ra tại thời điểm t . Các giá trị W(ai,b) tạo thành
một cột (i=1, 2,...., n) cho biết một thành phần tần số có trong những thời điểm t nào và các
giá trị W(ai,b) tạo thành hàng cho biết tại một thời điểm t của tín hiệu f(t ) có các thành phần
tần số nào.


Hình 7. Minh họa lưới dyadic với các giá trị của m và n

Được nghiên cứu từ trước những năm 80 của thế kỷ trước và cũng đã được ứng dụng trong
một số ngành khoa học và công nghệ khác nhau nhưng biến đổi Wavelets vẫn là một lĩnh
vực đang và sẽ tiếp tục được nghiên cứu và phát triển cũng như ứng dụng rộng rãi hơn nữa.
Tham số b trong biến đổi Wavelets cho biết khoảng dịch của hàm Wavelets mẹ và độ phân
giải các tần số khác nhau của f(t ) được minh họa bởi hệ số tỷ lệ chính là a. Biến đổi
Wavelets ngày càng được áp dụng rộng rãi đặc biệt là trong xử lý tiếng nói, xử lý ảnh số.
Tín hiệu tiếng nói là tín hiệu một chiều nhưng do đặc điểm của tiếng nói là tín hiệu khơng
dừng nên việc sử dụng Fourier là khơng đủ để phân tích một cách đầy đủ các đặc trưng của
tiếng nói. Khác với tín hiệu tiếng nói, xử lý tín hiệu ảnh số là xử lý tín hiệu hai chiều và do
đặc điểm của ảnh số là bao giờ cũng có tính định hướng và tính định vị. Tính định hướng
của một ảnh nghĩa là trong ảnh bao giờ cũng có một số ít các thành phần tần số nhưng các
Cơ sở lý thuyết

22

HVTH: Dương Tấn Vũ


N/C đánh giá các phép biến đổi đa tỉ lệ và ứng dụng trong xử lý ảnh

GVHD: PGS. TS. Lê Tiến Thường

thành phần tần số này trải rộng trên toàn bộ khơng gian ảnh cịn tính định vị của ảnh chính
là tính chất biểu thị rằng tại một vùng của ảnh có thể có rất nhiều thành phần tần số. Ảnh
biểu thị tính định vị rõ nhất chính là ảnh có nhiều biên vùng phân tách rõ rệt, tại các đường
biên bao giờ cũng có nhiều thành phần tần số khác nhau, cịn hầu hết các ảnh có tơng liên
tục đều là những ảnh có tính định hướng.
1.4 Giới thiệu một số họ wavelet

1.4.1 Biến đổi wavelets Haar
Biến đổi Haar Wavelets là biến đổi đơn giản nhất trong các phép biến đổi
wavelets.Hình vẽ 1.2 cho thấy dạng của hàm  (t ) với biến đổi Haar. Do tính chất đơn
giản của biến đổi Haar mà nó được ứng dụng tương đối nhiều trong nén ảnh, khi áp
dụng biến đổi này để nén ảnh thì thuật tốn nén ảnh trên máy tính có một số điểm khác
với cơng thức tốn học của biến đổi Haar:

Hình 8. Hàm  (t ) của biến đổi Haar
1.4.2 Biến đổi wavelets Meyer
Yves Meyer là một trong những nhà khoa học đã đặt nền móng cho phép biến đổi
Wavelets.Phép biến đổi Wavelets mang tên Meyer cũng là một phép biến đổi thơng
dụng, biến đổi này có khả năng phân tích tín hiệu tốt hơn nhiều so với biến đổi Haar.
Dạng của hàm  (t ) với biến đổi Meyer cho ở hình vẽ:

Hình 9. Hàm  (t ) của biến đổi Meyer
Cơ sở lý thuyết

23

HVTH: Dương Tấn Vũ


N/C đánh giá các phép biến đổi đa tỉ lệ và ứng dụng trong xử lý ảnh

GVHD: PGS. TS. Lê Tiến Thường

1.4.3 Biến đổi wavelets Daubechies
Giống như Meyer, Daubechies cũng là một nhà khoa học có cơng lao to lớn trong việc
nghiên cứu phát triển phép biến đổi Wavelets.Biến đổi Daubechies là một trong những
phép biến đổi phức tạp nhất trong biến đổi Wavelets.Họ biến đổi này được ứng dụng hết

sức rộng rãi, biến đổi Wavelets áp dụng trong JPEG2000 là một biến đổi trong họ biến
đổi Wavelets Daubechies. Dưới đây là một số hàm ψ(t) trong họ biến đổi Wavelets
Daubechies (hình 8):

Hình 10.

Hàm  (t ) của biến đổi Daubechies n với n=2,3,7,8

Phép biến đổi wavelets là sự lựa chọn phổ biến để giải quyết nhiều vấn đề trong xử lý
ảnh. Tuy vậy, biến đổi wavelets cũng thể hiện các hạn chế khi phân tích các đặc điểm
cong tồn tại phổ biến trong ảnh. Nguyên nhân là vì các hệ số của biến đổi wavelets hai
chiều chỉ chứa thông tin vị trí ở các tỉ lệ khác nhau, và hồn tồn khơng có thơng tin
biểu diễn hướng hay góc.
Các phép biến đổi Ridgelets và Curvelet đã được phát triển như là câu trả lời cho sự yếu
kém của biến đổi wavelets trong việc xử lý các đường cong, góc cạnh…

Cơ sở lý thuyết

24

HVTH: Dương Tấn Vũ


N/C đánh giá các phép biến đổi đa tỉ lệ và ứng dụng trong xử lý ảnh

(a)

GVHD: PGS. TS. Lê Tiến Thường

(b)


(c)

Hình 11. Ví dụ về xử lý ảnh bằng Wavelets: Triệt nhiễu. a) ảnh gốc, b) ảnh

nhiễu, c) ảnh triệt nhiễu bằng Wavelets.
2. Biến đổi Ridgelets.
Nhờ vào sự đơn giản của mình, nên biến đổi Wavelets đã được sử dụng rất nhiều trong xử lý
ảnh. Điều này được dựa trên sự thật rằng trong miền Wavelets, gần như toàn bộ thơng tin ảnh
được gói trong một số các hệ số. Tuy nhiên, Wavelets lại khơng thể trình bày một cách có hiệu
quả các điểm dọc theo các cạnh hoặc các đường thẳng. Vì thế, có một vài giải thuật mới đã
được phát triển dựa trên các biến đổi hai chiều với mong đợi sẽ nâng cao chất lượng xử lý ảnh
hơn là các giải thuật truyền thống.
Dựa trên xu hướng này, Candes và Donoho đã giới thiệu một giải thuật mới có tên là Ridgelets
và họ đã chứng tỏ được khả năng xử lý có hiệu quả của giải thuật này với các thành phần cạnh.
Biến đổi này có thể trình bày một cách có hiệu quả ba thơng số: tỉ lệ, vị trí và hướng của ảnh.
2.1 Biến đổi Ridgelets rời rạc
Cho ψ là hàm thoả mãn điều kiện :


R

ˆ ( )


2

2

d  


(1.19)

Hàm ψ cần phải thỏa mãn điều kiện về giá trị trung bình bằng zero, nghĩa là

 (t )dt  0

(1.20)

R

Hàm Ridgelets ѱa,b,θ: R2 --> R được xác định

 a ,b, ( x1 , x2 ) 
Cơ sở lý thuyết

1   x1 cos   x2 sin   b  


a
a 

25

(1.21)

HVTH: Dương Tấn Vũ



×