Tải bản đầy đủ (.pdf) (54 trang)

Phương pháp nén ảnh trên miền tần số sử dụng phép biển đổi dct và dwt

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.98 MB, 54 trang )

TRƢỜNG ĐẠI HỌC VINH
KHOA CÔNG NGHỆ THÔNG TIN

VÕ THỊ KHUYÊN

BÁO CÁO
ĐỒ ÁN TỐT NGHIỆP ĐẠI HỌC
Tên đồ án:

PHƢƠNG PHÁP NÉN ẢNH TRÊN MIỀN TẦN SỐ
SỬ DỤNG PHÉP BIỂN ĐỔI DCT VÀ DWT

Nghệ An, tháng 1 năm 2017


TRƢỜNG ĐẠI HỌC VINH
KHOA CÔNG NGHỆ THÔNG TIN

BÁO CÁO
ĐỒ ÁN TỐT NGHIỆP ĐẠI HỌC
Tên đồ án:
PHƢƠNG PHÁP NÉN ẢNH TRÊN MIỀN TẦN SỐ
SỬ DỤNG PHÉP BIỂN ĐỔI DCT VÀ DWT

Sinh viên thực hiện:
Giáo viên hướng dẫn:

Võ Thị Khuyên - MSV: 1251071595
Lớp: 53K1 - CNTT
ThS. Nguyễn Bùi Hậu


Nghệ An, tháng 01 năm 2017


Đồ án tốt nghiệp

GVHD: ThS. Nguyễn Bùi Hậu
MỤC LỤC

LỜI CẢM ƠN ..................................................................................................................1
MỞ ĐẦU .........................................................................................................................2
1. Sự cần thiết của đồ án ............................................................................................2
2. Mục tiêu của đồ án .................................................................................................3
2.1. Mục tiêu tổng quát ..............................................................................................3
2.2. Mục tiêu cụ thể ....................................................................................................3
3. Đối tƣợng và phạm vi nghiên cứu của đồ án .........................................................4
3.1. Đối tƣợng nghiên cứu .........................................................................................4
3.2 Phạm vi nghiên cứu..............................................................................................4
4. Nội dung nghiên cứu ..............................................................................................4
5. Kết cấu của đồ án ...................................................................................................4
Chƣơng 1. KỸ THUẬT NÉN DỮ LIỆU ẢNH SỐ .........................................................5
1.1. Giới thiệu chƣơng ...............................................................................................5
1.2. Tổng quan v ảnh số và kỹ thuật n n ảnh số ......................................................5
1.2.1. Ảnh số và ph n loại ảnh số ..............................................................................5
1.2.2. iểu di n ảnh số trong máy t nh ......................................................................8
1.2.3. Giới thiệu chung v n n ảnh số ........................................................................9
1.2.4. Các khái niệm v n n ảnh số..........................................................................10
1.3. Các ph p iến đổi trên mi n tần số ...................................................................12
1.3.1. iến đổi Cosin rời rạc (DCT-Discrete Cosine Transform) ............................12
1.3.2. iến đổi Wavelet rời rạc (DWT – Discrete Wavelet Transform)..................19
Chƣơng 2. MỘT SỐ PHƢƠNG PHÁP NÉN ẢNH SỐ ................................................20

2.1. Giới thiệu chƣơng .............................................................................................20
2.2. Cách ph n loại các phƣơng pháp n n ảnh.........................................................20
2.2.1. Cách ph n loại dựa vào nguyên lý n n ..........................................................20
2.2.2. Cách ph n loại dựa vào cách thức thực hiện n n ...........................................20
2.2.3. Cách ph n loại dựa vào lý thuyết mã hố ......................................................21
2.2.4. Q trình n n và giải n n ...............................................................................21
2.3. Một số phƣơng pháp n n ảnh số .......................................................................21
2.3.1. Các phƣơng pháp n n kh ng mất mát th ng tin ............................................21
2.3.2. Các phƣơng pháp n n trên mi n tần số ..........................................................25
Chƣơng 3. THỬ NGHIỆM VÀ ĐÁNH GIÁ ...............................................................35
3.1. Giới thiệu chƣơng .............................................................................................35
3.2. Matla căn ản ..................................................................................................35

SVTH: VÕ THỊ KHUYÊN - MSSV: 1251071595 - LỚP 53K1


Đồ án tốt nghiệp

GVHD: ThS. Nguyễn Bùi Hậu

3.2.1. Giới thiệu .......................................................................................................35
3.2.2. Làm quen với Matla .....................................................................................35
3.2.3. Nhập xuất dữ liệu từ dòng lệnh ......................................................................36
3.2.4. Nhập xuất dữ liệu từ bàn phím .......................................................................36
3.2.5. Các hàm tốn học ...........................................................................................37
3.2.6. Các phép tốn trên ma trận và vector .............................................................38
3.2.7. Các hàm xử lý ảnh cơ ản trong Matla ........................................................40
3.3. Phƣơng pháp n n ảnh JPEG dựa vào ph p iến đổi DCT ................................42
3.3.1. Các đoạn mã lệnh ...........................................................................................42
3.3.2. Kết quả khi chạy chƣơng trình .......................................................................43

3.4.2. Kết quả sau khi chạy chƣơng trình ................................................................45
KẾT LUẬN ...................................................................................................................48
1. Kết quả đạt đuợc ..................................................................................................48
2. Hạn chế ................................................................................................................48
3. Một số hƣớng nghiên cứu trong tƣơng lai: ..........................................................48
TÀI LIỆU THAM KHẢO .............................................................................................50

SVTH: VÕ THỊ KHUYÊN - MSSV: 1251071595 - LỚP 53K1


Đồ án tốt nghiệp

GVHD: ThS. Nguyễn Bùi Hậu
LỜI CẢM ƠN

Trong thời đại C ng nghệ Th ng tin ngày nay, việc ứng dụng C ng nghệ
Th ng tin vào cuộc sống cũng nhƣ các ngành khoa học ngày càng trở nên quan
trọng. Quá trình làm đ tài Đồ án tốt nghiệp này là ƣớc đầu tiên đi vào thực
ti n và cũng ch nh là ƣớc đầu thực hành và đúc rút chứng minh cho những m n
học trên ghế nhà trƣờng nói chung và m n học chuyên ngành nói riêng. Đ y
cũng ch nh là q trình nhận x t đánh giá và rút ra ƣu, nhƣợc điểm, để từ đó tìm
ra phƣơng án tối ƣu nhất cho việc học và đi ra thực tế sau này của ản th n.
Em xin ch n thành cảm ơn sự hƣớng dẫn của các thầy giáo, c giáo trong
Khoa C ng nghệ Th ng tin – Trƣờng Đại học Vinh. Đặc iệt, em ày tỏ lòng
iết thầy giáo ThS. Nguyễn Bùi Hậu đã tạo mọi đi u kiện và lu n giúp đỡ,
hƣớng dẫn em tận tình để em hồn thành đ tài Đồ án tốt nghiệp này. Em ch n
thành cảm ơn các thầy c lu n sẵn sàng giúp đỡ và tạo mọi đi u kiện tốt nhất
cho em. Cảm ơn gia đình, ạn è lu n quan t m động viên giúp đỡ để em có
đƣợc nhƣ ngày h m nay.
Mặc dù có nhi u cố gắng ằng toàn ộ kiến thức để hoàn thành c ng việc,

song thời gian và kinh nghiệm của ản th n chƣa đƣợc trau dồi nhi u nên việc
trình ày, ph n t ch, x y dựng chƣơng trình cịn nhi u thiếu sót cần đƣợc ổ
sung. Vì vậy, em rất mong nhận đƣợc ý kiến đóng góp của thầy c để sản phẩm
này có thể hồn thiện, đƣợc ứng dụng vào thực ti n.
Em xin chân thành cảm ơn!
Nghệ An, ngày 09 tháng 1 năm 2017
Sinh viên thực hiện

Võ Thị Khuyên

SVTH: VÕ THỊ KHUYÊN - MSSV: 1251071595 - LỚP 53K1

Trang 1


Đồ án tốt nghiệp

GVHD: ThS. Nguyễn Bùi Hậu
MỞ ĐẦU

1. Sự cần thiết của đồ án

Ngày nay, cùng với sự phát triển kh ng ngừng của khoa học và c ng nghệ,
máy t nh đóng vai trị ngày càng quan trọng và kh ng thể thiếu trong cuộc sống
xã hội loài ngƣời. Việc trao đổi th ng tin của con ngƣời trong tất cả các ngành,
các lĩnh vực của đời sống ngày càng trở nên cần thiết cùng với sự ra đời và phát
triển của mạng Internet.
Xử lý ảnh là một ngành khoa học còn tƣơng đối mới mẻ so với nhi u ngành
khoa học khác nhƣng nó đang đƣợc tập trung nghiên cứu và phát triển vì những
ứng dụng thực ti n của nó trong nhi u ngành, lĩnh vực khác nhau. Trong đó

“N n ảnh” là một phần của xử lý ảnh có ứng dụng to lớn trong truy n th ng và
trong lƣu trữ, đã có rất nhi u phƣơng pháp n n ảnh đƣợc ra đời và kh ng ngừng
đƣợc cải tiến để ngày càng hoàn thiện đem lại hiệu quả n n cao và cho chất
lƣợng ảnh tốt nhất. N n ảnh là một kỹ thuật mã hoá các ảnh số hoá nhằm giảm
số lƣợng các it dữ liệu cần thiết để iểu di n ảnh. Mục đ ch là giảm đi những
chi ph trong việc lƣu trữ ảnh và chi ph thời gian để truy n ảnh đi xa trong
truy n th ng nhƣng vẫn đảm ảo đƣợc chất lƣợng của ảnh. N n ảnh thực hiện
đƣợc là do một thực tế: th ng tin trong ức ảnh kh ng phải là ngẫu nhiên mà có
trật tự, tổ chức. Vì thế nếu óc tách đƣợc t nh trật tự, cấu trúc đó thì sẽ iết phần
th ng tin nào quan trọng nhất trong ức ảnh để iểu di n và truy n đi với số
lƣợng t it hơn so với ảnh gốc mà vẫn đảm ảo t nh đầy đủ của th ng tin. Ở ên
nhận quá trình giải mã sẽ tổ chức, sắp xếp lại đƣợc ức ảnh xấp xỉ gần ch nh xác
so với ảnh gốc nhƣng vẫn thỏa mãn chất lƣợng yêu cầu.
Thực tế cho thấy có nhi u vấn đ trong việc lƣu trữ và truy n tải ảnh số
hoá. N n ảnh thực sự có nhi u ứng dụng trong thực tế nhƣ: truy n các văn ản
đồ hoạ qua đƣờng điện thoại, n n ảnh trong y tế và truy n hình cáp,...
Do t nh chất hấp dẫn và ý nghĩa quan trọng của nó, n n ảnh thu hút đƣợc
nhi u mối quan t m của các kỹ sƣ, chuyên gia làm việc trong lĩnh vực c ng
nghệ th ng tin trong nƣớc và trên thế giới. Khi làm việc với các phƣơng pháp
n n ảnh, ngƣời ta nhận thấy rằng có phƣơng n n kh ng thể áp dụng n n nhi u
loại tập tin, lại có phƣơng pháp có hệ số n n tƣơng đối cao, nhƣng tốn nhi u ộ
nhớ, khó thực hiện trên các ảnh có k ch thƣớc , cũng có phƣơng pháp có hệ số
n n tƣơng đối cao, phƣơng pháp thực hiện lại tƣơng đối đơn giản, đòi hỏi t ộ
SVTH: VÕ THỊ KHUYÊN - MSSV: 1251071595 - LỚP 53K1

Trang 2


Đồ án tốt nghiệp


GVHD: ThS. Nguyễn Bùi Hậu

nhớ, có thể x y dựng dựa trên các ảnh có k ch thƣớc . Ngoài ra một số phƣơng
pháp n n ảnh xử lý trên mi n tần số ảnh lại cho kết quả n n tốt hơn khi xử lý
n n trên mi n kh ng gian ảnh. Do vậy, việc nghiên cứu các phƣơng pháp n n
ảnh để chọn phƣơng pháp n n trong các trƣờng hợp cụ thể có ý nghĩa v cũng
quan trọng trong lƣu trữ và truy n tải dữ liệu ảnh số.
Có nhi u cách ph n loại các phƣơng pháp n n: cách thứ nhất dựa vào
nguyên lý n n. Cách này ph n các phƣơng pháp n n thành hai họ lớn: N n
ch nh xác hay n n kh ng mất th ng tin: họ này ao gồm các phƣơng pháp n n
mà sau khi giải n n ta thu đƣợc ch nh xác dữ liệu gốc; N n có mất th ng tin:
họ này ao gồm các phƣơng pháp mà sau khi giải n n ta kh ng thu đƣợc dữ
liệu nhƣ ản gốc.
Cách ph n loại thứ hai dựa vào cách thức thực hiện nén. Theo cách này,
ngƣời ta cũng ph n thành hai họ: Phƣơng pháp kh ng gian (Spatial Data
Compression): Các phƣơng pháp thuộc họ này thực hiện n n ằng các tác động
trực tiếp lên việc lấy mẫu của ảnh trong mi n kh ng gian; Phƣơng pháp sử dụng
iến đổi (Transform Coding): gồm các phƣơng pháp tác động lên sự iến đổi
của ảnh gốc mà kh ng tác động trực tiếp nhƣ họ trên.
Xuất phát từ yêu cầu của thực tế, nhằm mục đ ch hƣớng tới một phần
nhiệm vụ xử lý dữ liệu ảnh số, Đồ án tốt nghiệp “PHƢƠNG PHÁP NÉN ẢNH
TRÊN MIỀN TẦN SỐ SỬ DỤNG PHÉP BIỂN ĐỔI DCT VÀ DWT” đi s u
nghiên cứu một số phƣơng pháp n n ảnh, đồng thời tiến hành ph n t ch phƣơng
pháp n n ảnh JPEG dựa vào ph p iển đổi và phƣơng pháp n n ảnh JPEG 2000
dựa trên iến đổi Wavelet với những đặc t nh vƣợt trội so với các chuẩn n n
trƣớc đó đem lại hiệu quả n n cao cho ảnh n n chất lƣợng tốt và nhi u những ƣu
điểm khác mà các chuẩn n n trƣớc đó kh ng thể có.
2. Mục tiêu của đồ án
2.1. Mục tiêu tổng quát


Đồ án nghiên cứu hệ thống lý thuyết liên quan đến n n dữ liệu trong đó tập
trung vào nhánh n n dữ liệu ảnh số. Từ đó, x y dựng chƣơng trình thử nghiệm
cài đặt một số thuật toán n n ảnh số nhằm ứng dụng trong lƣu trữ và truy n tải
thông tin.
2.2. Mục tiêu cụ thể

Đ tài tập trung vào 3 mục tiêu ch nh sau:
(i) Nghiên cứu tổng quan v n n ảnh, các ph p iến đổi sử dụng trong n n ảnh
SVTH: VÕ THỊ KHUYÊN - MSSV: 1251071595 - LỚP 53K1

Trang 3


Đồ án tốt nghiệp

GVHD: ThS. Nguyễn Bùi Hậu

(ii) Nghiên cứu các thuật tốn n n ảnh hiện có: Ý tƣởng và thuật toán
(iii) Tiến hành cài đặt các thuật toán n n ảnh, tiến hành ph n t ch, đánh giá
so sánh chất lƣợng của các thuật toán, đ xuất đƣợc lựa chọn phù hợp trong các
trƣờng hợp khác nhau.
3. Đối tƣợng và phạm vi nghiên cứu của đồ án
3.1. Đối tượng nghiên cứu

(a) Nghiên cứu lý thuyết
Nghiên cứu các tài liệu v n n ảnh đã c ng ố ở trong và ngồi nƣớc; các
kết quả khảo sát có t nh chất đánh giá của các nghiên cứu đi trƣớc; các tài liệu
lập trình để cài đặt thuật tốn.
(b) Nghiên cứu thực nghiệm
Nghiên cứu ng n lập trình Matla và cài đặt một số thuật toán n n ảnh; so

sánh, đánh giá hiệu quả n n ảnh cho các thuật toán.
3.2 Phạm vi nghiên cứu

Đồ án tập trung nghiên cứu các kỹ thuật n n ảnh số. Ứng dụng mà luận văn
x y dựng là chƣơng trình n n ảnh số.
4. Nội dung nghiên cứu

- Nghiên cứu tổng quan v n n ảnh, các ph p iến đổi sử dụng trong n n ảnh.
- Khảo sát và đánh giá v các thuật toán n n ảnh nhằm xác định ƣu điểm và
hạn chế của các thuật toán.
- Nghiên cứu ng n ngữ lập trình Matla để cài đặt m phỏng các thuật tốn
trên máy tính.
- Tiến hành ph n t ch, đánh giá, so sánh chất lƣợng các thuật toán.
5. Kết cấu của đồ án

Đồ án đƣợc chia làm 3 chƣơng.
Chƣơng 1. KỸ THUẬT NÉN DỮ LIỆU ẢNH SỐ
Trong chƣơng 1 sẽ trình ày những khái niệm cơ ản liên quan đến n n
ảnh, trình ày các ph p iến đổi sử dụng trong xử lý ảnh nói chung và n n ảnh
nói riêng.
Chƣơng 2. MỘT SỐ PHƢƠNG PHÁP NÉN ẢNH SỐ
Chƣơng này trình ày cách ph n loại các phƣơng pháp n n ảnh, một số
phƣơng pháp n n ảnh số: Phƣơng pháp mã hoá độ dài loạt RLE; Phƣơng pháp
mã hoá Huffman; Phƣơng pháp LZW; Phƣơng pháp n n ảnh JPEG dựa vào
ph p iến đổi DCT; Phƣơng pháp n n ảnh JPEG 2000 dựa vào ph p iến đổi
SVTH: VÕ THỊ KHUYÊN - MSSV: 1251071595 - LỚP 53K1

Trang 4



Đồ án tốt nghiệp

GVHD: ThS. Nguyễn Bùi Hậu

DWT. Nội dung chƣơng 2 sẽ là cơ sở quan trọng để tiến hành thử nghiệm trong
chƣơng 3.
Chƣơng 3. THỬ NGHIỆM VÀ ĐÁNH GIÁ
Chƣơng này sẽ tiến hành cài đặt các thuật toán n n ảnh n n ảnh JPEG dựa
vào ph p iến đổi DCT; Phƣơng pháp n n ảnh JPEG 2000 dựa vào ph p iến
đổi DWT. Đƣa ra các đánh giá, so sánh chất lƣợng của các thuật toán này. Từ đó
đ xuất các lựa chọn n n ảnh trong các trƣờng hợp cụ thể.

Chƣơng 1. KỸ THUẬT NÉN DỮ LIỆU ẢNH SỐ
1.1. Giới thiệu chƣơng

Trong chƣơng 1 sẽ trình ày những khái niệm cơ ản liên quan đến n n
ảnh, trình ày các ph p iến đổi sử dụng trong xử lý ảnh nói chung và n n ảnh
nói riêng.
1.2. Tổng quan về ảnh số và
thuật n n ảnh số
1.2.1. nh số v ph n oại nh số

1.2.1.1 Ảnh số
Ảnh số là tập hợp các điểm ảnh với mức xám phù hợp dùng để m tả ảnh
gần với ảnh thật.
Một ảnh số giả sử đƣợc iểu di n ằng hàm f(x, y). Tập con các điểm ảnh
là S; cặp điểm ảnh có quan hệ với nhau ký hiệu là p, q.
Phân loại ảnh
Ảnh đen trắng
Ảnh đen trắng chỉ ao gồm 2 màu: màu đen và màu trắng (kh ng chứa màu

khác) với mức xám ở các điểm ảnh có thể khác nhau. Ngƣời ta ph n mức đen
trắng đó thành L mức Nếu sử dụng số it =8 it để mã hóa mức đen trắng (hay
mức xám) thì L đƣợc xác định : L=2B (trong v dụ của ta L=28= 256 mức)
Nếu L ằng 2, =1, nghĩa là chỉ có 2 mức: mức 0 và mức 1, cịn gọi là ảnh
nhị ph n. Mức 1 ứng với màu sáng, còn mức 0 ứng với màu tối. Nếu L lớn hơn
2 ta có ảnh đa cấp xám. Nói cách khác, với ảnh nhị ph n mỗi điểm ảnh đƣợc mã

SVTH: VÕ THỊ KHUYÊN - MSSV: 1251071595 - LỚP 53K1

Trang 5


Đồ án tốt nghiệp

GVHD: ThS. Nguyễn Bùi Hậu

hóa trên 1 bit, còn với ảnh 256 mức, mỗi điểm ảnh đƣợc mã hóa trên 8 it. Nhƣ
vậy, với ảnh đen trắng: nếu dùng 8 it (1 yte) để iểu di n
mức xám, số các mức xám có thể iểu di n đƣợc là 256. Mỗi mức xám
đƣợc iểu di n dƣới dạng là một số nguyên nằm trong khoảng từ 0 đến 255, với
mức 0 iểu di n cho mức cƣờng độ đen nhất và 255 iểu di n cho mức cƣờng
độ sáng nhất.
Ảnh nhị ph n khá đơn giản, các phần tử ảnh có thể coi nhƣ các phần tử
logic. Ứng dụng ch nh của nó đƣợc dùng theo t nh logic để ph n iệt đối tƣợng
ảnh với n n hay để ph n iệt điểm iên với điểm khác.
V dụ v 1 ảnh đen trắng:

- Ảnh xám (gray image): giá trị mỗi điểm ảnh nằm trong giải giá trị từ 0 đến 255,
nghĩa là cần 8 its hay 1 yte để biểu di n mỗi điểm ảnh này.
Ví dụ v 1 ảnh xám:


- Ảnh màu:
Trong khuôn khổ lý thuyết ba màu (Red, Blue, Green) tạo nên thế giới màu)
trong đó R, G, là một giá trị xám và đƣợc biểu biểu di n bằng 1 yte, khi đó các giá
trị màu: 28*3=224≈ 16,7 triệu màu.

SVTH: VÕ THỊ KHUYÊN - MSSV: 1251071595 - LỚP 53K1

Trang 6


Đồ án tốt nghiệp

GVHD: ThS. Nguyễn Bùi Hậu

Mỗi màu cũng ph n thành L cấp màu khác nhau (thƣờng L=256). Mỗi khoảng
này biểu di n cho cƣờng độ sáng của một trong các màu ch nh. Do đó, để lƣu trữ ảnh
màu ngƣời ta có thể lƣu trữ từng màu riêng biệt, mỗi màu lƣu trữ nhƣ một ảnh đa cấp
xám. Do đó, kh ng gian nhớ dành cho một ảnh màu lớn gấp 3 lần một ảnh đa cấp xám
cùng kích cỡ.
P(x, y) = (R, G, B)
Hệ màu CMY: là phần bù của hệ màu RGB (C, M, Y)=(1, 1, 1)-(R, G, B)
Hay
C+R=M+G=Y+B=1
=> Hệ màu này thƣờng đƣợc dùng trong máy in.


Hệ màu CMYK: trong đó K là độ đậm nhạt của màu K= min (C, M, Y)

P(x, y) = (C-K, M-K, V-K, K).

Ví dụ:
Với (C1, M1, Y1) ta sẽ có K=min (C1, M1, Y1) vậy CMYK = (C1-K, M1-K,
Y1-K, K)

Hệ tọa độ RGB

V dụ v 1 ảnh màu:

SVTH: VÕ THỊ KHUYÊN - MSSV: 1251071595 - LỚP 53K1

Trang 7


Đồ án tốt nghiệp

GVHD: ThS. Nguyễn Bùi Hậu

1.2.2. iểu di n nh số trong má t nh
1.2.2.1 Điểm ảnh (Picture Element)
Gốc của ảnh (ảnh tự nhiên) là ảnh liên tục v kh ng gian và độ sáng. Để xử lý
bằng máy tính (số), ảnh cần phải đƣợc số hố. Số hoá ảnh là sự biến đổi gần đúng một
ảnh liên tục thành một tập điểm phù hợp với ảnh thật v vị tr (kh ng gian) và độ sáng
(mức xám). Khoảng cách giữa các điểm ảnh đó đƣợc thiết lập sao cho mắt ngƣời
không phân biệt đƣợc ranh giới giữa chúng. Mỗi một điểm nhƣ vậy gọi là điểm ảnh
(PEL: Picture Element) hay gọi tắt là Pixel. Trong khuôn khổ ảnh hai chi u, mỗi pixel
ứng với cặp tọa độ (x, y).

1 pixel

Hình minh họa của pixel

Định nghĩa:
Điểm ảnh (Pixel) là một phần tử của ảnh số tại toạ độ (x, y) với độ xám hoặc màu
nhất định. K ch thƣớc và khoảng cách giữa các điểm ảnh đó đƣợc chọn thích hợp sao
cho mắt ngƣời cảm nhận sự liên tục v không gian và mức xám (hoặc màu) của ảnh số
gần nhƣ ảnh thật. Mỗi phần tử trong ma trận đƣợc gọi là một phần tử ảnh.
1.2.2.2. Mức xám của ảnh
Một điểm ảnh (pixel) có hai đặc trƣng cơ ản là vị trí (x, y) của điểm ảnh và độ
xám của nó. Dƣới đ y chúng ta xem xét một số khái niệm và thuật ngữ thƣờng dùng
trong xử lý ảnh.
Định nghĩa:
Mức xám của điểm ảnh là cƣờng độ sáng của nó đƣợc gán bằng giá trị số tại điểm
đó.

SVTH: VÕ THỊ KHUYÊN - MSSV: 1251071595 - LỚP 53K1

Trang 8


Đồ án tốt nghiệp

GVHD: ThS. Nguyễn Bùi Hậu

Hình biểu diễn mức xám của ảnh số
Các thang giá trị mức xám th ng thƣờng: 16, 32, 64, 128, 256 (Mức 256 là mức
phổ dụng. Lý do: từ kỹ thuật máy t nh dùng 1 yte (8 it) để biểu di n mức xám: Mức
xám dùng 1 byte biểu di n: 28=256 mức, tức là từ 0 đến 255).
1.2.3. Giới thiệu chung về nén nh số
- Nén ảnh là một kỹ thuật mã hóa các ảnh số hóa nhằm mục đ ch giảm số lƣợng
các bit dữ liệu cần thiết để biểu di n ảnh.
- Mục đ ch là làm giảm đi những chi phí trong việc lƣu trữ ảnh và thời gian để

truy n ảnh đi xa, nhanh trong truy n th ng nhƣng vẫn đảm bảo đƣợc chất lƣợng của
hình ảnh.
- Nén ảnh thực hiện đƣợc do thông tin trong bức ảnh khơng phải xuất hiện ngẫu
nhiên mà có trật tự, có tổ chức vì thế khi ph n tách đƣợc tính trật tự, t nh tổ chức đó thì
sẽ biết ph n iệt đƣợc phần thông tin nào quan trọng nhất trong bức ảnh để biểu di n
và truy n đi với số lƣợng t it hơn so với ảnh gốc. Cịn ở bên nhận là q trình ngƣợc
lại nó sẽ giải mã, tổ chức, sắp xếp lại cho ra bức ảnh xấp xỉ chính xác gần với ảnh gốc
nhƣng vẫn thỏa mãn yêu cầu v chất lƣợng.
- Phƣơng pháp n n hiệu quả nhất th ng thƣờng sử dụng các biến đổi toán học để biến
ma trận các điểm ảnh từ không gian hai chi u này sang một không gian hai chi u khác, nơi
mức độ tƣơng quan giữa các hệ số biến đổi mới nhỏ hơn.
- Nén ảnh có rất nhi u ứng dụng trong thực tế nhƣ: truy n các văn ản đồ họa qua
đƣờng điện thoại (Fax), nén ảnh trong y tế và truy n hình cáp, nén ảnh để giảm khơng
gian lƣu trữ, tăng tốc độ truy n tải…. Ch nh vì khả năng ứng dụng trong nhi u lĩnh
vực cùng với sự tiến bộ của lĩnh vực vi điện tử dẫn đến sự ra đời của các tiêu chuẩn
nén ảnh.
- Các kỹ thuật nén ảnh ra đời hƣớng tới giải quyết bài tốn làm giảm thiểu khối
lƣợng thơng tin mơ tả ảnh số mà chất lƣợng vẫn tốt, n n tảng của quá trình nén là loại

SVTH: VÕ THỊ KHUYÊN - MSSV: 1251071595 - LỚP 53K1

Trang 9


Đồ án tốt nghiệp

GVHD: ThS. Nguyễn Bùi Hậu

bỏ dƣ thừa có trong tín hiệu. Độ dƣ thừa trong tín hiệu ảnh số phụ thuộc vào mức độ
tƣơng quan giữa các điểm ảnh, độ tƣơng quan lớn thì độ dƣ thừa cũng lớn.

- Các loại dƣ thừa:
- Dƣ thừa thông tin v không gian: trong một bức ảnh luôn tồn tại sự tƣơng quan
giữa các điểm ảnh cạnh nhau.
- Dƣ thừa thông tin v cấp xám: là dƣ thừa dựa vào sự tƣơng quan giữa các màu
sắc cạnh nhau.
- Dƣ thừa thông tin v thời gian: trong một chuỗi ảnh video, tồn tại sự tƣơng
quan giữa các điểm ảnh của các frame khác nhau.
1.2.4. Các khái niệm về nén nh số
1.2.4.1 Nén dữ liệu (Data Compression)
Nén dữ liệu là quá trình làm giảm lƣợng th ng tin "dƣ thừa" trong dữ liệu gốc và
do vậy, lƣợng th ng tin thu đƣợc sau n n thƣờng nhỏ hơn dữ liệu gốc rất nhi u. Với
dữ liệu ảnh, kết quả thƣờng là 10 : 1. Một số phƣơng pháp còn cho kết quả cao hơn.
Theo kết quả nghiên cứu đƣợc công bố gần đ y tại viện kỹ thuật Georgie, kỹ thuật
nén fractal cho tỉ số nén là 30 trên 1.
Ngoài thuật ngữ "nén dữ liệu”, do ản chất của kỹ thuật này nó cịn có một số
tên gọi khác nhƣ: giảm độ dƣ thừa, mã hoá ảnh gốc. Từ hơn hai thập kỷ nay, có rất
nhi u kỹ thuật n n đã đƣợc công bố trên các tài liệu v nén và các phần m m nén dữ
liệu đã xuất hiện ngày càng nhi u trên thƣơng trƣờng. Tuy nhiên, chƣa có phƣơng
pháp n n nào đƣợc coi là phƣơng pháp vạn năng (Universel) vì nó phụ thuộc vào
nhi u yếu tố và bản chất của dữ liệu gốc. Trong chƣơng này, chúng ta kh ng thể hy
vọng xem xét tất cả các phƣơng pháp n n. Hơn nữa, các kỹ thuật nén dữ liệu chung đã
đƣợc trình bày trong nhi u tài liệu chuyên ngành. Ở đ y, chúng ta chỉ đ cập các
phƣơng pháp n n có đặc thù riêng cho dữ liệu ảnh.
1.2.4.2. Tỉ lệ nén (Compression rate)
Tỷ lệ nén là một trong các đặc trƣng quan trọng nhất của mọi phƣơng pháp n n. Tuy
nhiên, v cách đánh giá và các kết quả công bố trong các tài liệu cũng cần đƣợc quan tâm
xem xét. Nhìn chung, ngƣời ta định nghĩa tỷ lệ n n nhƣ sau:
Tỷ lệ n n r = k ch thƣớc dữ liệu gốc/ k ch thƣớc dữ liệu thu đƣợc sau n n. Nhƣ
vậy hiệu suất của nén là: (1-tỷ lệ nén) x %.
Khi nói đến kết quả nén, chúng ta dùng tỷ số nén, thí dụ nhƣ 10 trên 1 có nghĩa là

dữ liệu gốc là 10 phần sau khi nén chỉ có 1 phần.
Tuy nhiên, cũng phải thấy rằng những số đo của một phƣơng pháp n n chỉ có
giá trị với chính sự n n đó, vì rằng hiệu quả của nén còn phụ thuộc vào kiểu dữ liệu
định nén. Tỷ lệ n n cũng chỉ là một trong các đặc trƣng cơ ản của phƣơng pháp n n.

SVTH: VÕ THỊ KHUYÊN - MSSV: 1251071595 - LỚP 53K1 Trang 10


Đồ án tốt nghiệp

GVHD: ThS. Nguyễn Bùi Hậu

Nhi u khi tỷ lệ n n cao cũng chƣa thể nói rằng phƣơng pháp đó là hiệu quả hơn các
phƣơng pháp khác, vì cịn các chi ph khác nhƣ thời gian, khơng gian và thậm chí cả
độ phức tạp tính tốn nữa. Thí dụ nhƣ n n phục vụ trong truy n dữ liệu: vấn đ đặt ra
là hiệu quả n n có tƣơng hợp với đƣờng truy n khơng.
Cũng cần phân biệt nén dữ liệu với n n ăng truy n. Mục đ ch ch nh của nén là
giảm lƣợng th ng tin dƣ thừa và dẫn tới giảm k ch thƣớc dữ liệu. Tuy vậy, đ i khi quá
trình n n cũng làm giảm ăng truy n tín hiệu số hố thấp hơn so với truy n tín hiệu
tƣơng tự.
1.2.4.3. Các loại dư thừa dữ liệu
Nhƣ trên đã nói, n n nhằm mục đ ch giảm k ch thƣớc dữ liệu bằng cách loại bỏ
dƣ thừa dữ liệu. Việc xác định bản chất các kiểu dƣ thừa dữ liệu rất có ích cho việc
xây dựng các phƣơng pháp n n dữ liệu khác nhau. Nói một cách khác, các phƣơng
pháp nén dữ liệu khác nhau là do sử dụng các kiểu dƣ thừa dữ liệu khác nhau. Nên có
4 kiểu dƣ thừa chính:

- Sự ph n ố
Trong một dãy ký tự, có một số ký tự có tần suất xuất hiện nhi u hơn một
số dãy khác. Do vậy, ta có thể mã hố dữ liệu một cách c đọng hơn. Các dãy ký

tự có tần suất cao đƣợc thay ởi một từ mã nhị ph n với số t nhỏ; ngƣợc lại
các dãy có tần suất thấp sẽ đƣợc mã hố ởi từ mã có nhi u t hơn. Đ y ch nh
là ản chất của phƣơng pháp mã hoá Huffman.
- Sự lặp lại của các ký tự
Trong một số tình huống nhƣ trong ảnh, 1 ký hiệu ( it "0" hay it "1")
đƣợc lặp đi lặp lại nhi u lần. Kỹ thuật n n dùng trong trƣờng hợp này là thay
dãy lặp đó ởi dãy mới gồm 2 thành phần: số lần lặp và k hiệu dùng để mã.
Phƣơng pháp mã hố kiểu này có tên là mã hoá loạt dài RLC (Run Length
Coding).
- Những mẫu sử dụng tần suất
Có thể có dãy ký hiệu nào đó xuất hiện với tần suất tƣơng đối cao. Do
vậy, có thể mã hoá ởi t it hơn. Đ y là cơ sở của phƣơng pháp mã hoá kiểu từ
điển do Lempel-Ziv đƣa ra và có cải tiến vào năm 1977, 1978 và do đó có tên
gọi là phƣơng pháp n n LZ77, LZ78. Năm 1984, Terry Welch đã cải tiến hiệu
quả hơn và đặt tên là LZW (Lempel-Ziv- Welch).
- Độ dƣ thừa vị tr
Do sự phụ thuộc lẫn nhau của dữ liệu, đ i khi iết đƣợc ký hiệu (giá trị)
xuất hiện tại một vị tr , đồng thời có thể đoán trƣớc sự xuất hiện của các giá trị
SVTH: VÕ THỊ KHUYÊN - MSSV: 1251071595 - LỚP 53K1 Trang 11


Đồ án tốt nghiệp

GVHD: ThS. Nguyễn Bùi Hậu

ở các vị tr khác nhau một cách phù hợp. Chẳng hạn, ảnh iểu di n trong một
lƣới hai chi u, một số điểm ở hàng dọc trong một khối dữ lệu lại xuất hiện trong
cùng vị tr ở các hàng khác nhau. Do vậy, thay vì lƣu trữ dữ liệu, ta chỉ cần lƣu
trữ vị tr hàng và cột. Phƣơng pháp n n dựa trên sự dƣ thừa này gọi là phƣơng
pháp mã hoá dự đoán.

Cách đánh giá độ dƣ thừa nhƣ trên hoàn toàn mang t nh trực quan nhằm
iểu thị một cái gì đó xuất hiện nhi u lần. Đối với dữ liệu ảnh, ngồi đặc thù
chung đó, nó cịn có những đặc thù riêng. Th dụ nhƣ có ứng dụng kh ng cần
toàn ộ dữ liệu th của ảnh mà chỉ cần các th ng tin đặc trƣng iểu di n ảnh nhƣ
iên ảnh hay vùng đồng nhất. Do vậy, có những phƣơng pháp n n riêng cho ảnh
dựa vào iến đổi ảnh hay dựa vào iểu di n ảnh.
1.3. Các ph p iến đổi trên miền tần số
1.3.1. iến đổi Cosin rời rạc (DCT-Discrete Cosine Transform)

iến đổi cosine rời rạc (DCT) iểu di n ảnh dƣới dạng tổng của các
cosine của các thành phần iên độ và tần số khác nhau của ảnh. Hàm dct2 t nh
DCT hai chi u của một ảnh. DCT có t nh chất mà với các ảnh điển hình, hầu hết
các th ng tin v ảnh chỉ tập trung trong một vài hệ số của DCT, trong khi các hệ
số còn lại chỉ chứa rất t th ng tin. Vì lý do này, DCT thƣờng đƣợc sử dụng
trong các ứng dụng n n ảnh khác nhau nhờ hiệu suất gần nhƣ tối ƣu của nó đối
với các ảnh có độ tƣơng quan cao giữa các điểm ảnh l n cận. Chẳng hạn, DCT là
trung t m của giải thuật n n ảnh theo chuẩn quốc tế thƣờng đƣợc iết với tên
JPEG (tên này do nhóm phát triển đặt ra: Joint Photographic Experts Group)
DCT hai chi u của ma trận A có k ch thƣớc MxN đƣợc định nghĩa nhƣ sau :
M 1 N 1
0  p  M 1
 (2m  1) p
 (2n  1)q
Bpq   p q   Amn cos
cos
với
0  q  N 1
2M
2N
m0 n 0

1/ M

Trong đó:  p  

1/ N

p0

 (2 / M ) 0  p  M  1

và  q  

q0

 (2 / N ) 0  q  N  1

Các giá trị pq đƣợc gọi là các hệ số của iến đổi DCT. DCT có thể iến đổi
ngƣợc đƣợc và iến đổi ngƣợc của nó cho ởi c ng thức :
M 1 N 1

Amn   p q Bpq cos
p 0 q 0

1/ M

Trong đó:  p  

 (2m  1) p
2M


cos

p0

 (2 / M ) 0  p  M  1

 (2n  1)q
2N

với

1/ N

và  q  

0  m  M 1
0  n  N 1
q0

 (2 / N ) 0  q  N  1

SVTH: VÕ THỊ KHUYÊN - MSSV: 1251071595 - LỚP 53K1 Trang 12


Đồ án tốt nghiệp

GVHD: ThS. Nguyễn Bùi Hậu

iểu thức DCT ngƣợc có thể đƣợc xem x t khi coi rằng mọi ma trận A k ch
thƣớc MxN nhƣ là tổng của MN hàm có dạng :

 p q Bpq cos

 (2m  1) p
2M

cos

 (2n  1)q
2N

Những hàm này đựơc gọi là những hàm cơ sở của DCT. Hệ số DCT Bpq
có thể đƣợc xem nhƣ trọng số cho mỗi hàm cơ sở. Với các ma trận 8x8, 64 hàm
cơ sở đƣợc minh hoạ ởi ảnh sau:

Hình minh họa ma trận 8x8
1.3.1. 1 Nén tổn hao dựa vào DCT
Giải thuật n n có tổn hao đƣợc iết đến nhi u nhất có lẽ là giải thuật dùng
DCT. Đ y là giải thuật đƣợc chuẩn hóa với tên gọi JPEG (lấy từ tên gọi của tổ
chức đã định ra tiêu chuẩn n n này: Joint Photographic Experts Groups (Nhóm
lien kết các chuyên gia xử lý ảnh). Chuẩn JPEG đƣợc sử dụng để mã hố ảnh đa
mức xám, ảnh màu. Nó kh ng cho kết quả ổn định lắm với ảnh đen trắng. Chuẩn
JPEG cung cấp giải thuật cho cả hai loại n n là n n kh ng mất mát th ng tin và
n n mất mát th ng tin.
Sơ đồ khối của gi i thuật nén v gi i nén nh JPEG:

ẢNH
GỐC

Ph
ân


8x8

kh

i

8x8

DCT

Lƣợng
tử hoá

Mã hoá

ẢNH
NÉN

......
ảng

ảng mã
SVTH: VÕ THỊ KHUYÊN - MSSV: 1251071595
lƣợng -tửLỚP 53K1 Trang 13
8x8


Đồ án tốt nghiệp


GVHD: ThS. Nguyễn Bùi Hậu

Sơ đồ khối của giải thuật n n và giải n n ảnh JPEG
Để n n ảnh theo giải thuật JPEG, ta chia ảnh thành các khối 8x8 (hoặc
16x16). Mỗi khối 8x8 này sẽ đƣợc xử lý riêng iệt qua các ƣớc của quá trình
n n ảnh. Đầu tiên, ta thực hiện iến đổi DCT thuận đối với mỗi khối. Nhƣ chúng
ta đã iết, do các điển ảnh kế cận nhau thƣờng có t nh tƣơng quan rất cao, ph p
iến đổi DCT thuận có xu hƣớng tập trung hầu hết năng lƣợng của ức ảnh vào
trong một vài hệ số DCT tần số thấp. Đ y là cơ sở để ta thực hiện n n ảnh. Với
một khối ảnh k ch thƣớc 8x8 tr ch từ ảnh nguồn, hầu hết các hệ số của nó đ u
ằng 0 hoặc gần ằng 0. Nhƣ vậy, ta có thể kh ng cần iểu di n các hệ số này
khi truy n dữ liệu ảnh đi. Lƣu ý rằng ản th n iến đổi DCT kh ng làm mất mát
thong tin của ảnh gốc, nó chỉ chuyển các th ng tin này v một dạng khác mà ta
có thể mã hóa một cách hiệu quả hơn.
Sau khi qua ộ iến đổi DCT, mỗi hệ số trong số 64 hệ số iến đổi DCT
đƣợc lƣợng tử hóa dựa vào một ảng giá trị lƣợng tử đƣợc thiết kế kỹ lƣỡng.
Một phƣơng pháp lƣợng tử đơn giản có thể dùng là chỉ giữ lại một vài hệ số
DCT tần số thấp (các hệ số có giá trị lớn) còn tất cả các hệ số còn lại gán ằng 0.
trong chuẩn n n JPEG, mỗi hệ số DCT sẽ đƣợc chia cho một trọng số ở vị tr
tƣơng ứng trong một ma trận lƣợng tử 8x8, sau đó làm tròn v số nguyên gần
nhất. Sau khi lƣợng tử hóa, các hệ số iến đổi DCT sẽ đƣợc sắp xếp theo một
SVTH: VÕ THỊ KHUYÊN - MSSV: 1251071595 - LỚP 53K1 Trang 14


Đồ án tốt nghiệp

GVHD: ThS. Nguyễn Bùi Hậu

chuỗi zig-zag ắt đầu từ thành phần DC, rồi đến thành phần AC… Cuối cùng
các hệ số này đƣợc chuyển thành chuỗi it nhị ph n ằng kỹ thuật mã hóa đƣa

ra ảnh n n.
Ở c ng đoạn giải mã, ộ giải mã sẽ thự hiện quá trình ngƣợc lại: Giải mã
entropy, sau đó nh n các hệ số thu đƣợc với phần tử tƣơng ứng của ma trận
lƣợng tử, rồi iến đổi ngƣợc DCT để tái tạo lại ảnh an đầu.
Ph n khối
Chuẩn n n JPEG ph n ảnh ra các khối 8x8. C ng đoạn iến đổi nhanh
Cosin hai chi u cho các khối 8x8 tỏ ra hiệu quả hơn. iến đổi Cosin cho các
khối có cùng k ch cỡ có thể giảm đƣợc một phần các t nh toán chung nhƣ việc
t nh hệ số Cji. Khi n=8 chúng ta chỉ cần t nh hệ số Cji cho 3 tầng (8= 23), số các
hệ số là: 4 + 2 + 1 = 7.
Nếu với một ảnh 1024x1024, ph p iến đổi nhanh Cosin một chi u theo
hàng ngang hoặc hàng dọc ta phải qua 10 tầng (1024 = 210). Số các hệ số Cji là:
512 + 256 + 128 + 64 + 32 + 16 + 8 + 4 + 2 + 1 = 1021. Thời gian t nh các hệ số
Cji với toàn ộ ảnh 1024x1024 lớn gấp 150 lần so với thời gian t nh toán các hệ
số này cho các khối.
iến đổi Cosin đối với các khối có k ch thƣớc nhỏ sẽ làm tăng độ ch nh
xác khi t nh toán với số dấu phẩy tĩnh, giảm thiểu sai số do làm tròn sinh ra.
Do các điểm ảnh k cận có độ tƣơng quan cao hơn, do đó ph p iến đổi
Cosin cho từng khối nhỏ sẽ tập trung năng lƣợng hơn vào một số t các hệ số
iến đổi. Việc loại ớt một số hệ số năng lƣợng thấp trong các khối chỉ tạo ra
mất mát th ng tin cục ộ giúp n ng cao chất lƣợng ảnh.
Ảnh sẽ đƣợc chia làm khối với:
 M '   N' 
   M B  NB
 k   l 

B

Các khối đƣợc xác định ởi ộ số (m,n) với m = [0..MB-1] và n=[0..NB-1],
ở đ y m chỉ thứ tự của khối theo chi u rộng, n chỉ thứ tự của khối theo chi u dài.

Ph n khối thực chất là xác định tƣơng quan giữa toạ độ riêng trong khối với toạ
độ thực của điểm ảnh trong ảnh an đầu. Nếu ảnh an đầu ký hiệu Image[i,j] thì
ma trận iểu di n khối (m,n) là x[u,v]đƣợc t nh:

x[u, v]  Im agemk  u , nl  v

iến đổi
SVTH: VÕ THỊ KHUYÊN - MSSV: 1251071595 - LỚP 53K1 Trang 15


Đồ án tốt nghiệp

GVHD: ThS. Nguyễn Bùi Hậu

iến đổi là một c ng đoạn lớn trong các phƣơng pháp n n sử dụng ph p
iến đổi.
Nhiệm vụ của c ng đoạn iến đổi là tập trung năng lƣợng vào một số t các
hệ số iến đổi.
C ng thức iến đổi cho mỗi khối là:
X (k 1 , k 2 ) 

 k 1 k 2
4

7 7
(2n1  1)k 1 
(2n 2  1)k 2 
Cos
  x(n1 , n 2 )Cos
16

16
n10 n 2 0

 k1

Trong đó

 k2

 1

 2
 0

 1

 2
 0

khi
khi

khi
khi

k1  0
(0  k1  8)

k2  0
(0  k 2  8)


Thuật toán iến đổi nhanh Cosin hai chi u cho mỗi khối trong trƣờng hợp
này sẽ ao gồm 16 ph p iến đổi nhanh Cosin một chi u. Đầu tiên, ngƣời ta
iến đổi nhanh Cosin một chi u cho các dãy điểm ảnh trên mỗi hàng. Lần lƣợt
thực hiện cho 8 hàng. Sau đó đem iến đổi nhanh Cosin một chi u theo từng cột
của ma trận vừa thu đƣợc sau 8 ph p iến đổi trên. Cũng lần lƣợt thực hiện cho
8 cột. Ma trận cuối cùng sẽ là ma trận hệ số iến đổi của khối tƣơng ứng.
Trong sơ đồ giải n n ta phải dùng ph p iến đổi Cosin ngƣợc. C ng thức
iến đổi ngƣợc cho khối 8x8:
7 7
(2n1 1)k1
(2n2 1)k2
x(n1 , n 2 )  1 2   X (kn1 , k 2 )Cos
Cos
4 k 10
16
16
k 2 0

 k1

Trong đó

 k2

 1

 2
 0


khi
khi

 1

 2
 0

khi
khi

k1  0
(0  k1  8)

k2  0
(0  k 2  8)

Lƣợng tử hóa
SVTH: VÕ THỊ KHUYÊN - MSSV: 1251071595 - LỚP 53K1 Trang 16


Đồ án tốt nghiệp

GVHD: ThS. Nguyễn Bùi Hậu

Khối lƣợng tử hố trong sơ đồ n n đóng vai trị quan trọng và quyết định tỉ
lệ n n của chuẩn n n JPEG. Đầu vào của khối lƣợng tử hoá là các ma trận hệ số
iến đổi Cosin của các khối điểm ảnh.
Để giảm số ộ lƣợng tử, ngƣời ta tìm cách quy các hệ số ở các khối v
cùng một khoảng ph n ố. Chuẩn n n JPEG chỉ sử dụng một ộ lƣợng tử hoá.

Giả sử rằng các hệ số đ u có hàm t nh xác suất xuất hiện nhƣ nhau. Chúng ta sẽ
căn chỉnh lại hệ số yj ằng ph p gán:
yj 

Với

yj j

j

j là trung ình cộng của hệ số thứ j.
j là độ lệch cơ ản của hệ số thứ j.

Nén
Đầu vào của khối n n gồm hai thành phần: thành phần các hệ số một chi u
và thành phần các hệ số xoay chi u.
Thành phần các hệ số một chi u Ci(0,0) với i = 0,1,..., 63 chứa phần lớn
năng lƣợng t n hiệu hình ảnh. Ngƣời ta kh ng n n trực tiếp các giá trị C i(0,0) mà
xác định độ lệch của Ci(0,0):
d i  Ci 1 (0,0)  Ci (0,0)

di có giá trị nhỏ hơn nhi u so với Ci nên trong iểu di n dấu phẩy động theo
chuẩn IEEE754 thƣờng chứa nhi u chuỗi it 0 nên có thể cho hiệu suất n n cao
hơn. Giá trị C0(0,0) và các độ lệch di đƣợc ghi ra một tệp tạm. Tệp này đƣợc n n
ằng phƣơng pháp n n Huffman.
Thành phần các hệ số xoay chi u Ci(m,n) với 1  m  7, 1  n  7 chứa các
th ng tin chi tiết của ảnh. Để n ng cao hiệu quả n n cho mỗi ộ hệ số trong một
khối ngƣời ta xếp lại chúng theo thứ tự ZigZag. Có thể hình dung hình ZigZag
nhƣ ảng trang ên.
Tác dụng của sắp xếp lại theo thứ tự ZigZag là tạo ra nhi u loạt hệ số giống

nhau. Chúng ta iết rằng năng lƣợng của khối hệ số giảm dần từ góc trên ên
trái xuống góc dƣới ên phải nên việc sắp xếp lại các hệ số theo thứ tự ZigZag
sẽ tạo đi u kiện cho các hệ số xấp xỉ nhau (cùng mức lƣợng tử) nằm trên một
dòng.

SVTH: VÕ THỊ KHUYÊN - MSSV: 1251071595 - LỚP 53K1 Trang 17


Đồ án tốt nghiệp

GVHD: ThS. Nguyễn Bùi Hậu

0

2

3

9

10

20

21

35

1


4

8

11

19

22

34

36

5

7

12

18

23

33

37

48


6

13

17

24

32

38

47

49

14

16

25

31

39

46

50


57

15

26

30

40

45

51

56

58

27

29

41

44

52

55


59

62

28

42

43

53

54

60

61

63

Mỗi khối ZigZag này đƣợc mã hoá theo phƣơng pháp RLE. Cuối mỗi khối
đầu ra của RLE, ta đặt dấu kết thúc khối EO (End Of Block).
Sau đó, các khối đƣợc dồn lại và mã hoá một lần ằng phƣơng pháp mã
Huffman. Nhờ có dấu kết thúc khối nên có thể ph n iệt đƣợc hai khối cạnh
nhau khi giải mã Huffman. Hai ảng mã Huffman cho hai thành phần hệ số tất
nhiên sẽ khác nhau.
Để có thể giải n n đƣợc, chúng ta phải ghi lại th ng tin nhƣ: k ch thƣớc
ảnh, k ch thƣớc khối, ma trận T, độ lệch tiêu chuẩn, các mức tạo lại, hai ảng mã
Huffman, k ch thƣớc khối n n một chi u, k ch thƣớc khối n n xoay chi u... và
ghi nối tiếp vào hai file n n của hai thành phần hệ số.

Tóm lại, DCT làm giảm độ tƣơng quan kh ng gian của th ng tin trong
lock (khối). Đi u đó cho ph p i u di n th ch hợp ở mi n DCT do các hệ số
DCT có xu hƣớng có phần dƣ thừa t hơn. Đi u này có nghĩa là DCT gói một
phần lớn năng lƣợng t n hiệu vào các thành phần iến đổi có tần số tƣơng đối
thấp để lƣu trữ hoặc truy n dẫn, tạo 0 và các giá trị rất thấp đối với thành phần
tần số cao. Nhờ đặc t nh của hệ thống nhìn của mắt ngƣời, các hệ số DCT có thể
đƣợc mã hóa phù hợp, chỉ các hệ số DCT quan trọng nhất mới đƣợc mã hóa và
truy n đi. DCT thuận kết hợp với DCT nghịch sẽ kh ng cho tổn thất nếu độ dài
SVTH: VÕ THỊ KHUYÊN - MSSV: 1251071595 - LỚP 53K1 Trang 18


Đồ án tốt nghiệp

GVHD: ThS. Nguyễn Bùi Hậu

từ mã của hệ số là 13 đến 14 its cho t n hiệu video đầu vào đƣợc số hóa ằng
các mẫu dài 8 it. Nếu hệ số đƣợc lƣợng tử hóa ằng 11 it (hoặc ngắn hơn), thì
n n ằng DCT sẽ có tổn hao.
1.3.2. iến đổi Wave et rời rạc (DWT – Discrete Wavelet Transform)

Mối quan hệ giữa hàm tỉ lệ và hàm wavelet đƣơc cho

ởi:

Các ph p lọc đƣợc tiến hành với nhi u tầng (level) khác nhau và để khối
lƣợng t nh toán kh ng tăng, khi qua mỗi ộ lọc, t n hiệu đƣợc lấy mẫu xuống 2.
Ứng với mỗi tầng, t n hiệu có độ ph n giải khác nhau. Do đó, ph p iến
đổi wavelet rời rạc đƣợc gọi là ph n t ch đa ph n giải (MRA, multiresolution
analysis).


Ph n t ch đa ph n giải sử dụng iến đổi wavelet rời rạc
Tại mỗi tầng lọc, iểu thức của ph p lọc đƣợc cho ởi c ng thức:

Trong đó, S(n) là t n hiệu, h(n) là đáp ứng xung của các ộ lọc th ng thấp
tƣơng ứng với hàm tỉ lệ Φ(n) và g(n) là đáp ứng xung của các ộ lọc th ng cao
tƣơng ứng với hàm wavelet ψ(n). Hai ộ lọc này liên hệ nhau theo hệ thức:
SVTH: VÕ THỊ KHUYÊN - MSSV: 1251071595 - LỚP 53K1 Trang 19


Đồ án tốt nghiệp

GVHD: ThS. Nguyễn Bùi Hậu

h(N-1-n)=(-1)ng(n)
trong đó, N là số mẫu trong t n hiệu.
T n hiệu S(n) có thể đƣợc tái tạo theo các ƣớc ngƣợc lại gọi là ph p iến
đổi wavelet rời rạc nghịch (IDWT, inverse discrete wavelet transform) đƣợc cho
ởi:

Trong đó, yhigh(k) và ylow(k) lần lƣợt là t n hiệu ngõ ra sau khi đi qua các
ộ lọc th ng cao và ộ lọc th ng thấp đã.
Chƣơng 2. MỘT SỐ PHƢƠNG PHÁP NÉN ẢNH SỐ
2.1. Giới thiệu chƣơng

Chƣơng này trình ày cách ph n loại các phƣơng pháp n n ảnh, một số
phƣơng pháp n n ảnh số: Phƣơng pháp mã hoá độ dài loạt RLE; Phƣơng pháp
mã hoá Huffman; Phƣơng pháp LZW; Phƣơng pháp n n ảnh JPEG dựa vào
ph p iến đổi DCT; Phƣơng pháp n n ảnh JPEG 2000 dựa vào ph p iến đổi
DWT;. Nội dung chƣơng 2 sẽ là cơ sở quan trọng để tiến hành thử nghiệm trong
chƣơng 3.

2.2. Cách phân loại các phƣơng pháp n n ảnh
2.2.1. Cách ph n oại dựa v o nguyên lý nén

N n ảo toàn th ng tin (losses compression): ao gồm các phƣơng pháp
n n mà sau khi giải n n sẽ thu đựơc ch nh xác dữ liệu gốc.Tuy nhiên n n ảo
toàn th ng tin chỉ đạt hiệu quả nhỏ so với phƣơng pháp n n kh ng ảo tồn
thơng tin.
Nén khơng ảo tồn th ng tin (lossy compression): ao gồm các phƣơng
pháp n n sau khi giải n n sẽ kh ng thu đƣợc dữ liệu nhƣ ản gốc. Các phƣơng
pháp này đƣợc gọi là “t m lý thị giác” đó là lợi dụng t nh chất của mắt ngƣời
chấp nhận một số vặn xoắn trong ảnh khi kh i phục lại.Phƣơng pháp này lu n
đem lại hiệu quả cao do loại ỏ đi những th ng tin dƣ thừa kh ng cần thiết.
2.2.2. Cách ph n oại dựa v o cách thức thực hiện nén

Phƣơng pháp kh ng gian (Spatial Data Compression ): các phƣơng pháp
này thực hiện n n ằng cách tác động trực tiếp lên việc lấy mẫu của ảnh trong
mi n kh ng gian.

SVTH: VÕ THỊ KHUYÊN - MSSV: 1251071595 - LỚP 53K1 Trang 20


Đồ án tốt nghiệp

GVHD: ThS. Nguyễn Bùi Hậu

Phƣơng pháp sử dụng iến đổi (Transform Coding): gồm các phƣơng pháp
tác động lên sự iến đổi của ảnh gốc chứ kh ng tác động trực tiếp.
2.2.3. Cách ph n oại dựa v o ý thu ết mã hoá

Các phƣơng pháp n n thế hệ thứ nhất: gồm các phƣơng pháp có mức độ

t nh toán đơn giản nhƣ lấy mẫu , gán từ mã,….
Các phƣơng pháp n n thế hệ thứ hai: gồm các phƣơng pháp dựa vào mức
độ ão hoà của tỷ lệ n n ằng cách sử dụng các ph p toán tổ hợp đầu ra một
cách hợp lý hoặc sử dụng iểu di n ảnh nhƣ : phƣơng pháp kim tự tháp Laplace,
phƣơng pháp dựa vào vùng gia tăng, phƣơng pháp tách hợp.
2.2.4. Quá trình nén v gi i nén

Gồm 2 c ng đoạn :
N n : dữ liệu gốc qua ộ mã hoá dữ liệu , ộ mã hoá này thực hiện n n dữ
liệu đến một mức th ch hợp cho việc lƣu trữ và truy n dẫn th ng tin. Quá trình
này sẽ thực hiện việc loại ỏ hay cắt ớt những dƣ thừa của ảnh để thu đƣợc
th ng tin cần thiết nhƣng vẫn đảm ảo đƣợc chất lƣợng ảnh.
Giải n n : dữ liệu n n đi qua ộ giải mã dữ liệu, ộ giải mã sẽ thực hiện
giải n n để thu đƣợc dữ liệu gốc an đầu.Việc giải n n này thƣờng phải dựa vào
các th ng tin đi k m theo dữ liệu n n ,tuỳ thuộc vào kiểu n n hay phƣơng pháp
n n mà dữ liệu giải n n đƣợc có hồn tồn giống với dữ liệu gốc an đầu hay
không.
2.3. Một số phƣơng pháp n n ảnh số
2.3.1. Các phương pháp nén kh ng m t mát th ng tin

2.3.1.1. Phương pháp mã hoá độ dài loạt RLE
Mã hoá theo độ dài loạt RLE (Run Length Encoding) là một phƣơng pháp
n n ảnh dựa trên sự cắt ớt các dƣ thừa v kh ng gian (một vài hình ảnh có
vùng màu lớn kh ng đổi đặc iệt đối với ảnh nhị ph n). Loạt đƣợc định nghĩa là
dãy các phần tử điểm ảnh (pixel) liên tiếp có cùng chung một giá trị.
Nguyên tắc :
Nguyên tắc của phƣơng pháp này là phát hiện một loạt các điểm ảnh lặp lại
liên tiếp, v dụ :110000000000000011 .Ta thấy điểm ảnh có giá trị 0 xuất hiện
nhi u lần liên tiếp thay vì phải lƣu trữ tồn ộ các điểm ảnh có giá trị 0 ta chỉ
cần lƣu trữ chúng ằng cách sử dụng các cặp (độ dài loạt, giá trị).

V dụ:
Cho một chuỗi nguồn d :
SVTH: VÕ THỊ KHUYÊN - MSSV: 1251071595 - LỚP 53K1 Trang 21


×