Tải bản đầy đủ (.pdf) (109 trang)

Bài toán về xử lý ảnh và nén ảnh JPEG2000

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (22.12 MB, 109 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
-----------------------------------------------

LUẬN VĂN THẠC SĨ KHOA HỌC
NGÀNH : ĐIỆN TỬ VIỄN THƠNG

BÀI TỐN VỀ XỬ LÝ ẢNH VÀ
NÉN ẢNH JPEG2000

PHAN VIỆT CƯỜNG

HÀ NỘI 2006


MỤC LỤC
CHƯƠNG 1 : CƠ SỞ BIỂU DIỄN ẢNH
1.1

Một số khái niệm về ảnh ………………………………………

1

1.2

Các định dạng cơ bản trong xử lý ảnh …………………………

1

1.2.1 Định dạng ảnh IMG ……………………………………………


2

1.2.2 Định dạng ảnh PCX ……………………………………………

3

1.2.3 Định dạng ảnh TIFF ……………………………………………

5

1.2.4 Định dạng ảnh GIF ……………………………………………..

6

1.3

Thay đổi nhịp lấy mẫu ………………………………………….

10

1.3.1 Bộ phân chia ……………………………………………………

10

1.3.2 Bộ lọc nội suy ………………………………………………….

11

1.4


13

Điều kiện để khơi phục hồn hảo ………………………………

CHƯƠNG 2: TỔNG QUAN CÁC BÀI TỐN VỀ XỬ LÝ ẢNH
2.1 Mở đầu …………………………………………………………….

19

2.2 Bài tốn nâng cao chất lượng ảnh …………………………………

19

2.2.1 Tăng cường ảnh …………………………………………………

19

2.2.1.1 Cải thiện ảnh dùng toán tử điểm ………………………………

20

2.2.1.2 Cải thiện ảnh dùng tốn tử khơng gian ……………………….

22

2.2.2 Khơi phục ảnh ………………………………………………….

23

2.3 Phát hiện đường biên ……………………………………………..


26

2.3.1 Phương pháp Gradient …………………………………………...

27

2.3.2 Phương pháp Laplace ……………………………………………

29

2.4 Bài toán phân vùng ảnh ……………………………………………

30


2.5 Bài toán nhận dạng ảnh ……………………………………………

32

2.6 Bài toán nén ảnh …………………………………………………..

33

2.6.1 Biến đổi ảnh ……………………………………………………..

34

2.6.2 Lượng tử hoá ……………………………………………………


34

2.6.3 Mã hoá Entropy …………………………………………………

35

2.7 Kết luận ……………………………………………………………

45

CHƯƠNG 3 : HỆ THỐNG NÉN ẢNH TĨNH JPEG2000
3.1 Giới thiệu ………………………………………………………….

46

3.2 Đặc điểm – yêu cầu - ứng dụng …………………………………...

47

3.3 Kiến trúc cơ bản của tiêu chuẩn …………………………………..

51

3.3.1 Tiling ……………………………………………………………

53

3.3.2 Dịch một chiều và biến đổi thành phần ảnh ……………………..

55


3.3.3 Biến đổi wavelet ………………………………………………..

58

3.3.3.1 Định nghĩa biến đổi wavelet …………………………………..

58

3.3.3.2 Biến đổi wavelet trong ảnh JPEG2000 ………………………..

61

3.3.3.3 Các phương pháp thực hiện biến đổi wavelet …………………

63

3.3.4 Lượng tử hoá …………………………………………………….

66

3.3.5 Mã hoá Entropy ………………………………………………….

67

3.3.5.1 Mã hoá Code-Blocks …………………………………………

67

3.3.5.2 Mã hoá theo ngữ cảnh .………………………………………


69

3.3.5.3 Mã hoá MQ: Mã hoá Entropy phụ thuộc ngữ cảnh ……………

78

3.3.6 Gói và lớp ………………………………………………………..

83

3.3.3.6.1 Cách chia gói và lớp …………………………………………

83


3.3.3.6.2 Ước lượng đường cong tỉ lệ méo ……………………………

84

3.4 Ví dụ nén ảnh JPEG2000 …………………………………………

87

CHƯƠNG 4: KẾT QUẢ SO SÁNH VÀ MƠ PHỎNG
4.1 Kết quả so sánh …………………………………………………..

93

4.2 Mơ phỏng …………………………………………………………


97

KẾT LUẬN VÀ KIẾN NGHỊ

99

TÀI LIỆU THAM KHẢO


CÁC TỪ VIẾT TẮT
AGP

Alphabet and Group Partitioning

APSG

Alphabet Partitioning and Sample Grouping

CCD

Charge Coupled Device

CU

Clean-Up

DCT

Discrete Cosine Transform


DWT

Discrete Wavelet Transform

EBCOT

Embedded Block Coding with Optimal Truncation

EZBC

Embedded ZeroBlock Coding and context modelling

GIF

Graphics Interchanger Format

ICT

Irrversible Component Transformation

JPEG

Joint Photographic Experts Group

RCT

Reversible Component Transformation

RLE


Run Length Encoded

LSB

Least Significant Bit

MSB

Most Significant Bit

MSE

Mean Square Error

MR

Magnitude Refinement

PCM

Pulse Code Modulation

PSF

Point Spread Function

PSNR

Peak Signal to Noise Ratio


R-D

Rate - Distortion

RWT

Reversible Wavelet Transform


ROI

Region of Interest

SNR

Signal to Noise Ratio

SP

Significance Propagation

bpp

bits per pixel

bps

bits per second


ppi

pixels per inch


MỞ ĐẦU
Từ khi có ảnh đen trắng, máy ảnh màu rồi đến nay là máy ảnh số và đặc
biệt khi có sự ra đời của truyền hình đen trắng, truyền hình màu, tiếp đến là
truyền hình số thì cơng nghệ xử lý ảnh được coi trọng nhằm nâng cao chất
lượng ảnh, hỗ trợ trong nghiên cứu và ứng dụng trong các lĩnh vực trong cuộc
sống như: y tế, bảo mật, nhận dạng, quân sự …..Cùng với sự phát triển của
các thiết bị thu ảnh công nghệ xử lý ảnh cũng đã phát triển mạnh mẽ để đáp
ứng được nhu cầu ngày càng cao của con người. Ngày nay, khi các thiết bị
điện tử, quang điện tử đã và đang được số hố mạnh mẽ thì các cơng nghệ xử
lý ảnh truyền thống trước đây cũng đã được thay thế bằng công nghệ xử lý
ảnh số.
Đề tài này xuất phát từ yêu cầu thực tế và cùng với các kiến thức cơ
bản đã được học và nghiên cứu tại trường cũng như cơ quan làm việc tôi đã
chọn đề tài “BÀI TOÁN VỀ XỬ LÝ ẢNH VÀ NÉN ẢNH JPEG2000”
Đề tài được tiến hành với mục đích nghiên cứu các cơ sở lý thuyết, các
kỹ thuật xử lý ảnh số, đặc biệt đề tài đi sâu vào kỹ thuật nén ảnh mới
JPEG2000 đang được IEEE và ITU nghiên cứu và bước đầu đang đi thử
nghiệm và ứng dụng trong một số lĩnh vực như hệ điều hành Windows Vista.
Trên cơ sở lý thuyết, đề tài cịn phần mơ phỏng cho thấy hiệu quả nén ảnh
JPEG2000 với các định dạng nén ảnh khác như JPEG, GIF.
Nội dung của đề tài được chia thành các chương như sau:
Chương 1: Cơ sở biểu diễn ảnh: đưa ra một số định dạng file ảnh cơ bản và
phương pháp lọc số nhiều nhịp ứng dụng trong wavelet và mã hố băng con
và điều kiện để khơi phục hồn hảo giữa bên phân tích và bên tổng hợp băng
con.



Chương 2: Tổng quan các bài toán về xử lý ảnh: đưa ra một số bài toán tác
động lên ảnh nhằm đạt được một mục đích mong muốn như: nâng cao chất
lượng ảnh, khôi phục ảnh, phát hiện đường biên của ảnh, phân vùng ảnh, nhận
dạng ảnh, nén ảnh.
Chương 3: Hệ thống nén ảnh tĩnh JPEG2000: đi sâu vào kỹ thuật nén ảnh
từ một ảnh ban đầu đến dịng bít dữ liệu đầu ra. Phương pháp nén ảnh
JPEG2000 dựa trên kỹ thuật biến đổi wavelet và mã hoá số học Arithmetic
với mã hoá khối nhúng cắt cụt tối ưu EBCOT.
Chương 4: Kết quả so sánh và mô phỏng: đưa ra một số kết luận so sánh
chủ quan và khách quan của nén ảnh JPEG2000 và JPEG cũng như phương
pháp nén ảnh tổn hao và không tổn hao. Mô phỏng nén JPEG2000 và đánh
giá kết luận của bản thân về JPEG2000.
Trong khuôn khổ của một đề tài với quỹ thời gian khơng cho phép và
một số khó khăn trong việc cập nhật tài liệu cũng như do hạn chế của bản
thân nên chắc chắn đề tài không tránh khỏi những thiếu sót, vậy kính mong
các thầy cơ cùng đồng nghiệp đóng góp chỉ bảo, phê bình để đề tài ngày càng
được hoàn thiện.
Em xin chân thành cảm ơn thầy giáo TS. Nguyễn Văn Khang đã tận
tình hướng dẫn chỉ bảo em trong thời gian thực hiện đề tài !
Em xin chân thành cảm ơn !
Hà Nội, 4/11/2006
Tác giả

Phan Việt Cường


Chương 1: Cơ sở biểu diễn ảnh


CHƯƠNG 1: CƠ SỞ BIỂU DIỄN ẢNH
1.1 Một số khái niệm về ảnh

Hình 1.1 : Ảnh số
 Pixel (Picture Element) phần tử ảnh: Ảnh trong thực tế là một ảnh liên tục
về không gian và về giá trị độ sáng. Để có thể xử lý ảnh bằng máy tính cần
thiết phải tiến hành số hố ảnh. Trong q trình số hố, người ta biến đổi
tín hiệu liên tục sang tín hiệu rời rạc thơng qua q trình lấy mẫu (rời rạc
hóa về khơng gian) và lượng hoá thành phần giá trị mà về nguyên tắc bằng
mắt thường không phân biệt được hai điểm kề nhau. Trong quá trình này,
người ta sử dụng khái niệm Picture element mà ta quen gọi hay viết là
Pixel - phần tử ảnh. Như vậy một ảnh là một tập hợp các Pixel tạo thành
một ma trận ảnh x(i,j) với i và j là chỉ số theo chiều dọc và ngang của ma
trận dữ liệu ảnh, giá trị x kết quả màu tại thời điểm đang xét.
 Ảnh xám: là ảnh mà mỗi pixel là biểu thị một giá trị của mức xám.
 Ảnh màu : là ảnh mã mỗi pixel một vector màu (R, G, B) với R, G, B là
biểu diễn một giá trị màu Red, Green, Blue.

1.2 Các định dạng ảnh cơ bản trong xử lý ảnh

Trang - 1 -


Chương 1: Cơ sở biểu diễn ảnh

Ảnh thu được sau q trình số hố có nhiều loại khác nhau, phụ thuộc
vào kỹ thuật số hố ảnh. Như đã nói ở phần trên, ta chia làm 2 loại: ảnh đen
trắng và ảnh màu. ảnh thu nhận được có thể lưu trữ trên tệp để phục vụ cho
các bước xử lý tiếp theo. Dưới đây sẽ trình bày một số định dạng ảnh thơng
dụng hay dùng trong q trình xử lý ảnh hiện nay.

1.2.1 Định dạng ảnh IMG
Ảnh IMG là ảnh đen trắng. Phần đầu của ảnh IMG có 16 bytes chứa các
thông tin cần thiết :
- 6 byte đầu: dùng để đánh dấu định dạng nh IMG. Giá trị của 6 byte này
viết dưới dạng Hexa 0x0001 0x0008 0x0001.
- 2 byte tiếp theo: chứa độ dài mẫu tin. Đó là độ dài của dãy các byte kề
liền nhau mà dãy này sẽ được lặp lại một số lần nào đó. Số lần lặp này sẽ
được lưu trong byte đếm. Nhiều dãy giống nhau được lưu trong một
byte.
- 4 byte tiếp: mô tả kích cỡ pixel.
- 2 byte tiếp : số pixel trên một dòng ảnh.
- 2 byte cuối: số dòng ảnh trong ảnh.
Ảnh IMG được nén theo từng dòng. Mỗi dòng bao gồm các gói (pack). Các
dịng giống nhau cũng được nén thành một gói. Có 4 loại gói sau:
- Loại 1: Gói các dịng giống nhau:
Quy cách gói tin này như sau: 0x00 0x00 0xFF Count. Ba byte đầu cho biết
số các dãy giống nhau; byte cuối cho biết số các dịng giống nhau.
- Loại 2: Gói các dãy giống nhau
Quy cách gói tin này như sau: 0x00 Count. Byte thứ hai cho biết số các dãy
giống nhau được nén trong gói. Độ dài của dãy ghi ở đầu tệp.

Trang - 2 -


Chương 1: Cơ sở biểu diễn ảnh

- Loại 3: Dãy các pixel không giống nhau, không lặp lại và không nén
được
Qui cách như sau: 0x80 Count. Byte thứ hai cho biết độ dài dãy các pixel
không giống nhau không nén được.

- Loại 4: Dãy các pixel giống nhau
Tuỳ theo các bit cao của byte đầu là 0 hay 1. Nếu bit cao là giá trị 1 thì đây là
gói nén các byte chỉ gồm bit 0, số các byte được nén được tính bởi 7 bit thấp
cịn lại. Nếu bit cao là giá trị 0 thì đây là gói nén các byte gồm toàn bit 1. Số
các byte được nén được tính bởi 7 bit thấp cịn lại.
Các gói tin của file IMG phong phú như vậy là do ảnh IMG là ảnh đen trắng,
do vậy chỉ cần 1 bit cho 1 pixel thay vì 4 hoặc 8 như đã nói ở trên. Tồn bộ
ảnh chỉ có những điểm sáng và tối tương ứng với giá trị 1 hoặc giá trị 0. Tỷ lệ
nén của kiểu định dạng này là khá cao.
1.2.2 Định dạng ảnh PCX
Định dạng ảnh PCX là một trong những định dạng ảnh cổ điển nhất. Nó
sử dụng phương pháp mã loạt dài RLE (Run-Length-Encoded) để nén dữ liệu
ảnh. Quá trình nén và giải nén được thực hiện trên từng dòng ảnh. Thực tế,
phương pháp giải nén PCX kém hiệu quả hơn so với kiểu IMG. Tệp PCX
gồm 3 phần: đầu tệp (header), dữ liệu ảnh (image data) và bảng màu mở rộng
Header của tệp PCX có kích thước cố định gồm 128 byte và được phân bố
như sau:
- 1 byte: chỉ ra kiểu định dạng. Nếu là kiểu PCX/PCC nó ln có giá trị là
0Ah.
- a1 byte: chỉ ra version sử dụng để nén ảnh, có thể có các giá trị sau:
+ 0: version 2.5.
+ 2: version 2.8 với bảng màu.

Trang - 3 -


Chương 1: Cơ sở biểu diễn ảnh

+ 3: version 2.8 hay 3.0 khơng có bảng màu.
+ 5: version 3.0 có bảng màu.

- 1 byte: chỉ ra phương pháp mã hoá. Nếu là 0 thì mã hố theo phưng pháp
BYTE PACKED, nếu không là phương pháp RLE.
- 1 byte: số bit cho một điểm ảnh plane.
- 1 word: toạ độ góc trái trên của ảnh. Với kiểu PCX nó có giá trị là (0,0);
cịn PCC thì khác (0,0).
- 1 word: toạ độ góc phải dưới.
- 1 word: kích thước bề rộng và bề cao ảnh.
- 1 word: số điểm ảnh.
- 1 word: độ phân giải màn hình.
- 1 word.
- 48 byte: chia thành 16 nhóm, mỗi nhóm 3 byte. Mỗi nhóm này chứa
thông tin về một thanh ghi màu. Như vậy ta có 16 thanh ghi màu.
- 1 byte: khơng dùng đến và luôn đặt là 0.
- 1 byte: số bit plane mà ảnh sử dụng. Với ảnh 16 màu, giá trị này là 4, với
ảnh 256 màu (1 pixel/8 bit) thì số bit plane lại là 1.
- 1 byte: số bytes cho một dòng quét ảnh.
- 1 word: kiểu bảng màu.
- 58 byte: khơng dùng.
Tóm lại, định dạng ảnh PCX thường được dùng để lưu trữ ảnh vì thao tác
đơn giản, cho phép nén và giải nén nhanh. Tuy nhiên vì cấu trúc của nó cố
định, nên trong một số trường hợp nó làm tăng kích thước lưu trữ. Và cũng vì
nhược điểm này mà một số ứng dụng lại sử dụng một kiểu định dạng khác
mềm dẻo hơn: định dạng TIFF (Targed Image File Format) sẽ mô tả dưới đây.

Trang - 4 -


Chương 1: Cơ sở biểu diễn ảnh

1.2.3 Định dạng ảnh TIFF

Kiểu định dạng TIFF được thiết kế để làm nhẹ bớt các vấn đề liên quan
đến việc mở rộng tệp ảnh cố định. Về cấu trúc, nó cũng gồm 3 phần chính:
- Phần Header (IFH): có trong tất c các tệp TIFF và gồm 8 byte:
+ 1 word: chỉ ra kiểu tạo tệp trên máy tính PC hay Macintosh. Hai loại
này khác nhau rất lớn ở thứ tự các byte lưu trữ trong các số dài 2 hay
4 byte. Nếu trường này có giá trị là 4D4Dh thì đó là ảnh cho máy
Macintosh; nếu là 4949h là của máy PC.
+ 1 word: version. Từ này ln có giá trị là 42. Có thể coi đó là đặc
trưng của file TIFF vì nó khơng thay đổi.
+ 2 word: giá trị Offset theo byte tính từ đầu file tới cấu trúc IFD
(Image File Directory) là cấu trúc thứ hai của file. Thứ tự các byte ở
đây phụ thuộc vào dấu hiệu trường đầu tiên.
- Phần thứ 2 (IFD): Nó khơng ở ngay sau cấu trúc IFH mà vị trí của nó
được xác định bởi trường Offset trong đầu tệp. Có thể có một hay nhiều
IFD cùng tồn tại trong file (nếu file có nhiều hơn 1 ảnh).
Một IFD gồm:
+ 2 byte: chứa các DE (Directory Entry).
+ 12 byte là các DE xếp liên tiếp. Mỗi DE chiếm 12 byte.
+ 4 byte : chứa Offset trỏ tới IFD tiếp theo. Nếu đây là IFD cuối cùng
thì trường này có giá trị là 0.
- Cấu trúc phần dữ liệu thứ 3: các DE.
Các DE có độ dài cố định gồm 12 byte và chia làm 4 phần:
+ 2 byte: Chỉ ra dấu hiệu mà tệp ảnh đã được xây dựng.
+ 2 byte: kiểu dữ liệu của tham số ảnh. Có 5 kiểu tham số cơ bản:

Trang - 5 -


Chương 1: Cơ sở biểu diễn ảnh


a) 1: BYTE (1 byte).
b) 2: ASCII (1 byte).
c) 3: SHORT (2 byte).
d) 4: LONG (4 byte).
e) 5: RATIONAL (8 byte).
+ 4 byte: trường độ dài (bộ đếm) chứa số lượng chỉ mục của kiểu dữ
liệu đã chỉ ra. Nó khơng phải là tổng số byte cần thiết để lưu trữ. Để
có số liệu này ta cần nhân số chỉ mục với kiểu dữ liệu đã dùng.
+ 4 byte: đó là Offset tới điểm bắt đầu dữ liệu thực liên quan tới dấu
hiệu, tức là dữ liệu liên quan với DE không phải lưu trữ vật lý cùng
với nó nằm ở một vị trí nào đó trong file.
Dữ liệu chứa trong tệp thường được tổ chức thành các nhóm dịng (cột)
qt của dữ liệu ảnh. Cách tổ chức này làm giảm bộ nhớ cần thiết cho việc
đọc tệp. Việc giải nén được thực hiện theo bốn kiểu khác nhau được lưu trữ
trong byte dấu hiệu nén.
Như đã nói ở trên, file ảnh TIFF là dùng để giải quyết vấn đề khó mở
rộng của file PCX. Tuy nhiên, với cùng một ảnh thì việc dùng file PCX chiếm
ít khơng gian nhớ hơn.
1.2.4 Định dạng ảnh GIF(Graphics Interchanger Format)
Cách lưu trữ kiểu PCX có lợi về khơng gian lưu trữ: với ảnh đen trắng
kích thước tệp có thể nhỏ hơn bản gốc từ 5 đến 7 lần. Với ảnh 16 màu, kích
thước ảnh nhỏ hơn ảnh gốc 2-3 lần, có trường hợp có thể xấp xỉ ảnh gốc. Tuy
nhiên, với ảnh 256 màu thì nó bộc lộ rõ khả năng nén rất kém. Điều này có
thể lý giải như sau: khi số màu tăng lên, các loạt dài xuất hiện ít hơn và vì
thế, lưu trữ theo kiểu PCX khơng cịn lợi nữa. Hơn nữa, nếu ta muốn lưu trữ

Trang - 6 -


Chương 1: Cơ sở biểu diễn ảnh


nhiều đối tượng trên một tệp ảnh như kiểu định dạng TIFF, đòi hỏi có một
định dạng khác thích hợp.
Định dạng ảnh GIF do hãng ComputServer Incorporated (Mỹ) đề xuất
lần đầu tiên vào năm 1990. Với địng dạng GIF, những vướng mắc mà các
định dạng khác gặp phải khi số màu trong ảnh tăng lên khơng cịn nữa. Khi số
màu càng tăng thì ưu thế của định dạng GIF càng nổi trội. Những ưu thế này
có được là do GIF tiếp cận các thuật toán nén LZW(Lempel-Ziv-Welch). Bản
chất của kỹ thuật nén LZW là dựa vào sự lặp lại của một nhóm điểm chứ
khơng phải loạt dài giống nhau. Do vậy, dữ liệu càng lớn thì sự lặp lại càng
nhiều. Dạng ảnh GIF cho chất lượng cao, độ phân giải đồ hoạ cũng đạt cao,
cho phép hiển thị trên hầu hết các phần cứng đồ hoạ.
Định dạng tổng quát của ảnh GIF như sau:
+ Chữ ký của ảnh

GIF note
GIF Header (7byte)

+ Bộ mô tả hiển thị

Global Palette

+ Bản đồ màu tổng thể

Header Image (10byte)

+ Mô tả một đối tượng của ảnh

Palette of image 1 (nếu có)


- Dấu phân cách

Data of Image !

- Bộ mơ tả ảnh

‘,’ ký tự liên kết

- Bản đồ màu cục bộ

…………………….

- Dữ liệu ảnh

‘;’ GIF terminator

Phần mô tả này lặp n lần nếu ảnh chứa n đối tượng.
+ Phần đầu cuối ảnh GIF (terminator)
- Chữ ký của ảnh GIF có giá trị là GIF87a. Nó gồm 6 ký tự, 3 kí tự đầu
chỉ ra kiểu định dạng, 3 ký tự sau chỉ ra version của ảnh.
- Bộ hình hiển thị: chứa mơ tả các thơng số cho tồn bộ ảnh GIF:

Trang - 7 -


Chương 1: Cơ sở biểu diễn ảnh

 Độ rộng hình raster theo pixel: 2 byte;
 Độ cao hình raster theo pixel: 2 byte;
 Các thông tin về bản đồ màu, hình hiển thị,...

 Thơng tin màu nền: 1 byte;
 Phần chưa dùng: 1 byte.
- Bản đồ màu tổng thể: mô tả bộ màu tối ưu đòi hỏi khi bit M = 1. Khi bộ
màu tổng thể được thể hiện, nó sẽ xác lập ngay bộ mơ tả hình hiển thị.
Số lượng thực thể bản đồ màu lấy theo bộ mô tả hình hiển thị ở trên và
bằng 2m, với m là lượng bit trên một pixel khi mỗi thực thể chứa đựng 3
P

P

byte (biểu diễn cường độ màu của ba màu cơ bản Red-Green-Blue).
Cấu trúc của khối này như sau:
Bit

Thứ

tự Mô tả

byte
Màu Red

1 Giá trị màu đỏ theo index 0

Màu

2 Giá trị màu xanh lục theo index 0

Green
Màu Blue


3 Giá trị màu xanh lơ theo index 0

Màu Red

4 Giá trị màu đỏ theo index 1

……..

……

……………………………………………

Bộ mô tả ảnh: định nghĩa vị trí thực tế và phần mở rộng của ảnh trong
phạm vi khơng gian ảnh đã có trong phần mơ tả hình hiển thị. Nếu ảnh biểu
diễn theo ánh xạ bản đồ màu cục bộ thì cờ định nghĩa phải được thiết lập. Mỗi
bộ mô tả ảnh được chỉ ra bởi ký tự kết nối ảnh. Ký tự này chỉ được dùng khi
định dạng GIF có từ 2 ảnh trở lên. Ký tự này có giá trị 0x2c (ký tự dấu phảy).

Trang - 8 -


Chương 1: Cơ sở biểu diễn ảnh

Khi ký tự này được đọc qua, bộ mơ tả ảnh sẽ được kích hoạt. Bộ mơ tả ảnh
gồm 10 byte và có cấu trúc như sau:
Các bit
00101100

Thứ tự byte


Mô tả

1 Ký tự liên kết ảnh (*)

Căn trái ảnh

2, 3 Pixel bắt đầu ảnh tính từ trái hình hiển thị

Căn đỉnh ảnh

4, 5 Pixel cuối ảnh bắt đầu tính từ đỉnh trên hình hiển thị

Độ rộng ảnh

6, 7 Chiều rộng ảnh tính theo pixel

Độ cao ảnh

8, 9 Chiều cao ảnh tính theo pixel

M1000pixel

10 Khi bit M=0: sử dụng bản đồ màu tổng thể
M=1: sử dụng bản đồ màu cục bộ
I=0: định dạng ảnh theo thứ tự liên tục
I=1: định dạng ảnh theo thứ tự xen kẽ
Pixel+1: số bit/pixel của ảnh này

Bản đồ màu cục bộ: bản đồ màu cục bộ chỉ được chọn khi bit M của
byte thứ 10 là 1. Khi bản đồ màu được chọn, bản đồ màu sẽ chiếu theo bộ mô

tả ảnh mà lấy vào cho đúng. Tại phần cuối ảnh, bản đồ màu sẽ lấy lại phần
xác lập sau bộ mơ tả hình hiển thị. Lưu ý là trường “pixel“ của byte thứ 10 chỉ
được dùng khi bản đồ màu được chỉ định. Các tham số này không những chỉ
cho biết kích thước ảnh theo pixel mà cịn chỉ ra số thực thể bản đồ màu của
nó.
Dữ liệu ảnh: chuỗi các giá trị có thứ tự của các pixel màu tạo nên ảnh. Các
pixel được xếp liên tục trên một dòng ảnh, từ trái qua phải. Các dòng ảnh
được viết từ trên xuống dưới.

Trang - 9 -


Chương 1: Cơ sở biểu diễn ảnh

Phần kết thúc ảnh: cung cấp tính đồng bộ cho đầu cuối của ảnh GIF.
Cuối của ảnh sẽ xác định bởi kí tự “;” (0x3b).
Định dạng GIF có rất nhiều ưu điểm và đã được công nhận là chuẩn để
lưu trữ ảnh màu thực tế (chuẩn ISO 10918-1). Nó được mọi trình duyệt Web
(Web Browser) hỗ trợ với nhiều ứng dụng hiện đại. Cùng với nó có chuẩn
JPEG (Joint Photograph Expert Group). GIF dùng cho các ảnh đồ hoạ
(Graphic), còn JPEG dùng cho ảnh chụp (Photographic).

1.3 Thay đổi nhịp lấy mẫu
Trong hệ thống nén ảnh JPEG2000 sử dụng biến đổi wavelet và mã hoá
băng con. Tín hiệu bên phân tích sau khi đi qua bộ lọc thông thấp và thông
cao được đi qua bộ chia giảm tỉ lệ lấy mẫu và bên tổng hợp được đi qua bộ
nội suy trước khi vào bộ lọc thơng thấp và thơng cao. Vì vậy trong phần này
tơi xin trình bày một số khái niệm về thay đổi nhịp lấy mẫu.
1.3.1 Bộ phân chia
Hệ thống làm nhiệm vụ giảm tần số lấy mẫu được gọi là bộ phân chia.


↓M

x(n)
Fs

y ↓ M (n )

Hình 1.2 : Bộ phân chia

Fs'

với M: hệ số phân chia tức là tín hiệu rời rạc x(n) sau khi đi qua bộ phân chia
này sẽ bị giảm đi M lần. Chu kỳ lấy mẫu sẽ tăng lên M lần lúc đó băng thơng
của tín hiệu sẽ rộng ra M lần

Fs' = F S ;
M

Ω s = 2πFs ;


Ω 's = 2πFs = 2π Fs = s
M M

Để tránh hiện tượng chồng phổ trước khi đi vào bộ phân chia người ta đặt một
bộ lọc thông thấp có tần sơ cắt là wc = π / M

Trang - 10 -



Chương 1: Cơ sở biểu diễn ảnh

h(n)

x(n)

↓M

yH(n)

y H ↓ M (n )

Hình 1.3: Sơ đồ khối của bộ phân chia
 Trong miền n


y H ( n) = x (n ) ∗ h(n ) = ∑ x(k ).h(n − k )



y H ↓ M (n ) = y H (Mn ) = ∑ x(k ).h(Mn − k )


Trong miền Z

YH (Z ) = X (Z ). H (Z )
1
YH ↓ M (Z ) =
M


M −1

∑ YH (WHl Z 1 / M )= M ∑ X (WHl Z 1/ M ).H (WHl Z 1 / M )
1

l =0

Trong miền W

( ) ( ) ( )

1
(e )= M ∑ X  e

YH e jw = X e jw . H e jw
YH ↓ M

jw

M −1
l =0



j

w −2 lπ
M


 1
=
 M


M −1



l=0

 j w − 2πl
Xe M



  j w − 2πl 
.H  e M 
 

 


1.3.2 Bộ lọc nội suy
Kết quả phép nội suy đã chèn thêm L-1 mẫu biên độ 0 vào giữa hai
mẫu của tín hiệu vào x(n) trong miền biến số n. Và tương ứngtrong miền tần
số sẽ tạo ra L-1 ảnh phụ của phổ cơ bản sau khi đã co hẹp lại L lần để nhường
chỗ cho L-1 ảnh phụ mà không gây nên hiện tượng chồng phổ. Như vậy phép
nội suy ↑ L không làm hư thơng tin. Nhưng để nội suy ra các mẫu có biên độ
0 ta phải đặt bộ nội suy một bộ lọc có wC = π / L . Trong miền biến số n bộ lọc

này có nhiệm vụ nội suy ra các mẫu biên độ 0, còn trong miền tần số nó làm

Trang - 11 -


Chương 1: Cơ sở biểu diễn ảnh

nhiệm vụ loại bỏ các ảnh phụ của phổ cơ bản. Sơ đồ tổng quát của bộ lọc nội
suy

↑L

x(n)

h(n)

y↑ L (n )

y ↑ LH (n )

Hình 1.4: Bộ lọc nội suy
 Trong miền n

 n
 x 
y↑ L (n ) =   L 
0


n = 0, ± L , ± 2L........

n

y↑ LH (n )= y↑ L (n ) ∗ h (n )=





k = −∞

còn lai

y↑ L (k ).h( n − k ) =

k
x  .h (n − k )
k = −∞  L 




với k = rL

y↑ LH (n )=



∑ x (r ).h (n − rL )

r = −∞


 Trong miền Z

( )

Y↑ L (Z )= X Z L

( )

Y↑ LH ( Z ) = Y↑ L (Z ).H (Z ) = X Z L .H (Z )
H(ZL )

↑L

Y↑ LH ( Z )

Y↑ L (Z )

X(Z)

H(Z )

=
X(Z)

Hình 1.5: Sự tương đương
 Trong miền W

( ) ( )
(e )= Y (e ).H (e ) = X (e )H (e )


Y↑ L e jw = X e jwL
Y↑ LH

jw

↑L

jw

jw

jwL

Trang - 12 -

jw

↑L
YH ( Z )

YH ↑ L (Z )


Chương 1: Cơ sở biểu diễn ảnh

1.4 Điều kiện để khơi phục hồn hảo
Hình 1.6 miêu tả q trình mã hố băng con bao gồm q trình phân
tách tín hiệu bên tay trái và q trình tổng hợp tín hiệu bên tay phải. Để có tín
hiệu bên khơi phục xˆ[ n] gần giống hệt bên phát x[n], loại bỏ được méo và

giao thoa thì cần phải yêu cầu rất chặt chẽ giữa các bộ lọc thông thấp và thông
cao cũng như giữa bộ lọc bên phân tích và bộ lọc bên tổng hợp.
Xét cấu trúc băng lọc FIR hai kênh như sau

Hình 1.6 : Sơ đồ khối quá trình phân tách và tổng hợp tín hiệu
Xét bộ lọc Haar
1

2
h0 [n] = 
1
2

1

2
h1 [n] = 
− 1
2


n =0
n =1
n=0
n =1

1
 2
f0 [n] = 
1

 2

n = −1

− 1

2
f1 [n ] = 
1
 2

n = −1

với H0 là bộ lọc thông thấp không nhân quả
R

R

Trang - 13 -

n=0

n=0


Chương 1: Cơ sở biểu diễn ảnh

H 0 (w)= ∑ h0 [k ]e −iwk = 1/ 2 + (1/ 2).e −iw = H 0 ( w) eiφ (w ) = cos( w / 2)e −iw/ 2 ; − π ≤ w ≤ π
k


Hình 1.7: Đặc tính biên độ và pha của bộ lọc thông thấp Haar H0
R

Tương tự với bộ lọc h 1[n] có đáp ứng xung:
R

R

1 / 2

h1[n] = − 1/ 2
0


n=0
n =1
n ≠ 1, 0

Đây là bộ lọc thông cao

H1 (w) = 1 / 2 − (1 / 2)e − iw = i sin (w / 2)e −iw / 2

 sin ( w / 2 ) e − i(π / 2 + w / 2 ); − π ≤ w < 0

=
 sin( w / 2 ) ei (π / 2 − w / 2 ); 0 < w ≤ π

Hình 1.8: Đặc tuyến biên độ và pha của bộ lọc thông cao H1
R


Trang - 14 -


Chương 1: Cơ sở biểu diễn ảnh

Rõ ràng là H 0 (w)+H 1 (w) = 1
R

R

R

R

Phân tích theo sơ đồ ta có 1.6


Phía phân tách

r0 [n ] = 1

2

(x[n ]+ x[n − 1])

y0 [n ]= r0 [2n ]= 1

2

( x [2n ]+ x [2 n − 1])


(1.1)

tương tự ta có

y1[n]= 1

2

(x[2n] − x[2n − 1])

(1.2)

Vậy phía phân tích có thể tương đương với phép nhân ma trận như sau:

 y0   L 
  =  . X
 y1   B 


Phía tổng hợp

 y 0 [n / 2 ]
t 0 [n ]= 
0

v0 [n ]= 1

n
n


even
odd

( t [n + 1]+t 0 [n ]) là bộ lọc thông thấp
2 0
1

2
=
1
2


n

even

n

odd

1
1
 2 y [n / 2 ]
v1 [n] = 
 n + 1
− 1
y1 
2  2 



n

even

n

odd

tương tự ta có

Vậy khi khơi phục lại tín hiệu ta có

Trang - 15 -


Chương 1: Cơ sở biểu diễn ảnh

1
(y 0 [n / 2 ] + y1[n / 2 ])
 2
xˆ[n ] = v0 [n ]+ v1[n ] = 
  n +1 
 n + 1 
 1  y0 

y
1
 2  

 2   2 


n even
n

odd

Xét

xˆ[2 n − 1]= 1
xˆ[2 n]= 1

2

2

(y 0 [n ] − y1[n ]) = x [2n − 1]

( y0 [n]+ y1[n])= x[2n]

Từ (1.1) và (1.2) ta có xˆ[n ]= x[n ] khơi phục hoàn hảo
Vấn đề ở đây la ta phải xây dựng các bộ lọc để khơi phục được hồn hảo có
trễ xˆ[n ]= x[n − n 0 ]

[

]

y 

xˆ = LT | BT  0 
 y1 
Nhận xét khôi phục hồn hảo có nghĩa là băng lọc tổng hợp là nghịch đảo của
băng lọc phân tích.

xˆ = x

[LT | BT ] LB  = W-1W = I



Với cơ sở rời rạc Haar là trường hợp đặc biệt ma trận trực giao W -1 = W T
Vậy ta có băng lọc trực giao, băng lọc tổng hợp là đảo của băng lọc phân tích

f 0 [n] = h0 [− n] ;
Xét trên miền tần số ta có X ( z ) =

f1 [n] = h1[− n]



∑ x[n ]z − n

Thay Z=e iw

n = −∞

Yêu cầu để xây dựng hoàn hảo là:

xˆ[n ]= x [n − k ] ⇒ Xˆ ( z ) = z − k X ( z ) với k là thời gian trễ


Trang - 16 -

P


Chương 1: Cơ sở biểu diễn ảnh

và H0(z) và H 1 (z) là các bộ lọc thông thấp và cao chuẩn nhưng không lý
R

R

R

R

tưởng do vậy khi lấy giảm mẫu của mỗi kênh có thể gây ra aliasing.

Hình 1.9: Bộc lọc thông thấp H 0(w) và thông cao H 1 (w)
R

R

R

R

Xét kênh lọc thơng thấp có


Y0 ( z ) = 1

2

{R0 (z1 2 )+ R0(− z1 2 )}= 12 {H 0 (z1 2 )X (z1 2 )+ H 0 (− z1 2 )X (− z1 2 )}

chuyển sang miền tần số ta có

X ( z) → X ( w); X ( − z) → X ( w + π );

( ) ( 2)

X z1 2 → X w

1   w  w
w
 w

Y0 (w) = H 0   X   + H0  + π  X  + π 
2  2  2
2
 2

Giả sử X(w) =1 (đầu vào là tất cả các tần số)
Và R0(w) = H 0 (w)
R

R

R


R

Sau khi giảm tần số lấy mẫu chúng ta có:

Hình 1.10: Chồng phổ

Trang - 17 -


×