Tải bản đầy đủ (.docx) (71 trang)

tiểu luận xử lý ảnh số nén tổn hao

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.08 MB, 71 trang )

digitalimageprocessing-gonzalez
TIỂU LUẬN XỬ LÝ ẢNH SỐ NÉN TỔN HAO
Không giống như các phương pháp tiếp cận lỗi nêu trong phần trước. Mã hóa tổn haodựa
trên các khái niệm về ảnh hưởng đến độ chính xác của hình ảnh được tái tạo để đổi lấy nén
tăng lên. Nếu sự biến dạng kết quả (có thể có hoặc có thể không được trực quan rõ ràng) có
thể được bỏ qua. Sự gia tăng trong nén là đáng kể. Trong thực tế, nhiều kỹ thuật mã hóa
tổn hao có khả năng tái tạo hình ảnh đơn sắc nhận ra được từ dữ liệu đã được nén bởi tỉ lệ
100:1 và hình ảnh mà hầu như không thể phân biệt từ bản dữ liệu góc bởi tỉ lệ 10:1 đến
50:1. Lỗi mã hóa hình ảnh đơn sắc, tuy nhiên hiếm khi kết quả giảm hơn 3:1 trong dữ liệu.
Như đã trình bày trong mục 8.2, sự khác biệt chính giữa hai cách tiếp cận này là sự hiện
diện hay vắng mặt của khối lượng tử của hình. 8.6
8.5. 1 MÃ HÓA ĐOÁN TRƯỚC TỔN HAO
Trong phần này, chúng tôi thêm một lượng tử để mô hình được giới thiệu trong mục 8.4.4
và kiểm tra kết quả cân bằng giữa độ chính xác tái tạo và hiệu suất nén. Như hình. 8.21 cho
thấy, các lượng tử mà hàm số nguyên gần nhất của bộ mã hóa có lỗi, hãy chèn các biểu
tượng.
digitalimageprocessing-gonzalez
Hình 8.21 Một tổn haomã hóa tiên đoán mô hình:(a) bộ mã hóa và (b) bộ giải mã
Mã hóa và các vị trí mà tại đó các lỗi dự đoán được hình thành. Sơ đồ dự báo lỗi vào một
phạm vi giới hạn của kết quả đầu ra ký hiệu e
n
thiết lập những mức độ nén và méo kết hợp
với tổn hao mã hóa tiên đoán.
Để thích hợpvới việc chèn các bước lượng tử hóa, mã hóa lỗi của hình 8.19 (a) phải được
thay đổi để dự đoán được tạo ra bởi các bộ mã hóa và giải mã là tương đương. Như hình.
8.21 (a) cho thấy. điều này được thực hiện bằng cách dự đoán các bộ mã hóa tổn hao trong
vòng một vòng phản hồi. ở vào của nó, ký hiệu fn. được tạo ra như một chức năng của các
dự đoán quá khứ và lỗi lượng tương ứng. Đó là.

Trong đó f
n


được như quy định tại Mục 8.4.4. Cấu hình vòng khép kín này ngăn ngừa sự
tăng dần lỗi ở đầu ra của bộ giải mã. Chú ý từ hình 8.21 (b) là đầu ra của bộ giải mã cũng
được cho bởi phương trình. (8.5-1)
EXAMPLE 8.16.
Delta modulation
Điều chế Delta (DM) là một hình thức đơn giản nhưng nổi tiếng của suy giảm mã hóa tiên
đoán trong đó dự báo và lượng tử được định nghĩa là:
Trong đó α là hệ số dự đoán (thường nhỏ hơn 1) và ξ là một hằng số tích cực.
digitalimageprocessing-gonzalez
Đầu ra của lượng tử. e
n
có thể được đại diện bởi một bit (hình 8.22a). vì vậy các bộ mã hóa
tượng trưng cho ở hình. 8.21 (a) có thể sử dụng là mã cố định chiều dài 1-bit. Tốc độ mã
DM là 1 bit / điểm ảnh.
Hình 8.22 (c) minh họa các cơ chế của quá trình điều chế Delta. mà các tính toán cần thiết
để nén và tái tạo lại chuỗi đầu vào {14.15.14.15.13.15.15.14.20.26.27.28.
27.27.29.37.47.62.75.77.78.79.80. 81.81.82.82} với α = 1 và ξ = 6.5 được lập bảng. Quá
trình bắt đầu với việc chuyển giao lỗi của các vị trí ảnh đầu vào đầu tiên để các bộ giải mã.
Ban đầu điều kiện của cuộc hóa f
0
= f
0
= 14 thành lập ở cả hai bộ mã hóa và giải mã, các
kết quả còn lại có thể được tính bằng cách liên tục đánh giá biểu thức. (8.5-2). (8.4-5).
(8.5-3). và (8.5-1). Vì vậy khi n = 1.
ví dụ. f
1
= (1) (14) = 14, e
1
= 15 - 14 = 1, e

1
= +6.5 , f
1
= 6.5 + 14 = 20.5, và lỗi sửa đổitạo
ra có (15 - 20.5). hoặc -5.5 mức xám.
Hình 8.22 (b) cho thấy đồ thị dữ liệu lập thành bảng hình 8.22 (c). Cả đầu vào và đầu ra
hoàn toàn được giải mã (fn và fn) được hiển thị. Chú ý rằng trong khu vực thay đổi nhanh
chóng từ n = 14 đến 19, trong đó ξ là quá nhỏ để đại diện cho những thay đổi lớn nhất của
đầu vào, một biến dạng được gọi là độ dốc quá tải. Hơn nữa, khi ξ là quá lớn để đại diện
cho những thay đổi nhỏ nhất của đầu vào, như n khu vực tương đối tốt từ n = 0 đến n = 7
nhiễu dạng hạt xuất hiện. Trong hầu hết các hình ảnh, hai hiện tượng này dẫn đến các cạnh
đối tượng bị mờ và bề mặt sần sùi hoặc nhiễu (có nghĩa là khu vực méo).
Đó là các tiêu chí tối ưu hóa được chọn để giảm thiểu dự báo các lỗi là ô vuông. Lỗi lượng
tử được giả định là không đáng kể (e’
n
≈ e
n
) và dự đoán được hạn chế đến một sự kết hợp
tuyến tính của m điểm ảnh trước. Những hạn chế này là không cần thiết nhưng ta đơn giản
hóa các cách phân tích và đồng thời làm giảm sự phức tạp tính toán của các dự báo. Kết
quả phương pháp mã hóa tiên đoán được gọi là điều chế mã xung (DPCM).
Dưới những điều kiện, những vấn đề thiết kế dự đoán tối ưu được giảm dẩn đến việc thực
hiện tương đối đơn giản lựa chọn các hệ số dự đoán m làm giảm thiểu biểu thức.
digitalimageprocessing-gonzalez
Phân biệt phương trình (8.5-7) đối với mỗi hệ số tương đương các đạo hàm đến 0 và giải
quyết các thiết lập kết quả của phương trình theo giả định rằng f
n
có nghĩa là lợi suất σ
2


bằng 0 và phương sai.
Vì vậy đối với bất kỳ hình ảnh đầu vào nào các hệ số làm giảm thiểu phương trình (8.5-7)
có thể được xác định thông qua một loạt các hoạt động ma trận cơ bản. Hơn nữa hệ số chỉ
phụ thuộc vào hàm tự tương quan của các vị trí ảnh trong hình ảnh ban đầu. Phương sai của
sai số dự đoán là kết quả từ việc sử dụng các hệ số tối ưu.
Mặc dù các cơ chế đánh giá phương trình (8.5-8) là khá đơn giản. Tính toán của hàm tự
tương quan là rất khó khăn trong thực tế để hình thành R và r . trong hầu hết trường hợp,
một tập hợp các hệ số trên toàn cầu được tính toán bằng cách giả định một mô hình hình
ảnh đơn giản và thay thế các hàm tự tương quan ứng với biểu thức(8.5-9 ) và (8.5-10).
Ví dụ. Hình ảnh là 2-D
Nguồn Mô hình Markov (xem phần 8 .3 3) với chức năng tự tương quan.
digitalimageprocessing-gonzalez
và tổng quát hóa dự đoán tuyến tính bậc bốn.
Ta được các hệ số tối ưu (Jain [1989])
nơi p
h
và p
t
là các hệ số tương quan ngang và dọc tương ứng của hình ảnh đang được xem
xét.
Cuối cùng tổng các hệ số dự đoán trong phương trình (8.5-6) thường được yêu cầu phải nhỏ
hơn hoặc bằng 1 tức là.
Những hạn chế này được thực hiện để đảm bảo rằng kết quả của dự báo nằm trong phạm vi
cho phép của các cấp màu xám và để giảm tác động của nhiểu lan truyền thường được xem
là những vệt ngang tái tạo hình ảnh giảm độ nhạy cảm của bộ giải mã DPCM của tiếng ồn
đầu vào điều này là quan trọng. bởi vì bất kỳ một lỗi nào (theo đúng trường hợp) có thể lan
truyền củng làm ảnh hưởng các kết quả đầu ra trong tương lai. Có nghĩa là đầu ra của bộ
giải mã có thể trở nên không ổn định bởi hạn chế phương trình (8.5-15) .Để tương thích
hoàn toàn thì hạn chế tác động của lỗi đầu vào để cho các kết quả đầu ra tốt hơn.
Xem xét các lỗi dự đoán từ DFCM mã hóa hình ảnh đơn sắc của hình. 8.23 theo giả định 0

lỗi lượng tử hóa và với bốn dự đoán:
digitalimageprocessing-gonzalez
Trong đó: ∆h = [f(x-1.y) – f(x – 1,y - 1)]
và ∆v = [f(x.y.…1) – f(x – 1.y - 1)]
đồ thị nằm ngang và thẳng đứng tại vị trí (x. y).
Phương trình (8.5-16) thông qua (8.5-18) xác định một tập hợp tương đối chính xác của α
trong đó cung cấp kết quả làm việc trên một loạt các hình ảnh. Các yếu tố dự báo thích hợp
của phương trình (8.5-19) được thiết kế để nâng cao cạnh màn biểu diễn bằng cách tính
toán là một biện pháp của các tính chất định hướng của một hình ảnh (∆h và ∆v) và chọn
một yếu tố dự báo cụ thể phù hợp với phép tính.
Hình 8.24 (a) đến (d) hiển thị hình ảnh lỗi dự đoán kết quả từ việc sử dụng các dự đoán
của biểu thức (8.5-1.6) thông qua (8.5-19).
digitalimageprocessing-gonzalez
lỗi cảm nhận là trực quan,như thứ tự của các yếu tố dự báo tăng. Độ lệch chuẩn của phân
phối dự báo lỗi theo một mô hình tương tự như là 4, 9,3.7,3.3. và 4.1 mức độ xám tương
ứng.
Tối ưu hóa lượng tử:
Lượng tử hóa hàm l = q (s) hình 8.25 là hàm lẻ của s [có nghĩa là q (-s) = -q (s)] có thể
được mô tả bằng L / 2 giá trị của s
i
và t
i
thể hiện ở phần đầu tiên của đồ thị những vị trí
xác định gián đoạn hàm và được gọi là mức độ quyết định và sửa đổi của các lượng tử. Như
một vấn đề s được coi là ánh xạ tới t. nếu nó nằm trong khoảng thời gian nửa mở (s
i
. s
i+1
)
Vấn đề thiết kế lượng tử là lựa chọn tốt nhất s

t
và t
t
cho một tiêu chí tối ưu hóa đặc biệt và
đầu vào hàm mật độ xác suất p (s). Nếu các tiêu chí tối ưu hóa mà có thể là một biện pháp
digitalimageprocessing-gonzalez
thống kê làm giảm thiểu các lỗi ô vuông lượng tử (có nghĩa là E{(s – t
1
)
2
} và p(s) (Max
[1960]).
Phương trình (8.5-20) cho thấy rằng mức độ sửa đổi là trọng tâm của các
p (s) trong khoảng thời gian quyết định quy định, trong khi đó phương trình. (8.5-21) cho
thấy mức độ quyết định là nằm giữa các cấp sửalại. Phương trình (8.5-22) là một hệ quả và
thực tế là q là một hàm lẻ. Đối với bất kỳ L, s
t
và t. đáp ứng biểu thức. (8.5-20) thông qua
digitalimageprocessing-gonzalez
(8.5-22) là tối ưu theo lỗi ô vuông,các lượng tử tương ứng được gọi là lượng tử Lloyd –
Max.
Bảng 8.10 là các cấp độ Loyd-Max 2 -, 4 -, và 8 , nó quyết định mức độ sửa đổi cho một
hàm mật độ xác suất Laplacia [xem phương trình. (8.4-10)]. Bởi vì được một giải pháp rõ
ràng hoặc thông qua biểu thức (8.5-20), (8.5-22) các giá trị được tạo ra số lượng (Paez và
Glisson [1972]). Ba bộ lượng tử hóa hiện cung cấp các mức kết quả1,2 và 3 bit / điểm ảnh
tương ứng. Như Bảng 8.10 đã được sửa trên một đơn vị. Việc sửa đổi ở từng mức độ được
quyết định đối với trường hợp xem xét σ ≠ 1 bằng cách nhân giá trị lập bảng độ lệch chuẩn
của hàm mật độ xác suất. Các dòng cuối cùng của bảng liệt kê các bước kích thước θ , đồng
thời đáp ứng biểu thức (8.5-20) thông qua (8.5-22) và các hạn chế bổ sung.
Một bộ mã hóa mà sử dụng một mã chiều dài thay đổi được sử dụng trong bộ mã hóa tiên

đoán tổn hao chung trong hình 8.21 (a). Một lượng tử thống nhất tối ưu kích thước bước θ
sẽ cung cấp tốc độ mã thấp hơn so với một chiều dài cố định được mã hóa lượng tử Lloyd-
Max với đầu ra độ chính xác tương tự (O'Neil [1971]).
Mặc dù Lloyd-Max và bộ lượng tử hóa thống nhất tối ưu là không tương thích . có thể đạt
được từ điều chỉnh mức lượng tử hoá dựa trên các xử lý cục bộ của một hình ảnh. Về lý
thuyết khu vực thay đổi từ từ có thể là lượng tử hóa tinh. trong khi các khu vực thay đổi
nhanh chóng được lượng tử hóa thô hơn. Cách tiếp cận này đồng thời làm giảm nhiễu cả
dạng hạt và độ dốc quá tải. trong khi chỉ cần một sự gia tăng tối thiểu trong tỷ lệ mã. Sự
cân bằng là tăng lượng tử phức tạp.
Hình 8.26 (a). (c) và (e) hiển thị hình ảnh được sửalại DPCM mà lại phù hợp từ kết hợp
giữa cấp 2 4 và 8 bộ lượng tử hóa Lloyd-Max trong Bảng 8.10 với dự đoán hai chiều
của phương trình. (8.5-18). Các bộ lượng tử hóa được tạo ra bởi bảng Lloyd-Max quyết
định. các cấp sửalại bởi độ lệch chuẩn của sai số dự đoán hai chiều bộ lượng tử hóa từ ví
dụ trên (có nghĩa là 3 cấp độ màu xám). Lưu ý rằng các cạnh của hình ảnh được giải mã bị
mờ. Kết quả này là đặc biệt đáng chú ý trong hình. 8.26 (a). được tạo ra sử dụng một lượng
tử hai cấp. nhưng là ít rõ ràng hơn trong hình. 8.26 (c) và (e). nơi bốn và tám cấp độ lượng
digitalimageprocessing-gonzalez
tử đã được áp dụng. Hình8.27 (a). (c) và (e) cho thấy sự khác biệt giữa những hình ảnh thu
nhỏ được giải mã và hình ảnh ban đầu của hình 8.23.
Để tạo ra những hình ảnh được giải mã trong hình 8.26 (b). (d). và (f). và những kết quả
hình ảnh lỗi trong hình. 8.27 (b). (d). và (f). chúng tôi sử dụng một phương pháp thích
hợplượng tử trong đó tốt nhất là bốn bộ lượng tử hóa có thể được lựa chọn cho mỗi khối
16 vị trí ảnh. Bốn bộ lượng tử hóa được mở rộng cách thứccủa bộ lượng tử hóa Lloyd-Max
tối ưu mô tả trước đây. Các yếu tố rộng là 0.5,1,0,1.75. và 2,5 Bởi vì một mã 2-bit đã được
nối vào mỗi khối để xác định lượng tử được lựa chọn. các chi phí liên quan đến việc
chuyển đổi lượng tử là 2/16 hoặc 0.125 bit / điểm ảnh. Lưu ý sự suy giảm đáng kể trong
nhận thức rằng lỗi là kết quả của sự gia tăng này tương đối nhỏ trong tỷ lệ mã.
Bảng 8.11 liệt kê các lỗi dịch vụ quản lý bản ghi của hình ảnh khác biệt trong hình. 8.27
(a) đến (f). cũng như đối với một số kết hợp khác của dự đoán và bộ lượng tử hóa.
Lưu ý rằng trong một cảm giác lỗi trung bình-vuông. hình thành hai cấp bộ lượng tử hóa

cũng như các cách thức không cộng được bốn cấp. Hơn nữa. bốn cấp độ bộ lượng tử hóa
thích nghi vượt trội so với phương pháp tiếp cận không cộng được tám cấp độ.
Nhìn chung các kết quả tính toán cho thấy dự đoán của (8.5-15),
(8.5-17) và (8.5-19) có biểu hiện những đặc vị trí chung giống như dự đoán của phương
trình. (8.5-18). Các nén mà kết quả theo mỗi phương pháp lượng tử được liệt kê ở hàng
cuối cùng của Bảng 8.11. Lưu ý rằng sự sụt giảm đáng kể trong dịch vụ quản lý bản ghi lỗi
[phương trình. (8 1-8)] đạt được bằng các phương pháp tiếp cận thích hợp ảnh hưởng không
đáng kể hiệu suất nén.
8.5.2 CHUYỂN ĐỔI MÃ
Các kỹ thuật mã hóa tiên đoán thảo luận trong phần 8.5.1 hoạt động trực tiếp trên các vị trí
điểm ảnh của một hình ảnh và đó là phương pháp miền không gian. Trong phần này chúng
ta xem xét kỹ thuật nén dựa trên sửa đổi những biến đổi của hình ảnh. Trong chuyển đổi mã
hóa, là một đảo ngược biến đổi tuyến tính chẳng hạn như Fourier.
BẢNG 8.11 Tổn hao DPCM dữ liệu góc có nghĩa là lỗi vuông
digitalimageprocessing-gonzalez
a b .c d e f
Hình 8.27 Các hình ảnh DPCM lỗi quy mô tương ứng với Hình. 8.26 (a) đến
digitalimageprocessing-gonzalez
.
Hình 8.27 Các hình ảnh lỗi DPCM tương ứng với hình. 8.26 (a) đến (f).
digitalimageprocessing-gonzalez
a b
Hình 8.28 Một chuyển đổi hệ thống mã hóa: (a) bộ mã hóa (b) bộ giải mã chuyển đổi)
Được sử dụng để lập bản đồ hình ảnh vào một tập hợp các hệ số biến đổi, mà sau đó được
lượng tử hóa và mã hóa. Đối với hầu hết các hình ảnh tự nhiên là một số lượng đáng kể
các hệ số có độ lớn nhỏ và có thể được lượng tử hóa thô (hoặc loại bỏ hoàn toàn) với rất ít
biến dạng hình ảnh. Một loạt các biến đổi bao gồm cả các biến đổi Fourier rời rạc (DFT)
của chương 4 có thể được sử dụng để chuyển đổi dữ liệu hình ảnh.
Hình 8.28 cho thấy một hệ thống mã hóa biến đổi điển hình. Các bộ giải mã thực hiện trình
tự ngược lại các bước ( ngoại trừ chức năng lượng tử ) của bộ mã hóa thực hiện bốn hoạt

động tương đối đơn giản đó là: chuyển đổi lượng tử hóa và mã hóa. Một hình ảnh đầu vào
đầu tiên được chia thành kích thước n x n , mà sau đó được biến đổi để tạo ra ( N / n )
2

mảng biến. Mỗi kích thước n x n . Mục tiêu của quá trình chuyển đổi là các vị trí ảnh hoặc
để đóng gói càng nhiều thông tin càng tốt vào số nhỏ nhất của hệ số biến đổi . Giai đoạn
lượng tử sau đó chọn lọc loại bỏ hoặc thô hơn lượng tử hóa các hệ số mang thông tin ít
nhất . Các hệ số này có tác động nhỏ nhất về mặt chất lượng . Quá trình mã hóa kết thúc
bằng cách mã hóa ( thường sử dụng một mã chiều dài thay đổi ) các hệ số lượng tử . Bất kỳ
hoặc tất cả các bước mã hóa biến đổi có thể được điều chỉnh để nội dung hình ảnh được
gọi là thích hợp biến đổi mã hóa hoặc cố định cho tất cả các biến đổi mã hóa không cộng
được.
Chuyển đổi chọn lọc
digitalimageprocessing-gonzalez
Chuyển đổi mã hóa các hệ thống dựa trên một loạt các biến đổi 2 chiều riêng biệt đã được
chỉnh sửa và nghiên cứu rộng rãi. Sự lựa chọn của một biến đổi cụ thể trong một ứng dụng
nhất định phụ thuộc vào số lượng lỗi sửa đổicó thể được tính toán sẵn. Nén được thực hiện
trong thời gian lượng tử của các hệ số chuyển đổi.
Xem xét một hình ảnh của f (x. y) kích thước NxN trước khi biến đổi rời rạc T (u, v) có
thể được thể hiện bằng các mối quan hệ chung.
cho u, v = 0. 1. 2. N - 1. Cho T (u, v), f (x. y) tương tự có thể thu được bằng cách sử
dụng tổng quát biến đổi ngược rời rạc.
cho x, y = 0.1. 2. N - 1. Trong các phương trình g (x. y. u. v) và h (x. y. u. v) được gọi
là phần chính trước khi chuyển đổi và ngược lại.Vì vậy được gọi là hàm cơ bản.
T (u. v) đối với u. v = 0.1.2 N - 1 trong phương trình. (8.5-25) được gọi là hệ số
chuyển đổi nó có thể được xem như là các hệ số mở rộng của
f (x.y .u.v) đối với cơ sở hàm h (x. y. u. v.)
Phần chính trong phương trình. (8.5-24) được cho là rời rạc nếu
G(x.y.u.v) = g
1

(x.u)g
2
(y.v) (8.5-26)
Ngoài ra các phần chính là đối xứng nếu chức năng tương đương với g
2
. Trong trường hợp
này phương trình. (8.5-26) có thể được thể hiện dưới dạng.
g(x. y. u. v) = g
1
(x. u)g
1
(y. v) (8.5-27)
digitalimageprocessing-gonzalez
phần giống nhau áp dụng cho các phần chính nếu g (x. y. u. v) được thay thế bởi h (x. y. u.
v) trong biểu thức (8.5-26) và (8.5-27). Nó không khó khăn để chứng minh rằng việc
chuyển đổi 2-D với một phần chính tách được có thể được tính toán sử dụng hàng cột hoặc
hàng ngang tương ứng như chuyển đổi 1-D. trong đó đã giải thích tại mục 4.6.1.
Những phần chínhtrước khi chuyển đổi và ngược lại trong biểu thức (8.5-24) và (8.5-25)
xác định loại chuyển đổi được tính toán và độ phức tạp tính toán tổng thể và lỗi sửa đổi
của hệ thống mã hóa biến đổi.

trong đó j = V-1. Thay thế những phần chính vào biểu thức (8.5-24) và (8.5-25) ta được
một biểu thức đơn giản (trong đó M = N) của các cặp biến đổi Fourier rời rạc giới thiệu
trong phần 4.2.2.
Một chuyển đổi tính toán đơn giản mà cũng rất hữu ích trong chuyển đổi mã hóa, được gọi
là biến đổi Walsh-Hadamard (WHT) có nguồn dữ liệu góc từ các hạt giống hệt về chức
năng.
Mà N = 2
m
.

Tổng kết trong số mũ của biểu thức này được thực hiện trong 2 modulo số học và b
k
(z) là
bit thứ K (từ phải sang trái) trong hệ nhị phân .
Biểu diễn của z. Nếu m = 3 và z = 6 (trong hệ nhị phân).
digitalimageprocessing-gonzalez
Ví dụ b
0
(z) = 0, b
1
(z) = l.và b
2
(z) = l. Trong phương trình (8.5-30) p(u) được tính toán và
sữ dụng:
như đã đề cập được thực hiện trong 2 modulo số học. Biểu diễn tương tự áp dụng cho p
t

(v).
Không giống như các phần chính của các DFT đó là sin và cos [xem Biểu thức. (8.5-28) và
(8.5-29)]. các phần chính Walsh-Hadamard bao gồm cộng và trừ xen kẽ cho 1 là sắp xếp
theo hình bàn cờ. Hình 8.29 cho thấy các phần chính khi N = 4.
Lúc đó mỗi khối gồm 4 x 4 = 16 phần tử .
Ký hiệu màu trắng + 1 và màu đen biểu thị -1. Để có được khối bên trái chúng ta để cho u
= v = 0 và các giá trị ô của g (x. y. 0.0) cho x. y = 0.1.2.3. Tất cả các giá trị trong trường
hợp này là 1. Khối thứ hai hàng trên cùng là các giá trị của g (x. y. 0.1) cho x. y = 0. 1.2. 3.
Như đã đề cập tầm quan trọng của biến đổi Walsh-Hadamard là thực hiện tất cả các giá trị
phần chính là 1 hoặc-1.
Một trong những biến đổi thường xuyên nhất được sử dụng để nén hình ảnh là chuyển đổi
rời rạc cosin (DCT). thu được bằng cách thay thế phần tiếp vào Biểu thức. (8.5-24) và (8.5-
25)

digitalimageprocessing-gonzalez
Hình 8.29 hàm cơ sở Walsh-Hadamard cho N = 4. Nguồn dữ liệu góc của mỗi khối là ở
trên cùng bên trái.
Mà :
digitalimageprocessing-gonzalez
tương tự cho α(u). Hình 8.30 cho g (x. y. u. v) đối với trường hợp N = 4. Tính toán tương
tự như giải thích cho hình 8.29. với sự khác biệt mà các giá trị của g là không phải số
nguyên. Trong hình 8.30 mức độ màu xám nhẹ hơn tương ứng với giá trị lớn hơn của g.
Ví dụ 8.19
Chuyển đổi mã hóa với DFT, WHT và DCT.
Hình8.31 (a), (b) ,(c), (d) và (e) cho thấy hình ảnh đơn sắc tương đương512 x 512 trong
hình 8.23. Những hình ảnh thu được bằng cách chia hình ảnh ban đầu vào kích thước 8x8
sử dụng một trong những biến đổi được mô tả (tức là DFT, WHT hoặc biến đổi DCT) cắt
bỏ 50% các hệ số kết quả và lấy nghịch đảo của các mảng hệ số ngắn.
Trong mỗi trường hợp các hệ số giữ lại đã được lựa chọn trên cơ sở mức độ tối đa. Khi
chúng ta bỏ qua bất kỳ lượng tử hoặc các vấn đề mã hóa, quá trình này số tiền để nén hình
ảnh ban đầu với hệ số 2. Lưu ý rằng trong mọi trường hợp các hệ số loại bỏ có rất ít tác
động trực quan về chất lượng tái tạo hình ảnh loại bỏ của họ tuy nhiên đi kèm với một số
lỗi vuông có thể được nhìn thấy trong những hình ảnh thu nhỏ của hình 8.31 (b). (d). và
(f). Các lỗi dịch vụ quản lý bản ghi thực tế là mức độ màu xám tương ứng 1.28,0.86 và
0.68.
digitalimageprocessing-gonzalez
digitalimageprocessing-gonzalez
Hình 8.31 gần giống với hình 8.23 bằng cách sử dụng (a) Fourier. (c) Hadamard Anil (e)
cos biến đổi cùng với sự tương ứng lỗi lớn của hình ảnh.
khác biệt nhỏ trong lỗi vuông ở ví dụ trên có liên quan trực tiếp đến năng lượng hoặc đóng
gói thông tin thuộc tính của biến đổi. Phù hợp với phương trình. (8.5-25), một hình ảnh n x
n, f (x. y) có thể được thể hiện như một chức năng biến đổi T (u v) của 2-D.
cho x. y = 0. 1. n - 1. Lưu ý rằng chúng tôi chỉ đơn thuần là thay thế tồn tại trong
phương trình (8.5-25) với n và bây giờ xem xét f (x. y) để đại diện cho một hình ảnh được

nén. Vì phần chính là nghịch đảo h (x. y. u. v) trong phương trình (8.5-34) chỉ phụ thuộc
vào các chỉ số x. y. u. v và không phải trên giá trị của f (x. y) hoặc T (u. v) nó có thể
được xem như là xác định một tập hợp các hàm cơ bản. Hình ảnh cơ sở cho hàng loạt quy
digitalimageprocessing-gonzalez
định của phương trình (8.5-34). Giải thích này sẽ trở nên rõ ràng hơn nếu các ký hiệu được
sử dụng trong phương trình. (8.5-34) được sửa đổi để có được.
trong đó F là một ma trận n x n có chứa các vị trí ảnh của f (x. y) và (8.5-36)

Sau đó ma trận H chứa các vị trí ảnh của đầu vào được định nghĩa một cách rõ ràng như
một sự kết hợp tuyến tính của ma trận n
2
kích thước n X n.
H
u.v
. trong đó u. v = 0.1.….n - j phương trình (8.5-36). Các ma trận này trong thực tế là
những hình ảnh cơ sở (hoặc hàm) việc mở rộng trong phương trình (8.5-35), các liên kết T
(u. v) là các hệ số mở rộng. Hình 8.29 và 8.30 minh họa các WHT và hình ảnh cơ sở DCT
đối với trường hợp n = 4.
Nếu bây giờ chúng ta định nghĩa một hàm mặt nạ hệ số biến đổi.
trong đó y (u. v) được loại bỏ những hình ảnh cơ sở làm cho sự đóng góp nhỏ nhất
trong phương trình (8.5-35).
digitalimageprocessing-gonzalez
Mà ||F - F|| là ma trận (F - F) và σ
2
T
(u.v)
là phương sai của hệ số biến đổi ở vị vị trí (u.v).
Đơn giản hóa dựa trên tính chất trực giao của các hình ảnh cơ sở và giả định rằng các vị trí
ảnh của F được tạo ra bởi một quá trình ngẫu nhiên với trung bình và phương sai. Tổng số
lỗi tương đươngtrung bình ô vuông là tổng của sự thay đổi của các hệ số chuyển đổi loại

bỏ, đó là các hệ số mà
y(u.v) = 0. Để [l - γ(u. v)] trong phương trình (8.5-39) là 1. Biến đổi , phân phối lại hoặc
đóng gói các thông tin mới nhất vào các hệ số tương đươngtốt nhất. và do đó các lỗi sẽ
nhỏ nhất. Cuối cùng dẫn đến phương trình (8.5-39), các lỗi trung bình-vuông của ( N/n)
2

hình ảnh giống hệt nhau. Vì vậy các lỗi trung bình-vuông (là một phương pháp của sai số
trung bình) của hình ảnh
n x n bằng với lỗi trung bình-vuông duy nhất.
Ví dụ trước đây cho thấy thông tin khả năng của đóng gói DCT là tốt hơn của các DFT và
WHT . Biến đổi Karhunen - Loesve ( KLT được thảo luận trong chương 11) . KLT giảm
thiểu các lỗi là ô vuông trong phương trình ( 8.5-39 ) cho bất kỳ hình ảnh đầu vào và bất
kỳ số lượng các hệ số giữ lại ( Kramer và Mathews [ 1956 ] ) .Tuy nhiên do KLT phụ thuộc
vào dữ liệu có được những hình ảnh cơ sở cho mỗi KLT, và thật sự là một tính toán không
đơn giản . Vì lý do này các KLT hiếm khi được sử dụng trong thực tế cho nén hình ảnh .
Thay vào đó một biến đổi như các DFT , WHT ,hoặc DCT . có hình ảnh cơ sở cố định ( đầu
vào độc lập ). Đầu vào biến đổi độc lập biến đổi dạng sóng không có since ( chẳng hạn
như biến đổi WHT ) là thực hiện đơn giản nhất. Các biến đổi hình sin ( chẳng hạn như
DFT hoặc DCT) khả năng đóng gói tối ưu thông tin của KLT.
digitalimageprocessing-gonzalez
Do đó nhiều biến đổi hệ thống mã hóa dựa trên DCT , cung cấp khả năng đóng gói thông
tin và tính toán phức tạp . Trong thực tế các thuộc tính của DCT đã được chứng minh là có
giá trị như vậy mà DCT đã trở thành một tiêu chuẩn quốc tế cho biến đổi mã hóa.
Một điều kiện bổ sung cho optimali H là chức năng mặt nạ của phương trình (8.5-37).
b
Hình 8.32 Các chu kỳ tiềm ẩn trong JD (a) DFT và (b) DCT.
hệ thống (xem Phần 8.6).
So với đầu vào biến đổi độc lập khác . Nó có ưu điểm là đã được thực hiện trong một mạch
tích hợp duy nhất, đóng gói những thông tin vào các hệ số ít nhất ( cho hầu hết các hình
ảnh tự nhiên ) và giảm thiểu sự xuất hiện khóa, được gọi là vật chặn. Điều này là đặc biệt

quan trọng trong việc so sánh với các biến đổi hình sin khác . Như hình 8.32 ( a) cho thấy
tiềm ẩn các chu kỳ vị trí K (xem phần 4.6 ) của DFT làm phát sinh gián đoạn giới hạn mà
kết quả trong tần số cao biến đổi đáng kể.Khi biến đổi hệ số DFT được cắt ngắn hoặc lượng
tử Gibbs . Đó là giới hạn giữa liền kề trở thành có thể nhìn thấy vì các vị trí ảnh giới hạn
giả định các giá trị trung bình của sự gián đoạn hình thành các vị trí giới hạn[ xem hình
8.32 (a)] các DCT của hình 8.32 ( b ) làm giảm hiệu ứng.
digitalimageprocessing-gonzalez
Chọn kích thước
Một yếu tố quan trọng ảnh hưởng đến biến đổi mã lỗi và phức tạp là tính toán kích thước .
Trong hầu hết các ứng dụng hình ảnh được chia nhỏ.
Điều kiện thứ hai đơn giản hoá việc tính toán của biến đổi (xem cơ sở 2 phương pháp tăng
gấp đôi liên tiếp tại mục 4.6.6). Nói chung cả hai mức độ nén và tính toán phức tạp như
tăng kích thước. Các kích thước phổ biến nhất là 8 x 8 và 16 x 16.
Ví dụ 8.20: Ảnh hưởng của kích thước trên biến đổi mã hóa
Hình 8.33 minh họa đồ họa tác động của kích thước về biến đổi mã hóa sửa lại lỗi. Các dữ
liệu đã thu được bằng cách chia hình ảnh đơn sắc của hình. 8.23 vào kích thước n X n , n =
2,4,8,16 và 32 tính toán các biến đổi của 75% các hệ số kết quả và tham gia các nghịch
đảo của các mảng cắt ngắn. Lưu ý rằng các đường cong Fladamard và cosin phẳng như kích
thước 8x8 của nó trở nên lớn hơn, trong khi lỗi sửa đổi Fourier giảm thậm chí còn nhanh
hơn. Phép ngoại suy của những đường cong để giá trị lớn hơn của n cho thấy lỗi sửa đổi
Fourier sẽ vượt qua đường cong Walsh-Hadamard và hội tụ về kết quả cosin. Trong thực tế,
kết quả này phù hợp với những phát hiện lý thuyết và thực nghiệm báo cáo của Netravali
[1980] và Pratt [1991] cho một Mô hình Markov 2-D.
Tất cả ba đường cong giao nhau khi kích thước 2x2 được sử dụng. Trong trường hợp này
chỉ có một trong bốn hệ số (25%) được giữ lại,do đó nghịch đảo chỉ đơn giản là thay thế 4
điểm ảnh theo giá trị trung bình của nó[xem phương trình. (4.2-22)]. Tình trạng này được
thể hiện rõ trong hình 8.34 (d). trong đó cho thấy một phần thu nhỏ của các kết quả DCT
2x2. Lưu ý rằng các hiện vật chặn đó là phổ biến trong kết quả này giảm khi kích thước
tăng lên 4 x 4 và 8 x 8 trong hình. 8.34 (e) và (f). Hình 8.34 (c) cho thấy một phần thu nhỏ
của hình ảnh ban đầu để tham khảo. Ngoài ra. hình 8.34 (a) và (b) điều kiện so sánh các kết

quả này với những ví dụ.
Hình 8.33 Lỗi sửa đổi so với kích thước
digitalimageprocessing-gonzalez
a b
c d
e f
Hình 8.34 tương đương hình. 8.23 sử dụng 25% của hệ số DCT: (a) và
8x8 kết quả (c) thu nhỏ ban đầu. (d) 2x2 kết quả (e) 4x4 kết quả. và (f) 8x8
Cấp phát bit
Các lỗi sửa đổi liên quan đến việc mở rộng của phương trình (8.5-38) là một chức năng của
số lượng và tầm quan trọng tương đối của các hệ số biến đổi được loại bỏ. Trong hầu hết
các hệ thống mã hóa biến đổi, các hệ số giữ lại được lựa chọn dựa vào phương sai tối đa,
được gọi là khu mã hóa hoặc trên cơ sở mức độ tối đa được gọi là ngưỡng mã hóa. Toàn bộ
quá trình cắt xén lượng tử hóa và mã hóa các hệ số được gọi là cấp phát bit.
Ví dụ 8.21: cấp phát bit.

×