tiểu luận xử lý ảnh số kỹ thuật nén ảnh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.29 MB, 58 trang )

Tiểu luận xử lý ảnh số: Kỹ thuật nén ảnh
Tiểu luận xử lý ảnh số: Kỹ thuật nén ảnh
8.1.Cơ bản về nén ảnh
Lĩnh vực nén ảnh thường xử lý để giảm lượng dữ liệu cần thiết để thể hiện một thông tin
cho trước. Cần phân biệt rõ ràng giữa dữ liệu và thông tin. Chúng không đồng nghĩa với
nhau. Trên thực tế, dữ liệu có thể được sử dụng để mô tả một lượng thông tin tương
đương. Chỉ trong trường hợp như một người nói rất nhiều và một người nói theo cách
ngắn gọn hơn nhưng cùng mô tả một câu chuyện. Ở đây, thông tin của câu chuyện là
những từ hoặc dữ liệu được dùng đến liên quan đến nội dung thông tin. Nếu cả hai trường
hợp dùng số lượng từ ngữ khác nhau để nói về cùng một vấn đề, hai phiên bản của câu
chuyện được tạo ra, và ít nhất một bao gồm những dữ liệu không cần thiết. điều đó có
nghĩa là nó cung cấp những thông tin không thích đáng hoặc hiểu đơn giản là những cái
đã biết. Nó còn có thể nói theo cách khác là chứa sự dư thừa dữ liệu.
Sự dư thường dữ liệu là một vấn đề quan trọng tron kỹ thuật nén ảnh số. nó không chỉ là
một lĩnh vực trừu tượng mà còn là một vấn đề toán học phức tạp. Nế n
1
và n
2
biểu diễn
cho số lượng thông tin mang trong hai đơn vị dữ liệu cùng thể hiện một thông tin như
nhau, thì sự dư thừa dữ liệu liên quan R
D
của gói dữ liệu đầu tin có thể được định nghĩa
bằng:
Trong đó C
R
thường được gọi là tỉ số nén, được tính:
Trong trường hợp n
2
=n
1

, C
R
= 1 và R
D
= 0, có thể nói rằng sự biểu diễn thông tin đầu tiên
không bị dư thừa dữ liệu. Khi n
2
rất nhỏ so với n
1
, C
R
tiến đến vô cùng và R
D
tiến tới 1,
nó là sự nén tồi và dư thừa quá nhiều duex liệu. Cuối cùng, nếu n
2
rất lớn so với n
1
, C
R

tiến tới 0 và R
D
tiến tới âm vô cùng thifnosi rằng gói dữ liệu thứ hai chứa nhiều dữ liệu
hữu ích hơn. Tất nhiên, điều này chỉ là trường hợp mô tả bình thường của sự mở rộng dữ
liệu. Trong thực tế, C
R
và R
D
nằm trong khoảng (0, ∞) và (-∞, -1), một tỉ số nén , ví dụ

bằng 10 hai 10:1, nghĩa là với mỗi đơn vị của gói dữ liệu nén, sự dư thừa thông tin của
gói tin thứ hai là 90% so với gói tin đầu tiên.
SVTH: Phan Tuấn Kiệt Trang 1
Tiểu luận xử lý ảnh số: Kỹ thuật nén ảnh
Trong kỹ thuật nén ảnh só, ba sự dư thừa cơ bản có thể được phát hiện và khai thác: Dư
thừa mã hóa, dư thừa liên pixel và dư thừa do tâm lý. Nén dữ liệu được thực hiện khi một
hoặc nhiều sự dư thừa này đựa giảm hoặc loại bỏ.
8.1.1. dư thừa do mã hóa:
ở chương 3 chúng ta đã xây dựng kỹ thuật tăng cường ảnh dựa vào xử lý histogram với
giả thiết rằng mức xám của ảnh có số lượng biến đổi ngẫu nhiên. Chúng ta đã thấy việc
biểu diễn hình ảnh bằng biểu đồ mức xám của nó được sử dụng rất nhiều. trong chương
này, chúng ta sử dụng một công thức tương tự để chỉ ra tại sao biểu đồ mức xám của hình
ảnh có thể cung cấp rất nhiều thông tin bên trong bức ảnh vào trong chương trình để có
thể cải thiện dữ liệu được sử dụng và thể hiện nó.
Chúng ta một lần nữa giả sử rằng biến ngẫu nhiên rời rạc r
k
trong khoảng [0;1] thể hiện
mức xám của một bức ảnh và mỗi giá trị r
k
xuất hiện với xác suất p
r
r
k
. theo chương 3:
Trong đó L là số lượng mức xám, n
k
là số lần mà mức xám thứ k xuất hiện trong bức ảnh,
và n là tổng số pixel trong ảnh. Nếu số lượng bít dùng để biểu diễn mỗi giá trị r
k
là l(r

k
)
thì số lượng bít trung bình cần thiết để biểu diễn một pixel là:
Có nghĩa là, độ dài trung bình của từ mã gắn cho các giá trị mức xám khác nhau sẽ được
tính bằng cách tổng hợp các bit dùng để biểu diễn mỗi giá trị mức xám và xác suất để
mỗi mức xám xuất hiện. do đó tổng số bit dùng để mã hóa một bức ảnh kích thước M*L
là M.N.L
avg
.
Việc biểu diễn mức xám của một bức ảnh bằng việc xây dựng mã nhị phân m bit cải thiện
vế phải của phương trình (8.1-4) thành m bít. Có nghĩa là, L
avg
= m khi m được thay thế
SVTH: Phan Tuấn Kiệt Trang 2
Tiểu luận xử lý ảnh số: Kỹ thuật nén ảnh
cho L(r
k
). Sau đó hằng số m có thể được lấy bằng phép cộng. Ngoại trừ phép tính tổng
p
r
(r
k
) với 0<= k <= L-1, vì dĩ nhiên nó bằng 1.
Một bức ảnh 8 mức có mức xám được biểu diễn như trong bảng 8.1. Nếu một mã nhị
phân 8 bit được dùng để biểu diễn 8 mức xám, khi đó L
avg
sẽ bằng 3, bởi vì l
1
(r
k

) bằng 3
bit cho tất cả r
k
. Nếu sử dụng mã 2 trong bảng 8.1, L
avg
sẽ được cải thiện như sau:
Từ phương trình (8.1-2), tỷ lệ nén là C
R
bằng 3/2.7 hay 1.11. Do đó có khoảng 10% dữ
liệu được tính toán bằng mã 1 bị dư thừa. Mức độ dư thừa có thể tính bởi phương trình
(8.1-1):

Biểu đồ 8.1 minh họa các đường cơ bản của thuật toán nén dựa vào mã 2. Nó biểu diễn cả
lược đồ xám của tấm ảnh ( biểu đồ của p
r
(r
k
) đối với r
k
) và l
2
(r
k
). bởi vì 2 thông số này tỉ
lệ nghịc với nhau nên l
2
(r
k
) tăng thì p
r

(r
k
) giảm . Từ mã ngắn nhất trong mã 2 được gán
cho mức xám xuất hiện thường xuyên nhất trong bức ảnh.
SVTH: Phan Tuấn Kiệt Trang 3
Tiểu luận xử lý ảnh số: Kỹ thuật nén ảnh
ở trong ví dụ trước, ta gán ít bít hơn cho những mức xám có xác suất xuất hiện lớn hơn
trong bức ảnh so với mức xám có xác suất bé hơn. Quá trình này thường được gọi là mã
hóa với chiều dài thay đổi. Nếu mức xám cảu một bức ảnh được mã hóa theo một cách
mà sử dụng nhiều từ mã hơn mức cần thiết để biểu diễn các mức xám( có nghĩa là mã đó
không đạt được số từu mã tối thiểu như trong phương trình (8.1-4)), thì bức ảnh đó được
gọi là có chứa mã dự phòng. Trong thực tế dư thừa do mã hóa được sử dụng khi từ mã
gắn cho một mức xám không được lựa chọn để đạt được sự tối ưu của xác suất xuất hiện
sự kiện. Nó hầu như luôn luôn được sử dụng khi mức xám của một bức ảnh được thể hiện
bởi một mã nhị phân thẳng hoặc tự nhiên. Trong trường hợp này, nền tảng cơ bản cho dư
thùa do mã hóalà bức ảnh thường bao gồm những đối tượng mức xám có hình thái bình
thường và phần nào dự đoán được, và được lấy mẫu sao cho các đối tượng được mô tả
lớn hơn so với các thành phần khác của bức ảnh. Và kết quả tự nhiên là trong hầu hết các
bức ảnh, một số mức xám nhất định có thể có xác suất nhiều hơn các mức xám khác(có
nghĩa là lược đồ xám của hầu hết các bức ảnh là không đồng đều). một mã nhị phân tự
nhiên của những mức xám đó gán số lượng bit giống nhau cho cả những giá trị có xác
suất lớn nhất và nhỏ nhất, do đó không đạt được sự tối ưu hóa số lượng bít và kết quả rơi
vào mã hóa dự phòng.
8.1.2. Dự thừa liên điểm ảnh
Xét những bức ảnh được cho trong hình 8.2(a) và (b). Như hình 8.2 (c) và (d) cho thấy,
những bức ảnh này chứa những lược đồ xám hầu như giống hệt nhau Cũng lưu ý rằng cả
2 lược đồ xám là trimodal, cho thấy sự hiện diện sự chi phối của ba giá trị mức xám. Bởi
vì mức xám của các bức ảnh có xác suất không giống nhau, mã hóa chiều dài có thể được
SVTH: Phan Tuấn Kiệt Trang 4
Tiểu luận xử lý ảnh số: Kỹ thuật nén ảnh

sử dụng để cải thiện dư thừa từ mã mà sẽ cho kết quả từ mã nhị phân thẳng hoặc tự nhiên
của những điểm ảnh đó, tuy nhiên, sẽ không thay đổi mức độ liên quan giữa các điểm ảnh
trong bức ảnh. Nói cách khác, các mã được sử dụng để thể hiện mức xám của mỗi bức
ảnh không thể hiện sự tương quan giữa các điểm ảnh. Sự liên quan là kết quả từ cấu trúc
hay quan hệ hình học giữa các đối tượng trong bức ảnh.
Bức ảnh 8.2(c) và (f) cho thấy các hệ số tương quan được tính toán trong suốt một hảng
của bức ảnh. Những hệ số này được tính toán sử dụng một phiên bản của phương trình
(4.6-30) trong đó:

Các thông số trong phương trình (8.1-6) giải thích cho số lượng khác nhau của tổng mà
phát sinh trong mỗi giá trị nguyên của ∆n. Tất nhiên, ∆n phải nhỏ hơn N, là số lượng của
các điểm ảnh trong một hàng. Biến x là thứ tự của hàng được dùng trong tính toán. Lưu ý
rằng sự khác biệt giữa biểu đồ của các hàm được chỉ ra trong hình 8.2(e) và (f). Mối quan
hệ này có thể nhận thấy một phần trong hình 8.2(f), nơi mà độ tương quan giữa
SVTH: Phan Tuấn Kiệt Trang 5
Tiểu luận xử lý ảnh số: Kỹ thuật nén ảnh
các điểm ảnh được chia ra bằng 45 hoặc 90 mẫu có thể liên quan trực tiếp đến khoảng
cách giữa các đường dọc tương ứng của hình 8.2(b). Hơn nữa, những điểm ảnh liền kề
nhau của cả 2 bức ảnh có sự tương quan lớn với nhau. Khi mà ∆n bằng 1 thì γ = 0.9922
và 0.9928 cho ảnh trong hình 8.2(a) và (b). Những giá trị này thường được lấy mẫu như
các bức hình trong tivi.
Sự minh họa này phản ánh một hình thức quan trọng khác của dư thừa dữ liệu, một mối
quan hệ trực tiếp tới mối tương quan liên pixel trong hình ảnh. Bởi vì giá trị của bất kỳ
một điểm ảnh cho trước nào có thể được dự đoán từ giá trị của các điểm ảnh lân cận,
thông tin được mang bởi một điểm ảnh riêng lẻ thì thường nhỏ. Nhiều thông tin ảo của
SVTH: Phan Tuấn Kiệt Trang 6
Tiểu luận xử lý ảnh số: Kỹ thuật nén ảnh
một điểm ảnh riêng lẻ đến bức ảnh là dư thừa, nó có thể được đoán dựa trên cơ bản của
giá trị của những điểm ảnh lân cận. Những tên khác nhau, bao gồm dư thừa không gian,
dư thừa hình học, và dư thừa giữa các khung đã được dùng để tham chiếu đến sự độc phụ

thuộc giữa các pixel. Chúng ta dùng thuật ngữ “interpixel redundancy” để bao hàm tất cả.
Thay vì cải thiện dư thừa xuyên pixel trong một bức ảnh, mảng pixel 2-D bình thường sử
dụng cho việc nhìn của con người và việc giải thích phải được biến đổi sang một dạng
khác hiệu quả hơn. Ví dụ như, sự khác nhau giữa các điểm ảnh lân cận có thể được dùng
để biểu diễn một bức ảnh. Sự chuyển đổi của dạng này (có nghĩa là loại bỏ dư thừa giữa
các điểm ảnh) thì được tham chiếu vào một bản đồ. Việc làm này được gọi là sự sắp xếp
ngược nếu các thành phần trong bức ảnh có thể được xây dựng từ dữ liệu được sắp xếp.
Hình 8.3 mô tả một thủ tục sắp xếp đơn giản. Hình 8.3(a) miêu tả một 1-in bằng 3-in của
một bức vẽ điện đơn giản mà được lấy mẫu ở xấp xỉ 330 dpi (điểm mỗi inch). Bức ảnh
8.3(b) chỉ một phiên bản nhị phân của bức ảnh. Và hình 8.3(c) miêu tả chi tiết mức xám
của một dòng của bức ảnh và ngưỡng dùng để xác định phiên bản nhị phân(xem phần
SVTH: Phan Tuấn Kiệt Trang 7
Tiểu luận xử lý ảnh số: Kỹ thuật nén ảnh
3.1).
Bời vì bức ảnh nhị phân chứa nhiều vùng có cường độ sáng không đổi, một sự biểu diễn
có hiệu quả có thể được cấu trúc bởi sự sắp xếp các điểm ảnh suốt mỗi dòng f(x,0), f(x,1),
…, f(x,N-1) vào trong một dãy cặp đôi (g
1,
w
1
), (g
2,
w
2
),…, trong đó g
i
biểu diễn mức xám
thứ i được tính toán trong hàng và w
i
là độ dài dich của lần dịch thứ i. Nói cách khác, bức

ảnh đã lấy ngưỡng có thể được biểu diễn hiệu quả hơn bằng những giá trị và độ dài của
các mức xám không đổi (dạng biểu diễn không thấy được) hơn là bằng một mảng 2 chiều
của những điểm ảnh nhị phân.
Hình 8.3(d) cho thấy dữ liệu mã hóa theo chiều dài tương ứng với chi tiết của dòng lấy
ngưỡng của hình 8.3(c). Chỉ cần thiết 88 bit để biểu diễn 1024 bit của dữ liệu nhị phân.
SVTH: Phan Tuấn Kiệt Trang 8
Tiểu luận xử lý ảnh số: Kỹ thuật nén ảnh
Trên thực tế, tất cả 1024×343 phần được thấy trên hình 8.3(b) có thể giảm xuống còn
12,166 runs. Nếu cần 11 bit để thể hiện mỗi cặp run-length , kết quả của ti lệ nén và sự
dư thừa tương ứng là:
8.1.3. Dư thừa do tâm lý nhìn:
Chúng ta lưu ý trong phần 2.1 rằng độ sáng của một vùng, nếu được nhận thấy bằng mắt,
phụ thuộc vào những yếu tốt khác nhiều hơn là ánh sáng thông thường phản chiếu bởi các
vùng. Ví dụ, cường độ biến đổi có thể nhận thức được trong một vùng có cường độ là
hằng số. Nhưng kết quả hiện tượng từ sự thật rằng mắt người không thể phản ứng với
những mức độ như nhau đối với tất cả các thông tin có thể nhìn thấy. Những thông tin
đơn giản đã biết ít liên quan quan trọng hơn những thông tin khác trong xử lý có thể nhìn
thấy bình thường. thông tin này được gọi là dư thừa có thể nhìn thấy. Nó có thể bị loại trừ
mà không làm giảm suy yếu chất lượng của tấm ảnh.
Mà dư thừa hình ảnh tâm lý tồn tại không cần đến như là một bất ngờ, bởi vì con người
nhận thức của các thông tin trong một hình ảnh bình thường không liên quan đến phân
tích định lượng của tất cả các giá trị điểm ảnh trong hình ảnh. Nói chung, một người quan
sát tìm kiếm để phân biệt các tính năng như các cạnh hoặc các khu vực kết cấu và kết hợp
chúng thành các nhóm nhận biết. Não sau đó tương quan những nhóm với kiến thức để
hoàn tất quá trình giải đoán ảnh.
Dự phòng tâm lý hình ảnh về cơ bản là khác nhau từ dư thừa thảo luận trước đó. Không
giống như mã hóa và dự phòng liên pixel, dự phòng tâm lý kết hợp với thông tin hình ảnh
thật hay định lượng. ta có thể loại bỏ nó vì những thông tin đó là không cần thiết để xử lý
hình ảnh bình thường. Kể từ khi loại bỏ các dữ liệu kết quả psychovisually dư thừa gây ra
một sự mất mát thông tin định lượng, nó thường được gọi là lượng tử. Thuật ngữ này là

phù hợp với việc sử dụng bình thường của từ này, mà thường có nghĩa là bản đồ của một
loạt các giá trị đầu vào cho một số lượng hạn chế của giá trị đầu ra đã thảo luận trong
SVTH: Phan Tuấn Kiệt Trang 9
Tiểu luận xử lý ảnh số: Kỹ thuật nén ảnh
phần 2.4. Vì nó là một hoạt động không thể đảo ngược (thông tin thị giác bị mất), kết quả
lượng tử trong quá trình nén dữ liệu tổn hao.
Ví dụ 8.3: Xem xét các hình ảnh trong hình. 8.4. Hình 8.4 (a) cho thấy một hình ảnh đơn
sắc với 256 mức màu xám. Hình 8.4 (b) cho thấy cùng một hình ảnh sau khi lượng tử
thống nhất bốn bit hoặc 16 cấp độ. Tỉ lệ nén kết quả là 2:1. Lưu ý, như được thảo luận
trong Phần 2.4, đường nét sai hiện diện trong khu vực trơn tru trước đây của bức ảnh.
Đây là hiệu ứng tự nhiên khi biểu diễn một bức ảnh thô dùng mức xám của hình ảnh.
Hình 8.4 (c) cho thấy những cải tiến đáng kể có thể với lượng tử hóa để tận dụng những
đặc thù của hệ thống thị giác của con người. Mặc dù tỉ lệ nén từ thủ tục này lượng tử thứ
hai cũng là 2:1, đường nét sai sẽ giảm đáng kể, nhiễu giống hạt bụi có thể tăng nhưng có
thể chấp nhận được. Phương pháp dùng để cải thiện ảnh cho ra kết quá này gọi là lượng
tử mức xám (IGS). Nó nhận ra sự nhạy cảm của mắt đối với các cạnh và cải thiện chúng
bằng cách thêm vào mỗi điểm ảnh một số giả ngẫu nhiên được tạo ra từ các bít thấp của
các điểm ảnh lân cận. Bởi vì cá bít thấp là khá ngẫu nhiên, công việc này là để tạo thêm
một mức độ ngẫu nhiên cho tấm ảnh mà phụ thuộc vào đặc tính riêng của bức ảnh. Để
các cạnh được tạo ra kết hợp với các đường nét sai.
Bảng 8.2 minh họa phương pháp này. Một tổng mà ban đầu được thiết lập bằng không-là
lần đầu tiên hình thành từ giá trị màu xám cấp hiện tại 8-bit và bốn bit thấp nhất của một
tổng được tạo ra trước đó. Nếu bốn bit quan trọng nhất của giá trị hiện tại là 11112, tuy
nhiên, 00002 sẽ thay thế. Bốn bit quan trọng nhất của tổng kết quả được sử dụng như các
giá trị điểm ảnh được mã hóa.
SVTH: Phan Tuấn Kiệt Trang 10
Tiểu luận xử lý ảnh số: Kỹ thuật nén ảnh
Cải thiện lượng tử xám là điển hình của một nhóm các phương pháp lượng tử mà hoạt
động trực tiếp trên các cấp độ màu xám của hình ảnh được nén. Những phương pháp này
thường đòi hỏi giảm độ phân giải không gian và / hoặc mức xám của hình ảnh. Các

đường nét sai kết quả hoặc hiệu ứng khác có liên quan đòi hỏi phải sử dụng các kỹ thuật
heuristic để bù đắp cho tác động trực quan của lượng tử. quét dòng bình thường 02:01
xen kẽ được sử dụng trong truyền hình phát sóng thương mại,là một ví dụ,đó là một hình
thức của lượng tử trong đó phần đan xen của khung liền kề cho phép giảm tỷ lệ quét
video nhưng ít giảm chất lượng hình ảnh về mặt nhận thức.
Những tiêu chí phải theo:
SVTH: Phan Tuấn Kiệt Trang 11
Tiểu luận xử lý ảnh số: Kỹ thuật nén ảnh
Như đã đề cập, loại bỏ các dư thừa do tâm lý dự phòng dữ liệu cho kết quả là mất mát
thông tin trực quan thực tế hoặc định lượng. Bởi vì thông tin quan tâm có thể bị mất, một
phương tiện lặp lại và tái sản xuất định lượng tính chất, mức độ mất mát thông tin là rất
quan trọng. Hai lớp tiêu chí được sử dụng làm cơ sở cho việc đánh giá như: (1) tiêu chí
khách quan trung thực và (2) các tiêu chí chủ quan trung thực.
Khi mức độ mất mát thông tin có thể được thể hiện như một chức năng của hình ảnh ban
đầu hoặc đầu vào và nén và giải nén hình ảnh đầu ra sau đó, nó được cho là dựa trên một
tiêu chí trung thực khách quan. Một ví dụ là root-mean-square (rms) lỗi giữa một đầu vào
và hình ảnh đầu ra. Cho f(x/y) đại diện cho một hình ảnh đầu vào và để cho f (x/y) biểu
thị một ước tính hoặc xấp xỉ của f (x/ y) là kết quả của nén và sau đó giải nén đầu vào.
Đối với bất kỳ giá trị của x và y, các sai lệch e(x.,y) giữa f (x, y) và xấp xĩ f (x, y) có thể
được định nghĩa là:
Do đó sự sai khác giữa 2 bức ảnh là:
Khi bức ảnh có kích thước M×N, sai lệch root mean square e
rms
được tính là căn bậc hai
của trung bình phương sai trên mảng M×N:
Một đối tượng liên quan trực tiếp đến tính trung thực của hình ảnh là tỷ lệ tín hiệu trên
nhiễu của ảnh trước khi nén và khi giải nén. Nếu tín hiệu được xác định là tổng
của tấm ảnh sạch f(x,y) và nhiễu e(x,y), tỷ lệ tín hiệu trên nhiễu trung bình được tính
bằng:
SVTH: Phan Tuấn Kiệt Trang 12

Tiểu luận xử lý ảnh số: Kỹ thuật nén ảnh
Giá trị rms của tỉ số tín hiệu trên nhiễn, kí hiệu SNR
rms
được tính bằng cách lấy căn của
phương trình (8.1-9).
Mặc dù tiêu chí trung thành cung cấp một cơ chế đơn giản và thuận tiện cho việc đánh
giá sự mất mát thông tin, hình ảnh nén nhất cuối cùng được xem bởi con người. Do đó,
đo lường chất lượng hình ảnh của các đánh giá chủ quan của một người quan sát con
người thường thích hợp hơn. Điều này có thể được thực hiện bằng cách hiển thị một hình
ảnh nén phù hợp của người xem và đánh giá trung bình của họ. Các đánh giá có thể được
thực hiện bằng cách sử dụng thang đánh giá tuyệt đối hoặc bằng so sánh cạnh theo cạnh
của f(x, y) và . Bảng 8.3 cho thấy một thang đánh giá tuyệt đối có thể, so sánh
Side-by-side có thể được thực hiện với quy mô như vậy như {-3, -2, -1,0,1,2, 3} để đại
diện cho các đánh giá chủ quan {tồi tệ hơn nhiều, tệ hơn, hơi tồi tệ hơn, giống nhau, tốt
hơn một chút, tốt hơn, tốt hơn nhiều}, tương ứng. Trong cả hai trường hợp, việc đánh giá
được cho là dựa trên các tiêu chí trung thực chủ quan.
Ví dụ 8.4: lỗi rms trong những hình ảnh lượng tử hóa của Hình. 8.4 (b) và (c) là 6.93 và
6.78. So sánh các mức độ màu xám, tương ứng. Rms tỷ lệ tín hiệu trên nhiễu tương ứng
là 10,25 và 39 Mặc dù các giá trị này khá tương tự, một đánh giá chủ quan của chất lượng
hình ảnh của hai hình ảnh được mã hóa có thể dẫn đến một đánh biên cho hình ảnh trong
hình. 8.4 (b) và một đánh giá khá cho rằng trong hình. 8.4 (c).
SVTH: Phan Tuấn Kiệt Trang 13
Tiểu luận xử lý ảnh số: Kỹ thuật nén ảnh
8.2. Mô hình xử lý ảnh
Trong phần 8.1, chúng tôi thảo luận riêng ba kỹ thuật chung để giảm hoặc nén số lượng
dữ liệu cần thiết để đại diện cho một hình ảnh. Tuy nhiên, những kỹ thuật này thường
được kết hợp để hình thành hệ thống nén hình ảnh thực tế. Trong phần này, chúng ta xem
xét các đặc điểm chung của một hệ thống và phát triển một mô hình chung để đại diện
cho nó.
Như hình 8.5, một hệ thống nén ảnh bao gồm hai khối cấu trúc riêng biệt: một bộ mã hóa

và một bộ giải mã. Một hình ảnh đầu vào f {x, y) được đưa vào bộ mã hóa, nó tạo ra một
tập hợp các ký hiệu từ các dữ liệu đầu vào. Sau khi truyền qua các kênh, các thông tin đã
mã hóa được đưa vào các bộ giải mã, nơi một hình ảnh đầu ra được xây dựng lại,
được tạo ra. Tất nhiên, không thể bằng f(x,y) một cách chính xác. Nếu nó chính
xác hoàn toàn thì hệ thống là không có lỗi hay tín hiệu được bảo toàn, nếu không, một vài
lỗi sẽ xuất hiện trong bức ảnh được giải mã.
Cả bộ mã hóa và giả mã được chỉ ra trong hình 8.5 bao gồm hai tính năng hoặc khối phụ
tương đối độc lập. Các bộ mã hóa được tạo thành từ một bộ mã hóa nguồn, trong đó loại
bỏ nhiễu đầu vào, và một bộ mã hóa kênh, làm tăng khả năng chống nhiễu của đầu ra
nguồn mã hóa. Như dự kiến, các bộ giải mã bao gồm một bộ giải mã kênh theo sau là
một bộ giải mã nguồn. Nếu các kênh giữa các bộ mã hóa và giải mã là không nhiễu
(không bị lỗi), bộ mã hóa và giải mã kênh được bỏ qua, và bộ mã hóa và giải mã nguồn
trở thành nguồn mã hóa và giải mã.
8.2.1 Bộ mã hóa nguồn và giải mã nguồn
SVTH: Phan Tuấn Kiệt Trang 14
Tiểu luận xử lý ảnh số: Kỹ thuật nén ảnh
Nguồn mã hóa có trách nhiệm giảm hoặc loại bỏ bất kỳ mã hóa, xuyên điểm ảnh, hoặc dư
thừa do tâm lý trong hình ảnh đầu vào. Các ứng dụng cụ thể và ứng dụng liên quan đến
yêu cầu độ chính xác cần có cách tiếp cận mã hóa tốt nhất để sử dụng trong bất kỳ tình
huống nào. Thông thường, phương pháp này có thể được mô phỏng theo một chuỗi ba
hoạt động độc lập. Như hình. 8.6 (a) cho thấy, mỗi hoạt động được thiết kế để làm giảm
một trong ba dư thừa được mô tả trong phần 8.1. Hình 8.6 (b) mô tả các bộ giải mã nguồn
tương ứng.
Trong giai đoạn đầu tiên của quá trình mã hóa nguồn, bộ Mapper biến đổi dữ liệu đầu
vào sang một định dạng (thường không phải là hình ảnh) được thiết kế để giảm dư thừa
xuyên điểm ảnh trong hình ảnh đầu vào. Hoạt động này thường có thể đảo ngược và có
thể không trực tiếp làm giảm số lượng dữ liệu cần thiết để thể hiện hình ảnh. Mã hóa
chạy theo chiều dài (mục 8.1.2 và 8.4.3) là một ví dụ về một Mapping mà cho kết quả
trực tiếp trong giai đoạn đầu của quá trình mã hóa nguồn. Các đại diện của một hình ảnh
của một tập hợp các hệ số biến đổi (Mục 8.5.2) là một ví dụ về trường hợp ngược lại.

Đây là sơ đồ biến đổi hình ảnh thành một mảng các hệ số, làm cho dư thừa interpixel của
nó dễ tiếp cận hơn cho việc nén trong giai đoạn cuối của quá trình giải mã.
Giai đoạn thứ 2, hay là khối quantizer trong hình 8.6(a), cải thiện độ chính xác của tín
hiệu ra của khối Mapper cho phù hợp với tiêu chí chính xác. Giai đoạn này cải thiện sự
dư thừa theo tâm lý của hình ảnh đầu vào. Như đã đề cập trong mục 8.1.3, hoạt động này
SVTH: Phan Tuấn Kiệt Trang 15
Tiểu luận xử lý ảnh số: Kỹ thuật nén ảnh
là không thể đảo ngược. Do đó nó phải được bỏ qua khi lỗi nén đạt được như mong
muốn.
Trong giai đoạn thứ ba và cuối cùng của quá trình giải mã nguồn, bộ Symbol coder tạo ra
một mã số cố định hoặc độ dài thay đổi để đại diện cho đầu ra bộ quantizer và làm cho
đầu ra phù hợp với mã. Khối symbol coder hạn phân biệt hoạt động này mã hóa từ quá
trình mã hóa nguồn tổng thể. Trong hầu hết các trường hợp, một mã chiều dài thay đổi
được sử dụng để đại diện cho các thiết lập dữ liệu ánh xạ và lượng tử hóa. Nó gán các từ
mã ngắn nhất cho các giá trị thường xuyên xảy ra nhất và do đó làm giảm dư thừa từ mã.
Các hoạt động, tất nhiên, có thể đảo ngược. Sau khi hoàn thành các bước mã hóa biểu
tượng, hình ảnh đầu vào đã được xử lý để loại bỏ một trong ba dư thừa được mô tả trong
phần 8.1.
Hình 8.6 (a) cho thấy quá trình mã hóa nguồn như ba hoạt động liên tiếp, nhưng cả ba
hoạt động không nhất thiết phải bao gồm trong tất cả các hệ thống nén.Ví dụ như khối
quantizer có thể được bỏ đi nếu lỗi là như mong muốn. Ngoài ra, một số kỹ thuật nén
thường được mô hình hoá bằng cách kết hợp các khối riêng biệt trong hình 8.6 (a). Trong
các hệ thống nén của mục 8.5.1. ví dụ, bộ mapper và quantizer thường được đại diện bởi
một khối duy nhất, mà đồng thời thực hiện cả hai hoạt động.
Các bộ giải mã nguồn hình. 8.6 (b) chỉ chứa hai thành phần: một bộ quantizer và một
mapper ngược. Các khối thực hiện theo thứ tự ngược, các hoạt động nghịch đảo của các
nguồn mã hóa ký hiệu mã hóa và ánh xạ ngược. Bởi vì kết quả lượng tử trong mất mát
thông tin không thể đảo ngược, một khối quantizer ngược không được bao gồm trong các
mô hình bộ giải mã nguồn hình. 8.6 (b).
Các bộ mã hóa và giải mã kênh đóng một vai trò quan trọng trong tổng thể quá trình mã

hóa-giải mã khi các kênh của hình. 8.5 là nhiễu hoặc dễ bị lỗi. Chúng được thiết kế để
giảm tác động của nhiễu kênh bằng cách chèn một hình thức kiểm soát dư thừa vào các
dữ liệu mã hóa nguồn. Như đầu ra của bộ mã hóa nguồn có chứa một ít dư thừa, nó sẽ rất
nhạy cảm với nhiễu không có sự bổ sung "kiểm soát dư thừa.".
Một trong những kỹ thuật mã hóa kênh hữu ích nhất được đưa ra bởi RW Hamming
(Hamming [1950]). Nó được dựa trên thêm đủ bit dữ liệu phụ được mã hóa để đảm bảo
rằng một số lượng tối thiểu của các bit phải thay đổi giữa các từ mã hợp lệ. Hamming cho
thấy, ví dụ, rằng nếu 3 bit dư thừa được thêm vào một từ 4-bit, do đó khoảng cách giữa
hai từ mã hợp lệ là 3, tất cả các lỗi bit đơn có thể được phát hiện và sửa chữa. (Bằng cách
SVTH: Phan Tuấn Kiệt Trang 16
Tiểu luận xử lý ảnh số: Kỹ thuật nén ảnh
phụ thêm các bit thêm dư thừa, lỗi nhiều bit có thể được phát hiện và sửa chữa.) 7-bit
Hamming (7,4) từ mã h
1
h
2
h
5
h
6
h
7
liên kết với một 4-bit số nhị phân là b
3
b
2
b
1
b
0

:
Để giải mã một kết quả mã hóa Hamming, các bộ giải mã kênh phải kiểm tra giá trị mã
hóa cho bit chẵn trong các trường bit mà bit chẵn được thành lập trước đây. Một lỗi đơn
bit được chỉ định bởi một tính chẵn lẻ khác không từ c
4
c
2
c
1
:
Nếu một giá trị khác 0 được tìm thấy, các bộ giải mã chỉ đơn giản là bổ sung mã từ vị trí
bit chỉ định bởi các từ mã chẵn lẻ. Giá trị nhị phân được giải mã sau đó được lấy từ các từ
mã sửa lỗi như h
3
h
5
h
6
h
7
.
Ví dụ 8.5: Mã hóa harming
Xem xét việc truyền tải dữ liệu IGS 4-bit của Bảng 8.2 trên một kênh truyền chứa nhiễu
Một lỗi bit đơn có thể gây ra tại một điểm ảnh sau khi giải nén nhận giá trị không đúng
giá trị của nó bằng nhiều đường đối với 128 mức màu xám. Một mã hóa kênh harmming
có thể được sử dụng để tăng khả năng giảm nhiễu của nguồn này khi được mã hóa IGS
dữ liệu bằng cách chèn đủ bit dự phòng để cho phép phát hiện và sửa chữa sai sót trên
các bit đơn. . Từ biểu thức. (8.2-1), các giá trị mã hóa Hamming cho IGS giá trị đầu tiên
trong Bảng 8.2 là 1100110
2

- Bởi vì các kênh Hamming mã hóa làm tăng số lượng bit cần
thiết để đại diện cho IGS giá trị 4-7. tỉ số nén 2:01 trong ví dụ IGS được giảm xuống 8:7
hoặc 1.14:1. Điều này làm giảm tỷ lệ nén nhưng làm tăng khả năng chống nhiễu.
8.3 Các yếu tố của lý thuyết thông tin
SVTH: Phan Tuấn Kiệt Trang 17
Tiểu luận xử lý ảnh số: Kỹ thuật nén ảnh
Trong phần 8.1 chúng tôi giới thiệu một số cách để giảm số lượng dữ liệu được sử dụng
để đại diện cho một hình ảnh. Một câu hỏi tự nhiên phát sinh là: Làm thế nào vài dữ liệu
thực sự cần thiết để đại diện cho một hình ảnh? Đó là, một số lượng tối thiểu của dữ liệu
đó đủ để mô tả hoàn toàn một hình ảnh mà không mất thông tin? Lý thuyết thông tin
cung cấp khuôn khổ toán học để trả lời này và những gì liên quan đến nó.
8.3.1 đo đạc thông tin:
Những tiền đề cơ bản của lý thuyết thông tin là thế hệ của thông tin có thể được mô hình
hóa như một quá trình xác suất có thể đo đạc được một cách trực quan. Theo giả thuyết
này, một sự kiện ngẫu nhiên xảy ra với xác suất P(E) được gọi là có chứa các đơn vị
thông tin.
Số I(E) thường được gọi là lượng thông tin chứa trong của E. Nói chung, số lượng thông
tin tự do của sự kiện A là tỉ lệ nghịch với xác suất E. Nếu P (E) = 1 (có nghĩa là, sự kiện
này luôn luôn xảy ra), I(E) = 0 và không có thông tin chứa trong nó. Đó là, bởi vì sự kiện
này chắc chắn xảy ra, không cần có thông tin giao tiếp cho rằng sự kiện này đã xảy ra.
Tuy nhiên, nếu P (E) = 0,99, thì phiên giao tiếp rằng E đã xảy ra truyền đạt một số lượng
nhỏ thông tin. Giao tiếp mà E đã không xảy ra truyền tải nhiều thông tin, bởi vì kết quả
này là ít có khả năng xảy ra.
Cơ sở của logarit trong phương trình (8,3-1) xác định đơn vị dùng để đo thông tin. Nếu
logarit cơ sở m được sử dụng, đo lường được gọi trong đơn vị là m-phân. Nếu cơ sở 2
được chọn, đơn vị kết quả của thông tin được gọi là một bit. Lưu ý rằng nếu P(E) = 1/2,
I(E) = —log21/2 or 1 bit. Nghĩa là, 1 bit là số lượng thông tin được truyền khi một trong
hai có thể đều có khả năng có thể xảy ra sự kiện. Một ví dụ đơn giản của kiểu như vậy là
lật một đồng xu và giao tiếp kết quả.
Khi chính thông tin được chuyển giao giữa một nguồn thông tin và người sử dụng các

thông tin, các nguồn thông tin gọi là được kết nối với người sử dụng thông tin bởi một
kênh thông tin. Kênh thông tin là phương tiện vật lý liên kết các nguồn cho người sử
dụng. Nó có thể là một đường dây điện thoại, một đường truyền năng lượng điện từ, hoặc
một văn bản trong một máy tính kỹ thuật số.
SVTH: Phan Tuấn Kiệt Trang 18
Tiểu luận xử lý ảnh số: Kỹ thuật nén ảnh
Hình số 8.7 cho thấy một mô hình toán học đơn giản cho hệ thống thông tin rời rạc. Ở
đây, các tham số đặc biệt quan tâm là dung lượng của hệ thống, được định nghĩa như khả
năng truyền thông tin của nó. Chúng ta hãy giả định rằng nguồn thông tin trong hình 8.7
tạo ra một chuỗi ngẫu nhiên các ký tự từ một tập hợp hữu hạn hoặc vô hạn đếm được các
biểu tượng. Nghĩa là, đầu ra của nguồn là một biến ngẫu nhiên rời rạc. Tập hợp các
nguồn kí tự{a1, a2, , aj} được gọi là nguồn bảng chữ cái A, và các yếu tố của thiết lập
này, ký hiệu là aj, được gọi là kí tự hoặc chữ cái. Xác suất của sự kiện đó là nguồn gốc sẽ
tạo ra kí tự aj thường được sử dụng để đại diện cho tập hợp tất cả các nguồn biểu tượng là
P (aj) và:

vector z = [P(a
1
), P(a
2
),…,P(a
j
)]
T
liên quan được sử dụng để đại diện cho tập tất cả các
nguồn kí tự xác suất P { P(a
1
), P(a
2
),…,P(a

j
)}. Tập hợp hữu hạn (A, z) mô tả các nguồn
thông tin đã hoàn thành.
Xác suất nguồn rời rạc sẽ tạo ra a
j
là P(a
j
), nên chính thông tin được tạo ra bởi sự sản xuất
của một nguồn kí tự đơn lẻ, phù hợp với phương trình (8.3-1), I(a
j
) =-log P(a
j
). Nếu
nguồn k những kí tự được tạo ra, luật của một số lượng lớn quy định rằng, đối với một
giá trị đủ lớn của k, kí tự a
j
(trên trung bình) được xuất đi kP(a
j
) lần. Do đó, chính thông
tin trung bình thu được từ nguồn k xuất ra là
Hay
Thông tin trung bình mỗi đầu ra nguồn, ký hiệu là H (z), là
SVTH: Phan Tuấn Kiệt Trang 19
Tiểu luận xử lý ảnh số: Kỹ thuật nén ảnh
Số lượng này được gọi là sự không chắc chắn hoặc sự ngẫu nhiên của nguồn. Nó xác
định số lượng trung bình của thông tin (trong m-phân đơn vị cho mỗi ký hiệu) thu được
bằng cách quan sát đầu ra của một nguồn đơn lẻ. Nếu tăng giá trị của nó,giá trị càng
không chắc chắn và do đó có nhiều thông tin có liên quan đến nguồn gốc. Nếu kí tự
nguồn có thể như nhau, ngẫu nhiên hoặc không chắc chắn của phương trình. (8.3-3) là tối
đa và nguồn cung cấp thông tin trung bình lớn nhất có thể cho mỗi ký hiệu nguồn.

Có mô hình hóa nguồn thông tin, chúng ta có thể phát triển các đặc điểm đầu vào-đầu ra
của các kênh thông tin khá dễ dàng. Bởi vì chúng ta đã mô hình hóa đầu vào đến kênh
trong hình. 8,7 như là một biến ngẫu nhiên rời rạc, thông tin chuyển giao cho đầu ra của
kênh này cũng là một biến ngẫu nhiên rời rạc. Như biến ngẫu nhiên mã nguồn, nó tăng
giá trị từ một tập hợp hữu hạn hoặc vô hạn đếm được của các kí tự{b
1
, b
2
, b
k
} được
gọi là kênh bảng chữ cái, B. Xác suất của sự kiện mà kí tự b
k
được giới thiệu thông tin
cho người sử dụng thông tin là P(b
k
). Tập hợp hữu hạn (B, v, trong đó v =[P(b
1
), P(b
2
),
…,P(b
K
)]
T
), mô tả các kênh đầu ra hoàn chỉnh và do đó người dủng nhận được thông tin.
Xác suất P(b
k
) của một kênh nhận đầu ra và phân phối xác suất của nguồn z có liên quan
của biểu thức:

trong đó P(b
k
| a
j
) là xác suất có điều kiện mà đầu ra biểu tượng b
k
được nhận, nhận nguồn
biểu tượng a
j
được tạo ra. Nếu xác suất có điều kiện được tham chiếu trong trình (8.3-4)
được bố trí trong một ma trận K x J ma trận Q, như sau:
SVTH: Phan Tuấn Kiệt Trang 20
Tiểu luận xử lý ảnh số: Kỹ thuật nén ảnh
sau đó xác suất phân phối của đầu ra alphabet hoàn chỉnh có thể được tính từ:

ma trận Q, với các yếu tố q
kj
= P(b
k
|a
j
), được gọi như ma trận chuyển đổi kênh hoặc bởi
ma trận kênh viết tắt.
Để xác định năng lực của một kênh thông tin với sự chuyển tiếp qua ma trận Q, dữ liệu
ngẫu nhiên của nguồn thông tin phải được tính toán trước tiên theo giả định rằng người
sử dụng thông tin quan sát một đầu ra b
k
cụ thể. Phương trình (8,3-4) định nghĩa một sự
phân bố của nguồn biểu tượng cho bất kỳ b
k

nào được quan sát, nên mỗi b
k
có một chức
năng dữ liệu ngẫu nhiên có điều kiện. Dựa trên các bước dẫn đến phương trình. (8,3-3),
chức năng dữ liệu ngẫu nhiên có điều kiện, được ký hiệu là H(z|b
k
), có thể được viết :
trong đó P (a
j
|b
k
) là xác suất biểu tượng a
j
, được truyền qua các nguồn, đưa người sử dụng
nhận được b
k
. Dự kiến giá trị trung bình của biểu thức này hơn tất cả b
k.
Sau sự thay thế của phương trình (8.3-7) cho H(z|b
k
) và một số sự sắp xếp, phương trình
có thể viết lại:
SVTH: Phan Tuấn Kiệt Trang 21
Tiểu luận xử lý ảnh số: Kỹ thuật nén ảnh
ở đây, P(a
j
,b
k
) là xác suất chung của a
j

và b
j
. Đó là, P (a
j
, b
k
) là xác suất mà a
j
được truyền
đi và b
k
nhận được.
Tợp hợp H(z|v) được gọi là sự không rõ nghĩa của z với sự liên quan đến v. Nó đại diện
cho thông tin trung bình của một kí hiệu nguồn, giả sử sự quan sát của ký hiệu đầu ra do
kết quả từ chính thế hệ của nó. Vì H(z) là thông tin trung bình của một biểu tượng nguồn,
giả sử không có kiến thức về kết quả đầu ra của biểu tượng, sự khác biệt giữa H(z) và
H(z|v) là những thông tin trung bình nhận được khi quan sát một biểu tượng đầu ra đơn
lẻ. Sự khác biệt này, ký hiệu là I(z, v) và được gọi là thông tin hòa hợp của z và v, là:
Thay thế các phương trình (8.3-3), (8.3-9) cho H(z) và H(z |v), và gọi lại là P(a
j
) =
P(a
j
,b
1
) + P(aj,b
2
)+…+P(a
j
,b

k
), suy ra:
sau nhiều thao tác tính toán, có thể được viết lại như sau:
Do đó, thông tin trung bình nhận được khi quan sát một đầu ra đơn lẻ của kênh thông tin
là một chức năng của đầu vào hoặc nguồn biểu tượng vector z và kênh ma trận Q. Giá trị
tối thiểu có thể của I(z,v) là 0 và xảy ra khi đầu vào và đầu ra kí tự là thống kê độc lập,
trong trường hợp P(a
j
,b
k
) = P (a
j
) P(b
k
) và log tập hợp trong phương trình (8.3-11) là với
mọi j và k 0. Giá trị lớn nhất của I(z, v), trên tất cả các lựa chọn có thể của nguồn xác
suất trong vector z là dung lượng C của kênh được mô tả bởi kênh ma trận Q. Đó là:
là nơi lấy giá trị lớn nhất xác suất tất cả các đầu vào có thể của biểu tượng. Dung lượng
của kênh xác định tỷ lệ tối đa (trong m-phân đơn vị thông tin cho mỗi nguồn ký hiệu) mà
thông tin có thể được truyền tin cậy qua kênh. Hơn nữa, dung lượng của một kênh không
SVTH: Phan Tuấn Kiệt Trang 22
Tiểu luận xử lý ảnh số: Kỹ thuật nén ảnh
phụ thuộc vào xác suất đầu vào của nguồn (có nghĩa là, làm thế nào các kênh được sử
dụng) nhưng là một chức năng của các xác suất có điều kiện xác định các kênh riêng lẽ.
Xem xét một nguồn thông tin nhị phân với nguồn bảng chữ cái A={a
1
,a
2
}={0,1}. xác suất
mà nguồn sẽ tạo ra các biểu tượng a

1
và a
2
là P(a
1
)= p
bs
and P(a
2
)= 1- p
bs
= p¯
bs
, tương ứng.
Từ phương trình (8,3-3), dữ liệu ngâũ của nguồn là:
Vì , H (z) phụ thuộc vào tham số p
bs
duy nhất, vế phải của phương trình được gọi là chức năng dữ liệu ngẫu nhiên nhị phân,
ký hiệu H
bs
(.),Vì vậy, ví dụ, H
bs
(t) là chức năng –tlog
2
t –¯tlog
2
t¯. Hình 8.8(a) là biểu đồ
của H
bs
(p

bs
) cho p
bs
là 0 ≤ p
bs
≤1. Chú ý rằng H
bs
lấy được giá trị lớn nhất chính nó (của 1
bit)khi p
bs
bằng ½. Đối với tất cả các giá trị khác của p
bs
, nguồn cung cấp ít hơn 1bit của
thông tin.
Bây giờ giả sử rằng thông tin được truyền qua một kênh thông tin nhị phân hỗn loạn và
để cho xác suất của một lỗi trong quá trình truyền của bất kỳ kí tự p
e
. Một kênh như vậy
được gọi là một kênh đối xứng nhị phân (BSC) và được xác định bởi ma trận kênh:

Đối với mỗi đầu vào hoặc nguồn biểu tượng, BSC sản xuất một đầu ra b
j
từ đầu ra
alphabet B ={b
1
, b
2
} = {0,1}. Xác suất biểu tượng b
1
và b

2
nhận ở đầu vào có thể được
xác định từ biểu thức (8.3-6):
Kết quả là, vì xác suất cho đầu ra là một số 0
là ., và xác suất ngõ ra là 1 là .
SVTH: Phan Tuấn Kiệt Trang 23
Tiểu luận xử lý ảnh số: Kỹ thuật nén ảnh
Các thông tin của BSC bây giờ có thể được tính từ biểu thức (8,3-12). Mở rộng kết quả
tổng hợp của phương trình này:
Nơi HBS(.) Là hàm dữ liệu ngẫu nhị phân của hình 8.8(a). Cho một giá trị cố định của
p
e
, I(z,v)là 0 khi p
bs
là 0 hoặc 1. Hơn nữa, I(z,v) đạt được giá trị tối đa của chính nó khi
nguồn kí tự nhị phân có thể như nhau. Hình 8.8(b) cho thấy I(z,v) với tất cả các giá trị
của p
bs
và một kênh lỗi cho trước p
e
.
trong quy định với phương trình (8.3-13) dung lượng của BSC được lấy từ tối đa của các
thông tin trên tất cả các nguồn phân phối có thể.
SVTH: Phan Tuấn Kiệt Trang 24
Tiểu luận xử lý ảnh số: Kỹ thuật nén ảnh
Từ hình 8.8(b), trong đó I(z, v) cho tất cả nguồn nhị phân có thể phân bố(có nghĩa là, cho
0 ≤ p
bs
≤1 or for z = [0,1]
T

to z=[1,0]
T
), ta thấy rằng I(z,v) là tối đa (cho bất kỳ p
e
nào) khi
p
bs
= 1/2. Giá trị này của p
bs
tương ứng với xác suất nguồn vector z = [1/2,1/2]
T
.Giá trị
tương ứng của I(z, v) là 1- H
bs
(p
e
). Do đó, dung lượng của BSC, vẽ trong hình 8.8 (c).
Lưu ý rằng khi không có khả năng xảy ra một kênh lỗi (p
e
=0), cũng như một kênh lỗi
chắc chắn (p
e
=1)—dung lượng cửa kênh thu được chính nó giá trị lớn nhất của 1 bit/kí tự.
Hay trong 2 trường hợp, thông tin truyền lớn nhất là có thể vì đầu ra của kênh hoàn toàn
dự đoán được. Tuy nhiên, khi p
e
=1/2, đầu ra của kênh hoàn toàn không thể đoán trước
được và không thông tin nào có thể truyền được qua nó.
8.3.3. Lý thuyết mã hóa cơ bản
Khuôn khổ toán học tổng thể giới thiệu trong phần 8.3.2 được dựa trên mô hình thể hiện

trong hình. 8.7, trong đó có chứa nguồn thông tin, kênh, và người sử dụng. Trong phần
này, chúng ta thêm một hệ thống thông tin liên lạc cho các mô hình và kiểm tra ba định lý
cơ bản liên quan đến việc mã hóa hoặc biễu diễn thông tin. Như hình. 8,9 cho thấy, hệ
thống thông tin liên lạc được chèn vào giữa nguồn thông tin và người sử dụng và bao
gồm một bộ mã hóa và giải mã.
Định lý mã hóa không nhiễu
Khi cả hai kênh thông tin và hệ thống thông tin liên lạc không gây ra lỗi, chức năng chủ
yếu của hệ thống thông tin liên lạc là thể hiện thông tin cho các nguồn càng gọn càng tốt.
Trong hoàn cảnh này, các định lý mã hóa không có nhiễu, còn được gọi là định lý đầu
tiên của Shannon (Shannon [1948]), xác định các độ dài trung bình tối thiểu của mã có
thể đạt được để biểu diễn cho nguồn thông tin.
Một nguồn thông tin với số hữu hạn (A, z) và ký tự nguồn độc lập thống kê được gọi là
một nguồn không nhớ. Nếu chúng ra mô tả đầu ra của nó là một bộ n kí hiệu từ các ký tự
nguồn (tốt hơn là một ký tự đơn lẻ), ngõ ra của nguồn sẽ có n thành phần tạo thành
A’={α
1
, α
2
,… α
jn
,}, nói cách khác, mỗi α
i
(được gọi là chuỗi biễn ngẫu nhiên) bao gồm n
ký tự từ A.(cần phân biệt ký hiệu từ tập hợp A với chuỗi các ký tự từ A và chuỗi các ký
tự từ các chuỗi đơn). Xác suất của một α
i
là P(α
i
),… liên quan đến ký hiệu riêng lẽ với
xác suất P(a

j
) bằng công thức
SVTH: Phan Tuấn Kiệt Trang 25

tiểu luận xử lý ảnh số kỹ thuật nén ảnh

Trích đoạn

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về