Nén Ảnh Phân Đoạn GVHD : Ths. Lê Ngọc Anh
SVTH : Phạm Đào Minh Vũ Trang 1
Trước hết , em xin chân thành cảm ơn các thầy , các
cô trong khoa Công Nghệ Thông Tin, trường Kỹ Thuật
Công Nghệ , những người đã trao cho em rất nhiều kiến thức
q báu để em có được ngày hôm nay .
Xin chân thành cảm ơn thầy Đoàn Công Hùng , người
đã cho em ý tưởng , và thầy Lê Ngọc Anh , người đã tận tình
giúp đở em trong suốt quá trình thực hiện đồ án .
Cuối cùng , xin được cám ơn gia đình , các bạn bè và
tất cả mọi người đã giúp đở em rất nhiều để em có thể hoàn
thành đồ án tốt nghiệp .
Xin chân thành cảm ơn .
Nén Ảnh Phân Đoạn GVHD : Ths. Lê Ngọc Anh
SVTH : Phạm Đào Minh Vũ Trang 2
MỤC LỤC
Chương I : Mở đầu .
I.Giới thiệu .
II.Lý thuyết tổng quan về nén số liệu .
II.1.Các khái niệm về nén số liệu .
II.2.Các kỹ thuật về nén số liệu .
II.2.1. Nén không tổn hao ( Lossless Compression ).
II.2.2. Nén tổn hao ( Lossy Compression ).
Chương II.Tìm hiểu về nén ảnh .
I.Lòch sử phát triển .
II. Các kỹ thuật nén phổ biến .
II.1.Nén thống kê và từ điển .
II.2.Nén có mất .
II.3.Điều biến sai số .
II.4.Nén đáp ứng .
Chương III.Nén ảnh phân đoạn – Fractal Image Compression .
I.Lòch sữ công nghệ nén ảnh Fractal .
II . Sự phân đoạn .
III.IFS – Iterated Function Systems .
III.1.IFS là gì ?
III.2.IFS cơ bản .
III.3.Nén ảnh với IFS.
III.4.Nén ảnh với PIFS.
Chương IV : Mã hóa và giải mã .
I . Lược đồ mã hóa .
I.1 Sự phân chia khối .
I.1.1. Lược đồ phân chia ngang dọc truyền thống .
I.1.2. Lược đồ phân chia ngang dọc được hiệu chỉnh .
I.1.3. So sánh .
I.2. Domain Block Pool .
I.3. Chuyển đổi affine ( Hàm mã hóa) .
I.3.1. Dùng Vector .
I.3.2. Dùng ma trận .
Nén Ảnh Phân Đoạn GVHD : Ths. Lê Ngọc Anh
SVTH : Phạm Đào Minh Vũ Trang 3
I.3.3. Tính thu gọn - Contractive.
I.3.3.1. Ma trận tam giác.
I.3.3.2. Giám sát các giá trò phần tử.
I.3.4. So sánh.
I.3.4.1. Mã hoá run-length .
I.3.4.2. Mã hóa Ziv-lempel.
I.3.4.3. Mã hóa tiên đoán trước .
I.4. Lượng tử hóa .
I.5. Mã hóa Fractal với ảnh màu .
I.5.1. RIFS – Recurrent IFS .
I.5.2. Các phương thức mã hóa Fractal cho ảnh màu .
I.5.3. Các kết quả mô phổng và đánh giá .
II . Lược đồ giải mã .
II.1. Lược đồ giải mã .
II.2. Sự phụ thuộc độ phân giải .
Chương V. Thiết kế chương trình.
I . Các module chính .
II . Lưu đồ chương trình .
III . Chi tiết tại mỗi bước .
IV . Lưu đồ khối chức năng .
Chương VI. Thử nghiệm so sánh và hướng phát triển .
I . Thử nghiệm .
II . So sánh với một vài phương thức mã hóa thông dụng .
III . Ưu khuyết điểm và phương hướng phát triển .
Chương VII . Kết Luận .
Phụ lục và tài liệu tham khảo.
Nén Ảnh Phân Đoạn GVHD : Ths. Lê Ngọc Anh
SVTH : Phạm Đào Minh Vũ Trang 4
CHƯƠNG
I
Mở Đầu
Giới thiệu .
Lý thuyết tổng quan về nén số liệu .
Các khái niệm về nén số liệu .
Các kỹ thuật về nén số liệu .
Nén không tổn hao ( Lossless Compression ).
Nén tổn hao ( Lossy Compression ).
Nén Ảnh Phân Đoạn GVHD : Ths. Lê Ngọc Anh
SVTH : Phạm Đào Minh Vũ Trang 5
I . Giới thiệu .
Trong thời đại ngày nay , với sự phát triển mạnh mẽ của khoa học công
nghệ thông tin , việc ứng dụng tin học hầu như đã vào trong tất cả mọi lónh vực
hoạt động sản xuất của con người ở các nước đã và đang phát triển trên thế giới
. Ở nước ta , nhằm góp phần vào công cuộc Công Nghiệp Hoá – Hiện Đại Hóa
, vấn đề tin học hóa đã và đang được triển khai . Việc ứng dụng tin học vào
công tác quản lý và điều hành tại các cơ quan xí nghiệp ngày càng cao và đem
lại nhiều hiệu quả thiết thực .
Bãn cảnh âọ, âäưng nghéa våïi nọ l váún âãư lỉu
trỉỵ v xỉí l dỉỵ liãûu. Cng våïi thåìi gian, sỉû
cáûp nháût, lỉu trỉỵ dỉỵ liãûu ngy cng nhiãưu,
âiãøn hçnh l mäüt säú công ty xuất nhập khẩu , công ty kinh doanh
các dòch vụ hàng hóa , du lòch , våïi mäüt khäúi lỉåüng låïn
dỉỵ liãûu cáưn lỉu trỉ ỵ. Vç váûy, váún âãư âỉåüc âàût
ra l lm sao lỉu trỉỵ dỉỵ liãûu êt täún kẹm nháút
m váùn âm bo tênh an ton v chênh xạc ca
nọ ? Do âọ, viãûc tçm ra phỉång phạp gim dung
lỉåüng lỉu trỉỵ m váùn âạp ỉïng âỉåüc u cáưu trãn
l ráút cáưn thiãút.
Chụng ta tháúy ràòng: ngy nay våïi sỉû phạt
triãøn vỉåüt träüi trong cäng nghãû pháưn cỉïng, dung
lỉåüng âéa cỉïng tàng lãn mäüt cạch âạng kãø v
nhanh chọng. Mäüt loảt âéa cỉïng khäng ngỉìng tàng
lãn vãư dung lỉåüng ra âåìi trong khi giạ thnh sn
pháøm lải hả. Bãn cảnh âọ cn cọ cạc thiãút bë
lỉu trỉỵ khạc nhỉ bàng tỉì, âéa quang , đóa DVD với dung
lượng trên 4.7G cng âỉåüc sỉí dủng räüng ri. Tuy
nhiãn, cng chênh vç l do ny m cạc nh láûp
trçnh thỉåìng sỉí dủng báút cỉï ti ngun no cọ
Nén Ảnh Phân Đoạn GVHD : Ths. Lê Ngọc Anh
SVTH : Phạm Đào Minh Vũ Trang 6
thãø, kãút qu l nhiãưu sn pháøm pháưn mãưm ra
âåìi nhỉng cọ kêch thỉåïc ráút låïn, chiãúm hng tràm
Mbyte. Thãm vo âọ, nhiãưu lénh vỉûc sn xút ạp
dủng nhỉỵng pháưn mãưm khạc nhau, âãø âạp ỉïng âỉåüc
nhu cáưu ny âi hi ngỉåìi sỉí dủng tiãúp cáûn
nhiãưu hån v tảo thọi quen lỉu trỉỵ nhiãưu sn
pháøm pháưn mãưm, ngoi ra l viãûc xỉí l nhiãưu
táûp tin v nhiãưu loải dỉỵ liãûu khạc nhau. Do
váûy, nẹn dỉỵ liãûu váùn l váún âãư cáưn thiãút
âỉåüc thỉûc hiãûn trỉåïc khi lỉu trỉỵ.
Song song våïi váún âãư trãn, mäüt lénh vỉûc khäng
thãø khäng kãø âãún l mảng mạy tênh. Ngy nay,
mảng mạy tênh m mi ngỉåìi âãưu nhàõc âãún l
mảng Internet -mảng ca cạc mảng- Cọ thãø nọi
ràòng: Internet l mảng thäng tin ton cáưu v säú
ngỉåìi kãút näúi vo mảng â lãn âãún vi chủc
triãûu ngỉåìi. Vç váûy, nhu cáưu truưn thäng ráút
låïn. Táút c mi ngỉåìi âãưu mún cọ thãø tçm
kiãúm thäng tin báút lûn chụng åí âáu, âãưu mún
chia s thäng tin, thiãút bë våïi ngỉåìi khạc hồûc
qun l thäng tin v thỉûc hiãûn ton bäü cạc tạc
vủ ny mäüt cạch nhanh chọng, dãù dng våïi âäü an
ton chênh xạc cao. Ngoi ra, hiãûn nay åí nỉåïc ta
ngành du lòch để giới thiệu với bạn bè thế giới về đất nước , về con người ,
cũng như các công ty sản xuất muốn cho thế giới biết đến các sản phẩm mang
đậm bản sắc dân tộc đòi hỏi rất nhiều dung lượng lưu trữ . Do âọ, bãn
cảnh viãûc ci tiãún pháưn cỉïng nhỉ: Modem, âỉåìng
truưn ta cn phi tçm cạch gim dung lỉåüng
dỉỵ liãûu cáưn thiãút trỉåïc khi truưn âãø gim
âỉåüc thåìi gian truưn v bäü nhåï. Âäúi våïi mảng
Internet, thỉûc hiãûn täút âiãưu âọ cho phẹp gim
âỉåüc cỉåïc phê truy cáûp mảng.
Váûy nẹn dỉỵ liãûu l gç ? Ta cọ thãø khại quạt
: Nẹn l quạ trçnh gim dung lỉåüng cáưn thiãút m
váùn biãøu diãùn cng mäüt dỉỵ liãûu cho trỉåïc .
Trong truưn thäng säú liãûu , nẹn l mäüt k
thût âỉåüc ạp dủng mäüt cạch linh hoảt cho lưng
thäng tin âang truưn . Cäng nghãû bãn trong vãư cå
bn cng nhỉ nhau trong c hai trỉåìng håüp l:
loải b thäng tin dỉ thỉìa hồûc biãøu thë thäng tin
dỉåïi dảng chàût ch hån âãø gim täøng säú byte
Nén Ảnh Phân Đoạn GVHD : Ths. Lê Ngọc Anh
SVTH : Phạm Đào Minh Vũ Trang 7
phi truưn qua phỉång tiãûn truưn thäng nhàòm
gim âãún tháúp nháút thåìi gian chiãúm phỉång tiãûn
ca mäüt cüc truưn â cho.
Âäúi våïi nẹn dỉỵ liãûu trãn mạy PC, cọ nhiãưu
thût toạn nẹn khạc nhau âỉåüc thiãút kãú cho
nhiãưu loải dỉỵ liãûu khạc nhau nhỉ: vàn bn, hçnh
nh, ám thanh Trong phảm vi ca âäư ạn, ta chè
xẹt âãún cạc phỉång phạp hình ảnh .
II . Lý thuyết tổng quan về nén số liệu .
II.1. Các khái niệm về nén số liệu .
Nẹn säú liãûu l quạ trçnh lm gim säú liãûu
cáưn thiãút âãø biãøu diãùn cng mäüt lỉåüng thäng tin
cho trỉåïc. Cạc k thût nẹn säú liãûu cọ thãø
âỉåüc thỉûc hiãûn bàòng phán cỉïng chun dủng hồûc
pháưn mãưm.
Cạc k thût nẹn säú liãûu bàòng pháưn cỉïng âi
hi phi cọ cạc pháưn cỉïng âàûc biãût âỉåüc thiãút
kãú thêch håüp våïi bàng thäng cäú âënh ca mảng
truưn säú liãûu. Cạc k thût nẹn säú liãûu bàòng
pháưn mãưm âỉåüc thỉûc hiãûn trãn mạy tênh cạ nhán
(PC) cọ thãø dng nẹn file vàn bn, cạc file nh
âỉåüc nháûp vo tỉì scaner hồûc camera v cạc file
ám thanh.
Trong khại niãûm vãư nẹn, ta cáưn phán biãût giỉỵa
säú liãûu v thäng tin. Säú liãûu (data) dng âãø
biãøu diãùn v truưn ti thäng tin (information),
cng mäüt lỉåüng thäng tin cho trỉåïc ta cọ thãø
biãøu diãùn bàòng cạc lỉåüng säú liãûu khạc nhau. Âån
vë âo säú liãûu (dung lỉåüng) l bit (binary digit).
Mäüt bit säú liãûu vãư màût toạn hc âỉåüc biãøu
diãùn bàòng mäüt chỉỵ säú nhë phán 0 v 1, vãư màût
âiãûn âỉåüc biãøu diãùn bàòng 1 trong 2 mỉïc âiãûn ạp
qui ỉåïc
Mäüt bit thäng tin âỉåüc âënh nghéa l lỉåüng thäng
tin. Gi sỉí P l xạc sút ca mäüt k hiãûu,
thç lỉåüng thäng tin chỉïa trong k hiãûu âọ âỉåüc
âënh nghéa l -Log
2
P bêt, cäng thỉïc ny chênh l
entropy ca k hiãûu. Váûy Entropy l gç? Trong lénh
Nén Ảnh Phân Đoạn GVHD : Ths. Lê Ngọc Anh
SVTH : Phạm Đào Minh Vũ Trang 8
vỉûc l thuút thäng tin sỉí dủng thût ngỉỵ
entropy l âån vë âo thäng tin âỉåüc m họa trong
mäüt thäng âiãûp. Entropy ca mäüt thäng âiãûp cng
cao thç thäng tin nọ chỉïa âỉûng cng nhiãưu. Entropy
ca ton bäü thäng âiãûp l täøng entropy ca cạc
k hiãûu thnh pháưn. Entropy phủ thüc vo xạc
sút xút hiãûn ca k hiãûu, mäüt k hiãûu cọ
xạc sút xút hiãûn cao thç thäng tin chỉïa âỉûng
trong nọ tháúp v s cáưn êt bêt hån âãø m họa.
II.2 . Các kỹ thuật nén số liệu .
II.2.1 . Nén không tổn hao ( Lossless Compression ) .
Nẹn khäng täøn hao cn âỉåüc gi l nẹn khäng
nhiãùu (Noiseless) hay nẹn khäng läùi (Free Error),
âm bo khäng máút mạt thäng tin sau quạ trçnh m
hoạ v gii m (nọ tảo lải mäüt bn sao chênh
xạc ca säú liãûu sau quạ trçnh m hoạ v gii
m). K thût ny sỉí dủng trãn nhỉỵng ngưn säú
liãûu âm bo âäü chênh xạc cao khi lỉu trỉỵ hồûc
truưn âi nhỉ cạc cå såí dỉỵ liãûu, cạc bng tênh
âiãûn tỉí, cạc vàn bn Vç våïi cạc táûp tin ny,
viãûc máút mạt d chè mäüt bit thäng tin l âiãưu
khäng thãø âỉåüc. Nẹn täøn hao cọ cạc phỉång phạp
m hoạ nhỉ: phỉång phạp m hoạ Huffman, m hoạ
säú hc, m hoạ LZW
II.2.2 . Nén tổn hao ( Lossy Compression ) .
Nẹn täøn hao l k thût nẹn cháúp nháûn máút
mạt mäüt lỉåüng thäng tin nháút âënh âãø âảt âỉåüc
hiãûu qu nẹn cao. Cọ thãø nọi mäüt cạch tỉång
tỉû: Nẹn täøn hao= Lm trån + Nẹn khäng täøn hao.
Lm trån l quạ trçnh thỉûc hiãûn mäüt phẹp biãún
âäøi no âọ (nhỉ: biãún âäøi säú liãûu tỉì miãưn
thåìi gian sang miãưn táưn säú bàòng phẹp biãún âäøi
Furiã råìi rảc gi l FFT ( Fast Fourier
Transform), hồûc phẹp biãún âäøi Cosin råìi rảc gi
l DCT (Discrete Cosine Transform) ), tiãúp âọ l
quạ trçnh lỉåüng tỉí hoạ. Säú liãûu cng âỉåüc lm
trån thç máút mạt thäng tin cng nhiãưu v tè säú
nẹn cng cao.
Nén Ảnh Phân Đoạn GVHD : Ths. Lê Ngọc Anh
SVTH : Phạm Đào Minh Vũ Trang 9
Nẹn täøn hao thêch håüp våïi cạc file hçnh nh, ám
thanh âỉåüc säú hoạ. Háưu hãút cạc k thût nẹn
täøn hao âãưu cọ thãø âỉåüc âiãưu chènh âãø cán bàòng
giỉỵa âäü chênh xạc v hiãûu qu nẹn. Cạc phỉång
phạp nẹn täøn hao nhỉ: phỉång phạp JPEG, phỉång
phạp Wavelet, phỉång phạp MPEG
CHƯƠNG
Nén Ảnh Phân Đoạn GVHD : Ths. Lê Ngọc Anh
SVTH : Phạm Đào Minh Vũ Trang 10
II
Lòch Sử Nén Ảnh
Lòch sử phát triển .
Các kỹ thuật nén phổ biến .
Nén thống kê và từ điển .
Nén có mất .
Điều biến sai số .
Nén đáp ứng .
Nén Ảnh Phân Đoạn GVHD : Ths. Lê Ngọc Anh
SVTH : Phạm Đào Minh Vũ Trang 11
I. Lòch sử phát triển .
Con người giao tiếp với máy tính chủ yếu thông qua màn hình , vì thế đồ
họa chính là sự quan tâm chính của các nhà thiết kế và các lập trình viên trên
thế giới . Các nhà lập trình đã mất rất nhiều thời gian và nổ lực để phát triển
giao diện đồ họa người dùng ( Graphical User Interface – GUI ) . Hàng triệu
con người và hàng tỉ Dollars đã được chi ra để tạo một cuộc cách mạng mới
trong việc hiển thò dữ liệu .
Con người đã chi một số tiền rất lớn dùng cho việc tạo ra các giao diện
người dùng GUI như là Microsoft Windows hay Motif - khả năng hiển thò các
hình ảnh đồ họa phức tạp như là các phương tiện truyền thống ( ti vi hay tạp chí
) . Điều này đã tạo ra phần mềm mới , được thiết kế để tận dụng các khả năng
trên .
Các chương trình sử dụng kỹ thuật đồ họa phức tạp thường thấy là trong
các ứng dụng máy tính như : trò chơi , giáo dục , internet , thiết kế đồ họa …
Các chương trình này đang rất phổ biến hiện nay . Các hình ảnh mà chúng sử
dụng thì tiêu tốn rất nhiều khoảng trống trên đóa , điều mà rất khó khăn cho các
công nghệ lưu trữ hiện thời
Trong các máy tính của IBM , bộ hiển thò VGA có lẻ là chấp nhận được
cho khả năng đồ họa màu chất lượng cao . Bộ VGA có thể hiển thò được 256
màu trong một bảng 262144 màu . Điều này cho phép bộ VGA hiển thò được
các hình ảnh có sắc thái liên tục , như là hình chụp , với một độ trung thực chấp
nhận được .
Nhưng vấn để ở đây chính là việc lưu trữ các hình ảnh này trong một
chương trình . Với một bộ VGA được đề cập ở trên thì một hình ảnh có 256 màu
với 200 dòng và 320 cột , với mỗi một điểm chúng tiêu tốn một pixel . Điều
này có nghóa là với một hình ảnh như trên , chúng sẽ tiêu tốn ít nhất là 64KB .
Con số này là không lớn đối với các ứng dụng chỉ sử dụng khoảng 100 – 200
hình ảnh cho việc truy cập . Nhưng đối với các công nghệ như hiện nay thì việc
sử dụng từ vài ngàn đến vài trăm ngàn là chuyện không thể tránh khỏi . Cho
một ví dụ về bộ phận bán lẻ của một siêu thò , giả sử chúng cần 10000 hình ảnh
để lưu trữ thì ta phải mất 640MB ( đối với ảnh 200x320 ) , thì đây là một con số
thật không hợp lý tí nào .
Nén Ảnh Phân Đoạn GVHD : Ths. Lê Ngọc Anh
SVTH : Phạm Đào Minh Vũ Trang 12
II . Các kỹ thuật nén phổ biến .
Trong suốt một thập kỉ trước , công việc nghiên cứu cho mục đích lưu trữ
các hình ảnh đã có một số kết quả rất khả quan . Trong những năm cuối 1970
vàđầu 1980 , hầu hết các phương pháp nén ảnh chỉ tập trung vào sử dụng công
nghệ nén không mất ( lossless compression ) truyền thống . Các đònh dạng file
nén phổ biến sử dụng công nghệ này là PCX , GIF , BMP … Chúng làm giảm
dung lượng các file gốc từ 10% - 90% dung lượng ban đầu .
Khi việc sử dụng các hình ảnh đồ họa tăng lên , các đònh dạng file như là
PCX trở không thõa đáng nữa . Làm giảm đi một nữa kích thước của file là một
điều đáng làm , nhưng trong khi đó nhưng người thiết kế và người sử dụng đang
sài hết các khoảng trống trên ổ đóa của họ một cách nhanh chóng bởi các ứng
dụng đa phương tiện đang làm chúng trở nên không còn tính khả thi .
II.1 . Các phương pháp nén thống kê ( Statistical Compression ) và từ
điển ( Dictionary Compression ) .
Các chương trình truyền thống và các dữ liệu trên máy tính thì đáp ứng
rất tốt việc nén trên nền tảng lợi dụng sự thống kê mức độ thay đổi trong tần số
xuất hiện của các kí tự riêng lẻ và chuỗi các kí tư hay một cụm kí tự . Hệ thống
trên nền tảng từ điển thật sự được ngụy trang dưới lớp vỏ chương trình thống kê
. Tuy nhiên , có một số các kiểu nén không có khuynh hướng nén tốt đối với
các hình ảnh có sắc màu liên tục .
Vấn đề chính ở đây có một số chương trình bắt nguồn từ sự thật là các
điểm ảnh trong các ảnh chụp có khuynh hướng trải rộng ra trên toàn bộ phạm
vi của chúng . Nếu các màu sắc trong một hình ảnh được đánh dấu như là một
biểu đồ thống kê trên cơ sở tần số xuất hiện , thì biểu đồ đó không có “nhọn” (
spiky ) như chúng ta mong muốn nén thống kê thực thi . Thật sự , trên việc vận
hành lâu dài , các biểu đồ về hình ảnh sống động có khuynh hướng là phẳng .
Điều này có nghóa là mỗi mã điểm ảnh đều có cùng cơ hội thể hiện như bất kỳ
điểm nào khác .
Các chương trình nén trên nền tảng từ điển đều gặp những vấn đề tương
tự . Các ảnh trên nền tảng chụp được quét lên thì không có các đặc tính dữ liệu
chung để tạo ra nhiều sự xuất hiện của các cụm ( phrase ) giống nhau . Xét một
hình ảnh có cấu trúc đường ngang như bề mặt của một ngôi nhà bằng gỗ , nó có
thể cho ta các chuỗi tương tự trong một số hàng liên tiếp .
Nén Ảnh Phân Đoạn GVHD : Ths. Lê Ngọc Anh
SVTH : Phạm Đào Minh Vũ Trang 13
Thật không may , bởi vì sự đa dạng của thế giới thực , các đặc tính giống
nhau trên mỗi hàng sẽ có khuynh hướng khác nhau ( không đáng kể ) đối với
cái ban đầu . Vượt ra ngoài một chuỗi hai mươi điểm ảnh , một hoặc hai điểm
sẽ thay đổi bởi một bước đơn giản từ việc quét ảnh trước và sau . Và trong khi
sự khác nhau đó là đủ nhỏ để chúng trở nên hoặc là không phát hiện được hoặc
là không có nghóa đối với mắt con người . Các chuỗi có sự so khớp chính xác
đối với phương thức nén này sẽ được sử dụng . Bởi vì sự thay đổi không đáng
kể , chiều dài của các chuỗi so khớp có khuynh hướng trở nên nhỏ đi . Điều này
sẽ làm hạn chế hiệu quả của việc nén .
II.2 . Nén tổn hao ( Lossy compression ) .
Cũng giống như các dữ liệu âm thanh , các hình ảnh đồ họa có một thuận
lợi trên các tập tin dữ liệu máy tính truyền thống : chúng có thể được hiệu chỉnh
trong suốt chu trình nén / giải nén mà không làm ảnh hưởng đến sự cảm nhận
của người dùng . Việc thay đổi thứ yếu một cách chính xác của bóng điểm ảnh
( shade pixel ) là ở đây và có thể dễ dàng hoàn thành nếu việc hiệu chỉnh được
làm một cách cẩn thận . Bởi vì các ảnh đồ họa trên máy tính thì thông thường
được quét lên từ thế giới thực , chúng thông thường tạo ra một thể hiện không
thực sự hoàn chỉnh của ảnh chụp hoặc của một số phương tiện in khác . Chương
trình nén tổn hao không làm mất đi sự tự nhiên cơ bản của hình ảnh thì mới hẳn
là khả thi .
Đưa ra phương pháp nén có mất cho các hình ảnh đồ họa là điều hoàn
toàn có thể thực hiện được , nhưng chúng ta thực thi nó như thế nào ? Các nhà
nghiên cứu đã thử sử dụng một vài công nghệ tương tự với công nghệ làm việc
trên giọng nói , như là mã hóa sai số ( Differential Coding ) và mã hóa đáp ứng
( Adaptive Coding ) , nhưng chúng đã không như mong đợi . Lí do chính là sự
khác nhau cơ bản giữa dữ liệu âm thanh và hình ảnh .
Dữ liệu âm thanh được lấy mẫu sử dụng các đònh dạng truyền thống thì
có đặc trưng lặp đi lặp lại ( repetitive ) . Âm thanh , bao gồm cả giọng nói ,
được tạo ra từ các sóng sine , lặp lại mỗi giây tại mỗi thời điểm . Mặc dù dòng
vào tại bộ DAC trên máy tính bao gồm hàng tá các tần số khác nhau được thêm
vào với nhau thì sóng sine nói chung vẫn kết hợp để tạo ra dạng sóng lặp (
repetitive waveforms ) .
Tính lặp lại tự nhiên của dữ liệu âm thanh có thể dùng cho việc nén .
Các công nghệ như là mã hóa đoán trước tuyến tính ( Linear Predictive Coding
) và sự điều biến mã xung sai số đáp ứng ( Adaptive Differential Pulse Code
Nén Ảnh Phân Đoạn GVHD : Ths. Lê Ngọc Anh
SVTH : Phạm Đào Minh Vũ Trang 14
Modulation ) đã lợi dụng điều này để mã hóa các dòng âm thanh với xác xuất
từ 50 – 90 phần trăm .
Khi sự nghiên cứu bắt đầu trên việc nén các ảnh đồ họa , các ảnh số hóa
đã được áp dụng với các công nghệ tương tự và đã có một vài sự thành công .
Khởi đầu , các nhà nghiên cứu thực hiện trên việc nén các dòng dữ liệu được
lưới hóa ( rasterized data ) . Khi các hình ảnh được số hóa , nó sẽ hiển thò như
là một chuỗi tuần tự các điểm ảnh . Một dòng tại một thời điểm được hiển thò
trên màn hình sẽ làm việc từ trái sang phải và từ trên xuống dưới . Vì thế , một
lát mỏng của hình ảnh sẽ được vẽ khi mỗi dòng hoàn thành , cho đến khi hình
ảnh được hiển thò đầy đủ trên màn hình . Khi được số hóa , các điểm ảnh có
kích thước từ một đến hai mươi bốn bit . Các màn hình đồ họa ngày nay sử dụng
8 bit để xác đònh một điểm ảnh .
II.3 . Sự điều biến sai số ( Differential Modulation ) .
Sự điều biến sai số phụ thuộc vào khái niệm rằng các dữ liệu tín hiệu
tương tự có khuynh hướng biến thiên trong các mẫu trơn mòn ( smooth patterns )
, với các bước nhảy căn bản trong biên độ tín hiệu là ngoại lệ , không theo
nguyên tắc . Trong dữ liệu tín hiệu âm thanh , điều này là đúng miễn sao tỉ lệ
lấy mẫu của tín hiệu là một vài cái gì đó cao hơn thành phần tần số cực đại .
Sự điều biến sai số của một tín hiệu âm thanh lợi dụng việc này bằng
cách mã hóa mỗi mẫu tín hiệu như là một sự khác nhau từ chính những mẫu
trước đó ( predecessor ) . Ví dụ như mỗi mẫu âm thanh là tám bit thì một hệ
thống mã hóa sai số có thể mã hóa sự khác nhau giữa các mẫu là bốn bit , nén
dữ liệu ban đầu được 50% . Những phần mất đi cho ta thấy rằng sự khác nhau
không phải luôn luôn được mã hóa khi sử dụng phương pháp sai số chuẩn . Các
tín hiệu có thể cao hơn giới hạn mã hóa hoặc việc mã hóa có thể quá kém để
điều chỉnh một sự khác nhau nhỏ . Khía cạnh mất đi này của mã hóa sai số có
thể được giám sát đủ tốt để mà có thể đưa ra một tín hiệu hoàn chỉnh .
Sự điều biến sai số thì có nhiều vấn đề hơn đối với việc nén các dữ liệu
đồ họa . Các điểm ảnh trong hình có thể không chắc chắn phụ thuộc vào sự
biến thiên lên xuống trong việc tăng độ mòn hình ảnh . Các đường phân chia rõ
ràng giữa các thành phần khác nhau của một hình ảnh chính là qui tắc . Điều
này có nghóa là một hệ thống tin dùng mã hóa sai số thì cần phải điều chỉnh sự
sai lệch cả lớn lẫn nhỏ giữa các mẫu , giới hạn sự tác động của nó . Một số hình
ảnh có đặc tính kéo dài liên tục của dữ liệu , nghóa là các điểm ảnh có một ít
hoặc là không có sự khác nhau , và vì thế việc nén được thực hiện rất tốt .
Nén Ảnh Phân Đoạn GVHD : Ths. Lê Ngọc Anh
SVTH : Phạm Đào Minh Vũ Trang 15
Nhưng ngược lại , một số nơi trong ảnh lại có sự thay đổi sắc thái đột ngột , và
việc nén sẽ không thể tốt được ở những nơi đó .
Nói chung , giải thuật mã hóa sai số các hình ảnh đồ họa thì dường như
không có tạo ra một công nghệ nén tốt hơn giải thuật nén không tổn hao tốt
nhất . Nó không làm phát sinh ra một lợi ích to lớn cần thiết nào trong sự phát
triển công nghệ nén .
II.4 . Mã hóa đáp ứng ( Adaptive Coding ) .
Mã hóa đáp ứng ( thường được sử dụng chung với mã hóa sai số ) thì dựa
vào việc tiên đoán trước các thông tin về sắc thái các điểm ảnh trên nền tảng
các đểm ảnh được thấy ở trước đó . Cho một ví dụ , nếu mười điểm ảnh cuối
cùng trong một ảnh sắc xám ( gray scale ) thì tất cả giá trò điểm ảnh nằm trong
khoảng 45 – 50 , một hệ thống nén đáp ứng có thể dự đoán các điểm ảnh kế
tiếp sẽ cùng nằm trong một vùng với xác xuất rất cao . Một lược đồ mã hóa dựa
trên nền tảng entropy , như mã hóa Huffman hay Arithmetic , có thể gán xác
suất xuất hiện vào các mã mới . Giả sử rằng phương pháp dự đoán cho phép
chúng ta tạo ra một sự tiên đoán về xác suất xuất hiện của các pixel , chúng ta
sẽ có :
Hình 1 . Adaptive coding
Hầu hết các lược đồ đáp ứng dựa vào việc sử dụng một vài các điểm ảnh
chung quanh như là một phần của sự tính toán cho xác xuất xuất hiện của
upcomming pixel . Trong hình trên , một điểm ảnh được mã hóa được thể hiện
tại vò trí (0,0) . Còn các điểm ảnh khác như A, B ,C ,D được dùng một cách bình
thường trong việc tính toán xác suất xuất hiện . Sự dự đoán các giá trò upcoming
của pixel đích ( target ) có thể được làm trên cơ bản một vài phương trình dự
đoán :
Previous
Row
-1,-1 -1,0 -1,1
Current Row
0,-1 0,0
Target
Pixel
A
B
C
D
Nén Ảnh Phân Đoạn GVHD : Ths. Lê Ngọc Anh
SVTH : Phạm Đào Minh Vũ Trang 16
Hình 2 . Sự dự đoán điểm ảnh .
Một số công nghệ sử dụng các dữ liệu trên để tính toán hầu hết giá trò có
thể có của điểm ảnh đích , và sau đó chúng hiệu chỉnh lược đồ mã hóa . Trong
khi các việc tính toán đó cho ra kết quả khả quan thì một lần nữa nó được xem
như là một kỹ thuật không hiệu quả trong công nghệ nén ảnh .
A
B
C
(A + C) / 2
(A + D) / 2
(A + ( C + D ) / 2 ) / 2
(A + ( C – B ))
(A + (( D – B) / 2))
Nén Ảnh Phân Đoạn GVHD : Ths. Lê Ngọc Anh
SVTH : Phạm Đào Minh Vũ Trang 17
CHƯƠNG
III
Nén Ảnh Phân Đoạn
_Fractal Image Compression_
Lòch sữ công nghệ nén ảnh Fractal .
Sự phân đoạn .
IFS – Iterated Function Systems .
IFS là gì ?
IFS cơ bản .
Nén ảnh với IFS .
Nén ảnh với PIFS .
Nén Ảnh Phân Đoạn GVHD : Ths. Lê Ngọc Anh
SVTH : Phạm Đào Minh Vũ Trang 18
I . Lòch sử công nghệ nén ảnh fractal .
Thuật từ Fractal đầu tiên được sử dụng bởi Benoit Mandelbrot để chỉ
đònh những đối tượng Ông đã thực hiện một ví dụ được mô tả bởi phương
trình cho thấy một sự đa dạng vô hạn của các chi tiết đó . Điều này có thể được
xem như la một dạng của việc nén : phương trình tự nó có thể được mô tả với
một vài các bit thông tin hoặc được thể hiện trong một chương trình ngắn ,
nhưng hình ảnh kết quả sẽ cần một lượng vô hạn các bit để thể hiện như là một
tập các điểm ảnh . Chương trình FracInt phổ biến có thể phát sinh rất nhiều
những hình ảnh tinh tế từ những công thức đơn giản ( one-line formulars ) .
Michael Barnsley và bạn đồng nghiệp của ông ta đã nhận thấy được
tiềm năng của phương thức Fractal cho việc nén ảnh . Barnsley đã phát triển
học thuyết Hệ Thống Chức Năng Được Lặp Lại ( Iterated Function Systems ) ,
viết tắt là IFS , đầu tiên được giới thiệu bởi J.Hutchinson năm 1981 . Sau khi
phát hành cuốn sách “Fractals Everywhere” năm 1988 thì nén Fractal trở nên
là một chủ đề rất thời thượng . Điều hấp dẫn của công nghệ này là tỉ lệ nén hấp
dẫn của nó , tăng từ 10000 lên 1 .
Thật không may , tỉ lệ nén đó có thể đạt được chỉ với những hình ảnh
được cấu trúc đặc biệt và chỉ với sự trợ giúp đáng kể của người hướng dẫn tiến
trình nén . Quá trình này được biết như là “Graduate Student Algorithm” ( tạm
dòch là “ Giải Thuật Sinh Viên Tốt Nghiệp “ ) . Nghóa là cho một sinh viên tốt
nghiệp vào một văn phòng và trạm làm việc đồ họa , khóa cửa lại , chờ cho
đến khi người sinh viên đó tìm ra được một IFS tốt nhất cho hình ảnh , và mở
cửa ra . Tiến trình nén này không thể hoàn thành một cách tự động , thậm chí
với siêu máy tính . Vì thế , việc nén dựa trên nền tảng IFS hóa ra không thực
tế .
Năm 1988 , ông Arnaud Jacquin , một học trò của Barnsley đã tạo ra một
điểm mốc của việc nén . Thay cho việc tìm ra một IFS cho một hình ảnh hoàn
chỉnh , ông đã có những ý tưởng về sự phân chia hình ảnh thành những vùng (
range ) không chồng lấp và tìm ra một IFS riêng cho mỗi ảnh phân chia đó .
Nén Ảnh Phân Đoạn GVHD : Ths. Lê Ngọc Anh
SVTH : Phạm Đào Minh Vũ Trang 19
Điều này sẽ biến vấn đề phức tạp trên thành một tác vụ có thể quản lý được ,
điều mà có thể được làm một cách tự động . Trong luận văn tiến só , ông ta đã
phát triển lý thuyết Hệ Thống Chức Năng Lặp Lại Được Phân Chia ( Partitioned
Iterated Function Systems ) , viết tắt là PIFS , và thực hiện một phiên bản về
giải thuật của ông ta trong phầm mềm .
Năm 1991 , Barnsley và Sloan đạt được bằng sáng chế Mỹ về công nghệ
này . Công ty của họ , Iterated Systems , thì bán những sản phẩm phần mềm và
phần cứng sử dụng nó , nhưng không có tung ra chi tiết về công nghệ này . Đặc
biệt , FIF ( Fractal Image Format) được sử dụng bởi các sản phẩm của Iterated
Systems thì càng không được mô tả rộng rãi . Chính vì điều này mà nén ảnh
Fractal không được sử dụng thực tế nhiều như là các công nghệ khác . Tuy
nhiên , nén Fractal vẫn là chủ đề của việc nghiên cứu , và nó đã thật sự chứng
minh được tính ưu việt nhất cho các ứng dụng , nơi mà tỉ lệ nén cao rất được
quan tâm .
PIFS cũng có tên là Local Iterated Function Systems ( LIFS – tạm dòch
là Hệ Thống Chức Năng Được Lặp Lại Cục Bộ ) , và Barnsley lại còn sử dụng
cả thuật từ “Fractal Tranform” , tất cả chúng đều nói đến cùng một công
nghệ .
II . Sự phân đoạn .
Bất cứ một đối tượng hình hoc bình thường nào cũng đều có liên quan
đến scale . Cho một ví dụ , một hình tròn khi quan sát nó bằng việc sử dụng một
cửa sổ lớn hơn là toàn bộ hình tròn đó , khi nhìn thông qua cửa sổ này , bạn sẽ
thấy nó là một hình tròn . Tiếp tục , khi quan sát nó bằng một cửa sổ nhỏ hơn
chu vi của nó thì ta sẽ thấy nó như là một vòng cung đường tròn . Và khi quan
sát nó bằng một cửa sổ rất nhỏ , chúng ta sẽ tưởng nó là bao gồm rất nhiều các
đường nhỏ xíu .
Nén Ảnh Phân Đoạn GVHD : Ths. Lê Ngọc Anh
SVTH : Phạm Đào Minh Vũ Trang 20
Hình 3. Quan sát hình tròn tại các mức ( scale ) khác nhau .
Hình 4 . Tam giác Sierpinski .
Nhưng đối với một đối tượng Fractal , có không một mức quan sát là lớn
hay nhỏ thì hình dạng và những gì phức tạp trong nó đều không thay đổi ,
không có cách nào để chia cắt nó vào trong một bộ tích hợp các đối tượng con ,
bởi vì các thành phần trên nó có tính tương tự nhau trên toàn bộ khung hình và
thật phức tạp ( xem hình tam giác Sierpinski ) . Bất cứ phần nào , khi phóng lớn
lên , đều trở thành một tam giác Sierpinski . Tính tự giống nhau ( seft-similarity
) đó là một đặc tính hết sức quan trọng của kỹ thuật nén ảnh Fractal và là một
đặc tính nổi bậc để nhận dạng kỹ thuật này trong các kỹ thuật nén khác .
Trong quá trình xử lý hình ảnh , các ứng dụng Fractal tập trung vào hai
phần chính :
1 . Áp dụng dấu hiệu và chiều ( không gian ) như là một đặc trưng
vào trong phân đoạn ảnh , phân tích bố cục , …
2 . Áp dụng IFS ( Iterated Function Systems ) vào trong quá trình
nén ảnh .
Hệ thống mã hóa và giải mã Fractal được thể hiện trong sơ đồ bên dưới .
Tại giai đoạn mã hóa , cho mỗi khối range , một chuyển đổi thu nhỏ và khối
domain đïc tìm thấy , sau đó sự chuyển đổi thu nhỏ và vò trí của các domain
sẽ được truyền đi đến đầu ra thông qua một kênh . Ở giai đoạn giải mã , hình
ảnh được tái tạo lại sử dụng các chuyển đổi và vò trí các khối domain ở trên
bằng việc lặp nhiều lần công việc này
Encoding
system
orig
… Channel…
Decoding
system
decode
Nén Ảnh Phân Đoạn GVHD : Ths. Lê Ngọc Anh
SVTH : Phạm Đào Minh Vũ Trang 21
Hình 5 . Sơ đồ mã hóa và giải mã .
III . Iterated Function System ( IFS ) là gì ?
Chúng ta điều thấy rằng tất cả các hình ảnh phức tạp có thể thu được từ
những công thức đơn giản . Việc đưa ra một công thức sẽ dễ dàng dẫn xuất ra
một hình ảnh tương ứng . Nhưng nếu đi theo một hướng ngược lại , từ ảnh đến
công thức , thì điều này sẽ là khả thi hơn , nó sẽ cho một tỉ lệ nén tuyệt vời .
Thay cho việc thể hiện một ảnh như là một trình tự các giá trò điểm ảnh , hình
ảnh có thể được khởi tạo lại từ một công thức , điều mà sẽ tốn rất ít dung lượng
lưu trữ . Ta hãy thử xét một ví dụ sau :
Giả sữ rằng để thể hiện một cái đóa tròn màu đen trên nền trắng ,
ta phải liệt kê tất cả các điểm ảnh trên cái đóa đó với hai chiều ngang và
dọc , thì ngược lại , ta có thể đưa ra một phương trình cho ảnh này , chỉ
đònh nó như là một tập các điểm (x,y) :
(x – a)
2
+ (y – b)
2
< r
2
Ở đây , r là bán kính của cái đóa và ( a,b ) là tâm của nó . Phương
trình này thì quá đủ để khởi tạo lại hình ảnh chiếc đóa . Hơn nữa , hình
ảnh này có thể được khởi tạo lại tại bất kỳ độ phân giải nào ( mà điều
này là không thể khi ta thể hiện chúng bằng tập các điểm ảnh ) . Có một
sự khác nhau tương tự giữa các font kí tự có thể co giãn và các font cố
đònh ( được tạo ra từ các điểm ảnh ).
Nhưng các hình ảnh trong thế giới thực thì không phải lúc nào cũng được
thể hiện như một phương trình đơn giản . Thật khó để tìm ra một công thức mô
tả chính xác hình ảnh đó . Ý tưởng cho điều này là lợi dụng tính tự giống nhau (
seft-similarity ) trong một hình ảnh để tìm ra sự thể hiện gần đúng như là một
phân đoạn ( cái mà sẽ phô bày ra tính tự giống nhau ở mỗi mức khác nhau ) .
Thay cho việc đưa ra một phương trình rõ ràng được thõa mãn bởi tất cả các
điểm của hình ảnh , thì Fractal được đònh nghóa như là một giải pháp điểm cố
đònh ( fixed-point ) của IFS .
IV . Thuật toán IFS cơ bản .
Một ánh xạ từ một tập vào chính nó thì được gọi là co lại ( contractive )
nếu nó làm giảm khoảng cách : khoảng cách giữa f(x) và f(y) thì nhỏ hơn
Nén Ảnh Phân Đoạn GVHD : Ths. Lê Ngọc Anh
SVTH : Phạm Đào Minh Vũ Trang 22
khoảng cách giữa 2 điểm x và y . Ví dụ như hàm f(x) = x/2 được đònh nghóa
trên tập các số thực là co lại được . Biểu diễn đònh lý ánh xạ thu nhỏ (
Contractive Mapping ) một cách ngắn gọn , rằng ánh xạ co lại có một điểm
được cố đònh duy nhất , nghóa là giá trò x thì tương đương với f(x) = x . Hơn nữa ,
điểm được cố đònh có thể thu được bởi việc bắt đầu từ bất kỳ điểm x
0
nào và cứ
việc tính theo trình tự :
x
1
= f(x
0
)
x
2
= f(x
1
) = f( f(x
0
) )
vv…
Trình tự trên sẽ hội tụ về một điểm duy nhất . Cho một ví dụ, bắt đầu với
giá trò x
0
= 1 và áp dụng cho hàm f(x) = x/2 , chúng ta sẽ thu được kết quả là 1 ,
1/2, 1/4 , 1/8, … và cuối cùng chúng sẽ tiến về 0 . Ví dụ trên đưa ra một tập các
số thực IR nhưng đònh lý ánh xạ hội tụ cũng áp dụng cho các chiều không gian
khác , ở đây là hình ảnh 2 chiều .
Một IFS bao gồm tập hữu hạn các ánh xạ hội tụ w
1
… w
n
trên tập IR
2
.
Một IFS có thể được áp dụng cho ảnh trắng đen như sau . Mỗi điểm x ( đen )
của ảnh được ánh xạ thành N điểm w
1
(x)… w
N
(x) . Hội của tất cả những điểm
kết quả thì tạo ra một hình ảnh trắng đen khác . Vì vậy , IFS sẽ chuyển đổi một
ảnh này sang một ảnh khác . IFS thì tự nó là một ánh xạ hội tụ . Và vậy nó có
một điểm cố đònh duy nhất ( unique fixed point ) bên trong tập tất cả ảnh đen
trắng . Vì thế , bằng việc bắt đầu từ một ảnh tùy ý và áp dụng lặp lại IFS thì
tiến trình sẽ hội tụ thành một ảnh duy nhất , cái mà chỉ phụ thuộc vào IFS chứ
không còn phụ thuộc vào hình ảnh ban đầu .
Vậy thực chất việc giải nén Fractal là như thế nào? Bộ giải nén chỉ cần
biết mô tả của IFS và như vậy là có thể tái tạo hình ảnh từ đó . Phương pháp
này làm việc bất chấp dạng chính xác của IFS , miễn là nó hội tụ . IFS có thể
được ví như là một bộ máy sao chép đặt biệt ; Nó tạo ra N bản sao thu nhỏ của
ảnh gốc , và dán chúng lại với nhau . Mỗi bản sao được làm giảm đi là vì mỗi
w
i
là một hội tụ . Bằng việc lấy đầu ra và cho lại vào đầu vào thì hình ảnh được
phát sinh tại mỗi bước ngày càng giống với ảnh ban đầu và quá trình sẽ hội tụ
thành một ảnh điểm cố đònh duy nhất , cũng được gọi là attractor của IFS .
Hình ảnh kết quả là một Fractal , bởi vì nó chứa đựng các bản sao thu
nhỏ của chính nó tại tất cả các mức . Ta sẽ thấy chi tiết hơn nếu chúng ta phóng
to một phần của ảnh lên . Vì tính chất tự giống nhau ( Seft – Similarity ) này ,
ảnh được nén sử dụng IFS thì xứng đáng với tên gọi là nén ảnh Fractal ( Fractal
Image Compression ) .
Nén Ảnh Phân Đoạn GVHD : Ths. Lê Ngọc Anh
SVTH : Phạm Đào Minh Vũ Trang 23
Trên đây , chúng ta chỉ đề cập đến hình ảnh đen trắng ( gray scale )
nhưng nó cũng có thể được áp dụng cho các ảnh màu . Vấn đề này chúng ta sẽ
thảo luận ở phần sau .
V . Nén ảnh với IFS .
Một IFS cho một sự xấp xỉ tốt của một hình ảnh I nếu điểm cố đònh của
IFS là một ảnh gần tương đồng với I . Mục đích là để tìm một tập các ánh xạ
hội tụ w
1
… w
N
để hội với W của tất cả các ánh xạ có điểm cố đònh gần với I .
Điều này thì thật không khả thi bởi việc ta phải thử vài ánh xạ , tính toán
các điểm cố đònh kết quả , so sánh nó với I và bắt đầu lại với những ánh xạ
khác cho đến khi một cái hợp nhất được tìm thấy . Thay vào đó , chúng ta sẽ
thử tìm ra một ánh xạ hội tụ W sao cho W(I) thì gần giống với I . Đònh lý
Collage của Barnsley nói rằng nếu W(I) là đủ gần với I thì điểm cố đònh
W
∞
(1) = W(W(W … W(1) … ))
cũng gần với I . Ảnh W(I) thì bao gồm việc cắt dán ( hội lại ) của tất cả các ảnh
thu nhỏ Wj(I) .
Với sự giúp đỡ của đònh lý Collage , vấn đề trên có thể được bắt đầu lại
như là việc tìm kiếm một nghệ thuật cắt dán tốt cho ảnh . Đây là nơi mà sự khó
khăn thực sự bắt đầu . Nói chung là không khả thi để tìm ra một nghệ thuật cắt
dán tốt một cách tự động . Một người phải hướng dẫn tiến trình nén bởi việc cắt
hình ảnh ban đầu thành từng phần để mỗi phần trông giống như là một phiên
bản thu nhỏ của toàn bộ hình ảnh , và hội tất cả các phần đó lại . Ví dụ như một
người sẽ quyết đònh là một nhánh của cây có thể được xem là một phiên bản
thu nhỏ của toàn bộ cây ( chúng có thể bò méo mó ) .
Mỗi lần các phần được xác đònh, máy tính có thể dẫn xuất ra những ánh
xạ
j
w
và vì thế ta có một IFS cho ảnh này . Có rất nhiều sự linh hoạt trong việc
chọn lựa các ánh xạ , miễn sao chúng là hội tụ , và những hàm Affine thì luôn
được sử dụng ở đây .
Trong không gian một chiều , hàm affine có dạng như sau :
ƒ(x) = a*x + b
Nén Ảnh Phân Đoạn GVHD : Ths. Lê Ngọc Anh
SVTH : Phạm Đào Minh Vũ Trang 24
Ở đây , a và b là hằng số . Trong không gian 2 chiều , hình ảnh của một
điểm X có tọa độ ( x,y) là :
ƒ(X) = A*X + B
Và ở đây , A là ma trận 2 chiều và B là một vector hằng số . Ma trận A
xác đònh việc quay , độ nghiêng , và mức ( scale ) cho ảnh , vector B thì xác
đònh sự biến đổi . Điều kiện có tính hội tụ trên ƒ có thể được biểu thò như điều
kiện trên hệ số của ma trận A : hệ số scale phải nhỏ hơn 1 .
Sau khi tất cả sự chuyển đổi affine đã được chọn , IFS có thể được thể
hiện lại ở dạng thu gọn bởi việc mã hóa các hệ số của tất cả các sự biến đổi .
Nếu một cách cắt dán tốt được tìm thấy , thì tổng số lượng các chuyển đổi
affine là nhỏ hơn rất nhiều tổng số lượng các pixel trong ảnh , vì thế việc mã
hóa các hệ số đòi hỏi ít bit hơn nhiều so với việc liệt kê tất cả các giá trò pixel .
Điều này giải thích tại sao việc mã hóa ảnh sử dụng IFS là một dạng của nén
dữ liệu . Việc nén là tổn hao bởi vì việc dùng IFS cho ta hình ảnh sắc nét nhưng
không bằng với ảnh gốc .
Cái khó khăn chính của tiến trình nén là tìm ra bên trong ảnh những
phiên bản thu nhỏ của toàn bộ ảnh . Hình ảnh trong thế giới thực thường chứa
nhiều cái tương tự với nó , nhưng chỉ ở giữa những phần được chọn của ảnh .
Bước đột phá ở đây là: với mỗi phần được chia trong ảnh gốc , tìm một IFS cục
bộ cho mỗi phần đó . Với phương pháp mới này thì cuối cùng chúng cũng trở
nên khả thi trong việc thực hiện tự động tiến trình nén và hơn thế nữa là để
thực hiện nó trong một khoảng thời gian cho phép .
VI . Nén ảnh với Partitoned Iterated Function Systems – PIFS .
Như đã nói ở phần trước , nén là một công việc làm giảm đi sự dư thừa
dữ liệu . Ở đây cũng tương tự như thế , các giải thuật nén ảnh cũng như là lượng
tử hóa vector ( Vector Quantization ) và nén Fractal ( Fractal Compression ) có
sự tham gia của PIFS bằng việc làm giảm sự dư thừa của hình ảnh đầu vào .
Những phương pháp nén các file văn bản thì là không mất dữ liệu ( lossless ) ,
ngược lại phương pháp nén ảnh là chỉ tìm một sự xấp sỉ và vì thế chúng luôn
có mất .
Lượng tử hóa vector ( Vector Quantization ) sử dụng từ điển ( hoặc là
sách mã – codebook ) chứa các mẫu pixel . Hình ảnh vào được phân chia thành
các khối pixel nhỏ , và mỗi khối được mã hóa như một mẫu tương ứng với hầu
Nén Ảnh Phân Đoạn GVHD : Ths. Lê Ngọc Anh
SVTH : Phạm Đào Minh Vũ Trang 25
hết các mẫu có sẵn trong từ điển . Thường thì một khối có cùng kích thước với
các mẫu tự điển nhưng tất cả các khối không cần phải như vậy , chúng có thể
có kích thước khác nhau . Bộ giải mã phải có phiên bản của từ điển và như vậy
chúng có thể dễ dàng khởi tạo lại một ảnh xấp xỉ với hình ảnh ban đầu bằng
việc kết hợp lại các mẫu từ điển được chỉ đònh bởi bộ mã hóa .
Nén Fractal với PIFS thì tương tự với lượng tử hóa vector , nhưng trong
trường hợp này không có tự điển bên ngoài . Hình ảnh đầu vào tương tác với từ
điển của chính nó . Bộ giải mã không có hình ảnh ban đầu , nhưng nó có thể
được tái tạo bằng việc lặp lại chu trình PIFS . Vì từ điển chỉ là một cuốn sách
mã ảo ( virtual codebook ) .
Bộ nén trước hết phân chia hình ảnh ban đầu thành một tập các range
không chồng lấp ( range – tạm dòch là vùng ) . Các range này thông thường là
những hình vuông hay hình chữ nhật , nhưng nó cũng rất tốt với các hình là tam
giác . Cho mỗi range , bộ nén sẽ tìm một phần của hình ảnh ban đầu , được gọi
là domain ( domain – tạm dòch là miền ) , cái mà tương tự với range . Một
domain đóng vai trò là một mẫu pixel trong việc lượng tử hóa , nhưng ở đây nó
phải lớn hơn range để chắc rằng việc ánh xạ từ domain sang range là sự hội tụ
trong các chiều không gian .
Nói chung , bộ nén phải tìm kiếm các domain , cái mà lớn hơn gấp hai
lần range ( nhưng tỉ lệ khác là có thể ) . Trái với range , domain có thể chồng
lấp được .
Hình 6. Ảnh “sunset” với các range và domain được tìm thấy .
Hình cho thấy hai range và hai domain tương ứng . Chúng được chọn
bằng giải thuật nén được làm nổi bậc lên . Giải thuật đã tìm thấy sự tương tự (
similarity ) giữa hai phần không liên quan với nhau trong ảnh : một range nằm
ở trên trời bên phải và một domain nằm kề bên , lớn gấp 2 lần range , ở bên