TRƯỜNG ĐẠI HỌC KINH TẾ - KỸ THUẬT CÔNG NGHIỆP
KHOA CÔNG NGHỆ THÔNG TIN
TRUYỀN THÔNG ĐA PHƯƠNG TIỆN
Đề tài: CÁC CHUẨN BIỂU DIỄN VÀ NÉN ẢNH :
- CHUẨN NÉN JPEG
- CHUẨN NÉN JPEG2000
- CHUẨN NÉN FAX
Giáo viên hướng dẫn: TRẦN THỊ BÍCH THẢO
Sinh viên thực hiện: Nhóm 14
1. Vũ Đức Chiến
2. Phạm Vĩnh Lộc
3. Phạm Văn Cương
1
A. MỞ ĐẦU.
Cùng với sự phát triển mạnh mẽ của máy tính và sự ra đời của Internet thì việc
tìm một phương pháp nén ảnh để giảm bớt không gian lưu trữ thông tin và truyền
thông tin trên mạng nhanh chóng đang là một yêu cầu cần thiết. Trong những năm
gần đây, có rất nhiều các phương pháp đã và đang được nghiên cứu rộng rãi để thực
hiện nén ảnh. Tất cả đều với một mục đích chung là làm thế nào để biểu diễn một ảnh
với dung lượng ít nhất để có thể tối thiểu hoá dung lượng kênh truyền và không gian
lưu trữ trong khi vẫn giữ được tính trung thực của ảnh. Và JPEG là một trong những
phương pháp nén ảnh khá hiệu quả.
B. NỘI DUNG.
I. CÔNG NGHỆ JPEG.
1. JPEG là gì?
JPEG viết tắt của Joint Photographic Experts Group, một nhóm các nhà nghiên
cứu đã phát minh ra định dạng này để hiển thị các hình ảnh đầy đủ màu hơn (full-
colour) cho định dạng di động mà kích thước file lại nhỏ hơn. Đây là một phương
pháp nén ảnh hiệu quả, nó cho phép làm việc với các ảnh có nhiều màu và kích cỡ
lớn, tỷ lệ nén ảnh đạt mức so sánh tới vài chục lần (chứ không phải phần trăm).
2. Phương pháp nén ảnh JPEG.
2.1. Khái quát về phương pháp nén ảnh tĩnh
Có nhiều cách để nén ảnh, nhưng dựa vào yếu tố bảo toàn thông tin có thể phân
chia thành 2 phương pháp nén ảnh tĩnh, đó là:
- Nén không mất mát thông tin: sử dụng các phương pháp mã hóa dữ liệu
- Nén có mất mát thông tin: Phương pháp nén dựa trên phép biến đổi ảnh
Quá trình nén ảnh được mô tả theo sơ đồ:
2
Các phương pháp mã hóa dữ liệu có thể kể đến:
- Mã hang loạt(RLE): Dùng số đếm để thay thế các đặc diểm giống nhau lặp lại.
- Mã Shannon-Fano: Dùng các cụm bít có độ dài thay đổi để mã hóa
- Mã Huffman: Sử dụng các đặc điểm mã hóa của Shannon-Fano với ý tưởng:
Kí hiệu có khả năng xuất hiện nhiều có từ mã ngắn.
- Mã Lemple- Ziv: Dựa trên việc xây dựng và tra từ điển
- Mã dự đoán: Dựa trên quá trình tạo điểm tuần tự và luật dự đoán.
Các phép biến đổi áp dụng trong nén ảnh bao gồm:
- Phép biến đổi Cosin rời rạc(DCT): Biểu diễn các giá trị điểm ảnh trên miền
tần số, tập trung năng lượng vào một số hệ số. DCT sử dụng trong các chuẩn
JPEG và MPEG
- Phép biến đổi Wavelet rời rạc(DWT): sử dụng các bộ lọc thông dải xử lý phân
tích đa phân trong phép DWT.
- Phép biến đổi Fractal: Sử dụng các phép biến đổi hình học.
Nén ảnh tĩnh dựa trên phép biến đổi ảnh được mô tả trong sơ đồ:
2.2. Phương pháp nén ảnh theo chuẩn JPEG
a. Phép biến đổi DCT (Discrete Cosin Transform)
Như chúng ta đã nói ở trên, phép biến đổi DCT được sử dụng trong phương
pháp nén ảnh theo chuẩn JPEG. Vì vậy trước khi đi vào tìm hiểu về phương pháp
nén ảnh JPEG chúng ta cùng khái quát sơ qua về phép biến đổi DCT.
3
b. Phương pháp nén ảnh theo chuẩn JPEG
Phương pháp nén ảnh theo thuẩn JPEG có thể cho hệ số nén tới 80:1 hay lớn hơn,
nhưng bạn phải chịu mất thông tin (ảnh sau khi bung nén khác với ảnh ban đầu), lượng
thông tin mất mát tăng dần theo hệ số nén. Tuy nhiên sự mất mát thông tin này không bị
làm một cách cẩu thả. JPEG tiến hành sửa đổi thông tin ảnh khi nén sao cho ảnh mới
gần giống như ảnh cũ, khiến phần đông mọi người không nhận thấy sự khác biệt. Và bạn
hoàn toàn có thể quản lý sự mất mát này bằng cách hạn chế hệ số nén. Như thế người
dùng có thể cân nhắc giữa cái lợi của việc tiết kiệm bộ nhớ và mức độ mất thông tin của
ảnh, để chọn phương án thích hợp.
4
Phương pháp nén ảnh JPEG dựa trên nguyên lý sau: ảnh màu trong không gian của 3
màu RGB (red Green Blue) được biến đổi về hệ YUV (hay YCBCr) (điều này không
phải là nhất thiết, nhưng nếu thực hiện thì cho kết quả nén cao hơn) theo công thức :
YUV. = 0.615R − 0.515G − 0.100B
Y= 0.299R + 0.587G + 0.114B
U= 0.492(B − Y)= = − 0.147R − 0.289G + 0.436B
V= 0.877(R − Y)
Hệ YUV là kết quả nghiên cứu của các nhà sản xuất vô tuyến truyền hình hệ Pal, Secam
và NTSC, nhận thấy tín hiệu video có thể phân ra 3 thành phần Y, U, V (cũng như phân
theo màu chuẩn đỏ, xanh lá cây và xanh da trời). Và một điều thú vị là hệ nhãn thị của
con người rất nhạy cảm với thành phần Y và kém nhạy cảm với hai loại U và V. Phương
pháp JPEG đã nắm bắt phát hiện này để tách những thông tin thừa của ảnh. Hệ thống
nén thành phần Y của ảnh với mức độ ít hơn so với U, V, bởi người ta ít nhận thấy sự
thay đổi của U và V so với Y.
Giai đoạn tiếp theo là biến đổi những vùng thể hiện dùng biến đổi cosin rời rạc
(thông thường là những vùng 8x8 pixel). Khi đó thông tin về 64 pixel ban đầu sẽ biến
đổi thành ma trận có 64 hệ số thể hiện "thực trạng" các pixel. Điều quan trọng là ở đây
hệ số đầu tiên có khả năng thể hiện "thực trạng" cao nhất, khả năng đó giảm rất nhanh
với các hệ số khác. Nói cách khác thì lượng thông tin của 64 pixel tập trung chủ yếu ở
một số hệ số ma trận theo biến đổi trên. Trong giai đoạn này có sự mất mát thông tin,
bởi không có biến đổi ngược chính xác. Nhưng lượng thông tin bị mất này chưa đáng kể
so với giai đoạn tiếp theo. Ma trận nhận được sau biến đổi cosin rời rạc được lược bớt sự
5
khác nhau giữa các hệ số. Đây chính là lúc mất nhiều thông tin vì người ta sẽ vứt bỏ
những thay đổi nhỏ của các hệ số. Như thế khi bung ảnh đã nén bạn sẽ có được những
tham số khác của các pixel. Các biến đổi trên áp dụng cho thành phần U và V của ảnh
với mực độ cao hơn so với Y (mất nhiều thông tin của U và V hơn). Sau đó thì áp dụng
phương pháp mã hóa của Hoffman: Phân tích dãy số, các phần tử lặp lại nhiều được mã
hóa bằng ký hiệu ngắn (marker).
(1)
(2)
Với và
Khi bung ảnh người ta chỉ việc làm lại các bước trên theo quá trình ngược lại cùng với
các biến đổi ngược.
Vì phương pháp này thực hiện với các vùng ảnh (thông thường là 8 x 8 pixel) nên
hay xuất hiện sự mất mát thông tin trên vùng biên của các vùng (block) này. Hiện nay
người ta đã giải quyết vấn đề này bằng cách làm trơn ảnh sau khi bung nén để che lấp sự
khác biệt của biên giới giữa các block. Một hệ nén ảnh theo chuẩn JPEG cùng algorithm
làm trơn ảnh đã được công ty ASDG đưa ra trong hệ Art Department Professional.
6
2.3 Ưu nhược điểm của phương pháp nén ảnh JPEG.
a. Ưu điểm:
JPEG cho phép nén ảnh với tỉ số nén lên đến 80:1 hoặc cao hơn, hiển thị các hình
ảnh đầy đủ màu hơn (full-colour) cho định dạng di động mà kích thước file lại nhỏ hơn.
JPEG cũng được sử dụng rất nhiều trên Web. Lợi ích chính của chúng là chúng có thể
hiển thị các hình ảnh với màu chính xác true-colour (chúng có thể lên đến 16 triệu màu),
điều đó cho phép chúng được sử dụng tốt nhất cho các hình ảnh chụp và hình ảnh minh
họa có số lượng màu lớn.
b. Nhược điểm.
Nhược điểm chính của định dạng JPEG là chúng được nén bằng thuật toán lossy
(mất dữ liệu). Điều này có nghĩa rằng hình ảnh của bạn sẽ bị mất một số chi tiết khi
chuyển sang định dạng JPEG. Đường bao giữa các khối màu có thể xuất hiện nhiều
điểm mờ, và các vùng sẽ mất sự rõ nét, tỉ số nén càng cao thì sự mất mát thông tin trên
ảnh JPEG càng lớn. Nói một cách khác, định dạng JPEG thực hiện bảo quản tất cả thông
tin màu trong hình ảnh đó, tuy nhiên với các hình ảnh chất lượng màu cao high-colour
như hình ảnh chụp thì điều này sẽ không hề hấn gì.
Các ảnh JPEG không thể làm trong suốt hoặc chuyển động - trong trườn hợp này
bạn sẽ sử dụng định dạng GIF (hoặc định dạng PNG để tạo trong suốt).
II. JPEG 2000
Như đã trình bày, kỹ thuật nén JPEG sẽ làm mất thông tin lúc giải nén, càng nén với hệ
số cao thì thông tin càng mất nhiều khi bung. Vì vậy để giải quyết vấn đề này, tháng
12/1999 một bản phác thảo tiêu chuẩn nén hình ảnh theo công nghệ mới JPEG2000.
Tháng 8/2000, bản phác thảo về tiêu chuẩn JPEG2000 đã được lưu hành trong giới
chuyên gia hình ảnh. Sau đó nó đã được công nhận là tiêu chuẩn quốc tế vào tháng
12/2000 và được ISO hợp thức hóa năm nay để cho phép ứng dụng vào các hệ xử lý,
phân phối.
Với JPEG2000 kỹ thuật xử lý hình ảnh sẽ đạt được những kết quả rất ngoạn mục vì có
thể nén nhỏ từ 100-200 lần mà hình ảnh không sai sót bao nhiêu so với hình ảnh gốc.
Nhưng đâu là điểm khác biệt để kỹ thuật JPEG2000 vượt trội hơn hẳn so với JPEG?
JPEG2000 là hệ thống mã hóa hình ảnh mà kỹ thuật nén dựa trên kỹ thuật sóng ngắn. Là
một tiện ích toán học cho phép mô tả bằng một công thức đơn giản những gì xảy ra tại
một thời điểm chính xác của tín hiệu. Với một chuỗi sóng ngắn, chỉ cần biểu diễn bằng
7
vài công thức, đường biểu diễn không đều mà không cần phải mô tả đặc tính của từng
điểm một. Và lẽ dĩ nhiên sẽ rất đắc lực khi phân tích tỉ mỉ một file ảnh kỹ thuật số.
Thuật toán trong kỹ thuật JPEG2000 là chọn một số nhỏ các sóng ngắn, các sóng này
được lập lại ở những nơi khác nhau, tỷ lệ khác nhau đã mô tả chính xác tín hiệu của hình
ảnh. File ảnh nén không chứa nhiều hơn số lượng chỉ vị trí và giãn nở của từng sóng
ngắn. Và kỹ thuật mã hóa theo từng khối, theo từng khu vực ưu tiên của hình ảnh (ROI
-Regional Of Interest) được áp dụng cũng là một tiến bộ đáng kể trong thuật toán mã
hóa JPEG2000.
Các điểm chú ý trong JPEG2000
3.1-Sự thay đổi các thành phần màu
Ban đầu hình ảnh phải được chuyển đổi từ không gian màu RGB sang không gian màu
khác, dẫn đến sự tách biệt của 3 thành phần màu này.Có 2 sự lựa chọn:
a.Không thể đảo màu(Irreversible Color Transform -ICT): sử dụng không gian màu
YC
B
C
R
8
b.Có thể đảo màu(Reversible Color Transform-RCT):sử dụng không gian màu YUV
đã sửa đổi mà không thực hiện các lỗi lượng tử cho nên nó có thể đảo màu. Thực hiện
đúng các yêu cầu RCT tức là số được làm tròn theo quy định mà không thể được thể
hiện chính xác dưới dạng ma trận. Quá trình chuyển đổi là:
3.2-Lát(Tiling)
Sauk hi chuyển đổi màu sắc,bức ảnh được phân chia-gọi là các lát,các vùng vuông của
ảnh đó được chuyển đổi và mã hóa riêng biệt nhau.Lát có nhiều kích cỡ, và nó có thể coi
các lát của ảnh như 1 lát duy nhất.Khi kích thước được chọn, tất cả các lát sẽ có cùng
kích thước(ngoại trừ những lát bên phải và phía dưới đường bao).Việc chia hình ảnh
thành nhìu lát là có lợi,các bộ giải mã cần ít bộ nhở hơn để giải mã bức ảnh và nó có thể
lựa chọn chỉ giải mã lát được chọn để giải mã 1 phần của bức ảnh.Bất lợi của phương
pháp này là chất lượng hình ảnh giảm thấp hơn tín hiệu tốt nhất đến tỷ số truyền( peak
signal to noise ratio). Sử dụng nhiều lát có thể tạo khối ảnh hưởng giống chuẩn JPEG
1992.
3.3-Hàm biến thiên chuyển đổi(Wavelet Trasform)
Những lát này sau đó được biến đổi đến độ sâu tùy ý,trái với JPEG 1992-sử dụng biến
đổi cosin vùng ảnh kích thước 8x8 :JPEG 2000 sử dụng 2 biến đổi wavelet
1.Không thể đảo ngược: nó được gọi là không thể đảo bởi nó sử dụng kĩ thuật
lượng tử hóa phụ thuộc vào độ chính xác của bộ giải mã.
2.Đảo ngươc:Nó chỉ sử dụng hệ số nguyên,cho nên đầu ra không yêu cầu làm tròn
số(lượng tử) và vì vậy nó không thực hiện bất kì sai số lượng tử nào.Nó được sử dụng
trong mã hóa không mất mát thông tin.
3.4-Lượng tử hóa(Quantization )
Sau khi biến đổi wavelet transform,các hệ số là vô hướng-đã được lượng tử hóa để giảm
số lượng các bit ,tại các điểm tổn hao của mất mát lượng tử.Đầu ra là 1 tập hợp
các số nguyên phải được mã hóa bit-by-bit.Các tham số có thể được thay đổi để
đạt chất lượng cuối cùng là bước lượng tử hóa:các bước quan trọng hơn là bước
nén và sự mất mát thông tin lượng tử.Với 1 bước lượng tử bằng 1,không có quá
trình lượng tử nào được thực hiện(nó được gọi là nén không mất mát)
3.5-Siêu dữ liệu(Metadata)
9
Đối với JPEG truyền thống, bổ sung các siêu dữ liệu: lưu trữ các thông tin về bức
ảnh( kích cỡ,độ sâu màu,độ phân giải, ngày tạo bức ảnh…)
3.6- Motion JPEG 2000
Motion JPEG quy định việc sử dụng định dạng JPEG 2000 cho các trình tự tính thời
gian của hình ảnh (tự động), có thể kết hợp với âm thanh, và tạo ra cách trình bày tổng
thể. Tên file mở rộng cho các tệp video Motion JPEG 2000 là .mj2 .mjp2 Motion JPEG
2000 (thường được biết đến như MJ2 hoặc MJP2) cũng đang được xem xét như là một
định dạng lưu trữ kỹ thuật số của Library of Congress. Nó là một tiêu chuẩn quốc tế mở
và cập nhật những thuận lợi cho MJPEG (hoặc MJ), được dựa trên những thành tựu của
định dạng JPEG. Không giống như các định dạng video phổ biến, chẳng hạn như
MPEG-4 Part 2, WMV, và H.264 thì MJ2 không sử dụng các khung nội suy (inter-
frame). Thay vào đó, mỗi frame là một thực thể độc lập được mã hóa bởi một biến thể
hoặc mất dữ liệu hay không giảm chất lượng của JPEG 2000. Nó là 1 cấu trúc vật lý
không phụ thuộc vào time ordering,nhưng nó sử dung những profile riêng biệt để bổ
sung dữ liệu. Đối với âm thanh, nó hỗ trợ LPCM mã hóa, cũng như biến thể khác của
MPEG-4 , như là dữ liệu thô "hoặc bổ sung dữ liệu".
3.7-JPEG2000 Security–JPSEC
Vấn đề an ninh,bản quyền trong sao chép,truyền thông ảnh được xử lý trong JPSEC:Mật
mã,nguồn chứng thực,toàn vẹn dữ liệu,điều kiện truy cập,bảo vệ quyền sở hữu
3.8-JPEG2000 Wireless-JPWL
Cải tiến JPEG2000 cho phù hợp với các ứng dụng đa phương tiện không dây.
3.9-JPXML
Hình ảnh được nhúng vào XML sử dụng ngôn ngữ đánh dấu (Geography Markup
Language-GML)
3.10-JP3D
Đây là phần mở rộng cho hình ảnh không gian 3 chiều(thể tích hình ảnh)
10