Tải bản đầy đủ (.doc) (26 trang)

TỔNG QUAN VỀ KĨ THUẬT NÉN ẢNH

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (523.12 KB, 26 trang )

Trường ĐH Công Nghệ GT Báo Cáo Thực Tập Chuyên Ngành
CHƯƠNG 1
TỔNG QUAN VỀ KĨ THUẬT NÉN ẢNH
1.1 Giới thiệu chung
Cùng với sự phát triển mạnh mẽ của máy tính và sự ra đời của Internet thì việc tìm một
phương pháp nén ảnh để giảm bớt không gian lưu trữ thông tin và truyền thông tin trên mạng
nhanh chóng đang là một yêu cầu cần thiết. Trong những năm gần đây, có rất nhiều các
phương pháp đã và đang được nghiên cứu rộng rãi để thực hiện nén ảnh. Tất cả đều với một
mục đích chung là làm thế nào để biểu diễn một ảnh với ít bit nhất để có thể tối thiểu hoá
dung lượng kênh truyền và không gian lưu trữ trong khi vẫn giữ được tính trung thực của ảnh.
Điều này tương đương với việc biểu diễn ảnh có độ tin cậy cao nhất với tốc độ bit nhỏ nhất.
Tốc độ bit được đo bằng số bit trên một điểm ảnh (pixel). Tốc độ bit đối với ảnh đen
trắng khi chưa được nén là 8 bit/pixel và đối với ảnh màu là 24 bit/pixel. Các kỹ thuật nén
hiênnay cho phép dung lượng ảnh được nén giảm 30 đến 50 lần so với ảnh gốc mà ảnh vẫn
giữ được độ trung thực cao. Độ trung thực của ảnh được đánh giá dựa trên tiêu chí như lỗi
trung bình, bình phương (MSE: Mean Square Error) hoặc tỷ số tín hiệu trên tạp âm (SNR:
Signal-to-Noise ratio) giữa ảnh gốc và ảnh nén.
Các nhà sản xuất máy tính đang quảng cáo những sản phẩm mới nhất nhằm đáp ứng lĩnh
vực đồ họa. Trong khi đó các nhà lập trình thì biết rất rõ là những máy tính hiện nay chưa thể
làm việc với các loại ảnh màu thực bởi lẽ lượng thông tin quá lớn của từng ảnh. Chẳng hạn
như để có bộ phim trên máy vi tính tương đương chất lượng với chương trình vô tuyến cần
phải lưu một lượng thông tin là 22 MB trong 1 giây.
Để giải quyết khó khăn này, người ta cần đến các kỹ thuật nén dữ liệu. Những phương
pháp thường (như Compress trong hệ UNIX) không đem lại hiệu quả: tỷ lệ nén dữ liệu cho
hình ảnh không quá 2:1. Nhưng với những phương pháp chuyên dụng có thể đạt tới 30:1. Hai
phương pháp nén hình ảnh nổi tiếng nhất hiện nay là của nhóm chuyên gia về hình ảnh động
(MotionPicture Experts Group - MPEG) và liên hiệp các nhóm chuyên gia về hình ảnh (Joint
PhotoGraphic Experts Group - JPEG). Những phương pháp này đã trở thành chuẩn công
nghiệp. Những yếu điểm cơ bản của các phương pháp này là sự mất mát thông tin và hiệu quả
nén không cao đối với những hình ảnh phức tạp.
Một chuyên gia giải thích kỹ thuật nén lossless như sau: "Giả sử bạn có một ngăn kéo


với
2 chiếc tất màu trắng, 2 chiếc tất màu đen. Thay vì nói: "Tôi có 1 tất trắng, 1 tất trắng
nữa, 1 tất đen, 1 tất đen nữa", bạn sẽ giảm câu đi khoảng một nửa nếu nói: "Tôi có 1 cặp tất
trắng và một cặp tất đen".
GV hướng dẫn: Nguyễn Thị Loan SV thực hiện: Vương Thị Thúy
Trường ĐH Công Nghệ GT Báo Cáo Thực Tập Chuyên Ngành
Tất cả các phương pháp nén ảnh đều dựa trên một nguyên lý đơn giản: trong dữ liệu có
nhiều phần tử thừa và nén ảnh dựa trên cơ sở tìm ra những phần tử đó và mã hóa chúng.
Ví dụ, như số 9999997777 có thể mã hóa thành 6947. Các hình ảnh trên màn hình máy vi tính
đặc trưngbởi số điểm (pixel) và số bit dành cho mã mầu của mỗi điểm (bit/pixel).
Phần lớn các hình ảnh (nhất là có độ phân giải cao) không có quy luật giữa các điểm gần
nhau, do đó các phương pháp thông dụng hiện nay như biến đổi cosin rời rạc, Wavelet Image
Compession (WIC) (theo chuẩn JPEG và MPEG) phải dùng đến biến đổi toán học và xấp xỉ
cácmối tương quan giữa các pixel. Với các phương pháp này bạn có thể nén ảnh tới tỷ lệ 20:1
- 30:1.Nhưng những ảnh này (vì bị mất thông tin) chỉ là những ảnh gần đúng với ảnh ban đầu,
ngoài ra còn có thể xuất hiện biến dạng hình ảnh như đối với phương pháp biến đổi cosin
rời rạc.
1.2 Nén ảnh:
Nhằm giảm thiểu không gian lưu trữ. Thường được tiến hành theo cả hai khuynh
hướng là nén có bảo toàn và không bảo toàn thông tin. Nén không bảo toàn thì thường có khả
năng nén cao hơn nhưng khả năng phục hồi thì kém hơn.
Nén ảnh sử dụng phép biến đổi: đây là kỹ thuật tiếp cận theo hướng nén không bảo
toàn và do vậy kỹ thuật thường nén hiệu quả hơn .JPG chính là tiếp cận theo kỹ thuật nén này.
1.3 Các nguyên tắc khi nén ảnh
Một tính chất chung nhất của tất cả các ảnh số đó là tương quan giữa các pixel ở cạnh
nhau lớn, điều này dẫn đến dư thừa thông tin để biểu diễn ảnh. Dư thừa thông tin sẽ làm cho
việc mã hoá không tối ưu. Do đó công việc cần làm để nén ảnh là phải tìm được các biểu diễn
ảnh với tương quan nhỏ nhất để giảm thiểu độ dư thừa thông tin của ảnh. Thực tế, có hai kiểu
dư thừa thông tin được phân loại như sau:
- Dư thừa trong miền không gian: tương quan giữa các giá trị pixel của ảnh, điều này có

nghĩa rằng các pixel lân cận của ảnh có giá trị gần giống nhau (trừ những pixel ở giápđường
biên ảnh).
- Dư thừa trong miền tần số: Tương quan giữa các mặt phẳng màu hoặc dải phổ khác
nhau.
Trọng tâm của các nghiên cứu về nén ảnh là tìm cách giảm số bit cần để biểu diễn ảnh
bằng việc loại bỏ dư thừa trong miền không gian và miền tần số càng nhiều càng tốt.
Các kỹ thuật nén ảnh được sử dụng:
- Nén ảnh không mất thông tin : với phương pháp này sau khi giải nén ta khôi phục
đượcchính xác ảnh gốc. Các phương pháp nén này bao gồm mã hoá Huffman, mã hoá
thuậttoán…
GV hướng dẫn: Nguyễn Thị Loan SV thực hiện: Vương Thị Thúy
Trường ĐH Công Nghệ GT Báo Cáo Thực Tập Chuyên Ngành
- Nén ảnh có mất thông tin: ảnh giải nén có một sự sai khác nhỏ so với ảnh gốc. Các
phương pháp này bao gồm:
• Lượng tử hoá vô hướng: PCM và DPCM
• Lượng tử hoá vector
• Mã hoá biến đổi: biến đổi cosin rời rạc (DCT), biến đổi Fourier nhanh
(FFT)
• Mã hoá băng con
Sơ đồ khối một hệ thống nén ảnh điển hình
Hai phương pháp nén ảnh tĩnh hiện đang được nghiên cứu rộng rãi hiện nay là
- Biến đổi cosin rời rạc DCT (Discrete Cosin Transform): đang được dùng trong chuẩn
nén ảnh JPEG hiện nay.
- Mã hoá băng con SBC (Subband Coding): được kết hợp với bi n ế đổi wavelet dùng làm
chuẩn nén ảnh JPEG 2000.
GV hướng dẫn: Nguyễn Thị Loan SV thực hiện: Vương Thị Thúy
Trường ĐH Công Nghệ GT Báo Cáo Thực Tập Chuyên Ngành
CHƯƠNG 2
CHUẨN NÉN ẢNH JPEG
2.1 Giới thiệu chung:

JPEG (phát âm là JAY-peg) viết tắt từ Joint Photographic Experts Group của ủy ban xác
lập các định dạng chuẩn, từ năm 1986 nhóm hiệp hội các tiêu chuẩn đã đưa ra chuẩn nén ảnh
JPEG và đến năm 1994 JPEG được khẳng định với tiêu chuẩn ISO 10918-1. JPEG là định
dạngnén ảnh có tổn thất, mặc dầu có sự thay đổi của các biến thể nhưng nó vẫn giữ
được nguyên lý của chuẩn nén cơ bản JPEG (các định dạng mở rộng khác như .jpg, .jpeg,
.jpe, .jfif và .jif).
Định dạng JPEG/JFIF được sử dụng để lưu trữ ảnh và truyền qua mạng Internet
(WorldWide Web) cùng với định dạng GIF gồm 256 màu. JPEG là định dạng nén để lưu trữ
ảnh màu và ảnh trắng đen bằng nhiều độ phân giải, định dạng nén JPEG làm suy giảm nhỏ về
chất lượng. Chuẩn nén JPEG là phương pháp nén ảnh tĩnh với tỉ lệ nén lên đến 20-1 mà không
làm mất thông tin đáng kể, mỗi ảnh có 3 kênh màu (đỏ, lục, lam) với giới hạn 8 bit/kênh.
Định dạng nén JPEG được sử dụng trong tất cả máy ảnh kỹ thuật số có kích thước rất nhỏ nên
thường chụpđược nhiều ảnh trên một thẻ nhớ, JPEG dễ hiển thị trên màn hình, ảnh có thể
chuyển nhanh qua thư điện tử (dung lượng từ 300KB đến 700KB), ảnh JPEG chất lượng cao
có dung lượng khoảng vài MB hay lớn hơn, khuyết điểm chính của ảnh JPEG là ảnh có chất
lượng thấp, ảnh thường bị suy giảm nếu so với ảnh gốc.
Nén theo chuẩn JPEG là một tiến trình nhiều bước. Trước hết là bước qui tắc hóa
(regularizing stage) để làm cho ảnh có nhiều đoạn giống nhau hơn thực tế. Ảnh màu
được chuyển sang dạng YUV hoặc CIELAB, trong đó thông tin về độ sáng (luminance)
được tách rờivới thông tin về độ màu (chrominance). Một yếu tố được tính tới là mắt người ta
nhạy cảm vớinhững thay đổi nhỏ về độ sáng hơn là những thay đổi về màu sắc, đặc biệt ở đầu
xanh của phổ. Ngoài ra cách làm này còn khai thác thực tế là ảnh thường có nhiều vùng
lớn tại đó các điểm kế nhau rất giống nhau về kênh màu.
Bước tiếp theo là lấy mẫu cho các kênh màu (gọi là “downsampling” hoặc
“chromasubsampling”). Đây là 1 trong 2 công đoạn làm mất thông tin và chỉ thực hiện khi
bạn chọn xác lập high compression/low quality (tỉ lệ nén cao/chất lượng thấp) của JPEG. Lấy
mẫu(subsampling) nghĩa là loại bỏ có hệ thống các thông tin màu sắc đối với các hàng hoặc
cột điểm ở tỉ lệ cho trước. Nếu bạn thực hiện cứ hai hàng loại bỏ một hàng và hai cột loại bỏ
một cột, giảm được dữ liệu màu đi 75%. Khi tời ảnh, trị của các điểm loại bỏ trước đó
được ngoại suy từ những gì còn lại.

Bước tiếp là sắp xếp lại dữ liệu bằng hàm toán học gọi là DCT (Discrete Cosine
GV hướng dẫn: Nguyễn Thị Loan SV thực hiện: Vương Thị Thúy
Trường ĐH Công Nghệ GT Báo Cáo Thực Tập Chuyên Ngành
Transform). Làm việc với các khối điểm 8x8, hàm DCT phân tích các tần số vùng theo
cả chiều ngang lẫn chiều dọc. Công đoạn này được gọi là lượng tử hóa (quantization) - cách
gọi kỹ thuậtcủa bước làm giảm số bit cần thiết để biểu diễn mổi giá trị tần suất. Các trị này
được nén trung thực trước hết bằng RLE sau đó mã hóa theo kỹ thuật Huffman. Đây là công
đoạn của JPEG chophép đạt tỉ số nén rất cao.
Quá trình tời (decompres s ion) là quá trình ngược lại. Dữ liệu được giải mã bằng thuật
toán Huffman, các trị kết quả được nhân lên, hàm DCT ngược được áp dụng, các vùng
luminance và chrominance được chuyển trở lại RGB.
2.2 Mã hóa JPEG
Có một miêu tả ngắn cho một hoặc nhiều phương pháp chung của sự mã hoá khi áp
dụngvào trường hợp 24 bit/pixel (8 cho mỗi màu: đỏ, xanh dương, xanh lá cây). Đây là
phương pháp nén giảm dữ liệu.
Sự chuyển đổi không gian màu:
Trước tiên ảnh nên được chuyển đổi từ RGB tới một không gian màu khác gọi là YcbCr.
Nó có 3 thành phần Y, Cb, Cr: thành phần Y miêu tả ánh sáng của điểm ảnh, thành phần Cb
vàCr miêu tả “chrominance” (phân loại thành phần xanh lá cây và đỏ). Sự chuyển đổi không
gianmàu YcbCr cho phép nén lớn nhất và cho ra cùng một chất lượng ảnh( hoặc chất lượng
ảnh lớn Icho ra cùng một sự nén).
Sự chuyển đổi đến YcbCr được chỉ rõ trong chuẩn JFIF, và nên thực hiện cho kết quả
file JPEGđể có sự tương thích là lớn I. Tuy nhiên , nhiều ảnh JPEG chất lượng cao không áp
dụng trườnghợp này và thay vì giữ chúng trong không gian màu sRGB, mỗi vùng màu
được nén và lượng tửhoá tách biệt với những giới hạn cùng chất lượng.
Downsampling
Mắt người có thể nhìn thấy nhiều chi tiết trong thành phần Y( ánh sáng) hơn trong
Cb(xanh lá cây) và Cr(xanh dương). Sử dụng sự hiểu biết này, giải mã có thể được thiết kế để
nén ảnh có hiệu quả hơn.
Nó làm giảm thành phần Cb và Cr (gọi là “downsampling” hoặc “chroma subsampling”).

Tỉ sốmà tại việc lấy mẫu xuống có thể được thực hiện trên LPEG 4:4:4(không lấy mẫu
xuống), 4:2:2( giảm bởi chia 2 theo hướng nằm ngang.), và thường sử dụng I là 4:2:0( giảm
bởi chia 2theo hướng nằm ngang và đứng). Ngưng quá trình lấy mẫu, Y, Cb và Cr được xử lý
tách biệt và trong cùng 1 loại. Lấy mẫu xuống thành phần chroma lưu giữ 33% hoặc 50%
không gian được lấy bởi ảnh.
Chia khối
GV hướng dẫn: Nguyễn Thị Loan SV thực hiện: Vương Thị Thúy
Trường ĐH Công Nghệ GT Báo Cáo Thực Tập Chuyên Ngành
Sau khi “subsampling” mỗi kênh phải bị tách ra đặt trong khối 8x8(của pixel). Nếu như
dữ liệu cho mỗi kênh không mô tả được số nguyên của các khối thì việc giải mã phải làm
đầynhững vùng còn lại của những khối không đầy đủ với một số hình thức của dữ liệu giả:
Làm đầy nền của pixel với màu qui định (màu đen) tạo ra vùng tối dọc phần nhìn
thấy rõ của khung. Lập lại nền pixel thì phổ biến nhưng kĩ thuật không tối ưu đễ tránh những
khung nhìn thấy rõ, nhưng nó vẫn tạo ra những vùng với màu của những ô làm đầy.
Cách tốt nhất là làm đầy pixel bởi sử dụng màu sắc mà nó qui định hệ số DCT của
pixel nhìnthấy rõ, tại tần số thấp I(ví dụ làm đầy với trung bình màu của phần nhìn thấy sẽ giữ
dược hệ số DC đầu tiên, nhưng thích hợp nhất là 2 hệ số AC kế tiếp sẽ tạo ra những kế quả tốt
I với ít nhất 8x8 ô những cạnh dọc theo khung).
Miêu tả hàm truyền cosine
8x8 ảnh nhỏ trình bày trong mặt xám 8 bit
GV hướng dẫn: Nguyễn Thị Loan SV thực hiện: Vương Thị Thúy
Trường ĐH Công Nghệ GT Báo Cáo Thực Tập Chuyên Ngành
8x8 ảnh nhỏ cho thấy sau khi có biểu đồ phương trình của nó (chẳng hạn 154 trở thành
trắng, 55 trở thành đen).
Tiếp đến là mỗi thành phần (Y,Cb,Cr) của mỗi khối 8x8 được chuyển đổi đến vùng tần
số sử dụng biến đổi cosine rời rạc 2-D (DCT) 8
Và sau đó lấy DCT và nhóm các kết quả số nguyên gần nhất
Giá trị lớn nhất ở đầu gốc trái gọi là hệ số DC, 63 giá trị còn lại gọi là hệ số AC. Biến dổi
cosine rời rạc làm tăng kích cỡ ảnh. DCT chuyển đổi 64 pixel tới 1 sự kết hợp tuyến tính của
64 ô vuông. Đường nằm ngang là u, đường thẳng đứng là v.

GV hướng dẫn: Nguyễn Thị Loan SV thực hiện: Vương Thị Thúy
Trường ĐH Công Nghệ GT Báo Cáo Thực Tập Chuyên Ngành
Lượng tử hoá : Mắt người nhìn thấy rõ sự khác nhau rất nhỏ của ánh sáng khi qua những
vùng tương đối lớn, nhưng không phân rõ chiều dài chính xác của sự biến đổi ánh sáng ở tần
số cao. Điều này được thực hiện bởi việc chia mỗi thành phần trong vùng tần số cho một hằng
số của thành phần đó, và sau đó nhóm các số nguyên gần nhất.
Lượng tử hoá ma trận:
GV hướng dẫn: Nguyễn Thị Loan SV thực hiện: Vương Thị Thúy
Trường ĐH Công Nghệ GT Báo Cáo Thực Tập Chuyên Ngành
Mật mã entropy : Mật mã entropy là 1 hình thức đặc biệt của sự nén dữ liệu giảm bớt sự
mất mát. Nó bao gồm sự sắp xếp các thành ảnh trong “zigzag” để dùng thuật toán “run-
lengthencoding” nhóm các tần số tương tự với nhau, chèn vào chiều các mã zero, và sử dụng
mật mã Huffman đối với phía trái.
Bảng zigzag của các thành phần ảnh JPEG
Chuẩn JPEG cũng được cho phép, nhưng không đòi hỏi, sử dụng mật mã số học, đó là
toán học cao cấp tới mật mã Huffman. Tuy nhiên nét đặc trưng này hiếm khi được sử dụng
bởi vì sự giải mã và mã hoá chậm hơn so với mật mã Huffman. Đặc trưng của mật mã số học
làm những file nhỏ hơn khoảng 5%.
Chuổi zigzag cho hệ số lượng tử hoá được trình bày ở bên dưới
Nếu như một khối thứ I được miêu tả bởi Bi và vị trí ở bên trong mỗi khối được miêu tả
bởi (p,q) với p = 0,1,…,7 và q = 0,1,…,7, bất kì một hệ số nào trong ảnh DCT có thể
được miêu tả như Bi(p,q). vì vậy, trong hệ thống ở trên, bậc của sự mã hoá pixel là
Bi(0,0),Bi(0,1), Bi(1,0),Bi(2,0), Bi(1,1), Bi(0,2), Bi(0,3), Bi(1,2),.v.v.
GV hướng dẫn: Nguyễn Thị Loan SV thực hiện: Vương Thị Thúy
Trường ĐH Công Nghệ GT Báo Cáo Thực Tập Chuyên Ngành
Sơ đồ mã hóa và giải mã dùng biến đổi DCT
Phương thức mã hoá được gọi là mã hoá chuỗi “baseline”. Ranh giới JPEG cũng được
chấp nhận nén mã hoá. Trong khi những chuỗi mã hoá này mã hoá hệ số của khối đơn tại 1
lần, sự nén đã mã hoá các hệ số có vị trí giống nhau của tất cả các khối, theo sau bởi các hệ số
vị trí tiếp theo của tất cả các khối,… vì vậy, nếu ảnh được chia tới N khối 8x8 {B0,B1,B2,…

Bn-1}, sau đó sự nénmã hoá Bi(0,0) cho tất cả các khối, với I = 0,1,2,…N-1. tiếp theo mã hoá
hệ số Bi(0,1), hệ số Bi(1,0), sau đó là Bi(0,2). Chú ý ở đây có những hệ số cùng vị trí đã
được mã hoá, vị trí tiếp theo để mã hoá thì nó phải xuất hiện kế đến trong hàng ngang zigzag.
Để mã hoá hệ số mẫu JPEG sử dụng mã hoá Huffman. JPEG có mật mã Huffman
đặc biệt cho việc kết thúc sớm chuỗi khi những hệ số còn lại là zero.
Kí tự mã số đặc biệt là “EOB”, chuỗi trở thành
Mật mã khác của JPEG tương ứng với sự kết hợp của (a) số bit quan trọng của hệ số, bao
gồm dấu, và (b) số hệ số zero liền nhau. (Bạn biết có bao nhiêu bit được mong đợi, lấy 1
bittương ứng {-1, +1}, 2 bit tương ứng {-3, -2, +2, +3},…).
Chuẩn JPEG cung cấp bảng Huffman, mã hoá có thể chọn bảng Huffman ngẫu
nhiên cho việc phân phối tần số thật trong ảnh đã được mã hoá.
Tỉ số và dụng cụ nén.
GV hướng dẫn: Nguyễn Thị Loan SV thực hiện: Vương Thị Thúy
Trường ĐH Công Nghệ GT Báo Cáo Thực Tập Chuyên Ngành
Ảnh này trình bày những pixel mà nó khác nhau giữa ảnh không nén và ảnh nén JPEG
với chất lượng 50%. Những vùng mờ có sự khác nhau rất lớn. Chú ý nhất là sự thay đổi
xuấthiện gần những cạnh nhọn và có hình dạng giống khối.
Nén theo kiểu 8x8 hình vuông có thể nhìn thấy những lớp vãy trong ảnh.
Kết quả tỉ số nén có thể thay đổi theo yêu cầu trong ước số được sử dụng trong pha
lượng tử hoá. Nén từ 10/1 thường kết quả trong ảnh thì mắt không thể phân biệt so
với nguyên thuỷ. Nén 100/1 thường có thể, nhưng sẽ nhìn vào dụng cụ riêng để so sánh
với nguyên thuỷ. Giới hạn sắp xỉ của sự nén phụ thuộc vào việc sử dụng nơi ảnh được đặt.
2.3 Giải mã JPEG
Giải mã để hiển thị ảnh bao gồm những công việc ngược lại ở trên.
Lấy ma trận hệ số DCT( sau khi cộng hệ số DC khác)
Và nhân nó với ma trận lượng tử hoá từ kết quả ở trên
GV hướng dẫn: Nguyễn Thị Loan SV thực hiện: Vương Thị Thúy
Trường ĐH Công Nghệ GT Báo Cáo Thực Tập Chuyên Ngành
Nó gần giống với ma trận hệ số DCT nguyên thuỷ cho nữa trên phía trái. Lấy nghịch đảo
DCT (DCT loại III) kết quả trong ảnh với các giá trị (vẫn dịch xuống 128)

Chú ý có sự khác nhau rất ít giữa ảnh nguyên thuỷ và ảnh giảm nén, có thể nhìn rõ ở góc
dưới phía bên trái.
GV hướng dẫn: Nguyễn Thị Loan SV thực hiện: Vương Thị Thúy
Trường ĐH Công Nghệ GT Báo Cáo Thực Tập Chuyên Ngành
Đây là những ảnh nhỏ không bị nén và có thể so sánh với ảnh nhỏ nguyên thuỷ, bằng
cách lấy kết quả khác nhau trong những giá trị sai số với trị tuyệt đối trung bình của sai số
khoảng 5/pixel.
2.4 So sánh JPEG với các chuẩn nén ảnh khác JPEG
Chuẩn này thường được áp dụng cho các hình chụp, nhưng khi xuất bạn nên chọn chất
lượng High, thông số 60 (Đừng tham chọn cao quá 80 hay 100, mặc dù nhìn có vẻ đẹp nhưng
khi tải lên web, sẽ rất lâu. Và cũng đừng chọn thông số 30 hay 15, hình sẽ vỡ hết!).
GIF Dạng này cho ra kích thước nhỏ đến tuyệt vời, thích hợp cho các dạng hình minh
hoạ, bảng biểu hay các hình chụp đen trắng. Đối với các hình chụp màu, file Gif thường tạo ra
GV hướng dẫn: Nguyễn Thị Loan SV thực hiện: Vương Thị Thúy
Trường ĐH Công Nghệ GT Báo Cáo Thực Tập Chuyên Ngành
các hạt li ti trên hình, trông không bắt mắt lắm (nếu cố tình, có thể lợi dụng tính chất này để
tạo hiệu ứng cho ảnh).
Gif động: Dựa vào nguyên lý tạo ảnh động của phim hoạt hình, khi nhìn trên màn hình
bạn thấy ảnh chuyển động, nhưng đấy chẳng qua là sự sắp xếp rất “ăn khớp” của các
frame ảnh tĩnh lần lượt được thay thế nhau và hiển thị. Tốc độ thay thế này xảy ra rất nhanh
nên mắt thường không phân biệt được (cũng giống như việc xem một đoạn phim quay tay ở
thế kỷ trước vậy).
File Gif còn có một kiểu khác lợi hại hơn: Gif có nền trong suốt - kiểu file này rất lợi hại
cho việc trình bày các trang web đòi hỏi tính mỹ thuật cao. Cách làm rất dễ, hầu như bất kỳ
ứng dụng đồ hoạ nào cũng cho phép chọn chức năng Transparency trước lúc xuất.
BMP, TIF: Dùng hai chuẩn này đưa lên trang web theo lý vẫn không có gì sai
nhưng thường thì chỉđể dùng cho người khác download thôi (hình giữ được chất lượng cao).
WMF Dạng file này chỉ áp dụng cho các dạng ảnh vectơ, chúng được xuất ra từ các
chươngtrình đồ hoạ vẽ minh hoạ như CorelDraw, Freehand, AI. Bởi vì các trình duyệt nhìn
các dạng file nguyên thể cdr, fh, ai, eps như chúng ta nhìn chữ cổ Ai Cập vậy (điếc luôn), do

đó mới bày ra cái dạng WMF này.
SWF Dạng này hơi cao cấp, thường dùng để trình bày các banner quảng cáo hay các
đoạn phim đềmô gây ấn tượng, chúng thường được tạo ra từ chương trình Flash hay Swish.
Cách thực hiện tượng đối phức tạp và trình duyệt phải có cài bộ lọc hỗ trợ Flash hay Flash
Player mới có thể xem được chúng.
PNG
Ảnh PNG này được tạo ra từ Fireworks, nếu dùng Photoshop mở thì chỉ thấy có một lớp
background, nhưng với Fireworks thì bạn sẽ thấy có nhiều lớp và tiếp tục sửa được.
Chuẩn này cho chất lượng cao hơn Gif, đẹp ngang bằng JPEG nhưng có lợi thế là cho
kích thước nhỏ hơn JPEG. Chúng tôi đã thử dùng Photoshop xuất một tập tin ảnh có kích
thước 300x50 pixel, độ phân giải 72 dpi ra ba chuẩn .GIF, .JPG, .PNG thì kết quả như sau:
GIF:1, 12kb, JPG: 3,32kb, PNG: 2,11kb. Thực chất, dạng file PNG là chuẩn do chương trình
Macromedia Fireworks tạo ra, lợi hại của chương trình này là dù khi tạo ra file ảnh có nhiều
GV hướng dẫn: Nguyễn Thị Loan SV thực hiện: Vương Thị Thúy
Trường ĐH Công Nghệ GT Báo Cáo Thực Tập Chuyên Ngành
lớp,còn nguyên font chữ, đưa lên web đọc không có vấn đề gì, nhưng lúc cần có thể lôi trở lại
edit tiếp. Trong khi đó, nếu dùng Photoshop mở thì bạn vẫn đọc được nhưng đó là một tấm
ảnh chết, không làm gì được.
Trong trường hợp này, thường phải dùng cắt nhỏ chúng thành từng mảnh rồi ghép lại,
nhìn trang màn hình thì không thấy gì, nhưng nếu để ý lúc trang web load lên sẽ rõ, chúng sẽ
chia nhỏ ra để hiển thị từng phần, nhờ vậy sẽ khiến người xem đỡ chán hơn.
Tóm lại, có hai chuẩn được dùng nhiều nhất trên internet là .GIF và .JPEG
GV hướng dẫn: Nguyễn Thị Loan SV thực hiện: Vương Thị Thúy
Trường ĐH Công Nghệ GT Báo Cáo Thực Tập Chuyên Ngành
CHƯƠNG 3
CHUẨN MỞ RỘNG JPEG 2000
3.1 Giới thiệu:
Ảnh số hóa ngày càng thân thuộc với người dùng và yêu cầu chất lượng ngày càng tăng
lên, vì vậy các vấn đề xử lý ảnh cũng tăng theo. Nén hình ảnh không chỉ là làm giảm dung
lượng lưu trữ và các yêu cầu băng thông, mà còn cho để nguyên phép tách, ghép để sắp xếp

xử lý và đáp ứng các mục tiêu trên các ứng dụng và thiết bị cụ thể. Hệ thống nén JPEG-2000
có tỉ lệ xuyên âm thấp hơn hẳn các chuẩn công nghệ JPEG truyền thống, cho dù JPEG-2000
không phải là một chuẩn mới hoàn toàn mà được phát triển từ các tiêu chuẩn đã có.
Điều quan trọng hơn, nó cho phép tách các phân giải khác nhau, các điểm ảnh, các miền
quan tâm, các thành phần và hơn nữa, tất cả chúng được đưa vào một dòng bit nén đơn. Nó
cho phép một ứng dụng xử lý hoặc truyền các thông tin cần thiết cho bất kỳ một thiết bị nào,
từmột ảnh nguồn đã được mã hóa theo chuẩn JPEG-2000. Tính tương thích này là một trong
những ưu điểm nổi trội mà các kỹ thuật xử lý JPEG truyền thống gặp rất nhiều khó khăn.
3.2 Cấu trúc mã hóa cơ bản sử dụng trong JPEG-2000:
Không giống như tiêu chuẩn JPEG truyền thống, kỹ thuật mã hóa dựa trên biến đổi
cosin rời rạc (DCT – Discrete Cosin Tranform) dùng mã hóa Huffman, JPEG-2000 sử kỹ
thuật mã hóa dạng sóng rời rạc (DWT – Descrete Wavelet Transform) dùng mã số học.
Sửdụng DWT cho phép nâng cao độ phân giải tần số mang tính không gian trong thể hiện
biến đổi hình ảnh. Sơ đồ khối của bộ mã hóa và giải mã JPEG-2000 chỉ ra trên hình 1 sau đây.
Sơ đồ khối của JPEG - 2000
GV hướng dẫn: Nguyễn Thị Loan SV thực hiện: Vương Thị Thúy
Trường ĐH Công Nghệ GT Báo Cáo Thực Tập Chuyên Ngành
Các thủ tục mã hóa được tiến hành như sau: ảnh nguồn được phân tích thành một hoặc
nhiều thành phần ( tương ứng với ảnh đen trắng và ảnh màu) và mỗi một thành phần
được phân tích thành các ô chữ nhật không chồng lấn qua một khối xử lý gọi là biến đổi liên
thành phần. Các ô thường có kích thước 512x512 hoặc 256x256 tùy thuộc vào các ảnh gốc.
Nói chung, kíchthước lớn nhất của ô sẽ liên quan tới hiệu quả của thủ tục nén, vì vậy hiện nay
thường chỉ có một ô cho mỗi một thành phần. Tuy nhiên, trong một vài trường hợp khả năng
xử lý và nén ảnh bị giới hạn nên các ô có kích thước nhỏ hơn được đưa vào sử dụng.
Sau đó thuật toán biến đổi rời rạc DWT được áp dụng vào mỗi ô, phân tách hình ảnh vào
một vài mức phân giải. Các mức phân giải tạo ra các phân băng (subband) mà các hệ số trong
đó thể hiện đặc tính tần số của các vùng trong thành phần của ô. Các hệ số của mỗi phân băng
được lượng tử hóa và ghép vào các mảng của các khối mã.
Hình 2 Các thành phần của ô.
Trong JPEG-2000, mỗi thành phần ô được phân tích thành vài mức phân giải và mỗi

mức phân giải gồm 3 phân băng, trừ mức phân giải thấp nhất – có 4 phân băng. Hơn nữa, mỗi
phân băng được phân họach thành một vài khu vực và mỗi khu vực gồm một số khối
mã (code blocks), mỗi khối mã được mã hóa entropy độc lập sử dụng mã hóa số học trong
khối mã hóa. Khối mã hóa số học trong JPEG-2000 là mã hóa nội dung dựa trên bộ mã hóa
MQ, tương tự như phương pháp mã hóa trong tiêu chuẩn JPEG. Đây là một lọai mã hóa số
học nhị phân độc lập với nội dung. Thuật toán này dựa trên chia khỏang xác suất đệ quy của
mã hóa Elias.
GV hướng dẫn: Nguyễn Thị Loan SV thực hiện: Vương Thị Thúy
Trường ĐH Công Nghệ GT Báo Cáo Thực Tập Chuyên Ngành
Thủ tục mã hóa này tiến hành trên một số vùng quan tâm và có chất lượng cao hơn nền.
Sau khi các khối mã được mã hóa, một thủ tục điều khiển tỉ lệ nén dựa trên thuật tóan
(EBCOT – Embeded Block coding with Optimized Truncation) mã hóa khối nhúng với cắt
giảm tối ưu, để tối ưu cả về chất lượng và độ phân giải. Bước cuối cùng là bước gói hóa sẽ
đóng gói các dòng bit vào các gói dữ liệu. Trong bước này, các bit dấu có thể được thêm vào
để cho phép hiệu chỉnh lỗi. Mỗi một dòng mã có một tiêu đề chính tại điểm bắt đầu để mô tả
ảnh gốc và các phương pháp phân tích khác nhau, các kiểu mã hóa đã được sử dụng để định
vị, tách, giải mã và khôi phục cấu trúc ảnh với độ phân giải mong muốn, tính trung thực, vùng
quan tâm và các đặc tính khác.
3.2.1. Biến đổi liên thành phần:
JPEG-2000 hỗ trợ các ảnh đa thành phần và biến đổi liên thành phần chỉ thực hiện trên
các ảnh đó. Hai kiểu biến đổi thành phần được hỗ trợ: biến đổi thành phần thuận nghịch
(RCT) có thể dùng trong nén không tổn thất và nén chấp nhận tổn thất, biến đổi thành phần
không thuận nghịch ICT chỉ được dùng cho nén có tổn thất.
Cả RCT và ICT là các biến đổi decorrelation, chúng được áp dụng vào 3 thành phần
đầutiên để đạt được các sắp xếp màu cho quá trình nén một cách hiệu quả, bằng cách sử dụng
một không gian màu có sự độc lập lớn nhất giữa thông tin không gian và màu sắc tương ứng
với hệ thống nhìn của người. Với các thành phần RGB, RCT có thể nhìn nhận xấp xỉ như biến
đổi YUV.
Trong JPEG-2000 ICT thường biến đổi 3 thành phần đầu tiên từ RGB sang YCrCb. So
sánh với RCT, ICT đạt được sự sắp xếp màu tốt hơn cho quá trình nén hiệu suất cao, và thể

hiện không gian màu hiệu quả hơn tương ứng với HVS để lượng tử hóa. Điểm yếu nhất của
nó là không thể khôi phục lại cấu trúc một cách hoàn hảo, vì vậy nó chỉ được dùng trong nén
có tổn thất.
3.2.2 Biến đổi dạng sóng:
Wavelet là một thể hiện tín hiệu cho các hệ số thông thấp thể hiện các đoạn dữ liệu dài
biến đổi chậm, và các hệ số thông cao thể hiện thay đổi tập trung trong đoạn dữ liệu ngắn. Nó
cung cấp một khung làm việc trong môi trường hợp trên nền tảng ổn định. Trên hình 3. sau
đâyđưa ra ví dụ về một khung làm việc của một biến đổi wavelet một kích thước như sau:
GV hướng dẫn: Nguyễn Thị Loan SV thực hiện: Vương Thị Thúy
Trường ĐH Công Nghệ GT Báo Cáo Thực Tập Chuyên Ngành
Khung làm việc cho biến đổi Wavelet một kích thước
Chúng ta đưa tín hiệu x(n) qua bộ lọc đáp ứng xung hữu hạn FIR (Finite Impulse
Response) được hai mẫu phụ sau khi lọc bị chia 2, để khôi phục lại tín hiệu gốc các hệ số
thông và thông cao sẽ được nhân lên 2 khi tổng hợp. Mặc dù bộ lọc đáp ứng xung vô hạn
(Finite Impulse Response) có thể được sử dụng nhưng các đáp ứng vô hạn sẽ dẫn theo sự
mở rộng dữ liệu vô hạn, và đó là điều chúng ta không mong muốn.
Một kiểu biến đổi wavelet được cải tiến từ mô hình trên gọi là mô hình “convolution”;
Khi đó các tín hiệu được trộn với bank bộ lọc sau đó mới tạo mẫu. Nói cách khác, chỉ một
nửa mẫu được giữ trong khi nửa kia được truyền qua. Rõ ràng là điều này không hiệu quả,
nhưng hướng tiếp cận này dẫn tới một biến đổi wavelet khác được gọi là mô hình “lifting”.
Nó gồm một dãy các điều hành lọc đơn giản xen kẽ các giá trị mẫu chẵn và các giá trị mẫu lẻ,
các giá trị mẫu này được cập nhật bởi giá trị trọng số của mẫu kia. Như vậy, bộ lọc lifting có
mức độ phức tạp trong tính toán thấp hơn bộ lọc “convolution”.
3.2.3 Lượng tử hóa:
Đối với nén JPEG-2000 chấp nhận tổn thất, sự mất mát thông tin xảy ra do 4 phần sau:
biến đổi liên thành phần không thuận nghịch, biến đổi wavelet không thuận nghịch, lượng tử
hóa và chỉ định tỉ lệ nén và tạo gói. Nó có thể coi là một trường hợp đặc biệt của lượng tử hóa.
Tiến trình lượng tử hóa là biến đổi các hệ số wavelet sang số nguyên. Sự mất mát thông tin
trong JPEG truyền thống chủ yếu là do lượng tử hóa vì nó sử dụng lược đồ mã hóa không
nhúng. Trong trường hợp của JPEG-2000 các hệ số lượng tử là các mã nhúng, vì vậy méo có

thể giảm trong các bước mã hóa tiếp theo. Chức năng chính của modul lượng tử là chuyển đổi
các hệ số sang số nguyên để chúng xử lý hiệu quả hơn trong module mã hóa entropy. Chất
lượng mã hóa không xác định bởi kích thước bước lượng tử , mà tại bước phép dòng bit phía
sau đó. Kích thước của bước lượng tử ngầm định là rất nhỏ (delta = 1/128).
Các hệ số lượng tử được phân hoạch vào các gói, mỗi một phân băng được chia thành
các hình chữ nhật không chồng lấn có kích thước bằng nhau. Ba hình chữ nhật tương ứng
với 3 vùng không gian tại 3 hướng phân băng HL, LH và HH của mỗi mức phân giải trong
một gói. Phân hoạch các gói cung cấp chỉ định không gian cũng như nó chứa thông tin cần
thiết để giải mã hình ảnh cho một vùng không gian nhất định với độ phân giải nhất định. Các
GV hướng dẫn: Nguyễn Thị Loan SV thực hiện: Vương Thị Thúy
Trường ĐH Công Nghệ GT Báo Cáo Thực Tập Chuyên Ngành
gói được chia nhỏ thành các khối mã không chồng lấn, nó là các thực thể cơ bản trong điều
hành mã hóa entropy. Do điều hành mã hóa entropy trên các khối mã nhỏ nên các dữ liệu gốc
và dữ liệu xử lý cho toàn bộ các khối mã hóa có thể thường trú trong cache của các CPU xử lý
trong hoạt động mã hóa entropy, vì vậy nó sẽ cải thiện được tốc độ mã hóa và giải mã. Trong
JPEG-2000 kích thước một khối mã là 64x64.
3.2.4 Mã hóa trong EBCOT
Sau tầng lượng tử hóa đến khối mã hóa tier-1. Trong đó sử dụng EBCOT để tạo ra các
dòng bit mềm dẻo chứa các tập con nhúng, mỗi tập con trong đó thể hiện một phương pháp
nén ảnh gốc tại độ phân giải đã suy giảm hoặc sự méo dạng tăng. Ưu điểm mấu chốt là tốc độ
bit hoặc độ phân giải khôi phục lại không cần biết thời gian nén và hình ảnh không cần phải
nén nhiều lần để đạt được tốc độ bit yêu cầu. Thuật toán EBCOT là cấu trúc mã hóa 2 tầng,
tầng thứ nhất nhận các thông tin từ khối mã và xử lý các mẫu thành dòng bit và chuyển sang
tầng thứ hai, bộ mã hóa tại tầng thứ hai thực hiện chỉ định méo tỉ lệ nén PCRD qua các thông
tin nhận được từ bộ mã hóa tầng thứ nhất.
Trong khối mã hóa tier-2 sử dụng một tập mã bit-plane đưa tới từ tier-1, trong khối mã
hóa tier-2 chỉ định PCRD và tạo gói được thực hiện để tạo ra dòng mã cuối cùng. Các thông
tin qua mã hóa được đóng gói thành các đơn vị dữ liệu gọi là “gói” tương ứng với một vài
điều kiện tới hạn. Trong khi JPEG-2000 một gói được nhìn nhận như là một tuple của phân
giải, thành phần, lớp và khu vực. Mỗi một gói gồm hai thành phần: tiêu đề và tải tin. Tiêu đề

chỉ thị phương pháp mã hóa nào được sử dụng trong gói còn tải tin chứa số liệu thực tế của
thông tin. Trong dòng mã, tiêu đề và tải tin có thể xuất hiện đồng thời hoặc độc lập tùy thuộc
vào kiểu mã hóa. Các thứ tự của gói tin trong dòng mã hóa có thể thay đổi tạo thành 5 chuỗi
khác nhau và vì vậy nó cung cấp độ mềm dẻo lớn nhất cho quá trình giải mã.
GV hướng dẫn: Nguyễn Thị Loan SV thực hiện: Vương Thị Thúy
Trường ĐH Công Nghệ GT Báo Cáo Thực Tập Chuyên Ngành
CHƯƠNG 4
CÁC ỨNG DỤNG CỦA JPEG
4.1 Đồ họa – Phim ảnh
JPEG là định dạng nén để lưu trữ ảnh màu và ảnh trắng đen bằng nhiều độ phân giải,
định dạng nén JPEG làm suy giảm nhỏ về chất lượng. Chuẩn nén JPEG là phương pháp nén
ảnh tĩnh với tỉ lệ nén lên đến 20-1 mà không làm mất thông tin đáng kể, mỗi ảnh có 3 kênh
màu (đỏ, lục, lam) với giới hạn 8 bit/kênh. Định dạng nén JPEG được sử dụng trong tất cả
máy ảnh kỹ thuật số có kích thước rất nhỏ nên thường chụp được nhiều ảnh trên một thẻ
nhớ, JPEG dễ hiển thị trên màn hình, ảnh có thể chuyển nhanh qua thư điện tử (dung lượng từ
300KB đến 700KB), ảnh JPEG chất lượng cao có dung lượng khoảng vài MB hay lớn hơn,
khuyết điểm chính của ảnh JPEG là ảnh có chất lượng thấp, ảnh thường bị suy giảm nếu so
với ảnh gốc.
Cùng với JPEG, RAW và TIFF là các định dạng phổ biến ở lĩnh vực phim ảnh. JPEG
(Joint Picture Experts Group) Là những file ảnh nén được ứng dụng rất rộng rãi và có hiệu
quả với các loại máy ảnh số compact (máy ảnh gọn nhẹ, máy du lịch) vì các file ảnh này nhỏ
và không đòi hỏi chất lượng ảnhquá cao. Các tệp ảnh ở dạng JPEG (có đuôi là .jpg), có thể
mở được với hầu hết các phần mềm xem và xử lý ảnh. Với chế độ nén trung bình, các tệp ảnh
này vẫn cho những bức ảnh chất lượngkhác tốt. Hầu hết các loại máy ảnh số đều cho phép lưu
ảnh ở định dạng JPEG, thậm chí nhiềumáy ảnh nghiệp dư chỉ có định dạng này mà thôi.
Không có định dạng nào thích hợp và tiện dụng như JPEG vì nó phù hợp với việc chụp nhiều
ảnh, ảnh du lịch, sinh hoạt gia đình, hay ta thường gọi là ảnh dịch vụ. Ngoài ra, với định dạng
JPEG, việc gửi ảnh qua thư điện tử hay đưa ảnh lên mạng trở nên dễ dàng hơn. Với
người cầm máy sáng tác, JPEG cũng là định dạng được khuyên nên dùng vì nó giúp máy xử
lý nhanh, tốn ít chỗ và nếu biết cách xử lý trên vi tính thì chất lượng ảnh cũng dễ đạt yêu cầu

cho triển lãm hoặc dự thi.
Trong lĩnh vực đồ họa, JPEG không thích hợp lắm vì file ảnh bị nén, những đường
thẳng, đặc biệt là những đường viền dễ bị nhòe, nghĩa là xuất hiện lỗi, làm giảm đáng kể chất
lượng của bản vẽ.
Về mặt bản chất, mỗi lần nén JPEG sẽ dấn đến sự hao hụt về thông tin. Nếu ta mở một
file ảnh JPEG để xử lý, rồi tiếp tục lưu lại file, ảnh sẽ được nén lần thứ hai. Nhắc đi nhắc lại
vài lần như thế, chất lượng ảnh sẽ giảm một cách đáng kể. Đó là một việc không nên làm.
Khi chụp ảnh với định dạng JPEG, người ta còn có thể đặt ở nhiều mức độ nén khác
nhau. Độ nén càng cao bao nhiêu, file càng nhỏ bấy nhiêu (càng ít tốn chỗ) và tất nhiên chất
lượng càng giảm và chỉ in ra được những bức ảnh nhỏ bấy nhiêu. Ngược lại, độ nén càng
GV hướng dẫn: Nguyễn Thị Loan SV thực hiện: Vương Thị Thúy
Trường ĐH Công Nghệ GT Báo Cáo Thực Tập Chuyên Ngành
thấp, file ảnh càng lớn, in ra được ảnh to hơn. Ví dụ, với máy có 5 triệu điểm ảnh chưa nén có
khoảng 15MB, nén ở mức độ trung bình còn 1,5 MB, vẫn còn có thể in được ảnh thông
thường 10 x 15cm với chất lượng khá tốt. Mức nén của JPEG cho chất lượng tốt nhất thường
được biểu thị bằng "superfine", thấp hơn là "fine", mức trung bình là "normal" hoặc
"standard".
TIFF (Tagged Image File Format): Một số máy ảnh kỹ thuật số loại đắt tiền, cho phép
chụp ảnh với định dạng TIFF (có đuôi file là .tif), cho ta nhiều thông tin về ảnh
hơn JPEG. Hiện nay người ta chỉ ứng dụng định dạng TIFF không nén. Định dạng TIFF có
thể biểu thị được độ sau màu lớn hơn JPEG, nó hỗ trợ đến 48 bit màu, nghĩa là mỗi kênh màu
16 bit (trong không gian RGB). Vì thế, định dạng TIFF có thểtái hiện đến 281 triệu giá trị
màu sắc. Song hầu hết các máy ảnh kỹ thuật số chỉ hỗ trợ đến 24 bit màu, nghĩa là mỗi kênh
màu cơ bản chỉ có 8 bit vì đa số các phần mềm xử lý ảnh không hỗ trợ cao hơn. Do các file
TIFF không nén nên mỗi lần nhớ lại dưới dạng định dạng này (trong quá trình chỉnh sửa),
lượng thông tin hầy như không thay đổi, chất lượng ảnh không bị suy giảm.
Định dạng TIFF có một nhược điểm đáng kể đó là trọng lượng tin học quá cao so với
JPEG. Ví dụ, chụp một bức ảnh với máy ảnh chuyên nghiệp có 8 triệu điểm ảnh, bằng định
dạng JPEG ở mức độ nén ít nhất sẽ có file ảnh vào khoảng 5 MB, cũng file ảnh này ở định
dạng TIFFlà 23 MB. Do vậy các quá trình từ chụp đến nạp vào card, chụp liên tục, xem lại

ảnh sau khi chụp sẽ chậm nhiều so với chụp ở định dạng JPEG. Vì thế, việc chụp ảnh ở định
dạng TIFF làviệc không nên làm. Trên thực tế, nếu chụp ảnh với định dạng JPEG ở mức độ
nén ít nhất, về mặt chất lượng, cũng không thua kém TIFF là bao nhiêu và gần như ta không
nhận biết được sự chênh lệch đó.
RAW: Các máy ảnh chuyên nghiệp thường cho phép chụp ảnh với định dạng RAW.
Không phải máy sẽ chụp ra các file có đuôi là "raw" mà là RAW của máy, mỗi hãng sản xuất
cho ra một loại file RAW khác nhau và từ đó cũng có đuôi khác nhau. Ví dụ, RAW của Sony
đuôi là SRF, của Kodak là DCR, Canon là CRW hoặc CR2, Minolta là MRW, Nikon là
NEF và chỉ có các phần mềm của hãng đó mới mở được file RAW của mình. Không những
thế, các hãng sản xuất lại hay thay đổi, cải tiến các file RAW của mình nên đôi khi các phần
mềm cũ lại trở nên lỗi thời với các file RAW thế hệ mới của chính mình.
Các file RAW chứa dữ liệu "thô" mà bộ cảm biến (CCD) và sau đó là bộ chuyển đổi
(converter) từ analog sang digital đã thực hiện được, với toàn bộ số lượng thông tin về ảnh mà
ống kính và máy có thể đạt được, và đương nhiên là không nén. Mọi xử lý tín hiệu như cân
bằng trắng, làm tăng độ nét, thay đổi độ tương phản hay cân bằng màu đều chỉ được thực hiện
sau đó trên máy tính. Nếu các dữ liệu này được chuyển sang định dạng JPEG hoặc TIFF để có
GV hướng dẫn: Nguyễn Thị Loan SV thực hiện: Vương Thị Thúy
Trường ĐH Công Nghệ GT Báo Cáo Thực Tập Chuyên Ngành
cân bằng trắng hoặc độ tương phản thích hợp thì sẽ dẫn đến sự hao hụt về dữ liệu so với file
RAW trước đó.
RAW có ưu điểm hơn TIFF ở chỗ cho chất lượng ảnh cao hơn vì nó có thể chuyển tải
được toàn bộ thông tin về ảnh mà máy ảnh có thể thu nhận được và chiếm ít chỗ hơn do vấn
đề nội suy màu. Mỗi bức ảnh trong môi trường màu RGB chứa đựng 3 giá trị màu sắc là đỏ,
lục, lam. Trong RAW, mỗi điểm ảnh chỉ biểu trưng cho một màu vì ở đây, bộ cảm biến CCD
chỉ chuyển đổi được một màu cho mỗi điểm ảnh. Hai màu còn lại sẽ được tính thêm bằng
thuật toán, nghĩa là được nội suy (ngoại trừ bộ cảm biến Foveon CMOS của Sigma).
Như vậy, định dạng RAW là định dạng tốt nhất cho việc xử lý ảnh sau chụp và là công
cụ sắc bén cho các nhà nhiếp ảnh chuyên nghiệp có trình độ cao. Nhưng vì RAW là một file
ảnh thô, lại không được chuẩn hóa, mỗi nhà sản xuất có một loại RAW khác nhau, nên nó
mang lạikhá nhiều phiền phức cho người sử dụng và không phải ai cũng nắm bắt được nó một

cách hoàn hảo. Mặt khác, tuy nhỏ hơn file TIFF, nhưng để lưu trữ, file RAW cũng còn rất lớn.
Ví dụ: cùng một bức ảnh, JPEG ở mức nén trung bình là 3,5 MB; RAW sẽ là 17 MB và
TIFF là 23 MB.
4.2 Một số lĩnh vực khác
Chuẩn JPEG 2000 hiện được sử dụng ở một số thị trường chuyên dụng nhỏ như rạp
chiếu kỹ thuật số, hình ảnh y học, bản đồ hay các hệ thống thông tin địa lý.
GV hướng dẫn: Nguyễn Thị Loan SV thực hiện: Vương Thị Thúy
Trường ĐH Công Nghệ GT Báo Cáo Thực Tập Chuyên Ngành
LỜI NÓI ĐẦU
Cùng với sự phát triển mạnh mẽ của máy tính và sự ra đời của Internet thì việc tìm một
phương pháp nén ảnh để giảm bớt không gian lưu trữ thông tin và truyền thông tin trên mạng
nhanh chóng đang là một yêu cầu cần thiết. Trong những năm gần đây, có rất nhiều các
phương pháp đã và đang được nghiên cứu rộng rãi để thực hiện nén ảnh. Tất cả đều với một
mục đích chung là làm thế nào để biểu diễn một ảnh với ít bit nhất để có thể tối thiểu hoá
dung lượng kênh truyền và không gian lưu trữ trong khi vẫn giữ được tính trung thực của ảnh.
Điều này tương đương với việc biểu diễn ảnh có độ tin cậy cao nhất với tốc độ bit nhỏ nhất.
Ảnh số hóa ngày càng thân thuộc với người dùng và yêu cầu chất lượng ngày càng tăng
lên, vì vậy các vấn đề xử lý ảnh cũng tăng theo. Nén hình ảnh không chỉ là làm giảm dung
lượng lưu trữ và các yêu cầu băng thông, mà còn cho để nguyên phép tách, ghép để sắp xếp
xử lý và đáp ứng các mục tiêu trên các ứng dụng và thiết bị cụ thể. Hệ thống nén JPEG-2000
có tỉ lệ xuyên âm thấp hơn hẳn các chuẩn công nghệ JPEG truyền thống, cho dù JPEG-2000
không phải là một chuẩn mới hoàn toàn mà được phát triển từ các tiêu chuẩn đã có.
GV hướng dẫn: Nguyễn Thị Loan SV thực hiện: Vương Thị Thúy
Trường ĐH Công Nghệ GT Báo Cáo Thực Tập Chuyên Ngành
LỜI KẾT
Mặc dù rất cố gắng để hoàn thành đề tài thực tập, xong thời gian có hạn và
kinh nghiệm kiến thức chưa nhiều nên việc khảo sát thực tế và phân tích thiết kế
còn có nhiều thiếu xót cần được bổ xung. Vì vậy, em mong nhận được ý kiến
đóng góp của thầy cô và bạn bè để đề tài ngày càng hoàn thiện.
Em xin gửi đến thầy cô lời cảm ơn chân thành nhất và đăc biệt cảm ơn cô

Nguyễn Thị Loan đã tận tình chỉ bảo hướng dẫn em hoàn thành đề tài thực tập.


Giảng viên hướng dẫn Sinh viên thực hiện
Nguyễn Thị Loan Vương Thị Thúy
GV hướng dẫn: Nguyễn Thị Loan SV thực hiện: Vương Thị Thúy

×