Tải bản đầy đủ (.doc) (4 trang)

Bước đột phá trong kỹ thuật nén hình ảnh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (80.52 KB, 4 trang )

MPEG 4: Bước đột phá trong kỹ thuật nén hình ảnh
Theo AG Tổng hợp

12:56 -
Thứ sáu,
05/01/2007
Cùng với sự phát triển mạnh mẽ của máy tính và sự ra đời của
internet, thì việc tìm ra một phương pháp nén ảnh nhằm giảm bớt
không gian lưu trữ thông tin và truyền thông trên mạng là yêu cầu
cấp thiết.
Các kỹ thuật nén Video đều cố gắng giảm lượng thông tin cần thiết cho một chuỗi
các bức ảnh, mà không làm giảm chất lượng ảnh. Mục đích của nén video là giảm bớt
số bít khi lưu trữ và truyền bằng cách loại bỏ lượng thông tin dư thừa trong từng
frame và dùng kỹ thuật mã hoá để tối thiểu hoá lượng thông tin quan trọng cần lưu
giữ.
Công nghệ nén hình phổ biến hiện nay
Với một thiết bị lưu hình kỹ thuật số thông thường, ảnh sau khi được số hoá sẽ được
nén lại. Quá trình nén sẽ xử lý các dữ liệu trong ảnh để đưa hình ảnh vào một không
gian hẹp hơn như trong thiết bị nhớ kỹ thuật số hoặc qua đường dây điện thoại,..
Với thị trường lưu hình kỹ thuật số hiện nay, các chuẩn nén phổ biến là Motion JPEG
(MJPEG), Wavelet, H.261/ H.263/ H.263+/ H.263++ và MPGE1/ MPGE2/ MPGE4.
Nhìn chung, có hai nhóm tiêu chuẩn chủ yếu: nhóm một gồm định dạng nén MJPEG
và Wavelet; và nhóm hai gồm các định dạng chuẩn còn lại.
Sơ lược nguyên tắc nén ảnh áp dụng ở MJPEG và Wavelet
Tính chất chung của các ảnh số là tương quan giữa các pixel ở cạnh nhau lớn, điều
này dẫn tới dư thừa thông tin để biểu diễn ảnh. Việc dư thừa thông tin dẫn tới việc
mã hoá không tối ưu. Do vậy, ta cần tìm phương án biểu diễn ảnh với tương quan
nhỏ nhất, để giảm thiểu độ dư thừa thông tin của ảnh. Có 2 kiểu dư thừa thông tin
như sau:
- Dư thừa trong miền không gian: là tương quan giữa không gian pixel của ảnh (các
pixel lân cận của ảnh có giá trị gần giống nhau, trừ những pixel ở giáp đường biên


ảnh)
- Dư thừa trong miền tần số: là tương quan giữa những dải màu hoặc các dải phổ
khác nhau.
Trọng tâm của các nghiên cứu về nén ảnh là giảm bớt một số bit để biểu diễn ảnh
bằng việc loại bỏ dư thừa trong miền không gian và miền tần số càng nhiều càng tốt.
Các chuẩn nén MJPEG và Wavelet đều tuân theo nguyên tắc tìm ra các phần tử dư
thừa miền không gian (mỗi Frame nén tự động). Trong khi đó, đặc trưng của các
chuẩn nén thuộc nhóm 2 là loại bỏ dư thừa ở cả miền không gian và miền tần số của
ảnh.
MJPEG là định dạng nén ảnh lâu đời nhất và đã được dùng phổ biến. Khi dùng chuẩn
nén MJPEG, ảnh được phân chia thành các khối vuông ảnh, mỗi khối vuông có kích
thước 8 x 8 pixel và biểu diễn mức sám của 64 điểm ảnh. Mã hoá biến đổi cosin rời
rạc DCT (Discrete Cosin Tranform) trong chuẩn nén này khai thác sự tương đồng
giữa các pixel trong mỗi khối, để lấy ra các biểu diễn ảnh với tương quan nhỏ. Chuỗi
biểu diễn sẽ bị rút ngắn, tuỳ theo mức nén của hệ thống hiện hành với qui trình rút
ngắn chuỗi biểu diễn. Vì vậy, hình ảnh sau khi giải nén thường có nhiều sai lệch so
với ảnh gốc.
ở chuẩn nén Wavelet, thay vì mã hoá theo từng khối 8 x 8, việc thực hiện trên toàn
bộ bề mặt ảnh, một loạt các bộ phận lọc ở khâu chuyển đổi sẽ phân tích các dữ kiện
về từng điểm ảnh và cho ra một tập các hệ số. Do chuẩn Wavelet có tác dụng với
toàn bộ bề mặt ảnh, nên các sai lệch ở ảnh giải nén sẽ khác với MJPEG. Hiệu ứng
ghép mảnh không xảy đến với ảnh được quan sát, nhưng độ phân giải hình ảnh giảm
cũng như một vài vết mờ sẽ xuất hiện.
Các định dạng Wavelet và MJPEG đều gây ra hiện tượng mất thông tin ở ảnh giải
nén. Sự dư thừa khả năng lưu ảnh ở mắt người cảm thụ khi dùng chuẩn nén Wavelet
ít hơn MJPEG 30%.
Sơ lược về chuẩn mã hoá H.26x và MPEGx
MPEG không phải là một công cụ nén đơn lẻ, mà ưu điểm của ảnh nén dùng MPEG là
ở chỗ MPEG có một tập hợp các công cụ mã hoá chuẩn, chúng có thể kết hợp với
nhau một cách linh động để phục vụ cho một loạt các ứng dụng khác nhau. Nguyên

lý chung của nén tín hiệu video là loại bỏ sự dư thừa về không gian (spatial
redunancy) và sự dư thừa về thời gian (temporal redunancy). Trong MPEG, việc loại
bỏ sự dư thừa về thời gian (nén liên ảnh), được thực hiện trước hết nhờ sử dụng tính
chất giữa các ảnh liên tiếp. Chúng ta dùng tính chất này để tạo ra các bức ảnh mới
nhờ vào thông tin từ những bức ảnh gửi trước đó. Do vậy ở phía bộ mã hoá ta chỉ
cần giữ lại những ảnh có sự thay đổi so với ảnh trước, sau đó ta dùng phương pháp
nén về không gian trong những bức ảnh sai khác này. Nói một cách cụ thể, nguyên
lý chung của các chuẩn nén là phỏng đoán trước chuyển động của các frame ở bộ mã
hoá. Mỗi frame ở tại một thời điểm nhất định sẽ có nhiều khả năng giống với các
frame đứng ngay trước và sau đó. Các bộ mã hoá sẽ tiến hành quét lần lượt những
phần nhỏ trong mỗi frame (marco blocks) và phát hiện ra marco block nào không
thay đổi từ frame này tới frame khác. Phía bên thu, tức bộ giải mã đã lưu trữ sẵn
những thông tin không thay đổi từ frame này tới frame khác, chúng được dùng để
điền thêm vào vị trí trống trong ảnh được khôi phục.
Tuy nhiên, do sự tương đồng giữa các frame là rất lớn, nên sự phát hiện ra các sai
lệch là rất khó. Do vậy ảnh khôi phục khó đạt được như ảnh gốc. Điều này đồng
nghĩa với việc chất lượng ảnh cũng tương tự như khi dùng chuẩn Wavelet và MJPEG,
nhưng dung lượng kênh truyền và không gian lưu trữ của các chuẩn nén H.26x và
MPEGx là nhỏ hơn (ví dụ như không gian lưu trữ của chuẩn H.263 nhỏ hơn Motion
JPEG từ 3 tới 5 lần). Sự khác biệt giữa các chuẩn nén này (như ở H.26x và MPEGx)
chủ yếu nằm ở khâu tiên đoán các frame mới và cách thức tính toán sai lệch giữa các
frame hiện tại và frame phỏng đoán. Chuẩn nén H.26x (gồm các thế hệ H.261,
H.262 và H.263...), thường có tốc độ mã hoá tín hiệu thấp hơn MPEGx (khoảng 1.5
Mbit/s với độ phân giải hình 352 x 288) do dùng chủ yếu trong viễn thông. Trong khi
đó, chuẩn MPEG2 dùng cho thị trường giải trí có độ phân giải hình cao hơn, và mang
lại chất lượng hình ảnh tốt (cao hơn 1,5Mb/s với độ phân giải 352x288 hoặc 6Mb/s
cho phân giải hoàn chỉnh).
Sơ lược định dạng nén ảnh MPEG4
So với các chuẩn nén đã nêu ở trên, chuẩn MPEG4 là định dạng nén hình ảnh tiên
tiến nhất, đáp ứng những đòi hỏi về kỹ thuật cũng như phù hợp với nhiều loại thị

trường.
Với nỗ lực không ngừng để đưa ra thị trường sản phẩm ưu việt nhất của ngành công
nghiệp . Máy ghi hình kỹ thuật số chuẩn MPEG4 với bản chất là một thiết bị thu hình
kỹ thuật số có hiệu suất cao, được chọn để đáp ứng nhu cầu cấp thiết của thị trường
về một định dạng nén ảnh hoàn hảo với tính năng nổi trội là, có thể thu được hệ
thống lớn các nguồn hình ảnh.
MPEG4 thực sự là một dạng nén ảnh mang tính đột phá của công nghệ nén hình
đương đại, thể hiện rõ nét ở những tiêu chuẩn sau:
- áp dụng những tiêu chuẩn có tính mở cao với sự hỗ trợ đắc lực từ ngành công
nghiệp an ninh và công nghiệp máy tính.
- Hiệu suất lớn.
- Khả năng truyền theo dòng và mạng lưới.
- Tối thiểu hoá dung lượng kênh truyền và không gian lưu trữ trong khi vẫn giữ được
tính trung thực của ảnh.
Định dạng nén ảnh MPEG4
Chuẩn MPEG4 cung cấp các phân bộ trong kết cấu logic và năng lực giải mã từng
dòng bits riêng rẽ. Một profile là một phân bộ xác định trên toàn bit stream (điều
chỉnh bitstream và bộ phân giải màu) một level sẽ xác định một số tiêu chí bắt buộc
cho tham số của bức ảnh (kích thước ảnh, số lượng bit..).
Những chuẩn nén MPEG4 có profile dạng đơn giản chiếm lĩnh đa phần thị trường.
MPEG4 mà Daicat tư vấn đã được phát triển và hoàn thiện trở thành định dạng nén
hình tiên tiến, hoàn hảo, với tiêu chí tập trung phát triển những nhân tố giúp tăng
cường chất lượng hình ảnh, cũng như phục vụ đắc lực cho các thiết bị giám sát có
các frame dạng chữ nhật. Mỗi bitstream hiển thị trong định dạng nén MPEG4 cung
cấp một mô tả mang tính phân tầng về hình ảnh hiển thị. Từng lớp dữ liệu được đưa
vào bit stream bởi những mật mã đặc biệt gọi là mật mã khởi nguồn.
Mỗi vật thể ảnh có thể được mã hoá dưới dạng đa lớp (scalable) hoặc đơn lớp (non
scalable)
VOL (video object layer) sẽ hỗ trợ quá trình mã hoá đa lớp. Một vật thể ảnh được
mã hoá dưới dạng đa lớp không gian hoặc đa lớp thời gian, đi từ phân giải thô tới

phân giải tinh. Bộ phận giải mã có thể đạt được độ phân giải hình mong muốn, tuỳ
theo những thông số như giải thông tần hiện có, hiệu su t máy và theo mong muốn
của người dùng.
Có hai loại VOL, loại thứ nhất mang đầy đủ chức năng của định dạng nén MPEG4,
loại còn lại với những chức năng được giảm bớt (VOL với header dạng ngăn). Loại
VOL này giúp bitstream tương thích với đường biên ở H.263.
VOP (video object plane)- ảnh đựoc mã hoá độc lập hoặc mã hoá trên cơ sở tham
khảo các ảnh khác qua khâu bù chuyển động ở bộ giải mã. Mỗi frame ảnh thông
thường có thể được biểu diễn bởi một VOP dạng chữ nhật.
Với chuẩn nén MPEG4, có 3 kiểu khác nhau để mã hoá cho khối ảnh.
1 . VOP được mã hoá độc lập. Trong trường hợp này VOP được mã hoá gọi là Intra
VOP (I-VOP).
2. VOP được tiên đoán qua kỹ thuật bù chuyển động nhờ một VOP khác đã được tiên
đoán trước đó. Đó là loại P-VOP (Predicted VOP).
3. VOP được tiên đoán dựa trên các VOP trước và sau nó thuộc dạng B-VOP ( Bi -
directiional Interpolated VOP).
B-VOP được thêm vào dựa trên I-VOP và P-VOP. Ngoài việc có thể nâng cao chất
lượng hình ảnh khi dùng, một ưu điểm khác của B-VOP là dùng kỹ thuật đa lớp thời
gian. Với kỹ thuật này, Frame dữ liệu hiển thị được tăng cường. Những lớp tăng
cường đưa thông tin vào giữa các lớp frame.
Định dạng nén ảnh MPEG4 hỗ trợ quá trình lượng tử hoá, do vậy cũng giúp đáp ứng
những đòi hỏi khác nhau về tốc độ bít. Lượng tử hoá đã có ở các chuẩn nén như
H263 và MPEG1, MPEG2. Bộ phận mã hoá ở định dạng nén mà Daicat tư vấn tương
thích với những bộ mã hóa trước đây trong các chuẩn nén

×