Tải bản đầy đủ (.pptx) (18 trang)

Phương pháp mã hóa nén dựa trên phép biến đổi (transform coding) và ứng dụng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.76 MB, 18 trang )

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

─────── * ───────

BÀI TẬP LỚN
XỬ LÝ DỮ LIỆU ĐA PHƯƠNG TIỆN
Đề tài 5 : Phương pháp mã hóa nén dựa trên phép biến đổi (Transform Coding) và ứng dụng.

GV hướng dẫn :
SV thực hiện

:

PGS.TS Nguyễn Thị Hoàng Lan
Hoàng Hữu Hợi
Lương Cao Phong
Ngô Hồng Hải
Nguyễn Văn Khỏe

20121772
20122218
20121638
20121926


Phân công công việc



Tìm hiểu chung về phương pháp nén dựa trên phép biến đổi – Lương Cao Phong





Tìm hiểu và phân biệt rõ các đặc điểm của 2 phép biến đổi được dùng các chuẩn nén hiện nay: DCT và DWT – Ngô Hồng Hải



Tìm hiểu thuật toán DCT trong nén ảnh JPEG – Nguyễn Văn Khỏe



Cài đặt thuật thoán DCT trong nén ảnh JPEG và đánh giá thử nghiệm vai trò của DCT trong nén ảnh JPEG – Hoàng Hữu Hợi


Tổng quan về phương pháp nén ảnh



Nén ảnh là một kỹ thuật mã hóa các ảnh số hóa nhằm giảm số lượng các bit dữ liệu cần thiết để biểu diễn ảnh



Mục đích là giảm đi những chi phí trong việc lưu trữ ảnh và chi phí thời gian để truyền ảnh đi xa trong truyền thông nhưng vẫn đảm bảo được chất lượng
của ảnh


Tìm hiểu chung về phương pháp nén ảnh dựa trên phép biến đổi (Transform
Coding)



Một phép biến đổi là một hàm toán học được sử dụng để biến đổi một tập các giá trị này thành một tập các giá trị khác và tạo ra một cách biểu diễn mới cho
cùng một nguồn tin



Sơ đồ chung
Biến đổi thuận

Lượng tử hóaMã hóa


Đặc điểm của phép biến đổi DCT



Đặc điểm của phép biến đổi DCT là tín hiệu hình ảnh trong miền không gian chuyển sang miền tần số thì các thành phần DC
và các thành phần AC mang hầu hết các thông tin chứa trong ảnh gốc. Trong đó, DC là thành phần quan trọng nhất mang độ
chói trung bình của ảnh, thành phần AC chứa các thông tin về chi tiết của ảnh. Sau đó khi qua khối lượng tử hóa, các hệ số ít
quan trọng sẽ bị loại bỏ bớt và chỉ giữ lại một số hệ số đầu tiên gọi là hệ số DCT.



DCT làm giảm độ tương quan không gian của thông tin trong block. Điều này có nghĩa là cho phép biểu diễn thích hợp ở
miền DCT do các hệ số DCT có xu hướng có phần dư thừa ít hơn. Điều này có nghĩa là DCT gói một phần lớn năng lượng tín
hiệu vào các thành phần biến đổi có tần số tương đối thấp để lưu trữ hoặc truyền dẫn, tạo 0 và các giá trị rất thấp đối với
thành phần tần số cao.


Đặc điểm của phép biến đổi DCT




Nhờ đặc tính của hệ thống nhìn của mắt người, các hệ số DCT có thể được mã hóa phù hợp, chỉ các hệ số DCT quan trọng
nhất mới được mã hóa và truyền đi.



DCT thuận kế hợp với DCT nghịch sẽ không bao giờ tổn thất nếu độ dài từ mã của hệ số là 13 đến 14 bít cho tín hiệu video
đầu vào được số hóa bằng các mẫu dài 8 bit. Nếu hệ số được lượng tử hóa bằng 11 bít hoặc ngắn hơn thì nén DCT sẽ có tổn
hao.


Đặc điểm của phép biến đổi DWT



Wavelet là phép biến đổi được sử dụng để phân tích các tín hiệu không ổn định-là những tín hiệu có đáp ứng tần số thay đổi
theo thời gian, và cho biết khi nào thì những tần số đó xuất hiện.



Phép biến đổi Wavelet sử dụng một hàm đơn( sóng mẹ), tất cả các hàm khác có được bằng cách thay đổi kích thước của
hàm( biến đổi tỉ lệ và tịnh tiến hàm đơn, được gọi là các sóng con).



Biến đổi Wavelet dù chỉ làm việc với các tín hiệu một chiều nhưng sau khi biến đổi xong ta thu được một hàm số hai biến
hoặc một tập các cặp giá trị W(a, b) minh họa các thành phần tần số khác nhau của tín hiệu xảy ra tại thời điểm t.



Nguyên lý nén ảnh JPEG

Nguyên lý của phương pháp nén JPEG là:



Cắt hình ảnh thành từng khối nhỏ, phân tích tất cả các dữ liệu về màu sắc, độ sáng mà các khối đó chứa bằng các phương trình ma trận.



Ảnh màu trong không gian RGB (Red, Green, Blue) được chuyển đổi qua hệ YUV. Trong khi thị giác của con người lại rất nhạy cảm với hệ Y, ít nhạy cảm
hơn nhiều với hệ U, V. Hệ thống sẽ nén thành phần Y của ảnh ở mức độ ít hơn nhiều so với U và V.



Dùng biến đổi Cosin rời rạc, sau đó lượng hóa và mã hóa theo phương pháp Huffman.

Khi giải nén ảnh, các bước thực thi sẽ làm ngược lại quá trình nói trên


Các bước trong nén ảnh JPEG



Mã hoá biến đổi DCT

Nguyên tắc chính của phương pháp mã hoá này là biến đổi tập các giá trị pixel của ảnh trong miền không gian sang một tập các giá trị khác trong miền tần số sao
cho các hệ số trong tập giá trị mới này có tương quan giữa các điểm ảnh gần nhau nhỏ hơn.



Các bước trong nén ảnh JPEG



Sơ đồ mã hóa và giải mã dùng biến đổi DCT


Biến đổi DCT



Vì ảnh gốc có kích thước rất lớn cho nên trước khi đưa vào biến đổi DCT, ảnh được phân chia thành các khối vuông, mỗi khối này thường có kích thước 8 x
8 pixel và biểu diễn các mức xám của 64 điểm ảnh, các mức xám này là các số nguyên dương có giá trị từ 0 đến 255. Việc phân khối này sẽ làm giảm được
một phần thời gian tính toán các hệ số chung, mặt khác biến đổi cosin đối với các khối nhỏ sẽ làm tăng độ chính xác khi tính toán với dấu phẩy tĩnh, giảm
thiểu sai số do làm tròn sinh ra.


Biến đổi DCT



Biến đổi DCT là một công đoạn chính trong các phương pháp nén sử dụng biến đổi. 2 công thức ở đây minh hoạ cho 2 phép biến đổi DCT thuận nghịch đối
với mỗi khối ảnh có kích thước 8 x 8. Giá trị x(n1, n2) biểu diễn các mức xám của ảnh trong miền không gian, X(k1, k2) là các hệ số sau biến đổi DCT trong
miền tần số.


Biến đổi DCT




Mỗi khối 64 điểm ảnh sau biến đổi DCT thuận sẽ nhận được 64 hệ số thực DCT (bảng 1). Mỗi hệ số này có chứa một trong 64 thành phần tần số không gian
hai chiều. Hệ số với tần số bằng không theo cả hai hướng (tương ứng với k1 và k2 bằng 0) được gọi là hệ số một chiều DC, hệ số này chính là giá trị trung
bình của 64 điểm ảnh trong khối. 63 hệ số còn lại gọi là các hệ số xoay chiều AC. Hệ số một chiều DC tập trung phần lớn năng lượng của ảnh.


Biến đổi DCT



Các bước của quá trình mã hóa biến đổi DCT đối với 1 khối


Biến đổi DCT



Biến đổi DCT không làm mất thông tin vì DCT là một biến đổi tuyến tính chuyển các giá trị của điểm ảnh từ miền không gian thành các hệ số trong miền
tần số. Nếu biến đổi DCT thuận và nghịch được tính toán với độ chính xác tuyệt đối và nếu các hệ số DCT không phải qua bước lượng tử và mã hoá thì ảnh
thu được sau biến đổi DCT ngược sẽ giống hệt ảnh gốc.


Cài đặt thuật toán DCT trong nén ảnh


Sơ đồ nén và giải nén ảnh


Cài đặt thuật toán DCT trong nén ảnh
Công
   thức biến đổi DCT với block 8x8




Biến đổi DCT thuận



Biến đổi DCT nghịch

Trong đó:
f(j,k) – các mẫu gốc trong khối 8x8 pixel
F(u,v) – các hệ số của khối DCT 8x8
C(u),C(v) =


Đánh giá vài trò của DCT trong nén ảnh



Tách thành phần mang tần số thấp (mang độ chói trung bình của các điểm ảnh) và thành phần mang tần số cao (chứa thông
tin chi tiết của ảnh). Do đó có thể loại bỏ một số thành phần tần số cao không quan trọng. -> giảm độ dư thừa của ảnh.



Ảnh hưởng trực tiếp đến việc cho lại chất lượng ảnh được khôi phục tốt hay xấu trong quá trình lượng tử hóa.



Giảm độ tương quan không gian của thông tin block. DCT gói một phần lớn năng lượng tín hiệu vào các thành phần biến đổi
có tần số tương đối thấp để lưu trữ hoặc truyền dẫn, tạo 0 và các giá trị rất thấp đối với thành phần tần số cao. -> tăng tỷ số

nén.



×