Tải bản đầy đủ (.doc) (41 trang)

Kỹ thuật xử lý tín hiệu video

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.14 MB, 41 trang )

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN CÔNG NGHỆ THÔNG TIN – TRUYỀN THÔNG
-oOo-

Báo Cáo
Xử Lý Dữ Liệu Đa Phương Tiện

ĐỀ TÀI : Kỹ Thuật Xử Lý Tín Hiệu Video
Và Mã Dự Đoán Trong Nén Video
Giảng viên hướng dẫn : PGS.Ts Nguyễn Thị Hoàng Lan
Sinh viên thực hiện : Lưu Thanh Tùng - 20093112

Hà Nội, Tháng 5 Năm 2015
1


LỜI NÓI ĐẦU

Truyền thông đa phương tiện là việc ứng dụng công nghệ thông tin trong
việc sáng tạo, thiết kế những sản phẩm mang tính đa phương tiện và
tương tác ứng dụng trong các lĩnh vực truyền thông, quảng cáo, giáo dục
và giải trí… Như vậy vai trò của truyền đông đa phương tiện có thể thấy là
rất rõ ràng và không thể phủ nhận được. Nhiều khía cạnh của truyền
thông được khai thác và ứng dụng, một trong số đó là các kỹ thuật xử lý
và nén video. Vấn đề đặt ra là nén là gì, tại sao cần nén và các kỹ thuật
nén được thực hiện như thế nào. Hiện nay có rất nhiều phương pháp nén
video và nhóm 9 chúng em chọn đề tài: “Các kỹ thuật xử lý tín hiệu
video và mã hóa dự đoán trong nén video”. Đề tài được chia là 2 phần
chính:
Tín hiệu video tương tự và tín hiệu video số
Các kỹ thuật xử lý tín hiệu video trong truyền


thông
Tìm hiểu chung về phương pháp mã hóa dự
đoán. Phân tích các phương pháp nén video dựa
trên phép biến đổi ảnh với đánh giá ước lượng
và bù chuyển động
Em xin chân thành cám ơn sự giúp đỡ tận tình của PGS/TS: Nguyễn Thị Hoàng Lan
để em hoàn thành đề tài này. Trong quá trình thực hiện báo cáo em không thể tránh
khỏi những thiếu sót, do đó rất mong nhận được sự đóng ghóp ý kiến của cô và các
bạn để em hoàn thiện hơn về kiến thức trong đề tài này.
Xin chân thành cám ơn!

2


MỤC LỤC
LỜI NÓI ĐẦU.......................................................................................................2
MỤC LỤC.............................................................................................................. 3
I. Tín hiệu video tương tự và tín hiệu video số...................................................4
1.1. Khái niệm video:.........................................................................................4
1.2. Tín hiệu video tương tự:.............................................................................4
1.2.1. Tín hiệu video tương tự............................................................................4
1.2.2. Các chuẩn video tương tự :.......................................................................6
1.3. Tín hiệu video số:........................................................................................6
1.3.1. Tín hiệu video số:.....................................................................................6
1.3.2. Các chuẩn video số:..................................................................................7
II. Kỹ thuật xử lý tín hiệu video trong truyền thông..........................................8
Phần 2: Nén video và phương pháp mã hóa dự đoán.......................................12

3



Phần 1: Kỹ thuật xử lý tín hiệu video trong
truyền thông
I. Tín hiệu video tương tự và tín hiệu video số
1.1. Khái niệm video:
Video là chuỗi các frame ảnh (khung hình) tượng trưng cho thông tin hình
ảnh. Đó là một chuỗi các frame truyền liên tục theo thời gian.
S = f(x,y,t)
Trong đó: x,y ϵ R: là tọa độ của điểm ảnh (thông tin về không gian)
t ϵ R: thông tin về thời gian.
Dựa trên công thức trên ta thấy ảnh tĩnh là một trường hợp đặc biệt của
video. Khi đó nó là một chuỗi các ảnh không thay đổi theo thời gian.
f(x,y,t1) = f(x,y,t2);
với mọi t1, t2 ϵ R, với mọi x, y ϵ R
Video thường được thu, lưu trữ, và chuyển đổi ở dạng tuần tự (analog) nên
chúng ta bắt đầu từ video tuần tự.
1.2. Tín hiệu video tương tự:
1.2.1. Tín hiệu video tương tự

Tín hiệu video tuần tự được xem như là tín hiệu điện 1 chiều theo thời gian
f(t) và được lấy mẫu theo chiều dọc.
Việc lấy mẫu theo chu kỳ này được gọi là quét (scanning). Các phương pháp
quét thường được sử dụng nhất là quét liên tục (progressive scanning) và
quét xen kẽ (interlace scanning)
Quét liên tục(progressive scanning)

4


Quét liên tục. Các dòng bắt đầu quét từ A đến B, tiếp tục đến C và cứ thế

cho đến D rồi quay trở lại A.
Mỗi ảnh(frame) là dữ liệu được lấy mẫu theo thời gian.
Mỗi ảnh này được quét liên tục từng dòng ngang và từ trên xuống dưới với
tốc độ là ∆t giây
Phương pháp này thường dùng trong công nghiệp máy tính với tốc độ ∆t =
1/72 giây.
Quét xen kẽ

Quét xen kẽ. Dòng quét bắt đầu từ A đến B, chuyển qua C và tiếp tục cho
đến khi tới D sẽ trở về E và tiếp tục quét đến F.
Vì mắt người phát hiện ra hình ảnh chớp khi tần số quét dưới 50Hz nên tần
số quét của máy bao giờ cũng phải lớn hơn 50 Hz. Tuy nhiên, khi áp dụng
trong các nhành công nghiệp khác thì gặp khó khăn về vấn đề băng thông do
kích thước qua lớn. Từ đó, xuất hiện phương pháp quét xen kẽ. Phương pháp
này chia dòng quét thành dòng chẵn và dòng lẻ (hay gọi là field) và quét các
dòng chẵn trong khoảng thời gian ∆t rồi chuyển qua quét các dòng lẻ. Vì thế
tần số quét sẽ giảm đi một nửa.
Một vài thông số quan trọng của tín hiệu video là :
5


• Độ phân giải theo chiều dọc (vertical resolution): thông số này có liên
quan đến số dòng quét trên 1 frame.
• Tỉ lệ co (aspec ratio): tỉ lệ giữa chiều rộng và chiều cao của frame.
1.2.2. Các chuẩn video tương tự :

Compoment Analog Video : chuẩn video này sử dụng các thành phần
màu RGB hoặc là YcrCb (YIQ hoặc YUV).
Composite Video :
• NTSC (National Television Standards Committee): hiện tại được sử

dụng ở Bác Mỹ và Nhật. Có 262,5 dòng trên 1 field hay 525 dòng trên
1 frame, 60 frames/s.
• PAL (Phase Alternating Line) và SECAM (Sequential Color And
Memory): được sử dụng ở Châu Âu và Việt Nam. Các thông số kỹ
thuật: 625 lines, 50 frames/s.
1.3. Tín hiệu video số:
1.3.1. Tín hiệu video số:

Tín hiệu video số được lưu trữ dưới dạng số. Do đó chúng được lấy
mẫu và lượng tử hóa. Tín hiệu video số là một thông tin 3 chiều gồm 2 chiều
không gian và 1 chiều thời gian hay còn gọi là chuỗi ảnh số với mỗi ảnh số
là một ảnh được lấy mẫu và lượng tử hóa.

6


1.3.2. Các chuẩn video số:

Việc trao đổi giữa các ứng dụng và các sản phẩm video số đã đưa ra các
chuẩn video số. Các chuẩn này bao gồm:
• Chuẩn nén: dùng để trao đổi thông tin trong dạng nén của video.
• Chuẩn các độ phân giải hiển thị: được dùng trong công nghiệp máy
tính.
• Chuẩn studio số: được dùng trong ngành công nghiệp ti vi.
• Chuẩn về giao tiếp mạng được dùng trong công nghiệp truyền thông.

Digital Video Studio Standards
Các chuẩn về ảnh và video số nén:

7



II. Kỹ thuật xử lý tín hiệu video trong truyền thông
Các phương pháp sử dụng:
• Phương pháp phổ biến: điều chế xung mã (PCM)
• Ngoài ra còn có: Điều chế xung mã vi sai (DPCM)
Điều chế xung mã vi sai thích ứng (ADPCM)
Điều chế Delta (DM)
Quá trình chuyển đổi tín hiệu tương tự thành tín hiệu số gọi là quá trình
chuyển đổi A/D. Quá trình này được đặc trưng bởi 3 bước: lấy mẫu, lượng
tử hóa và mã hóa.
Quá trình chuyển đổi tín hiệu số thành tín hiệu tương tự gọi là quá trình
chuyển đổi D/A. Quá trình này được đặc trưng bởi 2 bước: giải mã và lọc.

Điều chế xung mã (PCM)
Hệ thống PCM sử dụng sơ đồ ở trên để thực hiện chuyển đổi tín hiệu
tương tự sang tín hiệu số và ngược lại như sau:

Sơ đồ quá trình chuyển đổi A/D và D/A của Hệ thống PCM

2.1 Quá trình chuyển đổi A/D
a. Lấy mẫu
Lấy mẫu là quá trình rời rạc hóa tín hiệu theo thời gian. Đây là quá
trình chuyển đổi tín hiệu tương tự thành dãy các xung lấy mẫu (tín hiệu
điều biên xung PAM). Chu kì của dãy xung lấy mẫu được xác định theo
định lý Nyquist như sau:

là tần số lớn nhất của tín hiệu tương tự

8



Lấy mẫu tín hiệu tương tự

b. Lượng tử hóa
Lượng tử hóa là làm tròn biên độ xung lấy mẫu tới mức lượng tử gần
nhất  mã hóa giá trị mỗi xung lấy mẫu thành 1 từ mã có số lượng bit ít
nhất.
• Lượng tử hóa đều
Lượng tử hóa đều là chia biên độ các xung lấy mẫu thành các
khoảng đều nhau, mỗi khoảng là 1 bước sóng lượng tử đều .

Lượng tử hóa đều

Các mức chia trên biên độ gọi là các mức lượng tử Q. Mối quan
hệ giữa mức lượng tử Q, độ biến thiên biên độ tín hiệu tương tự (a,a) và

được biểu diễn qua CT sau:

9


Sau đó cần làm tròn biên độ các xung lấy mẫu tới các mức
lượng tử gần nhất để nhận được xung lượng tử  méo lượng tử
Biên độ xung méo lượng tử nằm trong giới hạn

công suất méo lượng tử

được xác định theo CT sau:


a: biên độ tín hiệu tương tự
: xác suất phân bố giá trị tức thời của biên độ xung lấy mẫu
trong 1 bước lượng tử

 Công suất méo tín hiệu chỉ phụ thuộc

mà không phụ thuộc

vào biên độ tín hiệu, do đó lượng tử hóa đều sẽ làm giảm chất
lượng tín hiệu tại đầu thu. Vì vậy trong hệ thống PCM chỉ dử dụng
lượng tử hóa không đều.
• Lượng tử hóa không đều
Lượng tử hóa không đều là chia biên độ xung lấy mẫu thành các
khoảng không đều theo nguyên tắc khi biên độ xung lấy mẫu càng
lớn thì độ dài bước lượng tử càng lớn.

Lượng tử hóa không đều

c. Mã hóa

• Đặc tính biên độ của bộ mã hóa – nén số

10


Mã hóa là chuyển đổi biên độ xung lượng tử thành một từ mã 8 bit,
giúp đáp ứng tối ưu tốc độ truyền tin trên kênh truyền.
Để thực hiện được điều đó cần sử dụng bộ mã hóa – nén số có đặc
tính biên độ dạng lôgarit. Biểu thức toán học của bộ mã hóa – nén số
như sau:


Trong đó:
A = 87,6 đặc trưng cho mức độ nén


Nhánh dương đường đặc tính biên độ của bộ mã hóa – nén sốA=87,6/13

• Hoạt động của bộ mã hóa – nén số

2.2 Quá trình chuyển đổi D/A
Bộ giải mã – dãn số: chuyển đổi mỗi từ mã 8 bit thành xung lượng tử
đã bị nén và sau đó dãn biên độ xung tới giá trị như chưa bị nén. Cần chú ý
là đường đặc tuyến bộ giải mã – dãn số phải đối xứng với đường đặc tuyến
bộ mã hóa – nén số để không gây méo khi khôi phục tín hiệu

11


Đường đặc tuyến của bộ nén và dãn số analog

Bộ lọc thông thấp: khôi phục lại tín hiệu tương tự nhờ nội suy giữa
các mẫu kế tiếp nhau với tần số cắt 3,4 kHz từ các dãy xung lượng tử của bộ
giải mã – dãn số.

Phần 2: Nén video và phương pháp mã hóa
dự đoán
I. Giới thiệu về nén video

12



Nén là quá trình trong đó lượng số liệu biểu diễn lượng thông tin của một
ảnh hoặc nhiều ảnh được giảm bớt bằng cách loại bỏ những số liệu dư thừa
trong tín hiệu video.

I.1. Dư thừa thông tin trong tín hiệu Video






Dư thừa không gian giữa các pixel
Dư thừa thời gian giữa các ảnh liên tiếp nhau
Dư thừa thành phần màu biểu diễn
Dư thừa thống kê các kí hiệu trong dòng bit truyền
Dư thừa tâm lí thị giác con người (vượt quá khả năng cảm nhận
của hệ thống thị giác)

I.2. Mục tiêu của nén tín hiệu Video
 Giảm tốc độ dòng bit của tín hiệu gốc xuống một giá trị nhất định,
đủ để có thể tái tạo ảnh khi giải nén
 Giảm dung lượng dữ liệu trong lưu trữ cũng như giảm băng thông
truyền dẫn cần thiết
 Tiết kiệm chi phí trong lưu trữ và truyền dẫn dữ liệu trong khi vẫn
duy trì chất lượng ảnh ở mức chấp nhận được

II. Chỉ tiêu nén tín hiệu video
 Tỷ số nén
 Tỷ số nén dung lượng lưu trữ


 Tỷ số nén dung lượng ảnh

 Tỷ số nén tốc độ dòng bit (bit/s)

 Chất lượng nén
 Nén không mất mát thông tin
 Nén có mất mát thông tin (dựa trên sai số MSE, SNR)

 Độ phức tạp
 Yêu cầu về thời gian: nén thời gian thực hay nén không thời
gian thực
 Yêu cầu về không gian, bộ nhớ,...
13


III. Mô hình nén video
Hệ thống nén ảnh video bao gồm 3 thành phần cơ bản như sau:

Mô hình hệ thống nén

Trong đó:
• Biểu diễn thuận lợi: tín hiệu được trình bày dưới dạng thuận tiện
để nén có hiệu quả cao nhất
• Lượng tử hóa: truyền tín hiệu video số qua một kênh số bằng cách
những thông tin biểu diễn được lượng tử hóa thành một số hữu
hạn các mức.
• Gán các từ mã: các từ mã là một chuỗi bit dùng để biểu diễn các
mức lượng tử hóa.
Các quá trình trên sẽ được thực hiện ngược lại sau khi xử lí kênh truyền

cho tín hiệu video.
Mỗi hoạt động cố gắng loại bỏ phần tử dư thừa trong tín hiệu video và
tận dụng sự giới hạn hệ thống nhìn của mắt người. Nhờ đó các phần tử dư
thừa, các thông tin giống nhau hoặc có liên quan với nhau sẽ không được
truyền đi.

IV.

Phương pháp nén video

Có nhiều kĩ thuật nén mất mát thông tin và không mất thông tin đã được
phát triển trong nhiều năm qua nhưng chỉ có một số ít có thể áp dụng cho
nén tín hiệu video số. Một trong số đó là các kĩ thuật nén được sử dụng để
tạo thành các tín hiệu nén JPEG (Joint Photographic Export Group) và
MPEG (Moving Picture Export Group).

14


Sự phối hợp các kĩ thuật trong JPEG và MPEG

a) Nén không mất mát thông tin
Nén không mất mát thông tin cho phép phục hồi lại đúng tín hiệu ban đầu
sau khi giải nén. Các kĩ thuật nén không mất mát thông tin bao gồm:





Mã hóa với độ dài thay đổi (VLC)

Mã hóa với độ dài rộng (RLC)
Sử dụng khoảng xóa frame và vòng
Biến đổi cosin rời rạc (DCT)

b) Nén có mất mát thông tin
Nén có mất mát thông tin chấp nhận tổn hao một ít thông tin để gia tăng
hiệu quả nén , rất thích hợp với nguồn thông tin là hình ảnh và âm thanh. Nó
cho tỉ lệ nén ảnh cao để có thể truyền dẫn phát sóng. Đồng thời cho một tỉ lệ
nén thích hợp vào mục đích xử lí và lưu trữ trong studio
Nén tổn hao được thực hiện qua 3 bước liên tục:
• Bước 1: biến đổi tín hiệu từ miền thời gian (không gian) sang miền
tần số bằng cách sử dụng các thuật toán chuyển vị như biến đổi
15


cosin rời rạc DCT...bước này thực hiện việc giảm độ dư thừa pixel
trong ảnh và quá trình này không gây tổn hao.
• Bước 2: lượng tử hóa các hệ số DCT, việc mất mát dữ liệu có thể
xảy ra ở giai đoạn này.
• Bước 3: nén dữ liệu đã biến đổi bằng cách mã hóa Entropy, mã
hóa không tổn hao như mã Huffman, RLC,...Do vậy các kĩ thuật
nén có mất mát thông tin được sử dụng gồm:
 Mã RLC (Run Length Coding)
 Mã hóa Shannon – Fano
 Mã hóa Huffman
 Phương pháp mã dự đoán

V. Phương pháp mã dự đoán
V.1.1. Giới thiệu
Phương pháp mã dự đoán hay còn gọi là điều xung mã vi sai (DPCM –

Differental Pulse Code Modulation) không mã hóa thông tin có biên độ ở
mỗi mẫu, mà chỉ mã hóa thông tin có biên độ vi sai (biên độ chênh lệch)
giữa mẫu đã cho và trị dự báo (được tạo từ các mẫu trước đó). Ngoài ra
DPCM còn dựa vào đặc điểm của mắt người, cho phép dùng đặc trưng phi
tuyến về lượng tử hóa.
Mã hóa DPCM

Sơ đồ khối mã hóa DPCM
16


V: tín hiệu màu, V’=e+P: tín hiệu tạo lại
e=V-P (P là hệ số dự đoán);

: sai số dự đoán

Trong đó:
 Bộ dự đoán: tính toán dự đoán ra các mẫu tín hiệu theo mẫu tại
thời điểm trước (tín hiệu tham chiếu)
 Sai số dự đoán: sai khác giữa tín hiệu dự đoán với tín hiệu được
truyền đến. Sai số dự đoán được dùng để giải mã đảm bảo không
mất mát thông tin.
 Bộ mã hóa Entropy: mã hóa các sai số dự đoán theo mã hóa
Entropy như mã hóa Huffman,...
Giải mã DPCM

Sơ đồ khối giải mã DPCM

Nhằm tránh các lỗi có thể xuất hiện trong khi truyền, một mẫu đầy đủ
được gửi đi theo chu kì nhất định, cho phép cập nhật được các giá trị chính

xác.
Như vậy có thể thấy rằng thay vì truyền đi toàn bộ thông tin của các mẫu,
ta chỉ truyền đi sự sai lệch giữa các mẫu. Điều này cho phép đạt được hiệu
quả nén cao hơn nhiều so với việc mã hóa và truyền đi giá trị của từng mẫu
riêng biệt.

17


V.1.2. Mã hóa dự đoán trong nén tín hiệu video
a) Mã hóa dự đoán trong Intraframe video
Đây là kỹ thuật nén giảm độ dư thừa không gian. Nén về không gian dựa
trên nguyên tắc là phát hiện sự tương quan của các điểm ảnh (pixels) lân cận
nhau (Intra-frame coding techniques), ảnh được mã hoá một cách độc lập mà
không cần tham khảo tới các ảnh khác. Hiệu quả nén tín hiệu đạt được do
loại bỏ sự thừa về không gian mà không có yếu tố thời gian tham gia vào
quá trình. JPEG chỉ áp dụng phương pháp nén theo không gian vì nó được
thiết kế để xử lý và truyền các ảnh tĩnh. Tuy nhiên nén tín hiệu theo phương
pháp của JPEG cũng có thể được dùng để nén các bức ảnh một cách độc lập
trongdãy tín hiệu video. ứng dụng này thường được gọi là JPEG động
(Motion JPEG).
Theo đó trong phương pháp này, tín hiệu dự báo trước được tạo từ các
mẫu trong cùng một intraframe, khi đó các mẫu được biến đổi nằm trên cùng
một dòng quét (mã giữa các pixel) và cùng với các dòng lân cận (mã giữa
các dòng).
Việc tạo tín hiệu dự báo Intraframe DPCM dựa trên mối liên kết giữa các
điểm ảnh. Do đó khi tạo tín hiệu dự báo cần chú ý đến các mẫu lân cận.
Tín hiệu dự báo có thể là hàm tuyến tính hoặc hàm phi tuyến tính của các
mẫu lân cận. Tín hiệu dự báo
mẫu trước đó


có thể biểu diễn trên cơ sở giá trị của m
với m
Có 2 phương pháp tạo tín hiệu dự báo:
18


• Dự báo cố định (hay dự báo độc lập) đối với ảnh số
• Dự báo thích nghi (hay dự báo phụ thuộc) đối với ảnh số
Các phương pháp trên đều có thể sử dụng cho các tín hiệu đen – trắng
hay các tín hiệu màu thành phần để tạo dự báo.
 Tạo dự báo DPCM tương tự
Mạch biến đổi DPCM với dự báo tương tự được minh họa như sau:

Mạch biến đổi DPCM với dự báo tương tự

Ở đây sử dụng các mạch tương tự và khuếch đại vi sai để có hiệu
các tín hiệu vào ra.
 Tạo dự báo DPCM số
Mạch biến đổi DPCM với dự báo số được minh họa như sau:

Mạch biến đổi DPCM với dự báo số

19


Ở đây sử dụng các mạch tương tự - số tuyến tính có độ chính xác cao, các
tín hiệu dự báo được tạo trong mạch số (có bộ nhớ số) và được trừ với tín
hiệu vào (dưới dạng số).

 DPCM hỗn hợp
Mạch biến đổi DPCM hỗn hợp được minh họa như sau:

Mạch biến đổi DPCM hỗn hợp

Ở đây sử dụng biến đổi tương tự - số phi tuyến, trong đó mạch số tạo dự
báo và biến đổi số - phi tuyến, còn tín hiệu vi sai tương ứng nhận được từ
mạch khuếch đại vi sai tương ứng.

b) Mã hóa dự đoán trong Interframe video
Đây là kĩ thuật nén giảm độ dư thừa thời gian. Phương pháp mã dự đoán
Interframe dựa trên nguyên tắc là các ảnh trong chuỗi video dường như có
liên quan mật thiết với nhau theo thời gian: Mỗi frame tại một thời điểm
nhất định sẽ có nhiều khả năng giống với các frame đứng ngay phía trước và
ngay phía sau nó.

20


Các bộ mã hoá sẽ tiến hành quét lần lượt từng khối pixel ảnh, sau đó nó
sẽ phát hiện khối pixel nào không thay đổi từ frame này tới frame khác. Bộ
mã hoá sẽ tiên đoán trước sự xuất hiện của các khối pixel khi biết vị trí và
hướng chuyển động của nó. Do đó chỉ những sự thay đổi giữa các khối trong
frame hiện tại (motion compesated residual) và các khối được tiên đoán mới
được truyền tới bên phía thu. Phía bên thu tức bộ giải mã đã lưu trữ sẵn
những thông tin mà không thay đổi từ frame này tới frame khác trong bộ
nhớ đệm của nó và chúng được dùng để điền thêm một cách đều đặn vào các
vị trí trống trong ảnh được khôi phục.
Việc loại bỏ dư thừavề thời gian (nén liên ảnh) được thực hiện trước hết
nhờ sử dụng các tính chất giống nhau giữa các ảnh liên tiếp (Inter-frame

techniques). Chúng ta có thể sử dụng tính chất này để tạo ra các bức ảnh mới
nhờ vào những thông tin từ những ảnh đã gửi trước nó (“predicted”). Dự
đoán liên ảnh làm giảm với sự tương quan theo thời gian với việc sử dụng
các kĩ thuật Vector chuyển động (Motion Estimation) và bù chuyển động
(compensation). Các khái niệm này sẽ được trình bày ở phần dưới

VI. Kỹ thuật mã hóa dựa trên phép biến đổi
Phép biến đổi là 1 hàm toán học được sử dụng để biến đổi một tập các giá
trị này thành một tập các giá trị khác và tạo ra một cách biểu diễm mới cho
cùng một nguồn tin.
Kỹ thuật mã hóa dựa trên phép biến đổi đều không mất mát thông tin,
việc tổn hao chỉ xảy ra ở bước lượng tử hóa do có sự làm tròn giá trị cho các
hệ số phép biến đổi
Các kỹ thuật mã hóa dựa trên phép biến đổi được sử dụng gồm:
• Kỹ thuật mã hóa dựa trên phép biến đổi cosin rời rạc – DCT
21


• Kỹ thuật mã hóa dựa trên phép biến đổi chồng – LT
• Kỹ thuật mã hóa dựa trên phép biến đổi DWT

VI.1. Kỹ thuật mã hóa dựa trên phép biến đổi DCT

Sơ đồ nén dựa trên phép biến đổi DCT

Phép biến đổi cosin rời rạc biến đổi thông tin ảnh từ miền không gian
sang miền tần số. Bằng cách biến đổi giá trị một khối các điểm ảnh thành
một khối các hệ số trong miền tần số.
a) Phân khối
Vì rằng ảnh gốc có kích thước rất lớn nên trước khi đưa vào biến đổi

DCT ảnh được phân chia thành các khối vuông 8x8 pixel, biểu diễn các
mức xám của 64 điểm ảnh, các mức xám này là các số nguyên dương có
giá trị từ 0-25. Việc phân khối này giúp làm giảm một phần thời gian tính
toán các hệ số chung, mặt khác biến đổi cosin đối với các khối nhỏ sẽ
làm tăng độ chính xác khi tính toán với dấu phẩy tĩnh, giảm thiểu sai số
do làm tròn sinh ra. Bên cạnh đó việc chọn giá trị khối là 8*8 pixel vì
rằng hàm hiệp phương sai suy giảm rất nhanh khi khoảng cách pixel mà
ở đó hiệp phương sai được định nghĩa là vướt quá 8, do đó phương pháp
nén sử dụng việc loại bỏ các thông tin dư thừa về mặt không gian không
cần quan tâm đến các khối pixel lớn hơn 8. Mặt khác khối 8*8 pixel là
vừa đủ để thuận tiện cho việc tính toán, thiết kế mạch cứng.
22


b) Phép biến đổi DCT
Phép biến đổi DCT hoạt động dựa trên ma trận vuông của khối giá trị
điểm ảnh (n*n pixel) sinh ra ma trận vuông các hệ số DCT và ngược lại,
được thể hiện thông qua các CT sau:
Biến đổi DCT thuận

: hệ số DCT của khối giá trị điểm ảnh (n*n pixel)
: giá trị biên độ của khối giá trị điểm ảnh (n*n pixel)
,

Biến đổi DCT ngược

c) Lượng tử hóa hệ số DCT
Mục đích của lượng tử hóa là giảm số lượng bit cần để lưu trữ các hệ
số biến đổi bằng việc giảm độ chính xác của các hệ số này cho nên lượng
tử hóa là quá trình xử lí có mất mát thông tin .

Các hệ số DCT được lượng tử hóa dựa trên bảng lượng tử
. Bảng này
được định nghĩa bởi từng ứng dụng cụ thể, các phần tử trong bảng lượng
tử có giá trị từ 1- 255, gọi là các bước nhảy lượng tử cho các hệ số DCT.
Quá trình lượng tử được thực hiện bằng cách chia các hệ số DCT cho các
bước nhảy lượng tử tương ứng. Kết quả này sau đó sẽ được làm tròn
xuống số nguyên gần nhất.

23


Kết quả: bảng hệ số lượng tử hóa

với các hệ số lượng tử được

xác định theo CT sau:

Quá trình lượng tử hóa và quét zig-zag

Quét các hệ số DCT: quá trình sắp xếp các hệ số DCT đã lượng tử
trong ma trận 2 chiều thành dãy một chiều nối tiếp nhau, phục vụ cho quá
trình tryền tải các bit nối tiếp theo thời gian. Có 2 dạng quét các hệ số
DCT là quét zig-zag và quét luân phiên
Quét zig-zag: quá trình sắp xếp được minh họa như hình trên. Biết
rằng năng lượng của khối hệ số giảm dần từ góc trên bên trái xuống góc
dưới bên phải nên việc sắp xếp lại các hệ số theo thứ tự zig-zag sẽ tạo
điều kiện cho các hệ số có cùng mức lượng tử nằm trên cùng 1 dòng.

d) Mã hóa các hệ số DCT
Sau khi quét các hệ số DCT, mỗi khối zig-zag sẽ được mã hóa theo

phương pháp mã RLE (Run Length Encoding), cuối mỗi khối đặt các dấu
24


kết thúc khối EOB. Sau đó các khối này được dồn lại và mã hõa 1 lần
bằng phương pháp mã Huffman – phép mã hóa không làm mất thông tin,
những hệ số có tần suất xuất hiện cao được gắn cho 1 từ mã ngắn, những
hệ số có tần suất xuất hiện thấp được gắn cho 1 từ mã dài. Vì vậy chiều
dài trung bình của bộ từ mã đã giảm xuống.
Việc mã hóa được quy định bởi bảng mã cho từ mã đầu ra như sau:

Bảng phân nhóm các hệ số AC

25


×