Tải bản đầy đủ (.pdf) (76 trang)

Bài giảng Truyền thông đa phương tiện: Chương 3 - ThS. Trần Đắc Tốt

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.13 MB, 76 trang )

TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP THỰC
PHẨM TP.HCM

TRUYỀN THÔNG ĐA PHƯƠNG TIỆN
(Multimedia Communication)

Giảng viên: Ths. Trần Đắc Tốt – Khoa CNTT
Email:
Website: www.oktot.com
Facebook: />Chương 3: Nguyên lý, kỹ thuật và chuẩn nén….

1


MÔN HỌC: TRUYỀN THÔNG ĐA PHƯƠNG
TIỆN
Chương 1: Tổng quan đa phương tiện
Chương 2: Đặc tính yêu cầu của dữ liệu đa phương tiện
Chương 3: Nguyên lý, kỹ thuật và chuẩn nén Audio, hình
ảnh, video
Chương 4: Truyền dữ liệu đa phương tiện trên mạng máy
tính
Chương 5: Mợt sớ ứng dụng trùn thông đa phương tiện

Chương 3: Nguyên lý, kỹ thuật và chuẩn nén….

2


CHƯƠNG 3: NGUYÊN LÝ, KỸ THUẬT VÀ
CHUẨN NÉN AUDIO, HÌNH ẢNH, VIDEO


Giới thiệu.
Nguyên lý nén dữ liệu.
Kỹ thuật và các nguyên tắc cơ bản của nén dữ liệu.
Kỹ thuật và chuẩn nén âm thanh.
Kỹ thuật và chuẩn nén hình ảnh.
Kỹ thuật và chuẩn nén Video.

Chương 3: Nguyên lý, kỹ thuật và chuẩn nén….

3


MỤC ĐÍCH – YÊU CẦU
Mục đích:
Giới thiệu nguyên lý,

Kỹ thuật và các chuẩn nén dữ liệu: âm thanh, hình ảnh và Video
kỹ thuật số.
Yêu cầu: Sinh viên nắm vững
Các nguyên lý nén dữ liệu đa phương tiện.
Các kỹ thuật nén dữ liệu đa phương tiện.
Các chuẩn nén dữ liệu âm thanh, hình ảnh và video kỹ tḥt sớ

Chương 3: Ngun lý, kỹ thuật và chuẩn nén….

4


CHƯƠNG 3: NGUYÊN LÝ, KỸ THUẬT VÀ
CHUẨN NÉN AUDIO, HÌNH ẢNH, VIDEO

Giới thiệu.
Nguyên lý nén dữ liệu.
Kỹ thuật và các nguyên tắc cơ bản của nén dữ liệu.
Kỹ thuật và chuẩn nén âm thanh.
Kỹ thuật và chuẩn nén hình ảnh
Kỹ thuật và chuẩn nén Video.

Chương 3: Nguyên lý, kỹ thuật và chuẩn nén….

5


Giới thiệu
Tại sao phải nén dữ liệu?
Các File Multimedia có dung lượng rất lớn vì thế để có thể lưu trữ hay
truyền đi… thì cần thiết phải làm giảm dung lượng các File đến mức có
thể.

Các File Text hay mợt số File khác cũng cần được nén lại để đáp ứng cho
việc gửi Mail hay trong các ứng dụng khác.
Vấn đề Băng thông mạng
Các vấn đề cần giải quyết
Các nguyên lý cơ bản trong nén dữ liệu, làm sao để đo lường hiệu suất
nén và xếp loại các kỹ thuật nén ?
Các kỹ tḥt nào có thể nén tớt cho dữ liệu đa phương tiện ?
Dữ liệu gớc có thể được lấy lại chính xác sau khi nén ?
Chuẩn nén âm thanh, hình ảnh và video ?
Chương 3: Nguyên lý, kỹ thuật và chuẩn nén….

6



CHƯƠNG 3: NGUYÊN LÝ, KỸ THUẬT VÀ
CHUẨN NÉN AUDIO, HÌNH ẢNH, VIDEO
Giới thiệu.
Nguyên lý nén dữ liệu.
Kỹ thuật và các nguyên tắc cơ bản của nén dữ liệu.
Kỹ thuật và chuẩn nén âm thanh.
Kỹ thuật và chuẩn nén hình ảnh
Kỹ thuật và chuẩn nén Video.

Chương 3: Nguyên lý, kỹ thuật và chuẩn nén….

7


Nguyên lý nén dữ liệu
Mong muốn nén âm thanh, hình ảnh và video số là để tốc độ bit và
yêu cầu lưu trữ có thể quản lý được. Chúng ta nén được dữ liệu nhờ
vào việc khai thác hai nhân tố chính:
Sự dư thừa dữ liệu trong âm thanh, hình ảnh và video sớ.
Đặc tính các giác quan của con người.
1. Sự dư thừa dữ liệu

Âm thanh số là chuỗi các giá trị lấy mẫu. Mợt hình ảnh là mợt mảng hai
chiều các giá trị lấy mẫu, và video là mợt chuỗi hình ảnh phát ra theo mợt
tớc đợ nào đó.
Các giá trị lấy mẫu âm thanh hay hình ảnh khơng hồn tồn đợc lập. Các
giá trị lấy mẫu lân cận ít nhiều có tương quan với nhau. Sự tương quan này
gọi là sự dư thừa.

Loại bỏ sự dư thừa không làm thay đổi ý nghĩa của dữ liệu.
Chương 3: Nguyên lý, kỹ thuật và chuẩn nén….

8


Nguyên lý nén dữ liệu
1. Sự dư thừa dữ liệu
Sự dư thừa trong âm thanh số

Trong hầu hết các trường hợp, các giá tri lấy mẫu âm thanh lân cận thì
tương tự như nhau.
 Mợt giá trị mẫu kế tiếp có thể được dự đốn ở mợt mức đợ nhất định
trên cơ sở giá trị lấy mẫu hiện tại.
 Kỹ thuật nén dùng đặc điểm này được gọi là mã hoá dự đoán

(predictive coding).

Chương 3: Nguyên lý, kỹ thuật và chuẩn nén….

9


Nguyên lý nén dữ liệu
1. Sự dư thừa dữ liệu
Sự dư thừa trong âm thanh sớ

Trong tiếng nói sớ, ta có mợt kiểu khác của dư thừa:
 Trong đàm thoại/lời nói bình thường, chúng ta chỉ phát ra tiếng nói
trong một tỷ lệ phần trăm rất thấp theo thời gian. Giữa những tiếng

nói phát ra là khoảng im lặng.
 Các mẫu ứng với các khoảng im lặng có thể được loại bỏ mà không

ảnh hưởng tới ý nghĩa của câu nói.
 Kỹ thuật nén sử dụng đặc điểm này được gọi là loại bỏ khoảng im

lặng (silence removal).
Chương 3: Nguyên lý, kỹ thuật và chuẩn nén….

10


Nguyên lý nén dữ liệu
1. Sự dư thừa dữ liệu
Sự dư thừa trong hình ảnh số: Trong hình ảnh sớ, các mẫu lân cận trên
mợt dịng qt bình thường là như nhau. Các mẫu lân cận trên những
đường quét gần kế nhau thì cũng tương tự nhau.
Sự tương tự này gọi là dư thừa không gian (spacial redundancy).
Dư thừa không gian được loại bỏ bằng kỹ thuật mã hoá dự đoán và các
kỹ thuật khác (như là mã hoá biến đổi).
Sự dư thừa trong video ảnh số: Video số là mợt chuỗi các hình ảnh, như
vậy nó cũng có các dư thừa khơng gian.
Các hình ảnh lân cận nhau trong mợt chuỗi video bình thường là như
nhau.
Sự tương tự này gọi là dư thừa thời gian (temporal redundancy) và có thể
bị loại bỏ bởi ứng dụng kỹ thuật dự đoán giữa các hình ảnh.
Chương 3: Nguyên lý, kỹ thuật và chuẩn nén….

11



Nguyên lý nén dữ liệu
2. Đặc tính của giác quan
Đầu ći sử dụng audio, hình ảnh và video là con người.
Con người có thể chịu được mợt sớ lỗi / mất thông tin mà không ảnh
hưởng đến hiệu quả truyền thông.
Theo nghĩa này các phiên bản nén không cần biểu diễn các mẫu thơng tin
gớc mợt cách chính xác.
Điều này trái với dữ liệu chữ sớ, ở đó mợt sớ dữ liệu mất / lỗi là không
được phép.
Một cách tổng quát, tri giác con người không nhạy khi một số ít dữ liệu bị
mất/lỗi trong audio, hình ảnh và video.
Đợ nhạy tri giác khác nhau đối với các khuôn mẫu tín hiệu khác nhau. Mợt
sớ thơng tin quan trọng đới với nhận thức của con người hơn những cái
khác.

Từ các đặc tính nhận thức =>“thơng tin đợc lập trung bình”
Chương 3: Nguyên lý, kỹ thuật và chuẩn nén….

12


Nguyên lý nén dữ liệu
3.

Phân loại các kỹ thuật nén

Có nhiều kỹ thuật dùng để nén thông tin đa phương tiện, nó được phân loại
theo nhiều cách. Nếu phân loại trên cơ sở kết quả của kỹ thuật nén => Hai
kiểu phân loại:

Dữ liệu gớc có thể tái tạo mợt cách chính xác sau khi nén.
Tớc đợ bít có thể là hằng số ở ngõ ra của hệ thống nén.

Kỹ thuật nén không mất dữ liệu và nén bị mất dữ liệu (lossless
versus, lossy Compression techniques):
Kỹ thuật nén không mất dữ liệu được dùng để nén các chương trình máy
tính, hồ sơ pháp lý và bệnh án, theo đó khơng có lỗi/mất dữ liệu sau nén.
Kỹ thuật này chỉ sử dụng các thống kê dữ liệu (data redundance).
Kỹ thuật nén bị mất dữ liệu dùng để nén audio, hình ảnh và video, ở đó
mợt sớ lỗi/mất dữ liệu có thể chấp nhận được. Kỹ thuật này sử dụng các
thống kê dữ liệu và đặc tính nhận thức của con người.
Chương 3: Nguyên lý, kỹ thuật và chuẩn nén….

13


Nguyên lý nén dữ liệu
3.

Phân loại các kỹ thuật nén

Kỹ thuật nén tốc độ bit không đổi và nén tốc độ bit thay đổi (CBR: Constant
Bit Rate coding - VBR: Variable Bit Rate coding)
Trong sớ hố audio/video, các mẫu được lấy trong các thời khoảng bằng
nhau và biểu diễn với một số bit như nhau.
Khi giải nén audio/video thành các dịng bit tớc đợ khơng đổi: Ta gọi kỹ
tḥt mã hố tớc đợ bit khơng đổi (CBR).

Mợt sớ kỹ tḥt nén sẽ làm giảm tớc đợ bit của các dịng, và ta gọi là kỹ
tḥt mã hố tớc đợ bit thay đổi (VBR).


Chương 3: Nguyên lý, kỹ thuật và chuẩn nén….

14


Nguyên lý nén dữ liệu
3.

Phân loại các kỹ thuật nén

Kỹ thuật nén tốc độ bit không đổi và nén tốc độ bit thay đổi (CBR: Constant
Bit Rate coding - VBR: Variable Bit Rate coding)
Rất quan trọng khi xếp loại một kỹ thuật nén là CBR/VBR:
 Trước tiên, nội dung phương tiện thay đổi theo thời gian: Nếu phức
tạp, nhiều dữ liệu được sử dụng để biểu diễn. Nếu đơn giản, ít dữ
liệu được sử dụng. Kỹ thuật VBR hiệu quả và cho chất lượng cao ở
cùng hệ số nén.
 Thứ hai, VBR khó đặc tả và mơ hình hóa, khó hỗ trợ bởi hệ thống
truyền thông đa phương tiện.
 Hai nhân tố này dùng trong mô tả khi thiết kế và phát triển hệ
thống đa phương tiện.

Chương 3: Nguyên lý, kỹ thuật và chuẩn nén….

15


Nguyên lý nén dữ liệu
4.


Đo lường hiệu năng nén

Hiệu năng của một kỹ thuật nén đo bằng một tập các tham số.
Hệ số nén (compression ratio): là tỷ số giữa số lượng dữ liệu gốc và số
lượng dữ liệu sau khi nén.
Chất lượng tái tạo phương tiện (reconstructed media quality): Khi sử dụng
kỹ thuật nén bị mất dữ liệu ta lưu ý: khi hệ sớ nén cao thì chất lượng tái
tạo phương tiện thấp.
Độ phức tạp trong cài đặt (Implementation complexity): Càng đơn giản
trong cài đặt càng tốt.
Tốc độ nén (compression speed): Nhanh là tốt.
Tốc độ giải nén (decompression speed): Nhanh là tốt.
Khi tốc độ nén và giải nén bằng nhau ta có kỹ tḥt nén đới xứng
(symmetric compression techniques), ngược lại ta có kỹ tḥt nén khơng
đới xứng (asymmetric compression techniques).
Chương 3: Nguyên lý, kỹ thuật và chuẩn nén….

16


CHƯƠNG 3: NGUYÊN LÝ, KỸ THUẬT VÀ
CHUẨN NÉN AUDIO, HÌNH ẢNH, VIDEO
Giới thiệu.
Nguyên lý nén dữ liệu.
Kỹ thuật và các nguyên tắc cơ bản của nén dữ liệu.
Kỹ thuật và chuẩn nén âm thanh.
Kỹ thuật và chuẩn nén hình ảnh
Kỹ thuật và chuẩn nén Video.


Chương 3: Nguyên lý, kỹ thuật và chuẩn nén….

17


Kỹ thuật và các nguyên tắc cơ bản của nén
dữ liệu
Kỹ thuật nén không mất dữ liệu (Lossness)
Dữ liệu gốc có thể phục hồi lại hồn tồn

Tỷ lệ nén thơng thường có thể đạt được từ 2:1 đến 50:1
Nén khơng mất dữ liệu được sử dụng để nén các chương trình máy tính,
các văn bản ḷt pháp và các bệnh án. Nó cũng được sử dụng kết hợp với
kỹ thuật nén mất dữ liệu để đạt các hệ số nén cao trong thông tin đa
phương tiện.
Các kỹ thuật nén không mất dữ liệu khai thác “tính dư thừa thớng kê”
(statisticals redundancies) trong dữ liệu được nén.
Chương 3: Nguyên lý, kỹ thuật và chuẩn nén….

18


Kỹ thuật và các nguyên tắc cơ bản của nén
dữ liệu
Kỹ thuật nén mất dữ liệu (Lossy)
Có sự khác biệt giữa dữ liệu gốc và dữ liệu được phục hồi lại sau khi nén

Có sử dụng các đặc điểm tâm sinh lý của thính giác và thị giác của con
người trong việc nghiên cứu cho các giải thuật nén.
Tỷ lệ nén đạt cao hơn so với các giải thuật nén khơng tổn hao (từ 100:1)

Các giải tḥt nén điển hình: JPEG, MPEG
Nén MP3, Photograph Image, Video

Chương 3: Nguyên lý, kỹ thuật và chuẩn nén….

19


Kỹ thuật và các nguyên tắc cơ bản của nén
dữ liệu
Ta dùng thuật ngữ “ký hiệu” (symbol) hoặc “ký tự” (charactere) để chỉ các
ký tự văn bản (text characteres), giá trị số (numbers), giá trị mẫu (sample
values).
Các giải thuật nén điển hình:
Mã hóa entropy (entropy coding – Huffman code)
Mã hóa đợ dài run (run-length coding)
Mã hóa Lempel-Ziv-Welch (LZW coding)
Mã sớ học


Chương 3: Nguyên lý, kỹ thuật và chuẩn nén….

20


Kỹ thuật và các nguyên tắc cơ bản của nén
dữ liệu
1. Mã hố Entropy
Đo lường thơng tin
Các ký hiệu khác nhau chuyển tải một lượng thông tin khác nhau phụ

thuộc vào xác suất xuất hiện của nó.
 Ký hiệu với xác suất xuất hiện cao tải một lượng thông tin nhỏ.
 Ký hiệu với xác suất xuất hiện thấp tải một lượng thông tin lớn.

 Lượng thông tin I được tải trong một ký hiệu với xác suất xuất hiện p
được định nghĩa bởi: I = log(1/p)
 Đơn vị của thông tin là bit, xác suất là các số thực giữa 0 và 1.

 Nếu xác suất p=1 thì log2(1/p)=0. Điều đó có nghĩa là ký hiệu có xác
suất xuất hiện bằng 1, không mang bất kỳ thông tin mới nào.
 Nếu xác xuất rất nhỏ thì log2(1/p) trở nên rất lớn. Như vậy, các ký
hiệu ít khi xuất hiện sẽ mang một lượng rất lớn thông tin.
Chương 3: Nguyên lý, kỹ thuật và chuẩn nén….

21


Kỹ thuật và các nguyên tắc cơ bản của nén
dữ liệu
1. Mã hố Entropy
Đo lường thơng tin
Khái niệm này của thông tin hết sức quan trọng trong nén dữ liệu. Chiều
dài mã nén lý tưởng của một ký hiệu trong nén không mất dữ liệu bằng
với số bit thông tin của ký hiệu. Các kỹ thuật nén nhắm tới mục tiêu này.
Thơng tin trung bình của mỗi ký hiệu trong một tập tin được gọi là
entropy H và được định nghĩa bởi công thức:

Với

si


: Ký hiệu phân biệt thứ i

p(si): Xác suất xuất hiện ký hiệu si

N

: Số các ký hiệu phân biệt trong file

Chương 3: Nguyên lý, kỹ thuật và chuẩn nén….

22


Kỹ thuật và các nguyên tắc cơ bản của nén
dữ liệu
1. Mã hố Entropy
Đo lường thơng tin
Entropy là giới hạn dưới cho nén không mất dữ liệu: Khi xác suất xuất

hiện của mỗi ký hiệu là cố định, mỗi ký hiệu sẽ được biểu diễn với trung
bình tới thiểu là H bit. Các bit được nén gần với entropy H cho hiệu quả
nén tốt hơn (với kỹ thuật nén không mất).
Kỹ tḥt mã hóa dựa trên “đợ dài mã hóa của các ký hiệu khác nhau thay
đổi theo lượng thông tin mà nó tải” được gọi là mã hóa entropy.

Chương 3: Nguyên lý, kỹ thuật và chuẩn nén….

23



Kỹ thuật và các nguyên tắc cơ bản của nén
dữ liệu
Mã hóa Huffman (Huffman Coding)
Hầu hết mã hố entropy thường được dùng là mã hố Huffman. Nó gán
mợt sớ ít bit cho các ký hiệu xuất hiện nhiều và nhiều bit cho các ký hiệu ít
xuất hiện. Nó có hiệu quả khi các xác suất xuất hiện của các ký hiệu khác
nhau rất nhiều và thường được dùng kết hợp với kế hoạch mã hố.
Giả sử mợt file gồm 1000 ký tự, các ký tự trong file là e, t, x, và z xác suất
xuất hiện của chúng trong file lần lượt là 0.8, 0.16, 0.02, và 0.02.

Biểu diễn bình thường (8 bits/ký tự): Như vậy ta cần 8000 bit để biểu
diễn tồn bợ file.
Trong mã hố Huffman, ta dùng số lượng

Symbol

Probability

bit khác nhau để biểu diễn các ký tự.

e

0.8

1

Tổng số bit yêu cầu là:

t


0.16

01

x

0.02

001

z

0.02

000

1000(1*0.8+2*0.16+3*0.02+3*0.02)=1240 bit
Chương 3: Nguyên lý, kỹ thuật và chuẩn nén….

Code

24


Kỹ thuật và các nguyên tắc cơ bản của nén
dữ liệu
Mã hóa Huffman (Huffman Coding)
Minh Họa tḥt tốn mã hóa Huffman:
1. Đặt tất cả các ký hiệu cùng với dòng xác suất xuất hiện theo thứ tự nhỏ ở

dưới và lớn ở trên.
2. Chọn hai nút có xác suất xuất hiện nhỏ nhất, tạo nút cha của chúng với hai
nhánh gán nhãn là 0 và 1.

3. Nút cha “đại diện” cho hai nút con với xác suất xuất hiện là tổng xác suất
của hai con.
4. Lập lại bước 2. và bước 3. cho tới khi tất cả các ký hiệu nược nối vào cây.
Nút cuối cùng tạo ra gọi là nút gốc (root node)
5. Bắt đầu từ nút gốc, gán bit 1 cho nhánh trên và bit 0 cho nhánh dưới cho
tất cả các nút.
Chương 3: Nguyên lý, kỹ thuật và chuẩn nén….

25


×