Tải bản đầy đủ (.pdf) (9 trang)

tài liệu tham khảo đa truyền thông phần 5 pptx

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (420.17 KB, 9 trang )

MPEG
MPEG
-
-
1
1

Kiến trúc
Băng lọc
phân tích ña
pha 32 kênh
Lượng tử
hoá
Mã hoá
M
U
X
FFT
LI: 512
LII: 1024
Phân tích
tâm sinh lý
âm học
Phân phối
bit ñộng
32
Dữ liệu
Thông
tin thêm
SMR
Lượng tử


32
s(n)
kênh
Dữ liệu
SMR: Tỷ số tín
hiệu/ngưỡng che
Băng lọc
phân tích ña
pha 32 kênh
MDCT
M
U
X
FFT
Phân tích
tâm sinh lý
âm học
SMR
32
s(n)
kênh
Vòng lặp chỉ ñịnh bit
Lượng tử hoá
Mã hoá Huffman
Mã thông
tin thêm
↓32
MPEG1 lớp 1,2
MPEG1 lớp 3
Thông

tin thêm
MPEG
MPEG
-
-
1
1
• Thuật toán cơ bản
– Tiến hành chia ngõ vào thành 32 băng con bởi các băng lọc.
• Lấy 32 mẫu PCM trong cùng một thời ñiểm, kết quả là 32 hệ số tần số ở ngõ ra.
– Trong MPEG-1 lớp I thì tập 32 giá trị PCM ñược kết hợp vào trong khối gồm
12 nhóm 32 mẫu này.
– MPEG-1 lớp II và lớp III thì gồm 3 khối 12 nhóm này.
– Phân bố bit ñảm bảo rằng mọi nhiễu lượng tử nằm ở dưới các ngưỡng che.
– Với mỗi băng con, xác ñịnh mức biên ñộ và mức nhiễu bằng mô hình tâm sinh
lý nghe. SMR (signal-mask rate) ñược sử dụng ñể xác ñịnh số bit cho quá trình
lượng tử hoá ñối với mỗi băng con với mục ñích giảm thiểu dung lượng.
MPEG
MPEG
-
-
1
1
Ví dụ: Sau khi phân tích, mức của 16 băng con ñầu là:
Band 1 2 3 4 5 6 7
8 9 10 11 12 13 14 15 16
Level (db) 0 8 12 10 6 2 10
60 35 20 15 2 3 5 3 1
Nếu mức của băng con thứ 8 là 60 thì nó che 12 dB ở băng con thứ 7 và 15 dB ở
băng con thứ 9.

Băng con 7 có mức 10dB<12dB: loại. Băng con 9 có mức 35dB>15dB: gởi ñi.
 Chỉ có các mức lớn hơn mức che là ñược gởi ñi thay vì dùng 6 bits ñể mã hoá, ta
chỉ dùng 4 bits.
MPEG-Layer I: Bộ lọc DCT 1 khung và tần số bằng phẳng trong mỗi băng con.
Mô hình tâm sinh lý nghe sử dụng che tần số.
MPEG-Layer II: Có 3 khung trong bộ lọc (trước, hiện tại và kế), tổng là 1125
mẫu. Sử dụng vài bits ñể che thời gian.
MPEG-Layer III: Sử dụng bộ lọc tới hạn ñể ñáp ứng tốt hơn. Mô hình tâm sinh lý
nghe sử dụng che thời gian, che tần số, tính toán ñộ dư thừa stereo và mã hoá
Hufman.
MPEG
MPEG
-
-
1
1
• Cấu trúc khung
– Header Info: Gồm 12 bits ñồng bộ; 20 bis thông tin hệ thống chỉ thị tốc ñộ bit,
tần số lấy mẫu, dạng nhấn…; 16 bits CRC với ña thức sinh x
16
+x
15
+x
2
+1.
– Side Info: Gồm phân bố bit: lớp 1 với 4 bits tuyến tính cho các băng con, lớp
II 4 bits cho các băng con tần thấp, 3 bit tần trung và 2 bits tần cao; hệ số tỷ lệ
là 6 bits/băng con kết hợp với phân bố bits và các bits mã hóa cho băng con ñó
ñể xác ñịnh giá trị, lớp III mã hóa âm thanh nổi.
– Subband Samples: 32x12 mẫu ñối với lớp I và 32x36 mẫu ñối với lớp II và lớp

III.
– Aux Data: Dữ liệu bổ sung
Header Info Side Info Subband Samples Aux Data
MPEG
MPEG
-
-
2
2
• Mở rộng MPEG-1 cho các ứng dụng mới.
• Có khả năng áp dụng nhiều tốc ñộ khác nhau, từ 32 ñến 1066kbps. Tần số lấy mẫu
có thể giảm 1 nửa so với MPEG-1 (16; 22,05; 24kHz).
• Khả năng ña kênh, tốc ñộ bits mở rộng có thể lên ñến 1 Mbps cho các ứng dụng
tốc ñộ cao. Cho phép nén ñồng thời nhiều kênh.
• Chất lượng âm thanh tuỳ thuộc ứng dụng.
• Hỗ trợ khả năng lồng tiếng, bình luận nhiều ngôn ngữ trong phần bits mở rộng.
• MPEG-2 sử dụng mã hoá cường ñộ cao, giảm xuyên âm, mã hoá dự ñoán liên
kênh và mã hoá ảo ảnh kênh trung tâm ñể nhận ñược tốc ñộ bit kết hợp 384 kbps.
• Khung MPEG-2 ñược chia thành 2 phần, phần ñầu là MPEG-1stereo, phần mở
rộng MPEG-2 chứa tất cả những dữ liệu surround khác.
MPEG
MPEG
-
-
2
2
Mono-stereo
MPEG-1
32;44.1;48kHz
MPEG-2

Layer I
Layer II
Layer III
Mono-stereo
MPEG-2
16;22,05;24kHz
Layer I
Layer II
Layer III
5 channels
MPEG-2
multi channel
32;44.1;48kHz
Layer I
Layer II
Layer III
MPEG
MPEG
-
-
2
2
• Mã hoá và giải mã MPEG-2
Matrix
MPEG-1
encoder
MPEG-2
Extension
encoder
L

C
R
LS
RS
L0
R0
T3
T4
T5
+
MPEG-1
decoder
MPEG-2
Extension
decoder
L0

R0

T3

T4

T5

Inverse
Matrix
L

C


R

LS

RS

channel
MPEG
MPEG
-
-
2
2
Trong ñó:
Với R: phải, L: trái, C: trung tâm, LS:trái vòm và RS: phải vòm.
Từ ñó dễ dàng trong mã hóa thuận nghịch
Cấu trúc khung



=====
+
=
++=
++=
0;1
2
1
;

21
1
,
)(0
)(0
δβαδβα
δβα
δβα
or
RSCRR
LSCLL
MPEG1 header MPEG-1 Data MPEG-1 Auxillary Data
MPEG2 header MPEG2 Data
Khung MPEG-1/2
AC
AC
-
-
3 (DOLBY DIGITAL)
3 (DOLBY DIGITAL)
• Chuyển tải âm thanh ña kênh trong các ứng dụng như DVD-Video, DTV và DBS.
• Phát triển từ AC-1 và AC-2.
• Mã hoá âm thanh từ 1 ñến 6 kênh, thông thường cung cấp âm thanh 5.1 kênh: trái,
phải, trung tâm, trái vòm, phải vòm và 1 kênh hiệu ứng tần số thấp.
• 6 kênh yêu cầu 6x48kHzx18bits=5.184Mbps chưa nén có thể ñược mã hoá tối thiểu
với tốc ñộ 384kbps (tỷ lệ 13:1).
• Tuy nhiên, AC-3 hỗ trợ tốc ñộ từ 32 ñến 640kbps.
• Cung cấp khả năng tự chọn mức âm thanh cho thính giả.
• Cho phép giảm dữ liệu bằng quá trình lượng tử biểu diễn trong miền tần số của tín
hiệu âm thanh.

• Bộ mã hoá sử dụng băng lọc phân tích chuyển các mẫu PCM thành các hệ số trong
miền tần số. Mỗi hệ số biểu diễn ký hiệu mũ nhị phân gồm phần số mũ và phần
ñịnh trị. Các tập số mũ ñược mã hoá thô qua phổ tín hiệu và xem như là ñường bao
phổ. Sử dụng phân phối bít xác ñịnh số bits cần mã hoá mỗi ñịnh trị dựa vào ñường
bao phổ. ðường bao phổ và các ñịnh trị ñược lượng tử cho 6 khối âm thanh (1536
mẫu âm thanh) ñược ñịnh dạng thành khung rồi chuyển ñi.
AC
AC
-
-
3 (DOLBY DIGITAL)
3 (DOLBY DIGITAL)
Quá trình giải mã hoàn toàn ngược lại, ở ñây chỉ xét quá trình mã hoá
Băng lọc
phân tích
Mã hoá
ñường bao
Chỉ ñịnh bit
Lượng tử hoá
phần ñịnh trị
ðịnh dạng khung AC-3
Thông tin chỉ ñịnh bit
Phần ñịnh trị
Số

ðường bao phổ
ñược mã hoá
Phần ñịnh trị ñược
lượng tử hoá
Các mẫu

PCM
Dòng bit
AC-3
APT
APT
-
-
X100
X100

APT-X100 cho tỷ lệ nén 4:1.
• Sử dụng ñể truyền dẫn, lưu trữ các tín hiệu audio mono, stereo hay ña kênh chất
lượng cao.
• Không hẳn dựa vào mô hình tâm sinh lý nghe, cũng không trực tiếp loại các thành
phần không thích hợp trong tín hiệu audio, mà nó ngầm hiểu một mô hình ñáp ứng
nghe bằng việc phân phối ít bit ở tần số cao.
• Thuật toán hoàn toàn trong miền thời gian sử dụng mã hoá dự ñoán tuyến tính trong
các băng con.
• Hoạt ñộng với bất kỳ tần số lấy mẫu với ngõ ra 16 bits/từ mẫu.
• Tín hiệu audio ñược chia thành 4 băng con với băng thông ñều nhau sử dụng các bộ
lọc QMF.
• Tín hiệu ñược phân tích trong miền thời gian: sử dụng mã hoá dự ñoán tuyến tính
ADPCM ñể lượng tử mỗi băng theo nội dung và loại bỏ ñộ dư thừa trong các băng
con.
• Mã hoá sự khác biệt của mẫu hiện thời và mẫu trước.
• Giải mã ñược tiến hành một cách ngược lại.
MÃ H
MÃ H
Ó
Ó

A ÂM THANH N
A ÂM THANH N


I
I
• Âm thanh ña kênh
L
R
C C
L
R
L
R
S
S
C
L
R
LS
RS
C
L
R
LS
RS
LFE
S: Surround.
LFE : Low Frequency
Enhancement (Woofer)

15 – 120Hz
Có thể ñặt bất kỳ.
2/0 Stereo
3/0
3/1
3/2 3/2 với siêu trầm (5.1)
MÃ HO
MÃ HO
Á
Á
ÂM THANH N
ÂM THANH N


I
I
• Mã hóa Trái phải (LR)
Không loại bỏ ñộ dư thừa.
Các kênh riêng biệt ñược mã hoá ñộc lập.
Ngưỡng che không liên quan.
Hiệu quả với âm thanh rất khác biệt giữa kênh trái và kênh phải
.
N
1
N2
L≈R
R≈L
+
+
L’

R’
Nguồn
MÃ HO
MÃ HO
Á
Á
ÂM THANH N
ÂM THANH N


I
I

Joint Stereo Midle-Side
Khuynh hướng của Joint Stereo không chỉ là kết hợp các ñịnh dạng của
chuẩn nén mp3 (MPEG1 lớp III) mà còn kết hợp các dạng khác: MPEG và AAC.
Middle-Side Stereo xét hai kênh dữ liệu theo hai phương diện khác nhau.
Thay vì lưu trữ một dữ liệu âm thanh theo hai kênh Left và Right, ta có thể chỉ cần lưu
trữ một chuỗi tương tự số trung bình Average (của Left và Right) và sự sai biệt
Difference (giữa Left và Right).
Ở dạng Middle-Side, ta có thể lưu trữ các giá trị Middle và Side như sau:
Middle=(L+R)/2, Side=(L-R)/2.
Dấu của Side là rất quan trọng, nếu Side >0 nghĩa là tín hiệu L lớn hơn tín
hiệu R.
Ta hoàn toàn có thể tái tạo hai kênh L, R như sau:
L=Middle+Side, R=Middle-Side.
Ưu ñiểm là sự khác biệt tương ñối của các tín hiệu audio của các kênh L và
R. Kết quả là kênh Middle lớn hơn nhiều so với kênh Side. Việc mã hoá kênh Side sử
dụng ít bít hơn ñể giải phóng tài nguyên mà có thể ñược sử dụng ñể triển khai hữu hiệu
hơn trên kênh Middle. Khi tái ñịnh dạng lại L, R thì kết quả sẽ thể hiện tín hiệu gốc ngõ

vào thực hơn.
MÃ HO
MÃ HO
Á
Á
ÂM THANH N
ÂM THANH N


I
I
– Tính chất
Kênh side sử dụng số bit rất ít.
Loại bỏ ñộ dư thừa cho tín hiệu mono trong thực tế.
Có thể ñược áp dụng trong miền thời gian lẫn tần số.
ðộ lợi mã hoá cao phụ thuộc tín hiệu.
– Biến ñổi ngược: tổng/hiệu chuẩn hoá.
MÃ HO
MÃ HO
Á
Á
ÂM THANH N
ÂM THANH N


I
I
• Stereo ghép cường ñộ cao (Intensity Stereo):
Mục ñích: Tối thiểu hoá thông tin stereo ñể nhận ñược tốc ñộ bit thấp nhất nếu có thể.
• Mã hoá tín hiệu tổng các kênh + các hướng của các kênh. Truyền ñường bao, sau

ñó tỷ lệ theo các kênh.
• Kiểm chứng dựa trên việc cảm nhận của con người kém ñối với tần số trên 3kHz.
• Không liên quan ñến kỹ thuật suy giảm.
• Biên ñộ và pha là không quan trọng.
• Giảm gần 50% dữ liệu.
• Không ñảm bảo thông tin về pha của tín hiệu.
• Một vài sự méo có thể nhận biết ñược.
• Sử dụng trong các ứng dụng tốc ñộ bit thấp.
MÃ HO
MÃ HO
Á
Á
ÂM THANH N
ÂM THANH N


I
I
Chỉnh pha
Chỉnh pha
Σ
ðo biên ñộ
ðo biên ñộ
÷
÷
ðo biên ñộ ðo biên ñộ
Hướng kênh L
Hướng kênh R
L+R
L

R
X
X
L+R
Hướng kênh L
Hướng kênh R
L
R

×