MULTIMEDIA
MULTIMEDIA
MULTIMEDIA
Lecturer: Nguyen Duy Nhat Vien
July, 2006.
N
N
Ộ
Ộ
I DUNG
I DUNG
• TỔNG QUAN
• KỸ THUẬT AUDIO
• KỸ THUẬT VIDEO
K
K
ỹ
ỹ
thu
thu
ậ
ậ
t Audio
t Audio
N
N
ộ
ộ
i dung
i dung
• GIỚI THIỆU
• MÃ HOÁ AUDIO CẢM QUAN
• PHÂN TÍCH TÂM LÝ ÂM HỌC
• KỸ THUẬT NÉN AUDIO
• MPEG-1
• MPEG-2
• AC-3 (DOLBY DIGITAL)
• APT-X100
• MÃ HOÁ ÂM THANH NỔI
Gi
Gi
ớ
ớ
i thi
i thi
ệ
ệ
u
u
• Âm thanh:
• Dạng lan truyền của sóng trong không gian,
• Sóng âm khi ñến tai người nghe, ñập vào màng nhĩ, làm cho người ñó
cảm nhận ñược sự rung ñộng này
• Con người có khả năng phân biệt với các âm thanh khác dựa vào một
số ñặc tính như tần số, nhịp ñiệu, mức áp lực
• Mục ñích của các hệ thống audio:
• Xử lý, tạo hiệu ứng, nén tín hiệu audio từ tín hiệu thu nhận từ nguồn.
• Audio số:
• Chuỗi các giá trị số ñược biểu diễn bằng mức âm thanh theo thời gian.
Ứ
Ứ
ng d
ng d
ụ
ụ
ng
ng
• Các hệ thống thông tin không dây:
– Truyền hình phân giải cao (HighDensity TV HDTV), Âm thanh quảng
bá số (Digital Broadcast Audio DBA), Vệ tinh quảng bá trực tiếp
(Digital Broadcast Satelite DBS).
• Các môi trường mạng:
– Âm thanh theo yêu cầu (chuyển mạch gói, Internet), Truyền hình cáp
(CATV) các tuyến studio.
• Các ứng dụng ña môi trường:
– CD-R, ðĩa ña năng số (DVD).
• Cinema:
– Dolby AC-3 (5 kênh, @384kbps), APT-x100.
• Lưu trữ khối:
– MiniDisc, DCC.
Audio s
Audio s
ố
ố
• Hệ thống audio tương tự và số
• Hệ thống audio tương tự, việc xử lý tín hiệu gặp phải một số vấn ñề
như khả năng của linh kiện (về mặt tần số), lưu trữ, phức tạp từ ñó
méo phi tuyến cao, SNR bé.
• Hệ thống audio số, việc thu nhận, hiệu chỉnh, xử lý và phát lại trở nên
dễ dàng hơn rất nhiều. Các kỹ thuật tổng hợp và nhận dạng phát triển
một cách nhanh chóng, tương thích máy tính và con người trở nên
phong phú hơn.
• Ưu ñiểm của audio số là: ðộ méo tín hiệu nhỏ (0,01%), Dải ñộng âm
thanh lớn gần mức tự nhiên (>90dB), Dải tần rộng hơn (20Hz ñến
20kHz), ðáp tuyến tần số bằng phẳng, Cho phép ghi âm nhiều lần mà
không giảm chất lượng, Thuận tiện lưu trữ, xử lý, Tăng dung lượng
kênh truyền, Khả năng xử lý bằng hệ phi tuyến
Qu
Qu
á
á
tr
tr
ì
ì
nh thu nh
nh thu nh
ậ
ậ
n audio s
n audio s
ố
ố
Hình 2-1 Quá trình thu nhận âm thanh số
Tín hiệu vào
tương tự
L
Tín hiệu vào
tương tự
R
Khuếch ñại
tuyến tính
Tạo
Dither
Lấy và
giữ mấu
Lọc thông
thấp
Mã
hóa
Khuếch ñại
tuyến tính
Lấy và
giữ mấu
Lọc thông
thấp
Mã
hóa
Ghép
kênh
Xử lý
Tín hiệu
ra số
L
L
ấ
ấ
y m
y m
ẫ
ẫ
u v
u v
à
à
lư
lư
ợ
ợ
ng t
ng t
ử
ử
ho
ho
á
á
• Lấy mẫu và giữ mức:
Lấy mẫu là quá trình rời rạc hóa tín hiệu về mặt thời gian và giữ cho biên
ñộ trong khoảng thời gian lấy mẫu không ñổi.
• Lượng tử hóa:
Lượng tử hóa là quá trình rời rạc tín hiệu về mặt biên ñộ. Tại mỗi mẫu,
biên ñộ ñược chia thành các mức gọi là các mức lượng tử
Hình 2-2 Lấy giữ mẫu và lượng tử
Tín hiệu vào Lượng tử
Dither
Dither
• Nguyên nhân: Lượng tử hóa méo. Tín hiệu có biên ñộ càng nhỏ thì
méo lượng tử càng cao.
• Khắc phục: Cộng âm thanh trước khi lấy mẫu với một tạp âm tương tự
Ngẫu nhiên hóa các ảnh hưởng méo lượng tử ñể phân phối ñều méo lượng
tử thành các lỗi ngẫu nhiên chứ không tập trung nhiều vào phần có biên ñộ
thấp.
• Khái niệm: Dither là một nhiễu ñược cộng vào tín hiệu âm thanh.
• Mục ñích: Loại bỏ méo lượng tử.
• Cơ sở: Dither làm cho tín hiệu âm thanh bị biến ñổi giữa các mức lượng tử
gần nhau, ñiều này làm giảm ñộ tương quan của lượng tử hóa tín hiệu, loại
các ảnh hưởng của lỗi và mã hóa các biên ñộ tín hiệu thấp hơn một mức
lượng tử.
• Nhược ñiểm: Cộng nhiễu vào tín hiệu.
Dither
Dither
Hình 2-3 Dither và không dither
Dither
Tín hiệu gốc
Tín hiệu lấy mẫu
Không dither
Tín hiệu gốc
Tín hiệu lấy mẫu
Tín hiệu sau khi lọcTín hiệu sau khi lọc
Mã h
Mã h
ó
ó
a v
a v
à
à
mã h
mã h
ó
ó
a kênh
a kênh
• Mã hoá
– là quá trình chuyển các mức rời rạc thành một chuỗi các mẫu số nhị
phân (hoặc các hệ ñếm khác) theo một quy luật nhất ñịnh.
– Sau mã hóa nhị phân, ta ñược tín hiệu ñiều xung mã PCM.
– Tín hiệu PCM không thích hợp ñể lưu trữ hoặc truyền dẫn vì vẫn còn
tồn tại thành phần một chiều mã hóa kênh.
• Mã hóa kênh
– biến ñổi dữ liệu với mục ñích ñạt ñược mật ñộ bit cao trong giới hạn
băng thông của kênh truyền.
– Giảm sự tổn hao trong khi truyền hoặc lưu trữ.
– Cải thiện dải thông, dữ liệu truyền dẫn có ñặc tính tối ưu.
– Làm cho phổ tín hiệu âm thanh số ít méo.
Gh
Gh
é
é
p kênh
p kênh
– Tín hiệu âm thanh số thường bao gồm nhiều kênh, ví dụ hệ
thống âm thanh 5.1 gồm các kênh trái, phải, trung tâm, trái
vòm, phải vòm và siêu trầm, ngoài ra còn có các tín hiệu
mã phụ, mã ñồng bộ…
– Nguyên lý ghép kênh có thường ñược áp dụng ñó là ghép
kênh phân chia theo thời gian, mỗi kênh sử dụng một khe
thời gian ñược ấn ñịnh trước.
L
R
L R
Ghép kênh L+R
Hình 2-4 Ghép kênh tín hiệu audio
MÃ HO
MÃ HO
Á
Á
AUDIO C
AUDIO C
Ả
Ả
M QUAN
M QUAN
• Giới thiệu
Mục ñích:
Biểu diễn chuỗi số ngắn gọn.
Tốc ñộ bit thấp.
Chất lượng cao
ðộng cơ:
Giảm tốc ñộ dữ liệu.
Giảm chi phí truyền dẫn (BW).
Giảm các yêu cầu lưu trữ.
Mạnh.
Các yêu cầu:
Cảm nhận trong suốt.
ðộc lập nguồn.
Có khả năng ña kênh.
ðộ phức tạp bất ñối xứng.
ðộ trễ hợp lý.
MÃ HO
MÃ HO
Á
Á
AUDIO C
AUDIO C
Ả
Ả
M QUAN
M QUAN
Mã hoá nguồn không thực tế với tín hiệu audio, do ñó, trong audio, người
ta tiến hành
- Khai thác các ñặc tính thu ñược.
- Loại bỏ các thành phần không thích hợp với cảm nhận.
- Giảm các dư thừa thống kê.
Thoại Audio
Băng thông 200-3400Hz 20Hz-20kHz
Tốc ñộ lấy mẫu 8kHz 44.1kHz/48kHz
Số bits trên mẫu 8bits 16+bits
Tốc ñộ bit thô 64kbps 768kbps
Số kênh 1 1-6+kênh
Mô hình hiệu quả nguồn Có Không
Sức chịu ñựng nguồn Có thể yêu cầu Yêu cầu
Chất lượng mong ñợi Méo do bị giới hạn Chất lượng “CD”
Tính ña dạng của phổ Harmonic, V/UV/TR Không thể phân loại
MÃ HO
MÃ HO
Á
Á
AUDIO C
AUDIO C
Ả
Ả
M QUAN
M QUAN
• Các tiêu chuẩn lấy mẫu theo các yêu cầu cụ thể khác nhau
- Chất lượng.
- ðộ trễ.
- Băng thông.
- Tốc ñộ
…
20Khz192.0 kbytes/sStereo16 bits/mẫu48 kHzDAT
20kHz176.4 kbytes/sStereo16 bits/mẫu44.1 kHzCD
10kHz88.2 kbytes/sStereo16 bits/mẫu22.05 kHzFM radio
5kHz11.0 kbytes/sMono8 bits/mẫu11.025 kHzAM radio
4Khz8 kbytes/sMono8 bits/mẫu8 kHzðiện thoại
Băng tầnTốc ñộMono/stereoSố bits/mẫuTốc ñộ lấy
mẫu
Tiêu chuẩn
MÃ HO
MÃ HO
Á
Á
AUDIO C
AUDIO C
Ả
Ả
M QUAN
M QUAN
Băng lọc số:
Băng lọc số là một tập hợp các bộ lọc số có chung ñầu vào nhiều ñầu ra hoặc chung
ñầu ra nhiều ñầu vào.
Băng lọc số phân tích là tập hợp các bộ lọc số có ñáp ứng tần số H
k
(e
jω
) có chung
ñầu vào và nhiều ñầu ra
Ngõ ra gồm M tín hiệu X
k
(n) chiếm dải tần liên tiếp nhau gọi là các tín hiệu băng
con (subband).
Các bộ lọc H
0
(e
jω
): thông thấp, H
M-1
(e
jω
): thông cao, H
i
(e
jω
): thông dải, với i từ 1
ñến M-2
H
0
(e
jω
)
H
1
(e
jω
)
H
M-1
(e
jω
)
…
X
0
(e
jω
)
X
1
(e
jω
)
X
M-1
(e
jω
)
x
0
(n)
x
1
(n)
x
M-1
(n)
x(n)
X(e
jω
)
MÃ HO
MÃ HO
Á
Á
AUDIO C
AUDIO C
Ả
Ả
M QUAN
M QUAN
Băng lọc số tổng hợp:
Là tập hợp các bộ lọc số có ñáp ứng tần số G
k
(e
jω
) có chung ñầu ra
Các bộ lọc : G
0
(e
jω
): thông thấp, G
M-1
(e
jω
): thông cao, G
i
(e
jω
): thông dải, với i từ 1
ñến L-2
Băng lọc số nhiều nhịp hai kênh và băng lọc gương cầu phương QMF
(Quadrature Mirror Filter Bank):
Băng lọc số nhiều nhịp là sự kết hợp của băng lọc số phân tích, băng lọc số tổng
hợp với bộ phân chia và bộ nội suy.
Với số bộ lọc của băng lọc phân tích và tổng hợp bằng 2 thì ta có băng lọc số nhiều
nhịp hai kênh.
G
0
(e
jω
)
G
1
(e
jω
)
G
L-1
(e
jω
)
…
X
0
(e
jω
)
X
1
(e
jω
)
X
L-1
(e
jω
)
x
0
(n)
x
1
(n)
x
L-1
(n)
x(n)
X(e
jω
)
+
+
MÃ HO
MÃ HO
Á
Á
AUDIO C
AUDIO C
Ả
Ả
M QUAN
M QUAN
• H0(e
jω
), G0(e
jω
) :Lọc thông thấp. H1(e
jω
), G1(e
jω
) :Lọc thông cao.
• Lý tưởng:
• Nếu |H0(e
jω
)|=|H1(e
jω
)| và nếu chọn tần số cắt cho 2 bộ lọc là π/2 thì ta thấy
|H0(e
jω
)|là ảnh của |H1(e
jω
)| qua gương ñặt ở vị trí π/2. Băng lọc nhiều nhịp
hai kênh với ñặc tính như vậy gọi là băng lọc gương cầu phương.
• Nếu giống dạng tín hiệu ngõ vào thì ta gọi là băng lọc gương
cầu phương khôi phục hoàn hảo PRQMF (Perfect Reconstructure QMF)
0
ˆ
( ) ( )
x n cx n n
= −
H
0
(e
jω
)
↓2 ↑2
G
0
(e
jω
)
H
1
(e
jω
)
↓2 ↑2
G
1
(e
jω
)
+
x(n)
x
0
(n)
x
1
(n)
v
0
(n)
v
1
(n)
y
1
’
(n)
ˆ
( )
x n
y
0
’
(n)
y
0
(n)
y
1
(n)
ˆ
( ) ( )
x n x n
=
MÃ HO
MÃ HO
Á
Á
AUDIO C
AUDIO C
Ả
Ả
M QUAN
M QUAN
• Mã hoá băng con và cấu trúc bộ lọc QMF
– Mã hoá băng con
• Sử dụng bộ lọc số ñể mã hoá băng con
• Thuận lợi cho việc nén tín hiệu âm thanh vì phổ tập trung không
ñồng ñều. Từ ñó, ta có ñược sự phân bố hợp lý, vừa hiệu quả, vừa
ñạt chất lượng cao.
H
0
(e
jω
)
↓2 ↑2
G
0
(e
jω
)
H
1
(e
jω
)
↓2 ↑2
G
1
(e
jω
)
+
x(n)
x
0
(n)
x
1
(n)
v
0
(n)
v
1
(n)
y
1
’
(n)
ˆ
( )
x n
y
0
’
(n)
y
0
(n)
y
1
(n)
v
0
(n)
v
1
(n)
Kênh
truyền
dẫn
Mã hoá Giải mã