Giáo trình môn học: Kỹ thuật Audio- Video số
CHƯƠNG I: TỔNG QUAN VỀ AUDIO- VIDEO SỐ
1.1. TỔNG QUAN VỀ AUDIO SỐ:
1.1.1 Tín hiệu AUDIO:
ừ ối thế kỷ 19, âm thanh điện tử đã được phát triển dướiạng hệ thống máy
điện thoại. Sang đầu thế kỷ 20, các máy quay đĩa và máy phát thanh đã mở ra những
ứng dụng mới cho âm thanh điện tử, đến mức gần như các gia đình trong thế giới văn
minh ngày nay đều sở hữu một vài thiết bị phục vụ đời sống tinh thần này.
1. Âm thanh tự nhiên:
Âm thanh là những biến đổi áp suất nhanh xảy ra trong không khí do nhiều
quá trình tự nhiên gây nên. Tiếng gió thổi trên cành cây, tiếng sóng biển vỗ bờ,
tiếng chim hót… tất cả đều là âm thanh tự nhiên. Nhiều hệ thống do con người
chế tạo cũng tạo ra những biến đổi áp suất tương tự, đôi khi là có chủ định song
đôi khi là khách quan.
Tai con người phản ứng lại với những biến đổi áp suất không khí ở phạm vi
tần số trong khoảng từ 30 Hz đến 15.000 Hz sau đó đưa đến não và đó chính là
âm thanh. Độ lớn hay biên độ dao động của những biến đổi áp suất này tạo nên
cảm giác về tiếng ồn.
2. Tái tạo âm thanh tự nhiên:
Âm thanh điện tử được gọi chung là Audio. Âm được thu từ nguồn nhờ một
hoặc nhiều micro và những tín hiệu audio thu được truyền qua hệ thống cho đến
khi tới loa phát.
Hình 1.1: Hệ thống tái tạo âm thanh điện tử
Mục đích tái tạo âm thanh điện tử là để tải các sóng âm thanh đến những
khoảng cách xa cả về không gian và thời gian, để người nghe có thể tiếp nhận
như thể họ đang nghe âm trực tiếp từ nguồn. Một mục đích khác nữa là để chau
chuốt âm thanh tự nhiên, làm cho âm thanh điện tử hay hơn âm gốc, hoặc tạo ra
những âm thanh mới không có trong tự nhiên.
1.1.2. Tín hiệu AUDIO số:
1. Laáy maãu:
Giảng viên: PHẠM THỊ ÁNH HỒNG Biên soạn năm 2012
Nguồn âm
Máy thu
Lưu trữ hoặc
truyền dẫn
Thu audio
Loa
Giáo trình mơn học: Kỹ thuật Audio- Video số
!"#$%$&$%'
(")*"%"#+,"(-!.'/012
#(!+3%(#!++
Hình 1.2: Quá trình điều biên trong miền thời gian
4"#5
≥
35
#'
!6'7*89
#$"/:0;2"(&$+
<45
=5
#'
&$-:0;.>'"("6
*$+;
#'
"(?&$??5
#'
@3A
4BC
⇒
5
@DD+4BC5
"("#+
<6$EF*?.GH5
68$*8%(#&$6*+
<I"#*?(*.J#$6("#
s
f
1
+
Hình 1.3: Quá trình điều biên trong miền tần số
.$EF>.$'?##76
(#*!K+DK+L+
Giảng viên: PHẠM THỊ ÁNH HỒNG Biên soạn năm 2012
I"#
,.
&"#01
(
(
M
N$
08"#
,.
N$
N$
5
35
5
<5
#'
5
O5
#'
3
Giáo trình mơn học: Kỹ thuật Audio- Video số
B$((D8"#&$
<34BC/82(%(*;1
+
<DD+4BC/82E(FPFEPQE*"+
<DR4BC/8*28*.G$%(
!"+
<:#/%#*"2D5
8?##"?
STPU.V@W+A3O+KWOA"
A
$"#/@D2
TS.M#"?+
2. Lượng tử hoá (Quantizing):
S-!"#"(-!"?+F#.$(
(#.$%>>*+T."#73
6?"?+
Giảng viên: PHẠM THỊ ÁNH HỒNG Biên soạn năm 2012
?
,.
&$7"#
(
(
M
N$
(
Hình 1.4 : Quá trình lấy mẫu và giữ trong miền thời gian
,.
N$
N$
5
S
35
S
5
S
5
S
35
S
&$
Hình 1.5 : Quá trình lấy mẫu và giữ trong miền tần số
Giáo trình môn học: Kỹ thuật Audio- Video số
Hình 1.6: Quaù trình löôïng töû hoaù 4 bit
- 4?"?"(6'%8>%(#?
&$+
- S#"?(G!#é"?(G!#"?
(?#+
- X "(6?"?/
22
QQ
−÷+
29&$M"
?STP"(
STP@
5,12
12
2
2
1
n
n
Q
Q
N
V
=
×
=
−
&$S@
2
2
1
Q
n
×
−
U%"#V
T"?T@
12
Q
U#V
Giảng viên: PHẠM THỊ ÁNH HỒNG Biên soạn năm 2012
D
A
A
AA
A
AA
AAA
A
AA
AA
AAA
AA
AAA
AAA
AAAA
N$
(
FY
(
A
.+>"+("#%(
>"?
(
+S"?
Giáo trình mơn học: Kỹ thuật Audio- Video số
⇒
STPU.V@WA3OKW
"(."?/.M#"?2
3. Mã hoá (coding):
1>"?>**?#78*(*%"
&$"#%(#+B$(("(0F1/.
#7'20Z1/$$'2E1/"&2E0F1
/'#7%25"*/8#$2+
:0F1(%!?&$-?+,)8#?
"($&?6?"?+F#"?
.J(#7#$$"+B!+K"(6"(-
!#7%(?#70F1+
Hình 1.7 : Sơ đồ khối đơn giản hoá của hệ thống PCM
1.1.3. Giao diện số AES/EBU:
1. Câú trúc cơ bản của giao thức AES/EBU
Tiêu chuẩn tín hiêụ video số AES/EBU là một giao thức cho phép các thiết bị
số có thể phát và thu tín hiệu audio số.
Khung dữ liệu được tạo bởi hai khung con (khung con A và B). Mỗi mẫu dữ
liệu được phối hợp từ một nguồn audio hoặc một kênh, dữ liệu phụ, dữ liệu mở đầu,
các thơng tin về giá trị (V), thơng tin thêm vào để trợ giúp người sử dụng dữ liệu (U),
thơng tin về các tham số hệ thống (C) và bít chẵn lẻ (P) để phát hiện sai số truyền để
kiểm tra độ tin cậy của kênh.
Các khung dữ liệu audio được nhóm lại thành các khối (block) gồm 192 khung.
Một tín hiệu cờ được gửi đi trong dòng dữ liệu cho phép nhận biết mỗi block. Khoảng
thời gian tồn tại một khung audio là 20,83 µs trong hệ thống lấy mẫu 48 KHz. Do đó
thời gian tồn tại một khối AES/EBU là: 20,83 µs x 192=4000 µs.
Giảng viên: PHẠM THỊ ÁNH HỒNG Biên soạn năm 2012
N*
5"
S#*"
"
""
%
E""
%
B"
:[<*
5"
###
01
01
"*
"*
L
Giáo trình môn học: Kỹ thuật Audio- Video số
Dữ liệu mở đầu gồm 4 bit, hay còn gọi là từ đồng bộ, được dùng để nhận biết sự
bắt đầu của một mẫu mới và của một block mới. Ba từ còn lại được sử dụng trong:
- Từ đồng bộ Z: dãy bít này cho biết sự bắt đầu của khung đầu tiên của một khối
(block) audio mới. Từ này tạo ra cờ Z.
- Từ đồng bộ X: từ này cho biết sự bắt đầu của tất cả các khung con A.
- Từ đồng bộ Y: từ này cho biết sự bắt đầu của mọi khung con B.
Mỗi khung audio gồm 2 khung con, trong đó mỗi khung gồm 32 bit. Mỗi mẫu tín
hiệu audio, theo lý thuyết có thể gồm 16 đến 20 bít hoặc tới 24 bít khi 4 bít phụ được
coi như các bít mẫu tín hiệu audio. Bít phụ cho biết tình trạng các dãy bit trong kênh,
nó nằm trong byte 2, các bít 0-2.
Mỗi khung con có 4 bit phụ:
- Bit giá trị (V): bit này cho biết các bit dữ liệu lấy mẫu âm thanh trước đó có
đúng hay không.
- Bit sử dụng (U): bit này cho biết mọi thông tin thêm vào để trợ giúp người
sử dụng dữ liệu.
- Bit kênh (C): cũng giống như bit sử dụng, bit kênh có mặt trong các khung
phụ, nó được gửi tới các hàng đợi được tạo bởi 28 hàng. Nội dung của hàng đợi rất
quan trọng trong việc xác định nội dung của từ dữ liệu audio.
- Bit parity (P): bit parity được đặt để chỉ định một parity chẵn. Bit parity cho
phép phát hiện số lẻ của lỗi do quá trình truyền dẫn. Một số thiết bị đã bỏ qua những
bit này hoặc thi hành không chính xác trong quá trình chỉ định.
2. Các đặc điểm giao diện kênh chuẩn AES/EBU:
Đặc điểm của định dạng giao diện sử dụng AES/EBU được chỉ ra trong bảng sau:
+ Định dạng: truyền dẫn nối tiếp của hai kênh số liệu được lấy mẫu và mã
hoá tuyến tính.
+ Các thông số phát: tín hiệu ra không cân bằng.
Các bộ nối: giắc cắm âm thanh RCA.
Biên độ tín hiệu ra: 500mV
đỉnh-đỉnh
ứng với tải 75Ω (không cân bằng).
+ Các thông số thu: Tín hiệu vào không cân bằng.
Các bộ giắc cắm âm thanh RCA.
Giảng viên: PHẠM THỊ ÁNH HỒNG Biên soạn năm 2012
\
F"
I] ] I ]
F"N F" F"N F" F"N
;#A;# ;#^;#A
4ối Audio
\5"
W
Giáo trình mơn học: Kỹ thuật Audio- Video số
Trở kháng vào 75Ω.
Định dạng kênh người sử dụng này được dùng trong các thiết bị CDs và RDATs
với tín hiệu vào ra số.
1.2 Tổng quan về VIDEO sè:
1.2.1. Tín hiệu VIDEO:
1.2.2. Số hóa tín hiệu VIDEO:
1. Lấy mẫu tín hiệu Video số
&$%(5
%
5
.
7.8(!.-
'*%6("#
S
+"#"(
S
S
T
f
1
=
E*8?&$"#8"(
""#*??>""#"(5
≥
35
.
+
(7.??#"&$?6$-!.
8_+
Hình 7.8: Phổ của tín hiệu sau khi lấy mẫu
a. Tần số lấy mẫu tín hiệu Video tổng hợp (Composite Video Signal)
,%&$%8*"#&$%(
.J3)D"##(5
+
(!(5
@5
TSF5
@A+K1BC
Giảng viên: PHẠM THỊ ÁNH HỒNG Biên soạn năm 2012
5
S
O5
.
5
S
5
.
5
S
<5
.
N$
"
5
S
O5
.
5
S
5
.
5
S
<5
.
N$
N*
NG
.?
N
K
Giáo trình mơn học: Kỹ thuật Audio- Video số
0:5
@+1BC
(((5
@D5
TSF5
@D+31BC
0:5
@K+K31BC
E&$%#?768#?%
((?***&$(*+
b. Tần số lấy mẫu tín hiệu Video thành phần (Component Video Signal)
&$%(*"#("-9
"$7&$%(&$#(+(9"$D`D33`
DDDa767?*+
2. Lượng tử hoá biên độ tín hiệu video (Quantizing).
,"(-!.8&$"#(6?(
"(6?"?/ 2+
@3
"(.M#+
T@R!73
R
@3LW6?"?+
Có hai cách lấy khoảng lượng tử:
- Tuyến tính:6?"?6*$&$
"%(+
- Không tuyến tính:F6?"?8.8.$?
&$+F%(&.8!6?"?%(.8
!6?"?Y+
!"?"("(#(9'%/.$&$7"
# sá%#$#"?2+T%$7-!
"ượng tử hóa"(#(+S(7
Q
2
1
±≤
+
4"?&"?%.M#*7'$
"?b
Q
2
1
+S(7"(##&$%((
(%/552+
X>.!/P1S_P1S-2?#"?
>
Giảng viên: PHẠM THỊ ÁNH HỒNG Biên soạn năm 2012
R
Giáo trình môn học: Kỹ thuật Audio- Video số
12
Q
RMS =
X>?&$/.$EF2"(
/3
_2
T(((?&$9"?
MRS
Q
S
8"(#
9#$.>+
[ ]
dBn
Q
Q
Q
S
n
RMS
8.1002.6
122
log20
10
+=
=
@R!
dB
Q
S
RMS
96.58=
???
RMS
Q
S
<$5
#'
+
<4?"?&$%&a
E?
RMS
Q
S
&
−
−
++=
bw
q
s
RMS
VV
V
f
f
n
Q
S
10
max
10
log20
2
log108.1002.6
max
10
2
log10
f
f
s
"(>???5
#'
−
−
bw
q
VV
V
10
log20
"(???6?%&+
T"(.M#
;
"("#
;
#'
"(%/D+3`L`L+L`W#C2
-
"($*&$(.$6?"?UV
[
"($*#YUV
.
"($*#'
[
_
.
@
Giảng viên: PHẠM THỊ ÁNH HỒNG Biên soạn năm 2012
^
A+K%$0:
A+KD%$TSF
Giáo trình mơn học: Kỹ thuật Audio- Video số
3. Mã hoá (Coding)
,"(.Y*'*>6"?#$6$
(+
4. Tiêu chuẩn Composite số
a. Tiêu chuẩn Digital Composite f
s
= 4f
sc
PAL (tiêu chuẩn PAL 4f
sc
)
STT Thông số Giá trò của PAL 625/50
S#M( L/((%(W3L2
3 S#M(& ^DR
"#5
;
@D5
@K+KDDKL#C
D *"# ODL
A
`OL
A
`O33L
A
`OL
A
L 17 :?
W ,$*?"? R)A.M#
K $7"$ KK+1.M
Bảng 7.1: Các thông số của tiêu chuẩn PAL 4f
sc
<?#(5
/N28*"">OL
A
%(O33L
%('"#5
+
<?#(0:#$c55"(3LBC+T%$5
7"(
;
@
( )
MHzHzf
f
f
n
H
V
H
43361875.42575.285
24
12 =+=++
%@LWK
<S6(?#(#$?/5#2
75.177344
25
=
SC
f
6(M5#
<"#5
*"(A
A
%(d
;
@D5
@K+KDDKL#C+
OS##$(&7'.$6
dòng
Mẫu
Hz
MHz
f
f
H
S
AAWD+L
LW3L
KDDKL+K
==
+
OS#8$#$?"(
mẫu
ảnh
Sốdòng
Dòng
Sốmẫu
A^K^W3LAAWD+L =×=×
+
T#M("(L!#M?"(KA^KL^DR
#M(&%(RK#M6?'(+
Giảng viên: PHẠM THỊ ÁNH HỒNG Biên soạn năm 2012
A
Giáo trình mơn học: Kỹ thuật Audio- Video số
Hình 7.9: Quan hệ số mẫu PAL 4f
sc
và một dòng tín hiệu Analog
FJ(%(W3LJ#6?'#(+
!K+^#&(A
÷
D"(
(&#^DR#(A
÷
^DK6"(#.$#RK#
(^DR
÷
D+
,8#8.$J#?7#^LR+
(#$#"(
ns
s
D+LW
D
WD
=
µ
* Lượng tử hóa
TT Thông số PAL composite Độ phân giải 8 bit Độ phân giải 10 bit
F#.?%$&$#( ;; ;F;ED;e;;
3 1"? ;e ;N
19# b;e b;N
D 1Y E DF
L 1'# F AA
W 19.$#( AD AW
K 1"?* A AAD
R F#.?%$.$ AA AAAAAAA3AA
Giảng viên: PHẠM THỊ ÁNH HỒNG Biên soạn năm 2012
,9Y
N
E(&
^RD6?#(
A^DK
1.$
1
1.$
I
RK#
^DR^D^+aa+++D
3
+
N.$
#
N$
3R+3
L3
D+K
F8.$
^LL^LW^LK^LR^L^^WA
LAf
Giáo trình mơn học: Kỹ thuật Audio- Video số
Bảng 7.2: Các mức chủ yếu của composite sọc màu tương tự 100/0/100/0 và
các giá trò PAL 4f
sc
tương ướng với độ phân giải 8 bit và 10 bit.
Hình 7.10: Quan hệ giữa các mức của Analog PAL sọc màu 100% và PAL 4f
sc
N?K+3%(!K+A##$?&$#(
#*%(#0:D5
(*$*?R
.%(A.+
gF#"?%$*?A.#3
@A3D#
(A
÷
A3/$EeF2%((AAA
÷
;;/$BeI2%G
• (AAA
÷
AA"(#.?%$*(.$6
(+
• (AAD
÷
;N/#D
÷
A^EeF2(.8&$%
+
• 1AAD
÷
/BeI2#D/EeF2"(9'.$7"(#
"?*+
• 1AA3LW/EeF2"(#'7"(#A#+
• 1DF/BeI2RDD/EeF2"(#YKAA#+
• 1;N"(#"?+
T%$AW#/AAD
÷
;N(D
÷
A^EeF2(8.8
&$%8*+
• F#(;F
÷
;;"(#.?%$+
Giảng viên: PHẠM THỊ ÁNH HỒNG Biên soạn năm 2012
#
^+L
^AR+
KAA
A
<AA
<A+3
<AD+R
EeF
A3
A^
RDD
3LW
D
3
A
BeI
;;
;N
DF
AA
AW
AAD
AA
AA3
AA
AAA
B#
AAf##(
1"?
1Y1Y
1'@#
1.$@1
"?*
#
^+L
^AR+
KAA
A
<AA
<A+3
<AD+R
EeF
A3
A^
RDD
3LW
D
3
A
BeI
;;
;N
DF
AA
AW
AAD
AA
AA3
AA
AAA
B#
AAf##(
1"?
1Y1Y
1'@#
1.$@1
"?*
4?
*(.$
3
Giáo trình mơn học: Kỹ thuật Audio- Video số
• 19&$#(%(/]""[2%('8#/F2"(
^+L#6"#&$%("(RRW#?#"?
^AR+#?#$##9&$+
h?%@A.M#5
@K+K1BC5
#'
@L1BC
-
@+3
[
_
.
@A+K
dB
Q
S
RMS
K+WR=
+
b. Tiêu Chuẩn Digital Composite f
s
= 4f
sc
NTSC (tiêu chuẩn NTSC 4f
sc
)
STT Thông số Giá trò NTSC 525/60
S#M( ^A
3 S#M(& KWR
"#5
;
@D5
@D+3RR1BC
D F"#
L *"# O
A
`O3
A
`O3
A
`OA
A
W 17 :?
K ,$*?"? R)A.M#
R $7"$ D1.M
Bảng 7.3: Các thông số cơ bản của NTSC 4f
sc
g"#85
@D+R1BC
≈
D+31BC5
@LKD+3LBC
#M("(
^A=
H
S
f
f
+
FL3L_R@DRK(&#$(&KWR#+
g4?'("(^A_KWR@D3#+
• ,8#8.$"(8#7('.$J#7#
KRD%(KRL+
• 4?%&(A
÷
KWK
• *"(6?'(#KWR
÷
^A^/D3#2+
F#!K++
Giảng viên: PHẠM THỊ ÁNH HỒNG Biên soạn năm 2012
NY'
(
4'
(
4%
&
E(
8
KDK
KDR
KR3
KRD
KRL
KRK
RD^
RLD
RLK
^AA
^A^
AAA
RWD R^
NY%
&
Giáo trình mơn học: Kỹ thuật Audio- Video số
Hình 7.11: Khoảng xoá dòng số NTSC 4f
sc
TT Thông số NTSC composite Độ phân giải 8 bit Độ phân giải 10 bit
F#.?%$&$#( ;; ;F;ED;e;;
3 1"? ;e ;N
19#( ; FF
D 1Y FR 3A
L 1 DW
W 1' F A;A
K 19.$#( AD AW
R 1"?* A AAD
^ F#.?%$.$ AA AAAAAAA3AA
Bảng 7.4: Các mức chủ yếu của Composite sọc tương tự 100/7.5/100/7.5 và
các giá trò NTSC 4f
sc
tương ứng với độ phân giải 8 bit và 10 bit
* Lượng tử hoá.
F#"?$*?A.#3
A
@A3D#(A
÷
A3("#
• (AAA
÷
AA"(6?*(8(#.$6
(+
• (AAD
÷
;N/#A^EeF2(&$+
Giảng viên: PHẠM THỊ ÁNH HỒNG Biên soạn năm 2012
D
Giáo trình mơn học: Kỹ thuật Audio- Video số
Hình 7.12: Quan hệ giữa các mức của analog NTSC và
Các giá trò mẫu digital 10 bit các sọc màu 100%
• (AAD
÷
AA/D
÷
WEeF2"(##.$+
• B#9(FF
÷
;N/^3K
÷
A^2+
• (;F
÷
;;"(#.?%$9+
• 1FF"(#&$/]""[%(F2+
• 1A;A"(#'+
• 1"(#+
?&$"?&
h?%@A.M#5
@D+1BC5
#'
@D+31BC
-
@+AD3
[
_
.
@A+KD
dB
Q
S
RMS
A^+WR=
+
* Kết Luận :
• ,%&$%8*/TSF0:2"#&
$%("(3)D"##(/35
5
)D5
2+
• &$%8*(#?768#?&
$%"($_#(+
Giảng viên: PHẠM THỊ ÁNH HỒNG Biên soạn năm 2012
L
-/#2
^^R+
^^D+3
^^3+^
^D+
KD+
L+LK
A
<3RL+K
<AA+K
<A3+
<AW+
EeF
A3
A3A
A^
^K3
RAA
3R3
3DA
W
D
A
BeI
;;
;F
;N
FF
3A
A;A
AW
AA
AAD
AA
AAA
AAf##(
1"?
1Y
1
1.$
1"?*
1'
B#
Giáo trình mơn học: Kỹ thuật Audio- Video số
• "#(G"%("
#"(?.>(*??$%(.$
""+F*&(.$$%$G""+"
#&*J#6?(31BC
÷
D1BC+
• S&$%8*$.*%***
&$%(*+
• &$8*.$"$8#-!'?"
67'?!a
5. Tiêu chuẩn Component số.
8F#*(?%(178
P##WAFFiP+8(&%8-
W3LMLA%(L3LMWA%$*?R.M#%(A.M#+
a. Tỷ lệ lấy mẫu
F8*%(!
• S10e/S510"%e2%8
SF/%"%F##2+
• eNd /e* N d2 % 8 EN /E"
N278FFiPP+WA(G#^R3?
8+KL1BC+
• ?"$"#?8#*"(9"$#(?&$
:#/]2%(&$#(F
N
%(F
P
"#?
%.$?8+KL1BC+(?"$"#
< D&$]"#5
@
MHzL+KL+D =×
&
$#("#?5
.
@5
@
KL+
×
@+KL1BC+
< D33&$]"#5
@
MHzL+KL+D =×
&
$#("#?5
.
@5
@
KL+3
×
@W+KL1BC+
< DDD&$]F
N
F
P
"(
MHzL+KL+D =×
+
b. Các tín hiệu mã hoá, thời gian và tần số lấy mẫu chuẩn 4:2:2.
F&$#7]F
N
F
P
#??.?
* Các thông số mã hoá màu 4:2:2 của tiêu chuẩn 625/50 và 525/60.
Thông số Chuẩn 4:2:2 của 625/50 Chuẩn 4:2:2 của 525/60
Giảng viên: PHẠM THỊ ÁNH HỒNG Biên soạn năm 2012
W
Giáo trình mơn học: Kỹ thuật Audio- Video số
F&$#7
67?
γ
]j@A+LRKXjOA+DNjOA+3^^Pj
F
N
j@A+LWD/Nj_]j2
F
P
j@A+K/Pj_]j2
S#M(
]RWD
F
N
D3
F
P
D3
]RLR
F
N
^3
F
P
D3^
S#M(& ]K3A
F
N
WA
F
P
WA
F"#
F#F
N
F
P
")*"(#(%(?
(%#]"?(+
"# ;
@RDW5
@+L1BC
;
.
@5
@ D35
@
W+KL1BC
;
@RLR5
@+L1BC
;
.
@5
@D3^5
@W+KL1BC
:#7hố ,'#7/0F12"?+
,$*?"? R)A.M#]%(&$#(
Bảng 7.5: Các thông số mã hoá 4:2:2 của tiêu chuẩn 625/50 và 525/60
* Thời gian và tần số lấy mẫu 4:2:2.
• B$W3LMLA(#$("(WD
s
µ
(#$(&"(L3
s
µ
('("(3
s
µ
+
• B$L3LMWA(#$("(W+LW
s
µ
(#$(&"(
L3
s
µ
('("(+LW
s
µ
+
• ;
@+L?$(.$$0::<Fc/0:6:*
_F""c""2+$W3LMLA5
@RWD
×
LW3LBC@+L1BC+F($
L3LMWA5
@RLR5
@RLR
×
LKD+3WL@+L1BC+
F.$(&$%+,)&?#"].J
kL+KL1BC(F
N
F
P
3+KL1BC+
c. Lượng tử hoá
* Thành phần chói Y.
TT Thông số của Y
component
Độ phân
giải 8 bit
Độ phân giải 10 bit
F#.?%$9 ;; ;F;E;e;;
Giảng viên: PHẠM THỊ ÁNH HỒNG Biên soạn năm 2012
K
Giáo trình mơn học: Kỹ thuật Audio- Video số
3 1"? ;e ;N
19Y eN F
D 1' A ADA
L X> "? ?
A AAD
W F#.?%$ AA AAAAAAA3AA
Bảng 7.6: Một số thành phần Y tín hiệu sọc màu 100/0/100/0 và các tín hiệu
số Y trong hệ HEX tương ứng với 8 bit và 10 bit
F#"?A.#3
A
@A3D#(A
÷
A3/$EeF2%(
(AAA
÷
;;/$BeI2%G?#
Hình 7.13: Quan hệ giữa các mức tín hiệu Analog Component Y của
sọc màu 100% và các giá trò lấy mẫu 10 bit và 8 bit
• AAA
÷
AA"(D#*(+
• (AAD
÷
;N"((&$+
• 1AADBeIWDEeF"(#'+
• 1FBeI^DAEeF"(#9Y+
• 0'.$?&$6"#+
• B#?"(6ả?*(**9#"(
#AAD
÷
ADABeID
÷
WDEeF+
• (F
÷
;NBeI^DA
÷
A^EeF"(##+
• 1;NBeIA^EeF"(#"?+
Giảng viên: PHẠM THỊ ÁNH HỒNG Biên soạn năm 2012
8 bit
3LL
3LD
3L
W
A
;;
;e
eN
A
A
AA
10 bit
# EeF BeI
KWW+
KW+^
KW+
KAA
A
<DK+^
<DR+^
<L+
A3
A3A
A^
^DA
WD
D
A
;;
;F
;N
F
ADA
AAD
AA
AAA
B#
1"
?
19
1"
?*
I.$
6"?
D#
*(
B#
D#
*(
R
Giáo trình mơn học: Kỹ thuật Audio- Video số
• (;F
÷
;;BeIA3A
÷
A3EeF"(D6?*(+
h?%@A.M#5
@+L1BC5
#'
@L+LK1BC
-
@A+RKD
[
_
.
@A+K
dB
Q
S
RMS
L+KA=
+
@R.
dB
Q
S
RMS
+LR=
* Thành phần C
B
và C
R
.
ST
T
Thông số C
B
và C
R
Component
Độ phân giải 8
bit
Độ phân giải 10
bit
F#.?%$9 ;; ;F ;E ;e
;;
3 1"? ;e ;N
19 eA FA
D 1' RA 3AA
L 19# A ADA
W 1"?* A AAD
K F#.?%$ AA AAAAAAA3AA
Bảng 7.7: Các mức analog component C
B
và C
R
của tín hiệu sọc màu
100/0/100/0 và các giá trò của C
B
và C
R
digital ứng với 8 bit và 10 bit
FJ&$F
N
%(F
P
"("7*?>#
LA#8%(.$EF+
(*#"??F
N
9
7?!
K+D?F
P
?!K+D.+
Giảng viên: PHẠM THỊ ÁNH HỒNG Biên soạn năm 2012
^
Giáo trình môn học: Kỹ thuật Audio- Video số
Hình 7.14b: Caùc möùc tín hieäu C
R
9"$
T@A.M#
-
@A+KK^3
MHzf
BR
CSC
KL+W=
[
_
N
@A+K
dB
Q
S
RMS
KD+KAL+RR^+AK
K+A
K^^3+A
"3A
L+L
KL+W
"AR+AAA3+W =++=−++×=
Giảng viên: PHẠM THỊ ÁNH HỒNG Biên soạn năm 2012
Hình 7.14a: Caùc möùc tín hieäu C
B
#
/A.2
^^+3
^W+^
^W+
LA
<LA
<^W+^
<^K+K
<DAA
R.
EeF BeI
3LL
3LD
3DA
3R
W
A
;;
;e
;A
RA
A
A
AA
A.
EeF BeI
A3
A3A
A^
^WA
L3
WD
D
A
;;
;F
;N
FA
3AA
ADA
AAD
AA
AAA
D#
*(
B#
B#
D#
*(
1"?
1#'
1'
1##'
1"?*
#
/A.2
^^+3
^W+^
^W+
LA
<LA
<^W+^
<^K+K
<DAA
R.
EeF BeI
3LL
3LD
3DA
3R
W
A
;;
;e
;A
RA
A
A
AA
A.
EeF BeI
A3
A3A
A^
^WA
L3
WD
D
A
;;
;F
;N
FA
3AA
ADA
AAD
AA
AAA
D#
*(
B#
B#
D#
*(
1"?
1#'
1'
1##'
1"?*
O
F
<
3A
Giáo trình môn học: Kỹ thuật Audio- Video số
@R.M#
dBdB
Q
S
RMS
K+LRW^R+LR ≈
d. Caáu truùc laáy maãu tröïc giao
F#Y*'*(6((k+
F(>#(/5"2%(5#+
F(k"(#+
Hình 7.15: Caáu truùc maãu tröïc giao
Giảng viên: PHẠM THỊ ÁNH HỒNG Biên soạn năm 2012
3
3
D
;"
;"3
5
5
3
5
3
5
3
5
5
5
Giỏo trỡnh mụn hc: K thut Audio- Video s
CHNG II: X Lí TRUYN DN AUDIO- VIDEO S
2.1. NẫN TN HIU AUDIO S
2.1.1. Gii thiu chung
Tín hiệu audio số PCM đợc dùng nhiều trong truyền hình, multimedia và nhiều
ứng dụng khác (các hệ thống đa đờng audio , nhà hát ). Tín hiệu âm thanh stereo
có độ phân giải 16 bit , lấy mẫu 48 KHz, sẽ cho tốc độ dữ liệu audio là 1,54 Mbit/s.
Audio số có nén đợc sử dụng trên CD-ROM, mạng, phát thanh,truyền hình số vệ
tinh DBS
Các hệ thống nén thông tin audio dựa trên đặc trng tâm sinh lý nghe (âm học) và
các giới hạn của tai ngời để loại bỏ các phần dữ liệu không cần thiết (d thừa ) trong
tín hiệu audio.
Hệ thống thính giác của con ngời hoạt động nh một bộ phân tích phổ, và phần
phổ của âm thanh nghe đợc độc lập sau khi qua bộ lọc thông giải, gọi là các dải băng
chuẩn . Các dải băng chuẩn có độ rộng 100Hz khi tần số dới 500 Hz, và khi tần số
trên 500 Hz thì dải băng tỷ lệ với tần số. Hiện nay chế độ sử dụng đợc tạo bởi 25 dải
băng con tơng ứng với 25 bộ lọc ốc tai theo quy luật tự nhiên. Khi tín hiệu audio đợc
tạo ra từ các tần số gần nhau, hệ thống HAS tổ hợp chúng thành các nhóm tơng đ-
ơng với cùng một năng lợng. Thờng thì các tần số cách xa nhau đợc xử lý riêng rẽ,
các âm lợng tơng đơng của chúng đợc đánh giá và xác định .
Độ nhạy của HAS giảm đi tại các tần số thấp và cao, thể hiện ở việc đờng viền
mức âm lợng trung bình tỷ lệ nghịch với các tần số âm thanh. Có thể nhận thấy rằng,
tại các mức âm lợng thấp, mức độ thay đổi độ nhạy của HAS là rất quan trọng và nó
giảm đi tại các mức âm lợng cao.
2.1.2. Kỹ thuật nén số liệu audio
Các kỹ thuật mã hoá nguồn đợc dùng để loại bỏ độ d thừa trong tín hiệu audio
và các kỹ thuật psychoacoustic- che mặt nạ tâm sinh lý nghe đ ợc sử dụng dùng để
nhận biết và loại bỏ những thành phần không thích hợp (các mẫu âm thanh lỗi).
Có hai kỹ thuât nén chủ yếu sử dụng hiện nay là:
1.M hoá dự đoán trã ớc trong miền thời gian:
Ging viờn: PHM TH NH HNG Biờn son nm 2012
33
Giỏo trỡnh mụn hc: K thut Audio- Video s
Phơng pháp này sử dụng việc mã hoá khác nhau đối với các thành phần khác
nhau của các mẫu liên tiếp mà có thể khôi phục đợc .Việc giảm tốc độ dòng bit sẽ đ-
ợc sử dụng để mã hoá và truyền dẫn các thông tin của tín hiệu audio.
2. M chuyển đổi trong miền tần số:ã
Kỹ thuật này sử dụng các khối block của các mẫu audio ra từ bộ PCM đều để
chuyển từ miền thời gian sang miền thời gian sang miền tần số những dải băng khác
nhau.
a.Nén không tổn hao .
Nén không tổn hao cho phép khôi phục lại dòng bit những thông tin nguyên
thuỷ sau bộ giải nén mà không gây ra tổn hao. Hệ thống này loại bỏ độ d thừa thống
kê, nhng thông tin tồn tại trong tín hiệu audio có thể dự báo trớc từ những mẫu trớc
đó. Bộ nén số liệu không tổn hao cho các tỷ số nén thấp, tỷ số tốt nhất đạt đợc là 2:1
nó phụ thuộc vào sự phức tạp của tín hiệu audio nguồn.
Nén không tổn hao sử dụng những kỹ thuật mã dự đoán trớc trong miền thời
gian bao gồm:
- Thuật toán vi sai: Các tín hiệu âm thanh có đặc tính là lặp đi lặp lại, vì vậy sẽ
xuất hiện lợng d thừa số liệu lớn, ngoài ra còn có những d thừa nh các tín hiệu âm
thanh không liên quan đến giác quan con ngời. Những thông tin lặp đi lặp lại sẽ đợc
loại bỏ trong quá trình mã hoá và lại đa vào tại quá trình giải mã cuối cùng .Kỹ thuật
DPCM thờng đợc sử dụng trong quá trình này . Các tín hiệu audio đầu tiên đợc phân
tích thành tập hợp các dải băng con bao gồm một số lợng các âm thanh rời rạc .Sau
đó, DPCM đợc sử dụng nhằm dự báo trớc các tín hiệu lặp theo một đoạn chu kỳ. Quá
trình mã hoá này tạo ra sự thích ứng trở lại năng lợng tín hiệu đầu vào nhằm sửa kích
cỡ bớc lợng tử phù hợp. Bớc này cũng đợc gọi là bộ thích ứng DPCM ( ADPCM).
- Các mã entropy tận dụng độ d thừa trong cách miêu tả của các hệ số băng
con đã lợng tử hoá nhằm cải thiện tính hiệu quả của quá trình mã hoá. Các hệ số l-
ợng tử này đợc gửi đi theo sự tăng dần của tần số, kết quả là chúng có giá trị lớn tại
những tần số thấp và tại những tần số cao là một dãy dài các hệ số nhỏ hoặc bằng 0.
Mã có độ dài thay đổi đợc sử dụng nh Haffman sẽ tạo ra bảng mã tối u thống kê các
giá trị miền tần số thấp và cao.
- Các thông số quá tải khối dữ liệu : Các giá trị nhị phân từ quá trình biến đổi
ADC, đợc nhóm thành các khối dữ liệu trong miền thời gian, bằng cách lấy các mẫu
kề nhau tại đầu ra ADC, lẫn trong miền tần số, bằng cách lấy các hệ số tần số tại
Ging viờn: PHM TH NH HNG Biờn son nm 2012
3
Giỏo trỡnh mụn hc: K thut Audio- Video s
đầu ra FDCT. Các giá trị nhị phân trong một khối dữ liệu sau đó tạo thang độ tiếp,
sao cho giá trị vừa dới giá trị toàn bộ thang. Hệ số thang độ này là chung cho tất cả
các giá trị trong khối. Cho nên, mỗi giá trị có thể biểu diễn bằng một định trị và bằng
một số mũ(chỉ thị biên độ rieng của mẫu). Đó là một quá trình lợng tử hoá không đều
độ lớn bớc lợng tử hoá đợc xác định bằng số bit chiếm trong khối. Vị trí bit đợc tính từ
mô hình HAS. Giảm độ rộng dữ liệu đợc thực hiện bằng cách gửi các giá trị mũ lần
1/khối dữ liệu. Mặc dù nhiễu phụ thuộc vào nội dung tín hiệu , nhng mã hoá đợc thực
hiện tốt . Kỹ thuật che mặt nạ giúp giảm nhiễu audio.
Hình 4.8 : Hệ thống mã hoá điểm quá tải khối dữ liệu Audio.
b. Nén tín hiệu có tổn hao.
Nén có tổn hao đợc đề cập đến bởi sự kết hợp của hai hay nhiều hơn các công
nghệ xử lý mà nó lợi dụng đặc tính của hệ thống HAS là không thể phân biệt đợc các
thành phần phổ có biên độ nhỏ giữa các thành phần phổ có biên độ nhỏ giữa các
thành phần phổ có biên độ lớn. Các phơng pháp giảm số liệu xử lý cao có hệ số nén
từ 2:1 đến 20:1, nó phụ thuộc vào quá trình nén và giải nén, và vào yêu cầu chất lợng
của audio. Các hệ thống nén số liệu có tổn hao sử dụng công nghệ mã hoá tri giác.
Nguyên lý cơ bản của nó là loại bỏ những thành phần d thừa trong tín hiệu audio số
Ging viờn: PHM TH NH HNG Biờn son nm 2012
Tín hiệu
vào tơng
tự
Bộ chuyển
đổi A/D 16 bit
Bộ nhớ
đệm trễ
Thang
độ số
Tính toán
thang độ
Mô hình
HAS
Bộ ghép
W. W.
12 bit
trọng số
3 bit số mũ
Dòng bit đ ã
m hoáã
3D
Giỏo trỡnh mụn hc: K thut Audio- Video s
bằng cách bỏ đi những tín hiệu nằm dới đờng cong ngỡng âm , điều này giải thích tại
sao ngời ta gọi các hệ thống nén số liệu có tổn hao là mất các thành phần âm .
Nén làm mất các thành phần âm đợc kết hợp từ các kỹ thuật nh:
- Kỹ thuật masking- che đối với các thành phần tín hiệu trong miền thời gian
và miền tần số. Tỷ lệ signal- mask đợc sử dụng để xác định số bit cho quá trình lợng
tử hoá mỗi băng với mục đích giảm thiểu khả năng nghe thấy của âm thanh.
- Chặn mức tạp âm lợng tử cho từng âm độ của tín hiệu âm thanh bằng cách
chỉ định số bit vừa đủ để chắc chắn rằng mức nhiễu lợng tử luôn luôn nằm dới mức
giá trị cần chặn. Tại những tần số gần với tần số tín hiệu âm thanh thì tỉ số tín hiệu
trên tạp âm SNR có thể chấp nhận đợc là từ 20 đến 30 dB, tơng đơng với độ phân
tích từ 4 đến 5 bit.
- Mã hoá nối: Công nghệ này khai thác sự d thừa trong hệ thống audio đa
kênh, ngời ta thấy rằng có rất nhiều phần số liệu ở trong các kênh là giống nhau, do
đó ngời ta có thể nén số liệu bằng cách mã hoá một phần số liệu chung đó trên một
kênh và chỉ định cho bộ giải mã lặp lại tín hiệu đó trên các kênh còn lại.
2.1.3. Nén audio theo tiêu chuẩn MPEG
2.1. Chuẩn MPEG-1
Các mẫu audio
PMC@ Chuyển đỏi từ miền Mã hoá Bit chỉ định Bộ đệm Dòng bit
thời gian sang khớp - Lợng tử hoấ khung
32/44,1/48 KHz miền tần số nối - Mã hoá số liệu mã hoá
(a)
mô hình tâm Số liệu phụ
sinh lý nghe
(b)
Dòng bit Khung không Khôi Chuyển đổi từ Các mẫu audio
mã hoá đóng gói phục miền thời gian PCM @
sang miền tần số 32/44,1/48
KHz
Số liệu phụ
Hình 4.9: Sơ đồ cấu trúc mã hoá (a) và giải mã (b) MPEG cho tín hiệu Audio
Tiêu chuẩn MPEG-1 đợc phát triển chủ yếu dùng cho mã hoá ảnh động và tín
hiệu audio kèm theo cho lu trữ với tốc độ 1,5Mbit/s . Chuẩn MPEG-1 dựa trên
nguyên lý nén tín hiệu audio của tiêu chuẩn MPEG-1. Hình vẽ mô tả cấu trúc cơ sở
của bộ mã hoá và giải mã MPEG tín hiệu audio.
Ging viờn: PHM TH NH HNG Biờn son nm 2012
3L