H C VI N CƠNG NGH B U CHÍNH VI N THƠNG
X
LÝ ÂM THANH, HÌNH
(Dùng cho sinh viên h đào t o đ i h c t xa)
L u hành n i b
HÀ N I - 2007
CuuDuongThanCong.com
/>
NH
H C VI N CƠNG NGH B U CHÍNH VI N THƠNG
X
LÝ ÂM THANH, HÌNH
Biên so n :
NH
TS. NGUY N THANH BÌNH
THS. VÕ NGUY N QU C B O
CuuDuongThanCong.com
/>
L I NÓI
U
Tài li u h ng d n h c t p mơn "X lý âm thanh và hình nh" dành cho kh i đào t o t
xa chuyên ngành đi n t vi n thông. Tài li u này s gi i thi u nh ng ki n th c c b n v x lý âm
thanh và hình nh. c bi t, tác gi chú tr ng t i v n đ x lý tín hi u ng d ng trong m ng vi n
thơng: đó là các ph ng pháp nén tín hi u, l u tr , các tiêu chu n nén tín hi u âm thanh và hình
nh. Nh ng ki n th c đ c trình bày trong tài li u s giúp h c viên ti p c n nhanh v i các v n đ
th c ti n th ng g p trong m ng vi n thơng.
Vì kh i l ng ki n th c trong l nh v c x lý âm thanh c ng nh hình nh r t l n, và v i
qu th i gian quá eo h p dành cho biên so n, tài li u h ng d n này ch a thâu tóm đ c tồn b
ki n th c c n có v l nh v c x lý âm thanh và hình nh.
tìm hi u v m t s v n đ có trong
đ c ng mơn h c địi h i h c viên ph i nghiên c u thêm trong s sách tham kh o đ c tác gi đ
c p t i trong ph n cu i c a tài li u này.
N i dung cu n sách đ
c chia làm hai ch
-
Ch
ng 1: K thu t x lý âm thanh
-
Ch
ng 2: K thu t x lý hình nh.
ng:
có th h c t t mơn này, sinh viên c n ph i có ki n th c c b n v x lý tín hi u s .
Các ki n th c này các b n có th tìm hi u trong cu n “X lý tín hi u s ” dành cho sinh viên i
h c t xa c a H c vi n.
ây là l n biên so n đ u tiên, ch c ch n tài li u cịn nhi u s sót, r t mong các b n đ c
trong quá trình h c t p và các thày cô gi ng d y mơn h c này đóng góp các ý ki n xây d ng.
Trong th i gian g n nh t, tác gi s c g ng c p nh p, b xung thêm đ tài li u h ng d n đ c
hoàn ch nh h n.
M i ý ki n đóng góp đ ngh g i v theo đ a ch email:
Tp. H Chí Minh 19/05/2007
Nhóm biên so n
CuuDuongThanCong.com
/>
2
CuuDuongThanCong.com
/>
CH
NG 1
1.1 T NG QUAN V X
1.1.1
Gi i thi u s l
1.1.1.1
K THU T X
LÝ ÂM THANH
LÝ ÂM THANH
c v âm thanh & h th ng x lý âm thanh
c tính c a âm thanh t
ng t [1]
M c đích c a l i nói là dùng đ truy n đ t thơng tin. Có r t nhi u cách mô t đ c đi m
c a vi c truy n đ t thông tin. D a vào lý thuy t thơng tin, l i nói có th đ c đ i di n b i thu t
ng là n i dung thông đi p, ho c là thông tin. M t cách khác đ bi u th l i nói là tín hi u mang
n i dung thơng đi p, nh là d ng sóng âm thanh.
Hình 1.1 D ng sóng c a tín hi u ghi nh n đ
c t âm thanh c a ng
i
K thu t đ u tiên dùng trong vi c ghi âm s d ng các thông s v c , đi n c ng nh
tr ng có th làm nên nhi u cách th c ghi âm ng v i các lo i áp su t khơng khí khác nhau. i n
áp đ n t m t microphone là tín hi u t ng t c a áp su t khơng khí (ho c đôi khi là v n t c). Dù
đ c phân tích b ng cách th c nào, thì các ph ng pháp khi so sánh v i nhau ph i dùng m t t l
th i gian.
Trong khi các thi t b t ng t hi n đ i trơng có v x lý âm thanh t t h n nh ng thi t b
c đi n, các tiêu chu n x lý thì h u nh khơng có gì thay đ i, m c dù cơng ngh có v x lý t t
h n. Trong h th ng x lý âm thanh t ng t , thông tin đ c truy n đ t b ng thông s liên t c
bi n thiên vô h n.
H th ng x lý âm thanh s lý t ng có nh ng tính n ng t ng t nh h th ng x lý âm
thanh t ng t lý t ng: c hai ho t đ ng m t cách “trong su t” và t o l i d ng sóng ban đ u
không l i. Tuy nhiên, trong th gi i th c, các đi u ki n lý t ng r t hi m t n t i, cho nên hai lo i
h th ng x lý âm thanh ho t đ ng s khác nhau trong th c t . Tín hi u s s truy n trong kho ng
cách ng n h n tín hi u t ng t và v i chi phí th p h n. Trong giáo trình này, t p trung đ c p
đ n h th ng s x lý âm thanh.
Thông tin dùng đ truy n đ t c a âm tho i v b n ch t có tính r i r c [2], và nó có th
đ c bi u di n b i m t chu i ghép g m nhi u ph n t t m t t p h u h n các ký hi u (symbol).
Các ký hi u t m i âm thanh có th đ c phân lo i thành các âm v (phoneme). M i ngơn ng có
các t p âm v khác nhau, đ c đ c tr ng b i các con s có giá tr t 30 đ n 50. Ví d nh ti ng
Anh đ c bi u di n b i m t t p kho ng 42 âm v .
Tín hi u tho i đ c truy n v i t c đ nh th nào? i v i tín hi u âm tho i nguyên th y
ch a qua hi u ch nh thì t c đ truy n c l ng có th tính đ c b ng cách l u ý gi i h n v t lý
c a vi c nói l u lốt c a ng i nói t o ra âm thanh tho i là kho ng 10 âm v trong m t giây. M i
3
CuuDuongThanCong.com
/>
m t âm v đ c bi u di n b i m t s nh phân, nh v y m t mã g m 6 bit có th bi u di n đ c
t t c các âm v c a ti ng Anh. V i t c đ truy n trung bình 10 âm v /giây, và khơng quan tâm
đ n v n đ luy n âm gi a các âm v k nhau, ta có th
c l ng đ c t c đ truy n trunh bình
c a âm tho i kho ng 60bit/giây.
Trong h th ng truy n âm tho i, tín hi u tho i đ c truy n l u tr và x lý theo nhi u
cách th c khác nhau. Tuy nhiên đ i v i m i lo i h th ng x lý âm thanh thì có hai đi u c n quan
tâm chung là:
1. Vi c duy trì n i dung c a thơng đi p trong tín hi u tho i
2. Vi c bi u di n tín hi u tho i ph i đ t đ c m c tiêu ti n l i cho vi c truy n tin ho c l u
tr , ho c d ng linh đ ng cho vi c hi u ch nh tín hi u tho i sao cho khơng làm gi m
nghiêm tr ng n i dung c a thông đi p tho i.
Vi c bi u di n tín hi u tho i ph i đ m b o vi c các n i dung thơng tin có th đ
dàng trích ra b i ng i nghe, ho c b i các thi t b phân tích m t cách t đ ng.
cd
1.1.1.2 Khái ni m tín hi u
Là đ i l ng v t lý bi n thiên theo th i gian, theo không gian, theo m t ho c nhi u bi n
đ c l p khác, ví d nh :
Âm thanh, ti ng nói: dao đ ng sóng theo th i gian (t)
Hình nh: c
ng đ sáng theo không gian (x, y, z)
a ch n: ch n đ ng đ a lý theo th i gian
Bi u di n tốn h c c a tín hi u: hàm theo bi n đ c l p
Ví d :
u (t ) = 2t 2 − 5
f ( x, y ) = x 2 − 2 xy − 6 y 2
Thơng th ng các tín hi u t nhiên không bi u di n đ c b i m t hàm s c p, cho nên
trong tính tốn, ng i ta th ng dùng hàm x p x cho các tín hi u t nhiên.
H th ng: là thi t b v t lý, thi t b sinh h c, ho c ch ng trình th c hi n các phép tốn
trên tín hi u nh m bi n đ i tín hi u, rút trích thơng tin, … Vi c th c hi n phép tốn cịn đ c g i
là x lý tín hi u.
1.1.1.3 Phân lo i tín hi u:
Tín hi u đa kênh: g m nhi u tín hi u thành ph n ,cùng chung mơ t m t đ i t ng nào đó
(th ng đ c bi u di n d i d ng vector, ví d nh tín hi u đi n tim (ECG-ElectroCardioGram) ,
tín hi u đi n não (EEG – ElectroEncephaloGram), tín hi u nh màu RGB.
Tín hi u đa chi u: bi n thiên theo nhi u h n m t bi n đ c l p, ví d nh tín hi u hình nh,
tín hi u tivi tr ng đen.
Tín hi u liên t c theo th i gian: là tín hi u đ
c đ nh ngh a t i m i đi m trong đo n th i
gian [a,b], ký hi u x (t ) .
4
CuuDuongThanCong.com
/>
Hình 1.2 Tín hi u liên t c theo th i gian
Tín hi u r i r c th i gian: là tín hi u ch đ
c đ nh ngh a t i nh ng th i đi m r i r c khác
nhau, ký hi u x(n) .
Hình 1.3 Tín hi u r i r c theo th i gian
Tín hi u liên t c giá tr : là tín hi u có th nh n tr b t k trong đo n [Ymin , Ymax ] , ví d tín
hi u t
ng t (analog).
Hình 1.4 Tín hi u liên t c giá tr
Tín hi u r i r c giá tr : tín hi u ch nh n tr trong m t t p tr r i r c đ nh tr
c (tín hi u
s ).
5
CuuDuongThanCong.com
/>
Hình 1.5 Tín hi u r i r c giá tr
Tín hi u analog: là tín hi u liên t c v th i gian, liên t c v giá tr .
Hình 1.6 Tín hi u analog
Tín hi u s : là tín hi u r i r c v th i gian, r i r c v giá tr .
Hình 1.7 Tín hi u s
Tín hi u ng u nhiên: giá tr c a tín hi u trong t
hi u trong t nhiên th ng thu c nhóm này
ng lai khơng th bi t tr
Tín hi u t t đ nh: giá tr tín hi u quá kh , hi n t i và t
thơng th ng có cơng th c xác đ nh rõ ràng
cđ
ng l i đ u đ
c. Các tín
c xác đ nh rõ,
1.1.1.4 Phân lo i h th ng x lý
G m hai lo i h th ng là h th ng t ng t và h th ng s . Trong đó h th ng x lý s : là
h th ng có th l p trình đ c, d mơ ph ng, c u hình, s n xu t hàng lo t v i đ chính xác cao,
giá thành h , tín hi u s d l u tr , v n chuy n và sao l u, nh c đi m là khó th c hi n v i các
tín hi u có t n s cao
6
CuuDuongThanCong.com
/>
1.1.1.5 H th ng s x lý âm thanh [3]
nh y c a tai ng i r t cao, nó có th phân bi t đ c s l ng nhi u r t nh c ng nh
ch p nh n t m biên đ âm thanh r t l n. Các đ c tính c a m t tín hi u tai ng i nghe đ c có th
đ c đo đ c b ng các công c phù h p. Thông th ng, tai ng i nh y nh t t m t n s 2kHz và
5kHz, m c dù c ng có ng i có th nh n d ng đ c tín hi u trên 20kHz. T m đ ng nghe đ c
c a tai ng i đ c phân tích và ng i ta nh n đ c k t qu là có d ng đáp ng logarith.
Tín hi u âm thanh đ c truy n qua h th ng s là chu i các bit. B i vì bit có tính ch tt r i
r c, d dàng xác đ nh s l ng b ng cách đ m s l ng trong m t giây, d dàng quy t đ nh t c đ
truy n bit c n thi t đ truy n tín hi u mà khơng làm m t thơng tin.
Hình 1.8
nh n đ c tám m c tín hi u khác nhau m t cách phân bi t, tín hi u đ nhđ nh c a tín hi u nhi u ph i nh h n ho c đ sai bi t gi a các m c đ . T s tín hi u trên nhi u
ph i t i thi u là 8:1 ho c là 18dB, truy n b i 3 bit. 16 m c thì t s tín hi u trên nhi u ph i là
24dB, truy n b i 4 bit.
1.1.1.6 Mơ hình hóa tín hi u âm thanh [4]
Có r t nhi u k thu t x lý tín hi u đ c mơ hình hóa và áp d ng các gi i thu t trong vi c
khôi ph c âm thanh. Ch t l ng c a âm tho i ph thu c r t l n vào mơ hình gi đ nh phù h p v i
d li u.
i v i tín hi u âm thanh, bao g m âm tho i, nh c và nhi u khơng mong mu n, mơ hình
ph i t ng quát và không sai l nh so v i gi đ nh. M t đi u c n l u ý là h u h t các tín hi u âm
tho i là các tín hi u đ ng trong th c t , m c dù mơ hình th c ti n thì th ng gi đ nh khi phân
tích tín hi u là tín hi u có tính ch t t nh trong m t kho ng th i gian đang xét.
Mơ hình phù h p v i h u h t r t nhi u lãnh v c trong vi c x lý chu i th i gian, bao g m
vi c ph c h i âm thanh là mơ hình Autoregressive (vi t t t AR), đ c dùng làm mơ hình chu n
cho vi c phân tích d đốn tuy n tính.
7
CuuDuongThanCong.com
/>
Tín hi u hi n t i đ c bi u di n b i t ng giá tr c a P tín hi u tr
tr ng, P là b c c a mơ hình AR:
c đó và tín hi u nhi u
s[u ] = ∑ s[n − i ]ai + e[n]
P
(1.1)
i =1
Mơ hình AR đ i di n cho các q trình tuy n tính t nh, ch p nh n tín hi u t ng t nhi u
và tín hi u t ng t đi u hịa. M t mơ hình khác phù h p h n đ i v i nhi u tình hu ng phân tích
là mơ hình auto regressive moving-average (ARMA) cho phép các đi m c c c ng nh đi m 0.
Tuy nhiên mơ hình AR có tính linh đ ng h n trong phân tích h n mơ hình ARMA, ví d m t tín
hi u nh c ph c t p c n mơ hình có b c P > 100 đ bi u di n d ng sóng c a tín hi u, trong khi
các tín hi u đ n gi n h n ch c n bi u di n b ng b c 30. Trong nhi u ng d ng, vi c l a ch n b c
c a mơ hình phù h p cho bài tốn sao cho đ m b o vi c bi u di n tín hi u là th a vi c khơng làm
m t đi thơng tin c a tín hi u là vi c h i ph c t p. Có r t nhi u ph ng pháp dùng đ
c l ng
b c c a mơ hình AR nh ph ng pháp maximum likelihood/least-squares [Makhoul, 1975], và
ph ng pháp robust to noise [Huber, 1981, Spath, 1991], v.v… Tuy nhiên, đ i v i vi c x lý các
tín hi u âm nh c ph c t p thì thơng th ng s d ng mơ hình Sin (Sinusoidal) r t có hi u qu
trong các ng d ng âm tho i. Mơ hình Sin r t phù h p trong các ph ng pháp dùng đ gi m
nhi u. Tín hi u đ c cho b i công th c sau
⎛ nT
⎞
s[n]∑ ai [n]sin ⎜⎜ ∫ ωi (t )dt + φi ⎟⎟
i =1
⎝0
⎠
Pn
(1.2)
ây là mơ hình t ng qt đ i v i các đi u ch biên đ và đi u ch t n s , tuy nhiên l i
không phù h p đ i v i các tín hi u t ng t nhi u, m c dù vi c bi u di n tín hi u nhi u có th
đ c bi u di n b i s l ng hàm sin r t l n.
1.1.1.7 Ki n trúc h th ng s x lý âm thanh
i v i máy tính s x lý âm thanh, ng i ta th ng dùng ph ng pháp i u ch xung
(Pulse Code Modulation , vi t t t PCM). D ng sóng âm thanh đ c chuy n sang dãy s PCM nh
sau, xét tín hi u hình sin làm ví d :
Air Displacement
Tín hi u g c là tín hi u nh Hình 1.9
Time
Hình 1.9 D ng sóng âm thanh nguyên th y
K đ n, s d ng m t microphone đ thu tín hi u âm thanh (trong khơng khí) và chuy n
đ i thành tín hi u đi n, t m đi n áp ngõ ra c a microphone ±1 volt nh Hình 1.10.
8
CuuDuongThanCong.com
/>
+1.0
Voltage
+0.5
0
-0.5
-1.0
Time
Hình 1.10 D ng sóng c a tín hi u đi n
Tín hi u đi n áp d ng t ng t sau đó đ c chuy n thành d ng s hóa b ng thi t b
chuy n đ i t ng t -s (analog-to-digital converter). Khi s d ng b chuy n đ i 16bit
t ng t -s , t m s nguyên ngõ ra có giá tr –32,768 đ n +32,767, đ c mơ t nh hình
1.11.
Converter Output
+32,767
+16,383
0
-16,384
-32,768
Time
Hình 1.11 Ngõ ra c a b chuy n đ i tín hi u t
ng t sang tín hi u s
Vì s l ng đi m d li u là vô h n nên không th l y t t c các đi m thu c tr c th i gian,
vi c l y m u s đ c th c hi n trong m t kho ng th i gian đ u đ n. S l ng m u trong
m t giây đ c g i là t n s l y m u (sampling rate). Hình 1.12 mơ t 43 m u đ c l y
Converter Output
+32,767
+16,383
0
-16,384
-32,768
1
43
Hình 1.12 Th c hi n vi c l y m u
K t qu c a vi c l y m u là m t chu i g m 43 ch s bi u di n cho các v trí c a d ng
sóng ng th i gian gian là m t chu k (hình 1.13).
Recorded Value
+32,767
+16,383
0
-16,384
-32,768
1
43
Hình 1.13 K t qu c a vi c l y m u các giá tr
9
CuuDuongThanCong.com
/>
Máy tính sau đó s xây d ng l i d ng sóng c a tín hi u b ng vi c k t n i các đi m d li u
l i v i nhau. D ng sóng k t qu đ c mơ t Hình 1.14.
Recorded Value
+32,767
+16,383
0
-16,384
-32,768
1
Hình 1.14 D ng sóng đ
43
c tái t o l i
L u ý r ng có m t vài đi m khác bi t gi a d ng sóng nguyên th y và d ng sóng tái t o
(Hình 1.9 và Hình 1.14), lý do:
A. Các giá tr đ c t o ra t i b chuy n đ i tín hi u t
nguyên và đ c làm tròn giá tr .
B. Hình dáng c a tín hi u tái t o ph thu c vào s l
ng t sang tín hi u s là các s
ng m u đ
c ghi nh n.
T ng quát, m t dãy s h u h n (đ i di n cho tín hi u s ) ch có th bi u di n cho m t
d ng sóng tín hi u t ng t v i đ chính xác h u h n.
1.1.1.8 T n s l y m u
Khi chuy n đ i m t âm thanh sang d ng s , đi u c n l u ý là t n s l y m u c a h th ng
x lý ph i đ m b o tính trung th c và chính xác khi c n ph c h i l i d ng sóng tín hi u ban đ u.
Theo đ nh l y m u Nyquist và Shannon, t n s l y m u quy t đ nh t n s cao nh t c a tín
hi u ph c h i.
tái t o l i d ng sóng có t n s là F , c n ph i l y 2 F m u trong m t giây. T n
s này còn đ c g i là t n s Nyquist. Tuy nhiên, đ nh lý Nyquist không ph i là t i u cho m i
tr ng h p. N u m t d ng sóng hình Sin có t n s là 500Hz, thì t n s l y m u 1000Hz. N u nh
t n s l y m u cao h n t n s Nyquist s gây ra tình tr ng “hi u ng là” nh h ng đ n biên đ
c a tín hi u và tín hi u b c ng nhi u, tuy nhiên lúc đó thì các thành ph n hài t n s th p l i có tín
hi u chính xác h n khi đ c ph c h i.
1.1.2
Nh c l i m t s khái ni m toán h c trong x lý âm thanh
1.1.2.1 Phép bi n đ i z [5]
Phép bi n đ i z c a m t chu i đ
c đ nh ngh a b i c p bi u th c
X (z ) =
∞
∑ x ( n) z
−n
(1.3a)
n = −∞
x ( n) =
Bi n đ i z c a x (n) đ
công su t vô h n theo bi n z
−1
1
X ( z ) z n−1dz
∫
2πj C
c đ nh ngh a b i bi u th c (1.6a). X (z ) còn đ
(1.3b)
c g i là dãy
v i các giá tr c a x(n) chính là các h s c a dãy công su t.
Mi n h i t ROC là { z X (z ) < ∞ }, là nh ng giá tr c a z sao cho chu i h i t , hay nói cách
khác
10
CuuDuongThanCong.com
/>
∞
∑ x ( n)
<
z −n
∞
(1.4)
n = −∞
Thông th
ng, mi n h i t c a z có d ng:
R1 < z < R2
(1.5)
Ví d : Cho x ( n) = δ ( n − n0 ) . Theo công th c (1.3a), ta có X ( z ) = z
− n0
Ví d : Cho x ( n) = u ( n) − u ( n − N ) . Theo cơng th c (1.3a), ta có
1− z−N
1 − z −1
N −1
X ( z ) = ∑ (1).z −n =
n =0
∞
Ví d : Cho x(n) = a .u (n) . Suy ra X ( z ) = ∑ a z
n
n
−n
=
n =0
Ví d : Cho x( n) = −b u (− n − 1) . Then X ( z ) =
n
−1
∑b
n
1
,a < z
1 − az −1
z −n =
n = −∞
B ng 2.1 Chu i tín hi u và bi n đ i z t
1. Tuy n tính
2. D ch
3. Hàm m
1
, z
1 − bz −1
ng ng
Chu i tín hi u
Bi n đ i z
ax1 (n) + bx2 (n)
aX 1 ( z ) + bX 2 ( z )
x(n + n0 )
z n X ( z)
a n x(n )
X (a −1 z )
0
4. Hàm tuy n tính
nx(n)
5.
o th i gian
x(-n)
X ( z −1 )
ng quan
x(n)*h(n)
X(z)H(z)
7. Nhân chu i
x(n)w(n)
1
X (ν )W ( z /ν )ν −1dν
∫
2πj C
6. T
−z
dX ( z )
dz
1.1.2.2 Phép bi n đ i Fourier
Bi n đ i Fourier c a tín hi u r i r c th i gian đ
c cho b i bi u th c
∞
X (e jw ) =
∑ x(n)e
− jwn
(1.6a)
n = −∞
x ( n) =
1
2π
π
∫ π X (e
−
jw
)e jwn dw
(1.6b)
Bi n đ i Fourier là tr ng h p đ c bi t c a phép bi n đ i z b ng cách thay th z = e .
Nh mơ t trong Hình 1.4, trong m t ph ng z, t n s w là góc quay. i u ki n đ đ t n t i bi n
iw
đ i Fourier là z = 1 , nh v y
11
CuuDuongThanCong.com
/>
∞
∑ x(n) < ∞
(1.7)
Hình 1.15 Vịng trịn đ n v thu c m t ph ng z
M t đ c tính quan tr ng c a bi n đ i Fourier c a m t chu i là X (e ) là hàm đi u hòa w,
iw
v i chu k là 2π .
B ng cách thay z = e
iw
b ng 2.1, có có đ
c b ng bi n đ i Fourier t
ng ng.
1.1.2.3 Phép bi n đ i Fourier r i r c
Trong tr
ng h p tín hi u t
ng t , tu n hoàn v i chu k N
~
x ( n) = ~
x (n + N )
−∞ < n<∞
(1.8)
x (n) có th có d ng là t ng r i r c các tín hi u sin thay vì tích phân nh
V i ~
cơng th c
(1.9b). Phép bi n đ i Fourier cho chu i tu n hoàn nh sau
2π
N −1
kn
−j
~
X (k ) = ∑ ~
x ( n )e N
(1.9a)
n =0
1
~
x (k ) =
N
2π
j
kn
~
∑ X ( k )e N
N −1
(1.9b)
k =0
Chu i x(n) h u h n, có giá tr b ng 0 v i 0 ≤ n ≤ N − 1 , có phép bi n đ i z là.
N −1
X ( z ) = ∑ x ( n) z − n
(1.10)
n =0
j 2πk
N u chia X (z ) thành N đi m trên vòng tròn đ n v , z k = e
N
, k = 0,1,..., N − 1 , ta
, k = 0,1,..., N − 1
(1.11)
có:
X (e
j
2π
k
N
N −1
) = ∑ x ( n )e
−j
2π
kn
N
n =0
x (n) có cơng th c t x(n) nh sau
Chu i tu n hồn vơ h n ~
~
x ( n) =
∞
∑ x(n + rN )
r = −∞
12
CuuDuongThanCong.com
/>
(1.12)
Ta nh n th y r ng các m u X (e
j
2π
k
N
) t ph ng trình (1.9a) và (1.11) chính là các h s
x (n) trong ph
Fourier c a chu i tu n hồn ~
có th đ
ng trình (1.12). Nh v y, m t chu i có chi u dài N
c bi u diwnx b i phép bi n đ i Fourier r i r c (DFT) nh sau:
N −1
X ( k ) = ∑ x ( n )e
−j
2π
kn
N
, k = 0,1,..., N − 1
(1.13a)
n =0
N −1
1
x ( n) =
N
∑ X ( k )e
j
2π
kn
N
, n = 0,1,..., N − 1
(1.13b)
k =0
i u khác bi t duy nh t gi a bi u th c (1.12) và (1.9) là ký hi u (lo i b ký hi u ~ khi
nói đ n tín hi u tu n hồn) và gi i h n h u h n 0 ≤ k ≤ N − 1 và 0 ≤ n ≤ N − 1 . L u ý m t
đi u là ch dùng phép bi n đ i DFT cho tín hi u tu n hồn có tính ch t là module c a N .
x ( n) =
∞
∑
x(n + rN ) = x( n
k = −∞
module N )
(1.14)
= x((n)) N
B ng 2.2 Chu i và bi n đ i DFT
1. Tuy n tính
Chu i tín hi u
Bi n đ i N đi m DFT
ax1 (n) + bx2 (n)
aX 1 (k ) + bX 2 (k )
x((n + n0 )) N
2. D ch
3.
o th i gian
1.2.1
2π
kn0
N
X (k )
X * (k )
∑ x(m)h((n − m))
X(k)H(k)
m =0
5. Nhân chu i
j
x((−n)) N
N −1
4. K t h p
1.2 MƠ HÌNH X
e
N
1 N −1
∑ X (r )W ((k − r )) N
N r =0
x(n)w(n)
LÝ ÂM THANH
Các mô hình l y m u và mã hố tho i
1.2.1.1 L y m u tín hi u
mi n th i gian và tái t o tín hi u liên t c [6]
x lý m t tín hi u liên t c b ng các ph ng ti n x lý tín hi u s , ta ph i đ i tín hi u
liên t c đó ra d ng m t chu i s b ng các l y m u tín hi u liên t c m t cách tu n hồn có chu k
là T giây. G i x(n) là tín hi u r i r c hình thành do q trình l y m u, tín hi u liên t c xa (t ) , ta
có
x(n) = xa ( nT ) − ∞ < n < ∞
Các m u x (n) ph i đ
cl
(1.15)
ng hóa thành m t t p các m c biên đ r i r c r i m i đ
đ a vào b x lý s . Hình 1.16 minh h a m t c u hình tiêu bi u cho h th ng x lý tín hi u t
c
ng
13
CuuDuongThanCong.com
/>
t b ng ph ng pháp s . Trong các ph n sau, ta b qua sai s l
bi n đ i A/D
Tín hi u
liên t c
M ch
l c
ng hóa phát sinh trong quá trình
ya (t ) M ch
x (n) M ch x lý tín y (n)
xa (t )
A/D
hi u s
Hình 1.16 C u hình h th ng x lý tín hi u t
D/A
ng t b ng ph
l c
ng pháp s
xác đ nh quan h gi a ph c a tín hi u liên t c và ph c a tín hi u r i r c t o ra t q
trình l y m u tín hi u, liên t c đó, ta chú ý đ n quan h gi a bi n đ c l p t và n c a tín hi u
xa (t ) và x(n)
t = nT =
n
Fs
(1.16)
nh lý l y m u: m t tín hi u liên t c có b ng t n h u h n, có t n s cao nh t là B Hertz
có th khơi ph c t các m u c a nó v i đi u ki n t n s l y m u Fs ≥ 2 B m u / giây
1.2.1.2 L y m u tín hi u
mi n t n s và tái t o tín hi u liên t c
Ta đã bi t tín hi u liên t c có n ng l ng h u h n thì có ph liên t c. Trong ph n này, ta
s xét quá trình l y m u c a các tín hi u lo i đó m t cách tu n hồn và s tái t o ín hi u t các
m u c a ph c a chúng
Xét m t tín hi u liên t c xa (t ) v i m t ph liên t c X a ( F ) . Gi s ta l y m u X a ( F )
t i các th i đi m cách nhau ∂F Hertz. Ta mu n tái t o X a ( F ) ho c xa (t ) t các m u X a ( F )
N u tín hi u t
xa (t ) có gi i h n th i gian là ℑ giây và Ts đ c ch n đ
ng t
Ts > 2ℑ thì aliasing khơng x y ra và ph X a ( F ) có th đ c khơi ph c hồn tồn t các m u.
1.2.1.3 L y m u tín hi u
mi n t n s và tái t o tín hi u r i r c
Xét m t tín hi u r i r c khơng tu n hồn x( n) có phép bi n đ i Fourier:
X (ω ) =
∞
∑ x ( n )e
− jωn
(1.17)
n = −∞
Gi s ta l y m u X (ω ) tu n hoàn t i các đi m cách nhau ∂ω rad. Vì X (ω ) tu n hoàn
v i chu k 2π , ch có các m u trong ph m vi t n s c b n là c n thi t.
thu n ti n, ta l y N
m u cách đ u nhau trong kho ng 0 ≤ ω ≤ 2π theo kho ng cách ∂ω = 2π / N
Xét ω = 2πk / N , ta đ
Xét tín hi u x p ( n) =
∞
⎛ 2π ⎞
k ⎟ = ∑ x(n)e − j 2πkn / N k = 0,1,..., N − 1 (1.18)
⎝ N ⎠ n=−∞
c X⎜
∞
∑ x(n − lN ) nh n đ
c b ng cách l p l i tu n hoàn x( n) t i m i
l = −∞
N m u, tín hi u này tu n hồn v i chu k N , do đó có th đ c tri n khai theo khai tri n
Fourier
x p ( n) =
1
N
N −1
2π
∑ X( N
k )e j 2πkn / N , n = 0,1,..., N − 1
k =0
14
CuuDuongThanCong.com
/>
(1.19)
x'a (t )
T công th c x p ( n) trên, ta nh n th y có th khơi ph c tín hi u x p ( n) t các m u c a
ph
X (ω ) . Nh v y, ta ph i tìm ra m i t ng quan gi a x p (n) và x(n) đ có th th c hi n
khơi ph c x( n) t
X (ω )
Vì x p (n) là s m r ng tu n hoàn c a x ( n) , nên x ( n) có th đ
n u khơng có aliasing
c khơi ph c t
x p ( n)
cõi th i gian, ngh a là n u x( n) có th i gian gi i h n nh h n ho c b ng
chu k N c a x p (n) .
1.2.1.4 Các chu n mã hóa âm tho i trong các h th ng x lý tho i [7]
Chu n mã hóa âm tho i thông th ng đ c nghiên c u và phát tri n b i m t nhóm các
chuyên gia đã giành h t th i gian và tâm huy t th c hi n các công vi c ki m nghi m, mô ph ng
sao cho đ m b o m t t p các yêu c u đ a ra đáp ng đ c. Ch có các t ch c v i ngu n tài
nguyên kh ng l m i có th th c hi n đ c các cơng vi c khó kh n này, thơng th ng, th i gian
t i thi u c n thi t đ hoàn thành m t chu n trong tr ng h p g p nhi u thu n l i trong quá trình
là kho ng b n n m r i.
i u này khơng có ngh a là m t chu n đ c đ a ra thì “khơng có l i” ho c khơng c n
ph i c i ti n. Do đó, các chu n m i luôn luôn xu t hi n sao cho t t h n chu n c c ng nh phù
h p v i các ng d ng trong t ng lai.
H i đ ng chu n là các t ch c có trách nhi m trong vi c giám sát vi c phát tri n các
chu n cho m t ng d ng c th nào đó. Sau đây là m t s h i đ ng chu n n i ti ng đ c nhi u
nhà cung c p s n ph m tuân theo
Liên minh vi n thông qu c t - International Telecommunications Union (ITU): Các
chu n vi n thơng c a ITU (chu n ITU-T) có uy tín trong vi c đ nh ra các chu n mã hóa
âm tho i cho h th ng m ng đi n tho i, bao g m các m ng vô tuy n l n h u tuy n.
Hi p h i công nghi p vi n thông - Telecommunications Industry Association (TIA): có
trách nhi m ban hành các chu n mã hóa tho i cho các ng d ng c th , là m t thành viên
c a Vi n tiêu chu n qu c gia Hoa K - National Standards Institute (ANSI). TIA đã thành
công trong vi c phát tri n các chu n s d ng trong các h th ng t ng đài t bào s B c
M , bao g m các h th ng s d ng chu n đa k t phân th i gian - Time division multiple
access (TDMA) và a truy nh p phân chia theo mã - Code division multiple access
(CDMA).
Vi n tiêu chu n vi n thông châu Âu - European Telecommunications Standards Institute
(ETSI): ETSI có các h i viên t các n c c ng nh các công ty Châu Âu, là t ch c đ a
ra các chu n s n xu t thi t b t i Châu Âu. ETSI đ c thành l p b i nhóm có nh h ng
nh t trong lãnh v c mã hóa âm tho i là nhóm di đ ng đ c bi t - Groupe Speciale Mobile
(GSM), đã đ a ra r t nhi u chu n h u d ng và đ c tri n khai r t nhi u trên th gi i
B qu c phòng Hoa K - United States Department of Defense (DoD). DoD có liên quan
đ n vi c sáng l p các chu n mã hóa tho i, đ c bi t đ n v i các chu n liên bang Hoa K
(U.S. Federal) dùng nhi u cho các ng d ng quân s
Trung tâm phát tri n và nghiên c u các h th ng vô tuy n c a Nh t B n - Research and
Development Center for Radio Systems of Japan (RCR). Các chu n t bào s đ c phát
hành b i RCR.
15
CuuDuongThanCong.com
/>
B ng 2.3 Các chu n mã hóa âm tho i chính
N m
hồn
thành
T c đ bit truy n
(kbps)
Tên chu n
Các ng d ng
1972a
ITU-T G.711 PCM
64
S d ng công c ng
1984b
FS 1015 LPC
2.4
Liên l c b o m t
1987b
ETSI GSM 6.10 RPELTP
13
Vô tuy n di đ ng s
1990c
ITU-T G.726 ADPCM
16, 24, 32, 40
S d ng công c ng
1990b
TIA IS54 VSELP
7.95
H th ng tho i t bào s TDMA
B cM
1990c
ETSI GSM 6.20 VSELP
5.6
H th ng t bào GSM
1990c
RCR STD-27B VSELP
6.7
H th ng t bào Nh t
1991b
FS1016 CELP
4.8
Liên l c b o m t
1992b
ITU-T G.728 LD-CELP
16
S d ng công c ng
1993b
TIA IS96 VBR-CELP
1995a
ITU-T G.723.1
MLQ/ACELP
1995b
MP-
8.5, 4, 2, 0.8
5.3, 6.3
H th ng tho i t bào s CDMA
B cM
Liên l c đa ph
tho i truy n hình
ng ti n, đi n
ITU-T G.729 CS-ACELP
8
S d ng công c ng
a
ETSI GSM EFR ACELP
12.2
S d ng công c ng
a
1996
TIA IS641 ACELP
7.4
H th ng tho i t bào s TDMA
B cM
1997b
FS MELP
2.4
Liên l c b o m t
1996
a
1999
là đ
là đ
c
là đ
a
b
ETSI AMR-ACELP
12.2, 10.2, 7.95,
7.40, 6.70, 5.90,
5.15, 4.75
S d ng công c ng vi n thông
c mô t m t ph n
c gi i thích đ y đ
c mơ t ng n g n mà khơng có mơ t k thu t chi ti t
1.2.1.5 Ki n trúc c a h th ng mã hóa âm tho i [8]
Hình 1.17 mô t s đ kh i c a h th ng mã hóa âm tho i. Tín hi u âm tho i t ng t liên
t c có t ngu n cho tr c s đ c s hóa b i b m t b l c chu n, b l y m u (b chuy n đ i
th i gian r i r c), và b chuy n tín hi u t ng t sang tín hi u s . Tín hi u ngõ ra là tín hi u âm
tho i th i gian r i r c v i các giá tr l y m u c ng r i r c hóa. Tín hi u này đ c xem là tín hi u
âm tho i s .
16
CuuDuongThanCong.com
/>
Hình 1.17 S đ kh i c a h th ng x lý tín hi u tho i
Thơng th ng, h u h t các h th ng mã hóa âm tho i đ c thi t k đ h tr các ng d ng
vi n thông, v i t n s gi i h n gi a 300 và 3400Hz. Theo lý thuy t Nyquist, t n s l y m u t i
thi u ph i l n h n hai l n b ng thông c a tín hi u liên t c th i gian. Giá tr 8kHz th ng đ c l a
ch n là t n s l y m u chu n cho tín hi u tho i. B mã hóa kênh th c hi n vi c mã hóa hi u ch nh
l i c a chu i bit truy n tr c khi tín hi u đ c truy n trên kênh truy n, n i mà tín hi u s b thay
đ i do nhi u c ng nh giao thoa tín hi u…. B gi i mã th c hi n vi c hi u ch nh l i đ có đ c
tín hi u đã mã hóa, sau đó tín hi u đ c đ a vào b gi i mã đ có đ c tín hi u âm tho i s có
cùng t c đ v i tín hi u ban đ u. Lúc này, tín hi u s s đ c chuy n sang d ng t ng t th i
gian liên t c. B ph n th c hi n vi c x lý tín hi u tho i ch y u c a mô hình h th ng x lý tho i
là b mã hóa và gi i mã. Thơng th ng, khi x lý các bài tốn v truy n tho i, mơ hình đ c đ n
gi n hóa nh Hình 1.18
Ví d tín hi u tho i ngõ vào là tín hi u r i r c th i gian có t c đ bit là 128kbps đ c đ a
vào b mã hóa đ th c hi n mã hóa chu i bit ho c th c hi n nén d li u tho i. T c đ c a chu i
bit thơng th ng s có t c đ th p h n t c đ c a tín hi u ngõ vào b mã hóa. B gi i mã nh n
chu i bit mã hóa này và t o ra tín hi u tho i có d ng là r i r c th i gian và có t c đ b ng v i t c
đ c a tín hi u ban đ u truy n vào h th ng.
Hình 1.18 S đ kh i đ n gi n hóa c a b mã hóa âm tho i
17
CuuDuongThanCong.com
/>
1.2.1.6 Ki n trúc t ng quát c a b mã hóa – gi i mã âm tho i [9]
Hình 1.19 Mô t s đ kh i t ng quát c a b mã hóa và gi i mã âm tho i.
i v i b mã hóa, tín hi u âm tho i đ u vào đ c x lý và phân tích nh m thu đ c các
thơng s đ i di n cho m t khung truy n. Các thơng s ngày đ c mã hóa và l ng t v i mã ch
s nh phân và đ c g i đi nh là m t chu i bit đã đ c nén. Các ch s này đ c đóng gói và
bi u di n thành chu i bit, chúng đ c s p x p th t truy n d a vào các thông s đã quy t đ nh
tr c và đ c truy n đ n b gi i mã.
Hình 1.20 Mơ hình chung c a b mã hóa âm tho i. Hình trên: b mã hóa, hình d
gi i mã.
i: b
B gi i mã th c hi n vi c phân tích chu i bit nh n đ c, các ch s nh phân đ c ph c
h i sau q trình phân tích và dùng đ k t h p v i các thông s t ng ng c a b gi i mã đ có
18
CuuDuongThanCong.com
/>
đ c các thông s đã đ c l ng t . Các thông s gi i mã này s k t h p v i nhau và đ
đ t o l i tín hi u âm tho i t ng h p.
c x lý
1.2.1.7 Các yêu c u c n có c a m t b mã hóa âm tho i [10]
M c tiêu chính c a c a mã hóa thoi là t i đa hóa ch t l ng nghe t i m t t c đ bit nào
đó, ho c t i thi u hóa t c đ bit ng v i m t ch t l ng đ c thù. T c đ bit t ng ng v i âm
tho i nào s đ c truy n ho c l u tr ph thu c vào chi phí c a vi c truy n hay l u tr , chi phí
c a mã hóa tín hi u tho i s , và các yêu c u v ch t l ng c a âm tho i đó. Trong h u h t các b
mã hóa âm tho i, tín hi u đ c xây d ng l i s khác v i tín hi u nguyên th y. T c đ bit truy n b
gi m b i vi c bi u di n tín hi u âm tho i (ho c các thông s trong mơ hình t o âm tho i) v i đ
chính xác b gi m, và b i q trình lo i b các thông tin d th a c a tín hi u. Các yêu c u lý
t ng c a m t b mã hóa tho i bao g m:
T c đ bit th p: đ i v i chu i bit mã hóa có t c bit t l thu n v i b ng thông c n cho
truy n d li u. i u này d n đ n n u t c đ bit th p s làm t ng hi u su t c a h th ng.
Yêu c u này l i xung đ t v i các các đ c tính t t khác c a h th ng, nh là ch t l ng c a
âm tho i. Trong th c t , vi c đánh đ i gi a các l a ch n ph thu c vào áp d ng vào ng
d ng gì.
Ch t l ng tho i cao: tín hi u âm tho i đã gi i mã ph i có ch t l ng có th ch p nh n
đ c đ i v i ng d ng c n đ t. Có r t nhi u khía c nh v m t ch t l ng bao g m tính d
hi u, t nhiên, d nghe và c ng nh có th nh n d ng ng i nói.
Nh n d ng ti ng nói / ngôn ng khác nhau: k thu t nh n d ng ti ng nói có th phân bi t
đ c gi ng nói c a ng i l n nam gi i, ng i l n n gi i và tr con c ng nh nh n d ng
đ c ngơn ng nói c a ng i nói.
C ng đ m nh trong kênh truy n nhi u: đây là y u t quan tr ng đ i v i các h th ng
truy n thông s v i các nhi u nh h ng m nh đ n ch t l ng c a tính hi u tho i.
Hi u su t cao đ i v i các tín hi u phi tho i (ví d nh tín hi u tone đi n tho i): trong h
th ng truy n d n kinh đi n, các tín hi u khác có th t n t i song song v i tín hi u âm
tho i. Các tín hi u tone nh là đa t n tone đôi – Dual tone multifrequency(DTMF) c a tín
hi u âm bàn phím và nh c thông th ng b chèn vào trong đ ng truy n tín hi u. Ngay c
nh ng b mã hóa tho i t c đ th p c ng có th khơng th t o l i tín hi u m t cách hồn
ch nh.
Kích th c b nh th p và đ ph c t p tính tốn th p: nh m m c đích s d ng đ c b
mã hóa âm tho i trong th c t , chi phí th c hi n liên quan đ n vi c tri n khai h th ng
ph i th p, bao g m c vi c b nh càn thi t đ h tr khi h th ng ho t đ ng c ng nh các
u c u tính tốn. Các nhà nghiên c u mã hóa âm tho i đã n l c trong vi c tìm ki m hi n
th c bài tốn tri n khai trong th c ti n sao cho có hi u qu nh t.
tr mã hóa th p: trong q trình x lý mã hóa và gi i mã tho i, đ tr tín hi u ln
ln t n t i, chính là th i gian tr t gi a âm tho i ngõ vào c a b mã hóa v i tín hi u ngõ
ra c a b gi i mã. Vi c tr quá m c s sinh ra nhi u v n đ trong vi c th c hi n trao đ i
ti ng nói hai chi u trong th i gian th c.
1.2.2
Các mô hình dùng trong x lý âm thanh [11]
1.2.2.1 Mơ hình quang ph
1.2.2.1.1 Mơ hình sin
19
CuuDuongThanCong.com
/>
Tín hi u âm thanh có th đ
c tri n khai t t p h p các mơ hình sin n u nh có có d ng
I
y (t ) = ∑ Ai (t )e jφ ( t )
(1.20)
i
i =1
t
V i φi (t ) = ∫ ω i (τ ) dτ , Ai (t ) và ω i (t ) là thành ph n biên đ và t n s t
ng ng c a
−∞
thành ph n sin th i . Trong th c t , tín hi u đ
v y ta có th vi t l i
c xem xét là tín hi u r i r c th i gian th c, nh
I
y (n) = ∑ Ai (n) cos(φi (n ))
(1.21)
i =1
nT
V i φi ( n) = ∫ ω i (τ ) dτ + φ 0,i .
(1.22)
0
V c b n, n u nh I có giá tr vơ cùng l n, thì b t c tín hi u âm thanh nào c ng có th
đ c tri n khai t mơ hình sin, phép tính g n đúng đ c áp d ng tính tốn trong mơ hình này.
Th c t , tính hi u nhi u c ng đ c tri n khai thành vơ s các tín hi u sin, và ta tách vi c x lý
riêng tín hi u này thành ph n x lý Stochastic ( Λ ) đ c ký hi u là e(n) .
I
y (n) = ∑ Ai (n) cos(φi (n )) + e(n)
i =0
(1.23)
Λ
Γ
Thành ph n Λ có th đ c tính b ng phép bi n đ i Short-Time Fourier s d ng l u đ
hình 1. Ph ng pháp này đ c ng d ng trong các ph n m m sms, vi t t t c a t ng h p mơ hình
ph - spectral modeling synthesis.
Hình 1.21 Phân tích các thành ph n hình sin c a ph n stochastic
20
CuuDuongThanCong.com
/>
Phát hi n đ nh và ghép (Peak detection and continuation): đ th c hi n vi c phân tích
các thành ph n hình sin t tín hi u th ng d , ta ph i tìm đ c và ghi chú l i các đ nh t n s n i
tr i, t c là các thành ph n hình sin n m vai trị chính trong cơng th c phân tích đ c. M t chi n
thu t đ c s d ng đ th c hi n đi u này là v “b ng ch d n” trong các khung STFT.
th c hi n vi c phân chia ph n nào là tín hi u, ph n nào là nhi u, các t n s và pha ph i
đ c xác đ nh m t cách chính xác. Ngồi ra, đ q trình t ng h p l i hai tín hi u đó đ c đ n
gi n, biên đ c a các thành ph n nên đ c n i suy gi a các khung tín hi u, và phép n i suy tuy n
tính th ng đ c s d ng. Các t n s c ng nh pha c a tín hi u c ng có th đ c n i suy, tuy
nhiên c n ph i l u ý là phép n i suy t n s có nh h ng ch t ch đ n phép n i suy pha.
T ng h p l i các thành ph n sin: Trong giai đo n t ng h p l i, các thành ph n sin có th
đ c t o b i b t k ph ng pháp nào nh máy t o dao đ ng s , máy t o dao đ ng b ng sóng ho c
t ng h p l y m u b ng sóng, ho c k thu t d a trên c s FFT. K thu t FFT đ c s d ng nhi u
do tính ti n l i khi tín hi u có nhi u thành ph n hình sin.
Trích tín hi u th ng d (Extraction of the residual): Vi c trích ph c a tín hi u nhi u
th ng d có th đ c th c hi n mi n t n (đ c mơ t trong hình 1) ho c tr c ti p t mi n th i
gian.
S hi u ch nh ph th ng d (Residual spectral fitting): thành ph n stochastic đ c mơ
hình hóa là tín hi u nhi u b ng r ng, đ c l c b i kh i đ c tr ng tuy n tính. Ph c ng đ c a tín
hi u th ng d có th đ c x p x b ng giá tr trung bình c a hàm piecewise-linear. Vi c t ng h p
trong mi n th i gian có th đ c th c hi n b ng phép đ o FFT, sau khi đã n đ nh đ c m t t p
c ng đ mong mu n và m t t p pha ng u nhiên.
Hi u ch nh âm thanh: mơ hình sin là m t mơ hình h u d ng vì nó cho phép áp d ng vi c
truy n các âm thanh nh c l y t vi c ghi b ng th c t . Hình 1.22 mơ t m t các b c th c h ên
cho vi c hi u ch nh tín hi u âm nh c
Hình 1.22 C c u t ch c cho vi c bi u di n vi c truy n tín hi u âm nh c
1.2.2.1.2 Tín hi u sin + nhi u + n t đ m
Trong mơ hình sin + nhi u, đi u c b n là các tín hi u âm thanh là t ng h p c a nhi u tín
hi u sin t n s th p và các lo i nhi u b ng r ng h u nh
d ng t nh. Khi đó, m t thành ph n c a
âm thanh khơng đ c xem xét đ n, đó là n t đ m. Vi c hi u ch nh âm thanh có th đ c th c
21
CuuDuongThanCong.com
/>
hi n d dàng b ng cách tách riêng thành ph n n t đ m đ xét riêng. Th c t , h u h t các d ng c
âm nh c m r ng tr ng đ c a m t n t nh c không làm nh h ng đ n ch t l ng x lý.
V i lý do này, m t mơ hình m i là sin + nhi u + n t đ m đ c phát h a dùng trong vi c
phân tích âm thanh. Ý t ng chính c a vi c trích âm đ m trong th c t t vi c quan sát r ng, các
tín hi u hình sin trong mi n th i gian đ c ánh x qua mi n t n thành các đ nh có v trí xác đ nh,
trong khi đó các xung ng n đ i ng u trong mi n th i gian khi đ c ánh x qua mi n t n l i có
d ng hình sin. Nh v y, mơ hình sin có th đ c ng d ng trong mi n t n s bi u di n các tín
hi u hình sin. S đ c a vi c phân tích SNT đ c mơ t trong Hình 1.23.
Hình 1.23 Phân tích tín hi u âm thanh theo mơ hình sin + nhi u + n t đ m
Kh i DCT trong Hình 1.23 mơ t ho t đ ng c a phép r i r c cosin.
Phép bi n đ i, đ
c đ nh ngh a nh sau:
N −1
⎛ (2n + 1)kπ ⎞
C (k ) = α ∑ x(n) cos⎜
⎟
2N
n =0
⎝
⎠
Phép bi n đ i DCT th c hi n vi c m t xung đ
c bi n đ i thành d ng cosin và ng
(1.24)
c l i.
1.2.2.1.3 Mơ hình LPC
Mã hóa d đốn tuy n tính có th đ c s d ng đ mơ hình ph t nh. T ng h p LPC đ c
mô t trong l u đ trong Hình 1.24. V b n ch t, mơ hình chính là gi i thu t tr t ng h p th c
hi n m t tính hi u có ph “đ c” đ c l c b i m t b l c c c. Tín hi u kích thích có th s d ng
chính tín hi u th ng d e có đ c qua q trình phân tích, ho c có th d d ng các thơng tin c a
tín hi u tho i/phi tho i.
Hình 1.24 T ng h p LPC
1.2.2.2 Mơ hình mi n th i gian
Vi c mơ t âm thanh trong mi n t n r t có hi u qu , tuy nhiên trong m t vài ng d ng, đ
ti n vi c nghiên c u vi c t ng h p âm thanh, vi c phân tích trong mi n th i gian l i có u th h n.
22
CuuDuongThanCong.com
/>
1.2.2.2.1 Máy t o dao đ ng s
Ta nh n th y m t âm thanh ph c t p đu c t ng h p t nhi u thành ph n hình sin b ng
phép t ng h p FTT-1. N u nh các thành ph n hình sin không quá nhi u, vi c t ng h p t ng thành
ph n đ c th c hi n b ng cách l y giá tr trung bình c a máy t o dao đ ng s .
e jω ( n+1) = e jω e jω n
0
V i e
jω0 n
0
(1.25)
0
= xR (n) + jxI (n) d ng s ph c, m i b c nh y th i gian đ c đ nh ngh a
nh sau:
xR (n + 1) = cos ω0 xR ( n) − sin ω0 xI (n)
(1.26)
xI (n + 1) = sin ω0 xR ( n) + cos ω0 xI (n)
(1.27)
Thông s biên đ và pha ban đ u có th tính d a theo pha ban đ u e
l ch pha vào s m . Tín hi u xR ( n + 1) có th đ
j ω0 0
và th c hi n vi c
c tính theo công th c sau
xR (n + 1) = 2 cos ω0 xR (n) − xR (n − 1)
(1.28)
áp ng xung c a b l c nh sau
H R ( z) =
1
1 − 2 cos ω0 z + z
−1
−2
=
(1 − e
Giá tr c c c a b l c bi u th c 10 n m trên chu vi đ
1
− jω0 z −1
)(1 − e )
jω0 z −1
(1.29)
ng tròn đ n v .
G i xR1 , xR 2 là hai bi n tr ng thái c a hai m u tr oc đó c a tín hi u ngõ ra xR , pha ban
đ u φ0 có th đ
c tính theo h ph
ng trình sau
xR1 = sin (φ0 − ω0 )
(1.30)
xR 2 = sin (φ0 − 2ω0 )
(1.31)
Máy t o dao đ ng s đ c bi t h u ích trong vi c bi u di n t ng h p tín hi u đ i v i các b
vi x lý đa m c đích, khi các phép toán trên d u ch m đ ng đ c tri n khai. Tuy nhiên, ph ng
pháp này dùng cho vi c t o tín hi u sin có hai b t l i:
Vi c c p nh t thông s u c u tính tốn trên hàm cosin. ây là m t đi u khó đ i v i
đi u ch t c đ âm thanh, do ph i th c hi n phép tính cosin ng v i t ng m u trong
mi n th i gian
Thay đ i t n s c a máy dao đ ng s s làm thay đ i biên đ tín hi u sin. Khi đó b
ph n logic đi u khi n biên đ c n đ c s d ng đ đi u ch nh h n ch này.
1.2.2.2.2 Máy t o dao đ ng b ng sóng
Trong ph ng pháp kinh đi n và linh đ ng nh t v t ng h p các d ng sóng có chu k (bao
g m tín hi u d ng sin) là vi c đ c l p đi l p l i m t b ng ch a n i dung c a m t d ng sóng đã
đ c l u tr tr c. N u d ng sóng đ c t ng h p d ng sin, đ i x ng thì vi c l u tr cho phép
ch c n l u tr ¼ chu k , và vi c tính tốn s h c s đ c n i suy cho c chu k .
t buf [
] là b
đ m có n i dung ch a là chu k c a d ng sóng, ho c b ng d ng sóng.
Máy t o dao đ ng d ng sóng ho t đ ng l p l i theo chu k quét b ng d ng sóng là b i s c a gia
s I và đ c n i dung c a b ng d ng sóng t i v trí đó.
23
CuuDuongThanCong.com
/>