Tải bản đầy đủ (.pdf) (175 trang)

xu ly am thanh hinh anh nguyen thanh binh xlatha cuuduongthancong com

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.71 MB, 175 trang )

H C VI N CƠNG NGH B U CHÍNH VI N THƠNG

X

LÝ ÂM THANH, HÌNH
(Dùng cho sinh viên h đào t o đ i h c t xa)
L u hành n i b

HÀ N I - 2007

CuuDuongThanCong.com

/>
NH


H C VI N CƠNG NGH B U CHÍNH VI N THƠNG

X

LÝ ÂM THANH, HÌNH
Biên so n :

NH

TS. NGUY N THANH BÌNH
THS. VÕ NGUY N QU C B O

CuuDuongThanCong.com

/>



L I NÓI

U

Tài li u h ng d n h c t p mơn "X lý âm thanh và hình nh" dành cho kh i đào t o t
xa chuyên ngành đi n t vi n thông. Tài li u này s gi i thi u nh ng ki n th c c b n v x lý âm
thanh và hình nh. c bi t, tác gi chú tr ng t i v n đ x lý tín hi u ng d ng trong m ng vi n
thơng: đó là các ph ng pháp nén tín hi u, l u tr , các tiêu chu n nén tín hi u âm thanh và hình
nh. Nh ng ki n th c đ c trình bày trong tài li u s giúp h c viên ti p c n nhanh v i các v n đ
th c ti n th ng g p trong m ng vi n thơng.
Vì kh i l ng ki n th c trong l nh v c x lý âm thanh c ng nh hình nh r t l n, và v i
qu th i gian quá eo h p dành cho biên so n, tài li u h ng d n này ch a thâu tóm đ c tồn b
ki n th c c n có v l nh v c x lý âm thanh và hình nh.
tìm hi u v m t s v n đ có trong
đ c ng mơn h c địi h i h c viên ph i nghiên c u thêm trong s sách tham kh o đ c tác gi đ
c p t i trong ph n cu i c a tài li u này.
N i dung cu n sách đ

c chia làm hai ch

-

Ch

ng 1: K thu t x lý âm thanh

-

Ch


ng 2: K thu t x lý hình nh.

ng:

có th h c t t mơn này, sinh viên c n ph i có ki n th c c b n v x lý tín hi u s .
Các ki n th c này các b n có th tìm hi u trong cu n “X lý tín hi u s ” dành cho sinh viên i
h c t xa c a H c vi n.
ây là l n biên so n đ u tiên, ch c ch n tài li u cịn nhi u s sót, r t mong các b n đ c
trong quá trình h c t p và các thày cô gi ng d y mơn h c này đóng góp các ý ki n xây d ng.
Trong th i gian g n nh t, tác gi s c g ng c p nh p, b xung thêm đ tài li u h ng d n đ c
hoàn ch nh h n.
M i ý ki n đóng góp đ ngh g i v theo đ a ch email:

Tp. H Chí Minh 19/05/2007
Nhóm biên so n

CuuDuongThanCong.com

/>

2
CuuDuongThanCong.com

/>

CH

NG 1


1.1 T NG QUAN V X
1.1.1

Gi i thi u s l

1.1.1.1

K THU T X

LÝ ÂM THANH

LÝ ÂM THANH

c v âm thanh & h th ng x lý âm thanh

c tính c a âm thanh t

ng t [1]

M c đích c a l i nói là dùng đ truy n đ t thơng tin. Có r t nhi u cách mô t đ c đi m
c a vi c truy n đ t thông tin. D a vào lý thuy t thơng tin, l i nói có th đ c đ i di n b i thu t
ng là n i dung thông đi p, ho c là thông tin. M t cách khác đ bi u th l i nói là tín hi u mang
n i dung thơng đi p, nh là d ng sóng âm thanh.

Hình 1.1 D ng sóng c a tín hi u ghi nh n đ

c t âm thanh c a ng

i


K thu t đ u tiên dùng trong vi c ghi âm s d ng các thông s v c , đi n c ng nh
tr ng có th làm nên nhi u cách th c ghi âm ng v i các lo i áp su t khơng khí khác nhau. i n
áp đ n t m t microphone là tín hi u t ng t c a áp su t khơng khí (ho c đôi khi là v n t c). Dù
đ c phân tích b ng cách th c nào, thì các ph ng pháp khi so sánh v i nhau ph i dùng m t t l
th i gian.
Trong khi các thi t b t ng t hi n đ i trơng có v x lý âm thanh t t h n nh ng thi t b
c đi n, các tiêu chu n x lý thì h u nh khơng có gì thay đ i, m c dù cơng ngh có v x lý t t
h n. Trong h th ng x lý âm thanh t ng t , thông tin đ c truy n đ t b ng thông s liên t c
bi n thiên vô h n.
H th ng x lý âm thanh s lý t ng có nh ng tính n ng t ng t nh h th ng x lý âm
thanh t ng t lý t ng: c hai ho t đ ng m t cách “trong su t” và t o l i d ng sóng ban đ u
không l i. Tuy nhiên, trong th gi i th c, các đi u ki n lý t ng r t hi m t n t i, cho nên hai lo i
h th ng x lý âm thanh ho t đ ng s khác nhau trong th c t . Tín hi u s s truy n trong kho ng
cách ng n h n tín hi u t ng t và v i chi phí th p h n. Trong giáo trình này, t p trung đ c p
đ n h th ng s x lý âm thanh.
Thông tin dùng đ truy n đ t c a âm tho i v b n ch t có tính r i r c [2], và nó có th
đ c bi u di n b i m t chu i ghép g m nhi u ph n t t m t t p h u h n các ký hi u (symbol).
Các ký hi u t m i âm thanh có th đ c phân lo i thành các âm v (phoneme). M i ngơn ng có
các t p âm v khác nhau, đ c đ c tr ng b i các con s có giá tr t 30 đ n 50. Ví d nh ti ng
Anh đ c bi u di n b i m t t p kho ng 42 âm v .
Tín hi u tho i đ c truy n v i t c đ nh th nào? i v i tín hi u âm tho i nguyên th y
ch a qua hi u ch nh thì t c đ truy n c l ng có th tính đ c b ng cách l u ý gi i h n v t lý
c a vi c nói l u lốt c a ng i nói t o ra âm thanh tho i là kho ng 10 âm v trong m t giây. M i
3
CuuDuongThanCong.com

/>

m t âm v đ c bi u di n b i m t s nh phân, nh v y m t mã g m 6 bit có th bi u di n đ c
t t c các âm v c a ti ng Anh. V i t c đ truy n trung bình 10 âm v /giây, và khơng quan tâm

đ n v n đ luy n âm gi a các âm v k nhau, ta có th
c l ng đ c t c đ truy n trunh bình
c a âm tho i kho ng 60bit/giây.
Trong h th ng truy n âm tho i, tín hi u tho i đ c truy n l u tr và x lý theo nhi u
cách th c khác nhau. Tuy nhiên đ i v i m i lo i h th ng x lý âm thanh thì có hai đi u c n quan
tâm chung là:
1. Vi c duy trì n i dung c a thơng đi p trong tín hi u tho i
2. Vi c bi u di n tín hi u tho i ph i đ t đ c m c tiêu ti n l i cho vi c truy n tin ho c l u
tr , ho c d ng linh đ ng cho vi c hi u ch nh tín hi u tho i sao cho khơng làm gi m
nghiêm tr ng n i dung c a thông đi p tho i.
Vi c bi u di n tín hi u tho i ph i đ m b o vi c các n i dung thơng tin có th đ
dàng trích ra b i ng i nghe, ho c b i các thi t b phân tích m t cách t đ ng.

cd

1.1.1.2 Khái ni m tín hi u
Là đ i l ng v t lý bi n thiên theo th i gian, theo không gian, theo m t ho c nhi u bi n
đ c l p khác, ví d nh :
Âm thanh, ti ng nói: dao đ ng sóng theo th i gian (t)
Hình nh: c

ng đ sáng theo không gian (x, y, z)

a ch n: ch n đ ng đ a lý theo th i gian
Bi u di n tốn h c c a tín hi u: hàm theo bi n đ c l p
Ví d :

u (t ) = 2t 2 − 5

f ( x, y ) = x 2 − 2 xy − 6 y 2

Thơng th ng các tín hi u t nhiên không bi u di n đ c b i m t hàm s c p, cho nên
trong tính tốn, ng i ta th ng dùng hàm x p x cho các tín hi u t nhiên.
H th ng: là thi t b v t lý, thi t b sinh h c, ho c ch ng trình th c hi n các phép tốn
trên tín hi u nh m bi n đ i tín hi u, rút trích thơng tin, … Vi c th c hi n phép tốn cịn đ c g i
là x lý tín hi u.

1.1.1.3 Phân lo i tín hi u:
Tín hi u đa kênh: g m nhi u tín hi u thành ph n ,cùng chung mơ t m t đ i t ng nào đó
(th ng đ c bi u di n d i d ng vector, ví d nh tín hi u đi n tim (ECG-ElectroCardioGram) ,
tín hi u đi n não (EEG – ElectroEncephaloGram), tín hi u nh màu RGB.
Tín hi u đa chi u: bi n thiên theo nhi u h n m t bi n đ c l p, ví d nh tín hi u hình nh,
tín hi u tivi tr ng đen.
Tín hi u liên t c theo th i gian: là tín hi u đ

c đ nh ngh a t i m i đi m trong đo n th i

gian [a,b], ký hi u x (t ) .

4
CuuDuongThanCong.com

/>

Hình 1.2 Tín hi u liên t c theo th i gian
Tín hi u r i r c th i gian: là tín hi u ch đ

c đ nh ngh a t i nh ng th i đi m r i r c khác

nhau, ký hi u x(n) .


Hình 1.3 Tín hi u r i r c theo th i gian
Tín hi u liên t c giá tr : là tín hi u có th nh n tr b t k trong đo n [Ymin , Ymax ] , ví d tín
hi u t

ng t (analog).

Hình 1.4 Tín hi u liên t c giá tr
Tín hi u r i r c giá tr : tín hi u ch nh n tr trong m t t p tr r i r c đ nh tr

c (tín hi u

s ).

5
CuuDuongThanCong.com

/>

Hình 1.5 Tín hi u r i r c giá tr
Tín hi u analog: là tín hi u liên t c v th i gian, liên t c v giá tr .

Hình 1.6 Tín hi u analog
Tín hi u s : là tín hi u r i r c v th i gian, r i r c v giá tr .

Hình 1.7 Tín hi u s
Tín hi u ng u nhiên: giá tr c a tín hi u trong t
hi u trong t nhiên th ng thu c nhóm này

ng lai khơng th bi t tr


Tín hi u t t đ nh: giá tr tín hi u quá kh , hi n t i và t
thơng th ng có cơng th c xác đ nh rõ ràng



ng l i đ u đ

c. Các tín

c xác đ nh rõ,

1.1.1.4 Phân lo i h th ng x lý
G m hai lo i h th ng là h th ng t ng t và h th ng s . Trong đó h th ng x lý s : là
h th ng có th l p trình đ c, d mơ ph ng, c u hình, s n xu t hàng lo t v i đ chính xác cao,
giá thành h , tín hi u s d l u tr , v n chuy n và sao l u, nh c đi m là khó th c hi n v i các
tín hi u có t n s cao
6
CuuDuongThanCong.com

/>

1.1.1.5 H th ng s x lý âm thanh [3]
nh y c a tai ng i r t cao, nó có th phân bi t đ c s l ng nhi u r t nh c ng nh
ch p nh n t m biên đ âm thanh r t l n. Các đ c tính c a m t tín hi u tai ng i nghe đ c có th
đ c đo đ c b ng các công c phù h p. Thông th ng, tai ng i nh y nh t t m t n s 2kHz và
5kHz, m c dù c ng có ng i có th nh n d ng đ c tín hi u trên 20kHz. T m đ ng nghe đ c
c a tai ng i đ c phân tích và ng i ta nh n đ c k t qu là có d ng đáp ng logarith.
Tín hi u âm thanh đ c truy n qua h th ng s là chu i các bit. B i vì bit có tính ch tt r i
r c, d dàng xác đ nh s l ng b ng cách đ m s l ng trong m t giây, d dàng quy t đ nh t c đ
truy n bit c n thi t đ truy n tín hi u mà khơng làm m t thơng tin.


Hình 1.8
nh n đ c tám m c tín hi u khác nhau m t cách phân bi t, tín hi u đ nhđ nh c a tín hi u nhi u ph i nh h n ho c đ sai bi t gi a các m c đ . T s tín hi u trên nhi u
ph i t i thi u là 8:1 ho c là 18dB, truy n b i 3 bit. 16 m c thì t s tín hi u trên nhi u ph i là
24dB, truy n b i 4 bit.

1.1.1.6 Mơ hình hóa tín hi u âm thanh [4]
Có r t nhi u k thu t x lý tín hi u đ c mơ hình hóa và áp d ng các gi i thu t trong vi c
khôi ph c âm thanh. Ch t l ng c a âm tho i ph thu c r t l n vào mơ hình gi đ nh phù h p v i
d li u.
i v i tín hi u âm thanh, bao g m âm tho i, nh c và nhi u khơng mong mu n, mơ hình
ph i t ng quát và không sai l nh so v i gi đ nh. M t đi u c n l u ý là h u h t các tín hi u âm
tho i là các tín hi u đ ng trong th c t , m c dù mơ hình th c ti n thì th ng gi đ nh khi phân
tích tín hi u là tín hi u có tính ch t t nh trong m t kho ng th i gian đang xét.
Mơ hình phù h p v i h u h t r t nhi u lãnh v c trong vi c x lý chu i th i gian, bao g m
vi c ph c h i âm thanh là mơ hình Autoregressive (vi t t t AR), đ c dùng làm mơ hình chu n
cho vi c phân tích d đốn tuy n tính.

7
CuuDuongThanCong.com

/>

Tín hi u hi n t i đ c bi u di n b i t ng giá tr c a P tín hi u tr
tr ng, P là b c c a mơ hình AR:

c đó và tín hi u nhi u

s[u ] = ∑ s[n − i ]ai + e[n]
P


(1.1)

i =1

Mơ hình AR đ i di n cho các q trình tuy n tính t nh, ch p nh n tín hi u t ng t nhi u
và tín hi u t ng t đi u hịa. M t mơ hình khác phù h p h n đ i v i nhi u tình hu ng phân tích
là mơ hình auto regressive moving-average (ARMA) cho phép các đi m c c c ng nh đi m 0.
Tuy nhiên mơ hình AR có tính linh đ ng h n trong phân tích h n mơ hình ARMA, ví d m t tín
hi u nh c ph c t p c n mơ hình có b c P > 100 đ bi u di n d ng sóng c a tín hi u, trong khi
các tín hi u đ n gi n h n ch c n bi u di n b ng b c 30. Trong nhi u ng d ng, vi c l a ch n b c
c a mơ hình phù h p cho bài tốn sao cho đ m b o vi c bi u di n tín hi u là th a vi c khơng làm
m t đi thơng tin c a tín hi u là vi c h i ph c t p. Có r t nhi u ph ng pháp dùng đ
c l ng
b c c a mơ hình AR nh ph ng pháp maximum likelihood/least-squares [Makhoul, 1975], và
ph ng pháp robust to noise [Huber, 1981, Spath, 1991], v.v… Tuy nhiên, đ i v i vi c x lý các
tín hi u âm nh c ph c t p thì thơng th ng s d ng mơ hình Sin (Sinusoidal) r t có hi u qu
trong các ng d ng âm tho i. Mơ hình Sin r t phù h p trong các ph ng pháp dùng đ gi m
nhi u. Tín hi u đ c cho b i công th c sau

⎛ nT

s[n]∑ ai [n]sin ⎜⎜ ∫ ωi (t )dt + φi ⎟⎟
i =1
⎝0

Pn

(1.2)


ây là mơ hình t ng qt đ i v i các đi u ch biên đ và đi u ch t n s , tuy nhiên l i
không phù h p đ i v i các tín hi u t ng t nhi u, m c dù vi c bi u di n tín hi u nhi u có th
đ c bi u di n b i s l ng hàm sin r t l n.

1.1.1.7 Ki n trúc h th ng s x lý âm thanh
i v i máy tính s x lý âm thanh, ng i ta th ng dùng ph ng pháp i u ch xung
(Pulse Code Modulation , vi t t t PCM). D ng sóng âm thanh đ c chuy n sang dãy s PCM nh
sau, xét tín hi u hình sin làm ví d :

Air Displacement

Tín hi u g c là tín hi u nh Hình 1.9

Time

Hình 1.9 D ng sóng âm thanh nguyên th y
K đ n, s d ng m t microphone đ thu tín hi u âm thanh (trong khơng khí) và chuy n
đ i thành tín hi u đi n, t m đi n áp ngõ ra c a microphone ±1 volt nh Hình 1.10.

8
CuuDuongThanCong.com

/>

+1.0
Voltage

+0.5
0
-0.5

-1.0
Time

Hình 1.10 D ng sóng c a tín hi u đi n
Tín hi u đi n áp d ng t ng t sau đó đ c chuy n thành d ng s hóa b ng thi t b
chuy n đ i t ng t -s (analog-to-digital converter). Khi s d ng b chuy n đ i 16bit
t ng t -s , t m s nguyên ngõ ra có giá tr –32,768 đ n +32,767, đ c mơ t nh hình
1.11.
Converter Output

+32,767
+16,383
0
-16,384
-32,768
Time

Hình 1.11 Ngõ ra c a b chuy n đ i tín hi u t

ng t sang tín hi u s

Vì s l ng đi m d li u là vô h n nên không th l y t t c các đi m thu c tr c th i gian,
vi c l y m u s đ c th c hi n trong m t kho ng th i gian đ u đ n. S l ng m u trong
m t giây đ c g i là t n s l y m u (sampling rate). Hình 1.12 mơ t 43 m u đ c l y

Converter Output

+32,767
+16,383
0

-16,384
-32,768
1

43

Hình 1.12 Th c hi n vi c l y m u
K t qu c a vi c l y m u là m t chu i g m 43 ch s bi u di n cho các v trí c a d ng
sóng ng th i gian gian là m t chu k (hình 1.13).
Recorded Value

+32,767
+16,383
0
-16,384
-32,768
1

43

Hình 1.13 K t qu c a vi c l y m u các giá tr
9
CuuDuongThanCong.com

/>

Máy tính sau đó s xây d ng l i d ng sóng c a tín hi u b ng vi c k t n i các đi m d li u
l i v i nhau. D ng sóng k t qu đ c mơ t Hình 1.14.
Recorded Value


+32,767
+16,383
0
-16,384
-32,768
1

Hình 1.14 D ng sóng đ

43

c tái t o l i

L u ý r ng có m t vài đi m khác bi t gi a d ng sóng nguyên th y và d ng sóng tái t o
(Hình 1.9 và Hình 1.14), lý do:
A. Các giá tr đ c t o ra t i b chuy n đ i tín hi u t
nguyên và đ c làm tròn giá tr .
B. Hình dáng c a tín hi u tái t o ph thu c vào s l

ng t sang tín hi u s là các s

ng m u đ

c ghi nh n.

T ng quát, m t dãy s h u h n (đ i di n cho tín hi u s ) ch có th bi u di n cho m t
d ng sóng tín hi u t ng t v i đ chính xác h u h n.

1.1.1.8 T n s l y m u
Khi chuy n đ i m t âm thanh sang d ng s , đi u c n l u ý là t n s l y m u c a h th ng

x lý ph i đ m b o tính trung th c và chính xác khi c n ph c h i l i d ng sóng tín hi u ban đ u.
Theo đ nh l y m u Nyquist và Shannon, t n s l y m u quy t đ nh t n s cao nh t c a tín
hi u ph c h i.
tái t o l i d ng sóng có t n s là F , c n ph i l y 2 F m u trong m t giây. T n
s này còn đ c g i là t n s Nyquist. Tuy nhiên, đ nh lý Nyquist không ph i là t i u cho m i
tr ng h p. N u m t d ng sóng hình Sin có t n s là 500Hz, thì t n s l y m u 1000Hz. N u nh
t n s l y m u cao h n t n s Nyquist s gây ra tình tr ng “hi u ng là” nh h ng đ n biên đ
c a tín hi u và tín hi u b c ng nhi u, tuy nhiên lúc đó thì các thành ph n hài t n s th p l i có tín
hi u chính xác h n khi đ c ph c h i.

1.1.2

Nh c l i m t s khái ni m toán h c trong x lý âm thanh

1.1.2.1 Phép bi n đ i z [5]
Phép bi n đ i z c a m t chu i đ

c đ nh ngh a b i c p bi u th c

X (z ) =



∑ x ( n) z

−n

(1.3a)

n = −∞


x ( n) =
Bi n đ i z c a x (n) đ
công su t vô h n theo bi n z

−1

1
X ( z ) z n−1dz

2πj C

c đ nh ngh a b i bi u th c (1.6a). X (z ) còn đ

(1.3b)
c g i là dãy

v i các giá tr c a x(n) chính là các h s c a dãy công su t.

Mi n h i t ROC là { z X (z ) < ∞ }, là nh ng giá tr c a z sao cho chu i h i t , hay nói cách
khác

10
CuuDuongThanCong.com

/>



∑ x ( n)


<

z −n



(1.4)

n = −∞

Thông th

ng, mi n h i t c a z có d ng:

R1 < z < R2

(1.5)

Ví d : Cho x ( n) = δ ( n − n0 ) . Theo công th c (1.3a), ta có X ( z ) = z

− n0

Ví d : Cho x ( n) = u ( n) − u ( n − N ) . Theo cơng th c (1.3a), ta có

1− z−N
1 − z −1

N −1


X ( z ) = ∑ (1).z −n =
n =0



Ví d : Cho x(n) = a .u (n) . Suy ra X ( z ) = ∑ a z
n

n

−n

=

n =0

Ví d : Cho x( n) = −b u (− n − 1) . Then X ( z ) =
n

−1

∑b

n

1
,a < z
1 − az −1

z −n =


n = −∞

B ng 2.1 Chu i tín hi u và bi n đ i z t

1. Tuy n tính
2. D ch
3. Hàm m

1
, z 1 − bz −1

ng ng
Chu i tín hi u

Bi n đ i z

ax1 (n) + bx2 (n)

aX 1 ( z ) + bX 2 ( z )

x(n + n0 )

z n X ( z)

a n x(n )

X (a −1 z )


0

4. Hàm tuy n tính

nx(n)

5.

o th i gian

x(-n)

X ( z −1 )

ng quan

x(n)*h(n)

X(z)H(z)

7. Nhân chu i

x(n)w(n)

1
X (ν )W ( z /ν )ν −1dν

2πj C

6. T


−z

dX ( z )
dz

1.1.2.2 Phép bi n đ i Fourier
Bi n đ i Fourier c a tín hi u r i r c th i gian đ

c cho b i bi u th c



X (e jw ) =

∑ x(n)e

− jwn

(1.6a)

n = −∞

x ( n) =

1


π


∫ π X (e


jw

)e jwn dw

(1.6b)

Bi n đ i Fourier là tr ng h p đ c bi t c a phép bi n đ i z b ng cách thay th z = e .
Nh mơ t trong Hình 1.4, trong m t ph ng z, t n s w là góc quay. i u ki n đ đ t n t i bi n
iw

đ i Fourier là z = 1 , nh v y

11
CuuDuongThanCong.com

/>



∑ x(n) < ∞

(1.7)

Hình 1.15 Vịng trịn đ n v thu c m t ph ng z
M t đ c tính quan tr ng c a bi n đ i Fourier c a m t chu i là X (e ) là hàm đi u hòa w,
iw


v i chu k là 2π .
B ng cách thay z = e

iw

b ng 2.1, có có đ

c b ng bi n đ i Fourier t

ng ng.

1.1.2.3 Phép bi n đ i Fourier r i r c
Trong tr

ng h p tín hi u t

ng t , tu n hoàn v i chu k N

~
x ( n) = ~
x (n + N )

−∞ < n<∞

(1.8)

x (n) có th có d ng là t ng r i r c các tín hi u sin thay vì tích phân nh
V i ~

cơng th c


(1.9b). Phép bi n đ i Fourier cho chu i tu n hoàn nh sau

N −1
kn
−j
~
X (k ) = ∑ ~
x ( n )e N

(1.9a)

n =0

1
~
x (k ) =
N


j
kn
~
∑ X ( k )e N
N −1

(1.9b)

k =0


Chu i x(n) h u h n, có giá tr b ng 0 v i 0 ≤ n ≤ N − 1 , có phép bi n đ i z là.
N −1

X ( z ) = ∑ x ( n) z − n

(1.10)

n =0

j 2πk
N u chia X (z ) thành N đi m trên vòng tròn đ n v , z k = e

N

, k = 0,1,..., N − 1 , ta

, k = 0,1,..., N − 1

(1.11)

có:

X (e

j


k
N


N −1

) = ∑ x ( n )e

−j


kn
N

n =0

x (n) có cơng th c t x(n) nh sau
Chu i tu n hồn vơ h n ~
~
x ( n) =



∑ x(n + rN )

r = −∞

12
CuuDuongThanCong.com

/>
(1.12)



Ta nh n th y r ng các m u X (e

j


k
N

) t ph ng trình (1.9a) và (1.11) chính là các h s

x (n) trong ph
Fourier c a chu i tu n hồn ~
có th đ

ng trình (1.12). Nh v y, m t chu i có chi u dài N

c bi u diwnx b i phép bi n đ i Fourier r i r c (DFT) nh sau:
N −1

X ( k ) = ∑ x ( n )e

−j


kn
N

, k = 0,1,..., N − 1

(1.13a)


n =0

N −1

1
x ( n) =
N

∑ X ( k )e

j


kn
N

, n = 0,1,..., N − 1

(1.13b)

k =0

i u khác bi t duy nh t gi a bi u th c (1.12) và (1.9) là ký hi u (lo i b ký hi u ~ khi
nói đ n tín hi u tu n hồn) và gi i h n h u h n 0 ≤ k ≤ N − 1 và 0 ≤ n ≤ N − 1 . L u ý m t
đi u là ch dùng phép bi n đ i DFT cho tín hi u tu n hồn có tính ch t là module c a N .

x ( n) =






x(n + rN ) = x( n

k = −∞

module N )

(1.14)

= x((n)) N
B ng 2.2 Chu i và bi n đ i DFT

1. Tuy n tính

Chu i tín hi u

Bi n đ i N đi m DFT

ax1 (n) + bx2 (n)

aX 1 (k ) + bX 2 (k )

x((n + n0 )) N

2. D ch
3.

o th i gian


1.2.1


kn0
N

X (k )

X * (k )

∑ x(m)h((n − m))

X(k)H(k)

m =0

5. Nhân chu i

j

x((−n)) N
N −1

4. K t h p

1.2 MƠ HÌNH X

e


N

1 N −1
∑ X (r )W ((k − r )) N
N r =0

x(n)w(n)

LÝ ÂM THANH

Các mô hình l y m u và mã hố tho i

1.2.1.1 L y m u tín hi u

mi n th i gian và tái t o tín hi u liên t c [6]

x lý m t tín hi u liên t c b ng các ph ng ti n x lý tín hi u s , ta ph i đ i tín hi u
liên t c đó ra d ng m t chu i s b ng các l y m u tín hi u liên t c m t cách tu n hồn có chu k
là T giây. G i x(n) là tín hi u r i r c hình thành do q trình l y m u, tín hi u liên t c xa (t ) , ta


x(n) = xa ( nT ) − ∞ < n < ∞
Các m u x (n) ph i đ

cl

(1.15)

ng hóa thành m t t p các m c biên đ r i r c r i m i đ


đ a vào b x lý s . Hình 1.16 minh h a m t c u hình tiêu bi u cho h th ng x lý tín hi u t

c
ng

13
CuuDuongThanCong.com

/>

t b ng ph ng pháp s . Trong các ph n sau, ta b qua sai s l
bi n đ i A/D
Tín hi u
liên t c

M ch
l c

ng hóa phát sinh trong quá trình

ya (t ) M ch

x (n) M ch x lý tín y (n)

xa (t )
A/D

hi u s

Hình 1.16 C u hình h th ng x lý tín hi u t


D/A

ng t b ng ph

l c

ng pháp s

xác đ nh quan h gi a ph c a tín hi u liên t c và ph c a tín hi u r i r c t o ra t q
trình l y m u tín hi u, liên t c đó, ta chú ý đ n quan h gi a bi n đ c l p t và n c a tín hi u

xa (t ) và x(n)
t = nT =

n
Fs

(1.16)

nh lý l y m u: m t tín hi u liên t c có b ng t n h u h n, có t n s cao nh t là B Hertz
có th khơi ph c t các m u c a nó v i đi u ki n t n s l y m u Fs ≥ 2 B m u / giây

1.2.1.2 L y m u tín hi u

mi n t n s và tái t o tín hi u liên t c

Ta đã bi t tín hi u liên t c có n ng l ng h u h n thì có ph liên t c. Trong ph n này, ta
s xét quá trình l y m u c a các tín hi u lo i đó m t cách tu n hồn và s tái t o ín hi u t các
m u c a ph c a chúng

Xét m t tín hi u liên t c xa (t ) v i m t ph liên t c X a ( F ) . Gi s ta l y m u X a ( F )
t i các th i đi m cách nhau ∂F Hertz. Ta mu n tái t o X a ( F ) ho c xa (t ) t các m u X a ( F )
N u tín hi u t

xa (t ) có gi i h n th i gian là ℑ giây và Ts đ c ch n đ

ng t

Ts > 2ℑ thì aliasing khơng x y ra và ph X a ( F ) có th đ c khơi ph c hồn tồn t các m u.
1.2.1.3 L y m u tín hi u

mi n t n s và tái t o tín hi u r i r c

Xét m t tín hi u r i r c khơng tu n hồn x( n) có phép bi n đ i Fourier:

X (ω ) =



∑ x ( n )e

− jωn

(1.17)

n = −∞

Gi s ta l y m u X (ω ) tu n hoàn t i các đi m cách nhau ∂ω rad. Vì X (ω ) tu n hoàn
v i chu k 2π , ch có các m u trong ph m vi t n s c b n là c n thi t.


thu n ti n, ta l y N

m u cách đ u nhau trong kho ng 0 ≤ ω ≤ 2π theo kho ng cách ∂ω = 2π / N
Xét ω = 2πk / N , ta đ
Xét tín hi u x p ( n) =


⎛ 2π ⎞
k ⎟ = ∑ x(n)e − j 2πkn / N k = 0,1,..., N − 1 (1.18)
⎝ N ⎠ n=−∞

c X⎜



∑ x(n − lN ) nh n đ

c b ng cách l p l i tu n hoàn x( n) t i m i

l = −∞

N m u, tín hi u này tu n hồn v i chu k N , do đó có th đ c tri n khai theo khai tri n
Fourier

x p ( n) =

1
N

N −1




∑ X( N

k )e j 2πkn / N , n = 0,1,..., N − 1

k =0

14
CuuDuongThanCong.com

/>
(1.19)

x'a (t )


T công th c x p ( n) trên, ta nh n th y có th khơi ph c tín hi u x p ( n) t các m u c a
ph

X (ω ) . Nh v y, ta ph i tìm ra m i t ng quan gi a x p (n) và x(n) đ có th th c hi n

khơi ph c x( n) t

X (ω )

Vì x p (n) là s m r ng tu n hoàn c a x ( n) , nên x ( n) có th đ
n u khơng có aliasing


c khơi ph c t

x p ( n)

cõi th i gian, ngh a là n u x( n) có th i gian gi i h n nh h n ho c b ng

chu k N c a x p (n) .

1.2.1.4 Các chu n mã hóa âm tho i trong các h th ng x lý tho i [7]
Chu n mã hóa âm tho i thông th ng đ c nghiên c u và phát tri n b i m t nhóm các
chuyên gia đã giành h t th i gian và tâm huy t th c hi n các công vi c ki m nghi m, mô ph ng
sao cho đ m b o m t t p các yêu c u đ a ra đáp ng đ c. Ch có các t ch c v i ngu n tài
nguyên kh ng l m i có th th c hi n đ c các cơng vi c khó kh n này, thơng th ng, th i gian
t i thi u c n thi t đ hoàn thành m t chu n trong tr ng h p g p nhi u thu n l i trong quá trình
là kho ng b n n m r i.
i u này khơng có ngh a là m t chu n đ c đ a ra thì “khơng có l i” ho c khơng c n
ph i c i ti n. Do đó, các chu n m i luôn luôn xu t hi n sao cho t t h n chu n c c ng nh phù
h p v i các ng d ng trong t ng lai.
H i đ ng chu n là các t ch c có trách nhi m trong vi c giám sát vi c phát tri n các
chu n cho m t ng d ng c th nào đó. Sau đây là m t s h i đ ng chu n n i ti ng đ c nhi u
nhà cung c p s n ph m tuân theo
Liên minh vi n thông qu c t - International Telecommunications Union (ITU): Các
chu n vi n thơng c a ITU (chu n ITU-T) có uy tín trong vi c đ nh ra các chu n mã hóa
âm tho i cho h th ng m ng đi n tho i, bao g m các m ng vô tuy n l n h u tuy n.
Hi p h i công nghi p vi n thông - Telecommunications Industry Association (TIA): có
trách nhi m ban hành các chu n mã hóa tho i cho các ng d ng c th , là m t thành viên
c a Vi n tiêu chu n qu c gia Hoa K - National Standards Institute (ANSI). TIA đã thành
công trong vi c phát tri n các chu n s d ng trong các h th ng t ng đài t bào s B c
M , bao g m các h th ng s d ng chu n đa k t phân th i gian - Time division multiple
access (TDMA) và a truy nh p phân chia theo mã - Code division multiple access

(CDMA).
Vi n tiêu chu n vi n thông châu Âu - European Telecommunications Standards Institute
(ETSI): ETSI có các h i viên t các n c c ng nh các công ty Châu Âu, là t ch c đ a
ra các chu n s n xu t thi t b t i Châu Âu. ETSI đ c thành l p b i nhóm có nh h ng
nh t trong lãnh v c mã hóa âm tho i là nhóm di đ ng đ c bi t - Groupe Speciale Mobile
(GSM), đã đ a ra r t nhi u chu n h u d ng và đ c tri n khai r t nhi u trên th gi i
B qu c phòng Hoa K - United States Department of Defense (DoD). DoD có liên quan
đ n vi c sáng l p các chu n mã hóa tho i, đ c bi t đ n v i các chu n liên bang Hoa K
(U.S. Federal) dùng nhi u cho các ng d ng quân s
Trung tâm phát tri n và nghiên c u các h th ng vô tuy n c a Nh t B n - Research and
Development Center for Radio Systems of Japan (RCR). Các chu n t bào s đ c phát
hành b i RCR.

15
CuuDuongThanCong.com

/>

B ng 2.3 Các chu n mã hóa âm tho i chính
N m
hồn
thành

T c đ bit truy n
(kbps)

Tên chu n

Các ng d ng


1972a

ITU-T G.711 PCM

64

S d ng công c ng

1984b

FS 1015 LPC

2.4

Liên l c b o m t

1987b

ETSI GSM 6.10 RPELTP

13

Vô tuy n di đ ng s

1990c

ITU-T G.726 ADPCM

16, 24, 32, 40


S d ng công c ng

1990b

TIA IS54 VSELP

7.95

H th ng tho i t bào s TDMA
B cM

1990c

ETSI GSM 6.20 VSELP

5.6

H th ng t bào GSM

1990c

RCR STD-27B VSELP

6.7

H th ng t bào Nh t

1991b

FS1016 CELP


4.8

Liên l c b o m t

1992b

ITU-T G.728 LD-CELP

16

S d ng công c ng

1993b

TIA IS96 VBR-CELP

1995a

ITU-T G.723.1
MLQ/ACELP

1995b

MP-

8.5, 4, 2, 0.8
5.3, 6.3

H th ng tho i t bào s CDMA

B cM
Liên l c đa ph
tho i truy n hình

ng ti n, đi n

ITU-T G.729 CS-ACELP

8

S d ng công c ng

a

ETSI GSM EFR ACELP

12.2

S d ng công c ng

a

1996

TIA IS641 ACELP

7.4

H th ng tho i t bào s TDMA
B cM


1997b

FS MELP

2.4

Liên l c b o m t

1996

a

1999

là đ
là đ
c
là đ
a

b

ETSI AMR-ACELP

12.2, 10.2, 7.95,
7.40, 6.70, 5.90,
5.15, 4.75

S d ng công c ng vi n thông


c mô t m t ph n
c gi i thích đ y đ
c mơ t ng n g n mà khơng có mơ t k thu t chi ti t

1.2.1.5 Ki n trúc c a h th ng mã hóa âm tho i [8]
Hình 1.17 mô t s đ kh i c a h th ng mã hóa âm tho i. Tín hi u âm tho i t ng t liên
t c có t ngu n cho tr c s đ c s hóa b i b m t b l c chu n, b l y m u (b chuy n đ i
th i gian r i r c), và b chuy n tín hi u t ng t sang tín hi u s . Tín hi u ngõ ra là tín hi u âm
tho i th i gian r i r c v i các giá tr l y m u c ng r i r c hóa. Tín hi u này đ c xem là tín hi u
âm tho i s .

16
CuuDuongThanCong.com

/>

Hình 1.17 S đ kh i c a h th ng x lý tín hi u tho i
Thơng th ng, h u h t các h th ng mã hóa âm tho i đ c thi t k đ h tr các ng d ng
vi n thông, v i t n s gi i h n gi a 300 và 3400Hz. Theo lý thuy t Nyquist, t n s l y m u t i
thi u ph i l n h n hai l n b ng thông c a tín hi u liên t c th i gian. Giá tr 8kHz th ng đ c l a
ch n là t n s l y m u chu n cho tín hi u tho i. B mã hóa kênh th c hi n vi c mã hóa hi u ch nh
l i c a chu i bit truy n tr c khi tín hi u đ c truy n trên kênh truy n, n i mà tín hi u s b thay
đ i do nhi u c ng nh giao thoa tín hi u…. B gi i mã th c hi n vi c hi u ch nh l i đ có đ c
tín hi u đã mã hóa, sau đó tín hi u đ c đ a vào b gi i mã đ có đ c tín hi u âm tho i s có
cùng t c đ v i tín hi u ban đ u. Lúc này, tín hi u s s đ c chuy n sang d ng t ng t th i
gian liên t c. B ph n th c hi n vi c x lý tín hi u tho i ch y u c a mô hình h th ng x lý tho i
là b mã hóa và gi i mã. Thơng th ng, khi x lý các bài tốn v truy n tho i, mơ hình đ c đ n
gi n hóa nh Hình 1.18
Ví d tín hi u tho i ngõ vào là tín hi u r i r c th i gian có t c đ bit là 128kbps đ c đ a

vào b mã hóa đ th c hi n mã hóa chu i bit ho c th c hi n nén d li u tho i. T c đ c a chu i
bit thơng th ng s có t c đ th p h n t c đ c a tín hi u ngõ vào b mã hóa. B gi i mã nh n
chu i bit mã hóa này và t o ra tín hi u tho i có d ng là r i r c th i gian và có t c đ b ng v i t c
đ c a tín hi u ban đ u truy n vào h th ng.

Hình 1.18 S đ kh i đ n gi n hóa c a b mã hóa âm tho i

17
CuuDuongThanCong.com

/>

1.2.1.6 Ki n trúc t ng quát c a b mã hóa – gi i mã âm tho i [9]

Hình 1.19 Mô t s đ kh i t ng quát c a b mã hóa và gi i mã âm tho i.
i v i b mã hóa, tín hi u âm tho i đ u vào đ c x lý và phân tích nh m thu đ c các
thơng s đ i di n cho m t khung truy n. Các thơng s ngày đ c mã hóa và l ng t v i mã ch
s nh phân và đ c g i đi nh là m t chu i bit đã đ c nén. Các ch s này đ c đóng gói và
bi u di n thành chu i bit, chúng đ c s p x p th t truy n d a vào các thông s đã quy t đ nh
tr c và đ c truy n đ n b gi i mã.

Hình 1.20 Mơ hình chung c a b mã hóa âm tho i. Hình trên: b mã hóa, hình d
gi i mã.

i: b

B gi i mã th c hi n vi c phân tích chu i bit nh n đ c, các ch s nh phân đ c ph c
h i sau q trình phân tích và dùng đ k t h p v i các thông s t ng ng c a b gi i mã đ có

18

CuuDuongThanCong.com

/>

đ c các thông s đã đ c l ng t . Các thông s gi i mã này s k t h p v i nhau và đ
đ t o l i tín hi u âm tho i t ng h p.

c x lý

1.2.1.7 Các yêu c u c n có c a m t b mã hóa âm tho i [10]
M c tiêu chính c a c a mã hóa thoi là t i đa hóa ch t l ng nghe t i m t t c đ bit nào
đó, ho c t i thi u hóa t c đ bit ng v i m t ch t l ng đ c thù. T c đ bit t ng ng v i âm
tho i nào s đ c truy n ho c l u tr ph thu c vào chi phí c a vi c truy n hay l u tr , chi phí
c a mã hóa tín hi u tho i s , và các yêu c u v ch t l ng c a âm tho i đó. Trong h u h t các b
mã hóa âm tho i, tín hi u đ c xây d ng l i s khác v i tín hi u nguyên th y. T c đ bit truy n b
gi m b i vi c bi u di n tín hi u âm tho i (ho c các thông s trong mơ hình t o âm tho i) v i đ
chính xác b gi m, và b i q trình lo i b các thông tin d th a c a tín hi u. Các yêu c u lý
t ng c a m t b mã hóa tho i bao g m:
T c đ bit th p: đ i v i chu i bit mã hóa có t c bit t l thu n v i b ng thông c n cho
truy n d li u. i u này d n đ n n u t c đ bit th p s làm t ng hi u su t c a h th ng.
Yêu c u này l i xung đ t v i các các đ c tính t t khác c a h th ng, nh là ch t l ng c a
âm tho i. Trong th c t , vi c đánh đ i gi a các l a ch n ph thu c vào áp d ng vào ng
d ng gì.
Ch t l ng tho i cao: tín hi u âm tho i đã gi i mã ph i có ch t l ng có th ch p nh n
đ c đ i v i ng d ng c n đ t. Có r t nhi u khía c nh v m t ch t l ng bao g m tính d
hi u, t nhiên, d nghe và c ng nh có th nh n d ng ng i nói.
Nh n d ng ti ng nói / ngôn ng khác nhau: k thu t nh n d ng ti ng nói có th phân bi t
đ c gi ng nói c a ng i l n nam gi i, ng i l n n gi i và tr con c ng nh nh n d ng
đ c ngơn ng nói c a ng i nói.
C ng đ m nh trong kênh truy n nhi u: đây là y u t quan tr ng đ i v i các h th ng

truy n thông s v i các nhi u nh h ng m nh đ n ch t l ng c a tính hi u tho i.
Hi u su t cao đ i v i các tín hi u phi tho i (ví d nh tín hi u tone đi n tho i): trong h
th ng truy n d n kinh đi n, các tín hi u khác có th t n t i song song v i tín hi u âm
tho i. Các tín hi u tone nh là đa t n tone đôi – Dual tone multifrequency(DTMF) c a tín
hi u âm bàn phím và nh c thông th ng b chèn vào trong đ ng truy n tín hi u. Ngay c
nh ng b mã hóa tho i t c đ th p c ng có th khơng th t o l i tín hi u m t cách hồn
ch nh.
Kích th c b nh th p và đ ph c t p tính tốn th p: nh m m c đích s d ng đ c b
mã hóa âm tho i trong th c t , chi phí th c hi n liên quan đ n vi c tri n khai h th ng
ph i th p, bao g m c vi c b nh càn thi t đ h tr khi h th ng ho t đ ng c ng nh các
u c u tính tốn. Các nhà nghiên c u mã hóa âm tho i đã n l c trong vi c tìm ki m hi n
th c bài tốn tri n khai trong th c ti n sao cho có hi u qu nh t.
tr mã hóa th p: trong q trình x lý mã hóa và gi i mã tho i, đ tr tín hi u ln
ln t n t i, chính là th i gian tr t gi a âm tho i ngõ vào c a b mã hóa v i tín hi u ngõ
ra c a b gi i mã. Vi c tr quá m c s sinh ra nhi u v n đ trong vi c th c hi n trao đ i
ti ng nói hai chi u trong th i gian th c.

1.2.2

Các mô hình dùng trong x lý âm thanh [11]

1.2.2.1 Mơ hình quang ph
1.2.2.1.1 Mơ hình sin

19
CuuDuongThanCong.com

/>

Tín hi u âm thanh có th đ


c tri n khai t t p h p các mơ hình sin n u nh có có d ng
I

y (t ) = ∑ Ai (t )e jφ ( t )

(1.20)

i

i =1

t

V i φi (t ) = ∫ ω i (τ ) dτ , Ai (t ) và ω i (t ) là thành ph n biên đ và t n s t

ng ng c a

−∞

thành ph n sin th i . Trong th c t , tín hi u đ
v y ta có th vi t l i

c xem xét là tín hi u r i r c th i gian th c, nh

I

y (n) = ∑ Ai (n) cos(φi (n ))

(1.21)


i =1

nT

V i φi ( n) = ∫ ω i (τ ) dτ + φ 0,i .

(1.22)

0

V c b n, n u nh I có giá tr vơ cùng l n, thì b t c tín hi u âm thanh nào c ng có th
đ c tri n khai t mơ hình sin, phép tính g n đúng đ c áp d ng tính tốn trong mơ hình này.
Th c t , tính hi u nhi u c ng đ c tri n khai thành vơ s các tín hi u sin, và ta tách vi c x lý
riêng tín hi u này thành ph n x lý Stochastic ( Λ ) đ c ký hi u là e(n) .
I

y (n) = ∑ Ai (n) cos(φi (n )) + e(n)
i =0

(1.23)

Λ
Γ

Thành ph n Λ có th đ c tính b ng phép bi n đ i Short-Time Fourier s d ng l u đ
hình 1. Ph ng pháp này đ c ng d ng trong các ph n m m sms, vi t t t c a t ng h p mơ hình
ph - spectral modeling synthesis.

Hình 1.21 Phân tích các thành ph n hình sin c a ph n stochastic


20
CuuDuongThanCong.com

/>

Phát hi n đ nh và ghép (Peak detection and continuation): đ th c hi n vi c phân tích
các thành ph n hình sin t tín hi u th ng d , ta ph i tìm đ c và ghi chú l i các đ nh t n s n i
tr i, t c là các thành ph n hình sin n m vai trị chính trong cơng th c phân tích đ c. M t chi n
thu t đ c s d ng đ th c hi n đi u này là v “b ng ch d n” trong các khung STFT.
th c hi n vi c phân chia ph n nào là tín hi u, ph n nào là nhi u, các t n s và pha ph i
đ c xác đ nh m t cách chính xác. Ngồi ra, đ q trình t ng h p l i hai tín hi u đó đ c đ n
gi n, biên đ c a các thành ph n nên đ c n i suy gi a các khung tín hi u, và phép n i suy tuy n
tính th ng đ c s d ng. Các t n s c ng nh pha c a tín hi u c ng có th đ c n i suy, tuy
nhiên c n ph i l u ý là phép n i suy t n s có nh h ng ch t ch đ n phép n i suy pha.
T ng h p l i các thành ph n sin: Trong giai đo n t ng h p l i, các thành ph n sin có th
đ c t o b i b t k ph ng pháp nào nh máy t o dao đ ng s , máy t o dao đ ng b ng sóng ho c
t ng h p l y m u b ng sóng, ho c k thu t d a trên c s FFT. K thu t FFT đ c s d ng nhi u
do tính ti n l i khi tín hi u có nhi u thành ph n hình sin.
Trích tín hi u th ng d (Extraction of the residual): Vi c trích ph c a tín hi u nhi u
th ng d có th đ c th c hi n mi n t n (đ c mơ t trong hình 1) ho c tr c ti p t mi n th i
gian.
S hi u ch nh ph th ng d (Residual spectral fitting): thành ph n stochastic đ c mơ
hình hóa là tín hi u nhi u b ng r ng, đ c l c b i kh i đ c tr ng tuy n tính. Ph c ng đ c a tín
hi u th ng d có th đ c x p x b ng giá tr trung bình c a hàm piecewise-linear. Vi c t ng h p
trong mi n th i gian có th đ c th c hi n b ng phép đ o FFT, sau khi đã n đ nh đ c m t t p
c ng đ mong mu n và m t t p pha ng u nhiên.
Hi u ch nh âm thanh: mơ hình sin là m t mơ hình h u d ng vì nó cho phép áp d ng vi c
truy n các âm thanh nh c l y t vi c ghi b ng th c t . Hình 1.22 mơ t m t các b c th c h ên
cho vi c hi u ch nh tín hi u âm nh c


Hình 1.22 C c u t ch c cho vi c bi u di n vi c truy n tín hi u âm nh c

1.2.2.1.2 Tín hi u sin + nhi u + n t đ m
Trong mơ hình sin + nhi u, đi u c b n là các tín hi u âm thanh là t ng h p c a nhi u tín
hi u sin t n s th p và các lo i nhi u b ng r ng h u nh
d ng t nh. Khi đó, m t thành ph n c a
âm thanh khơng đ c xem xét đ n, đó là n t đ m. Vi c hi u ch nh âm thanh có th đ c th c

21
CuuDuongThanCong.com

/>

hi n d dàng b ng cách tách riêng thành ph n n t đ m đ xét riêng. Th c t , h u h t các d ng c
âm nh c m r ng tr ng đ c a m t n t nh c không làm nh h ng đ n ch t l ng x lý.
V i lý do này, m t mơ hình m i là sin + nhi u + n t đ m đ c phát h a dùng trong vi c
phân tích âm thanh. Ý t ng chính c a vi c trích âm đ m trong th c t t vi c quan sát r ng, các
tín hi u hình sin trong mi n th i gian đ c ánh x qua mi n t n thành các đ nh có v trí xác đ nh,
trong khi đó các xung ng n đ i ng u trong mi n th i gian khi đ c ánh x qua mi n t n l i có
d ng hình sin. Nh v y, mơ hình sin có th đ c ng d ng trong mi n t n s bi u di n các tín
hi u hình sin. S đ c a vi c phân tích SNT đ c mơ t trong Hình 1.23.

Hình 1.23 Phân tích tín hi u âm thanh theo mơ hình sin + nhi u + n t đ m
Kh i DCT trong Hình 1.23 mơ t ho t đ ng c a phép r i r c cosin.
Phép bi n đ i, đ

c đ nh ngh a nh sau:
N −1
⎛ (2n + 1)kπ ⎞

C (k ) = α ∑ x(n) cos⎜

2N
n =0



Phép bi n đ i DCT th c hi n vi c m t xung đ

c bi n đ i thành d ng cosin và ng

(1.24)
c l i.

1.2.2.1.3 Mơ hình LPC
Mã hóa d đốn tuy n tính có th đ c s d ng đ mơ hình ph t nh. T ng h p LPC đ c
mô t trong l u đ trong Hình 1.24. V b n ch t, mơ hình chính là gi i thu t tr t ng h p th c
hi n m t tính hi u có ph “đ c” đ c l c b i m t b l c c c. Tín hi u kích thích có th s d ng
chính tín hi u th ng d e có đ c qua q trình phân tích, ho c có th d d ng các thơng tin c a
tín hi u tho i/phi tho i.

Hình 1.24 T ng h p LPC

1.2.2.2 Mơ hình mi n th i gian
Vi c mơ t âm thanh trong mi n t n r t có hi u qu , tuy nhiên trong m t vài ng d ng, đ
ti n vi c nghiên c u vi c t ng h p âm thanh, vi c phân tích trong mi n th i gian l i có u th h n.

22
CuuDuongThanCong.com


/>

1.2.2.2.1 Máy t o dao đ ng s
Ta nh n th y m t âm thanh ph c t p đu c t ng h p t nhi u thành ph n hình sin b ng
phép t ng h p FTT-1. N u nh các thành ph n hình sin không quá nhi u, vi c t ng h p t ng thành
ph n đ c th c hi n b ng cách l y giá tr trung bình c a máy t o dao đ ng s .

e jω ( n+1) = e jω e jω n
0

V i e

jω0 n

0

(1.25)

0

= xR (n) + jxI (n) d ng s ph c, m i b c nh y th i gian đ c đ nh ngh a

nh sau:

xR (n + 1) = cos ω0 xR ( n) − sin ω0 xI (n)

(1.26)

xI (n + 1) = sin ω0 xR ( n) + cos ω0 xI (n)


(1.27)

Thông s biên đ và pha ban đ u có th tính d a theo pha ban đ u e
l ch pha vào s m . Tín hi u xR ( n + 1) có th đ

j ω0 0

và th c hi n vi c

c tính theo công th c sau

xR (n + 1) = 2 cos ω0 xR (n) − xR (n − 1)

(1.28)

áp ng xung c a b l c nh sau

H R ( z) =

1
1 − 2 cos ω0 z + z
−1

−2

=

(1 − e

Giá tr c c c a b l c bi u th c 10 n m trên chu vi đ


1
− jω0 z −1

)(1 − e )
jω0 z −1

(1.29)

ng tròn đ n v .

G i xR1 , xR 2 là hai bi n tr ng thái c a hai m u tr oc đó c a tín hi u ngõ ra xR , pha ban
đ u φ0 có th đ

c tính theo h ph

ng trình sau

xR1 = sin (φ0 − ω0 )

(1.30)

xR 2 = sin (φ0 − 2ω0 )

(1.31)

Máy t o dao đ ng s đ c bi t h u ích trong vi c bi u di n t ng h p tín hi u đ i v i các b
vi x lý đa m c đích, khi các phép toán trên d u ch m đ ng đ c tri n khai. Tuy nhiên, ph ng
pháp này dùng cho vi c t o tín hi u sin có hai b t l i:
Vi c c p nh t thông s u c u tính tốn trên hàm cosin. ây là m t đi u khó đ i v i

đi u ch t c đ âm thanh, do ph i th c hi n phép tính cosin ng v i t ng m u trong
mi n th i gian
Thay đ i t n s c a máy dao đ ng s s làm thay đ i biên đ tín hi u sin. Khi đó b
ph n logic đi u khi n biên đ c n đ c s d ng đ đi u ch nh h n ch này.

1.2.2.2.2 Máy t o dao đ ng b ng sóng
Trong ph ng pháp kinh đi n và linh đ ng nh t v t ng h p các d ng sóng có chu k (bao
g m tín hi u d ng sin) là vi c đ c l p đi l p l i m t b ng ch a n i dung c a m t d ng sóng đã
đ c l u tr tr c. N u d ng sóng đ c t ng h p d ng sin, đ i x ng thì vi c l u tr cho phép
ch c n l u tr ¼ chu k , và vi c tính tốn s h c s đ c n i suy cho c chu k .
t buf [

] là b

đ m có n i dung ch a là chu k c a d ng sóng, ho c b ng d ng sóng.

Máy t o dao đ ng d ng sóng ho t đ ng l p l i theo chu k quét b ng d ng sóng là b i s c a gia
s I và đ c n i dung c a b ng d ng sóng t i v trí đó.

23
CuuDuongThanCong.com

/>

×