Tải bản đầy đủ (.pdf) (30 trang)

slike bài giảng xử lý tiếng nói - trịnh văn loan

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.32 MB, 30 trang )

1
1
1
Tr
Tr


nh Văn Loan
nh Văn Loan
B
B


môn K
môn K


thu
thu


t M
t M
á
á
y t
y t
í
í
nh
nh


Khoa CNTT,
Khoa CNTT,
ĐHBK H
ĐHBK H
à
à
N
N


i
i
X
X


LÝ TI
LÝ TI


NG N
NG N
Ó
Ó
I
I
2
2
T
T

à
à
i li
i li


u tham kh
u tham kh


o
o


La parole et son traitement automatique
La parole et son traitement automatique
Calliope, Masson, 1989
Calliope, Masson, 1989


Traitement de la parole
Traitement de la parole
Rene Boite et Murat Kunt, Presse Polytechnique Romandes, 1987
Rene Boite et Murat Kunt, Presse Polytechnique Romandes, 1987


Fundamentals of Speech Signal Processing
Fundamentals of Speech Signal Processing
Saito S., Nakata K. , Academic Press, 1985
Saito S., Nakata K. , Academic Press, 1985



Digital Processing of Speech Signals
Digital Processing of Speech Signals
Lawrence R. Rabiner, Ronald W. Schafer, Prentice
Lawrence R. Rabiner, Ronald W. Schafer, Prentice
-
-
Hall .1978
Hall .1978


Discrete
Discrete
-
-
Time Processing of Speech Signals
Time Processing of Speech Signals
John R. Deller, John G. Proakis, Hansen John H. L. 1999
John R. Deller, John G. Proakis, Hansen John H. L. 1999


Ti
Ti
ế
ế
ng Vi
ng Vi



t hi
t hi


n đ
n đ


i (Ng
i (Ng


âm, ng
âm, ng


ph
ph
á
á
p, phong c
p, phong c
á
á
ch)
ch)
Nguy
Nguy



n H
n H


u Qu
u Qu


nh, H
nh, H
à
à
N
N


i, 1994
i, 1994


D
D


n lu
n lu


n Ngôn ng
n Ngôn ng



h
h


c
c
Nguy
Nguy


n Thi
n Thi


n Gi
n Gi
á
á
p,
p,
Đo
Đo
à
à
n Thi
n Thi



n Thu
n Thu


t , Nguy
t , Nguy


n Minh Thuy
n Minh Thuy
ế
ế
t, H
t, H
à
à
N
N


i, 1994
i, 1994




3
3
N
N



i dung
i dung
1. M
1. M


t s
t s


kh
kh
á
á
i ni
i ni


m cơ b
m cơ b


n
n
2. X
2. X



lý t
lý t
í
í
n hi
n hi


u ti
u ti
ế
ế
ng n
ng n
ó
ó
i
i
3. Mã ho
3. Mã ho
á
á
ti
ti
ế
ế
ng n
ng n
ó
ó

i
i
4. T
4. T


ng h
ng h


p ti
p ti
ế
ế
ng n
ng n
ó
ó
i
i
5. Nh
5. Nh


n d
n d


ng ti
ng ti

ế
ế
ng n
ng n
ó
ó
i
i
4
4


X
X


lý thông tin ch
lý thông tin ch


a trong t
a trong t
í
í
n hi
n hi


u ti
u ti

ế
ế
ng n
ng n
ó
ó
i
i
nh
nh


m truy
m truy


n,
n,
lưu tr
lưu tr


t
t
í
í
n hi
n hi



u n
u n
à
à
y ho
y ho


c t
c t


ng
ng
h
h


p, nh
p, nh


n d
n d


ng ti
ng ti
ế
ế

ng n
ng n
ó
ó
i.
i.


C
C
á
á
c nghiên c
c nghiên c


u đư
u đư


c ti
c ti
ế
ế
n h
n h
à
à
nh đ
nh đ



x
x




ti
ti
ế
ế
ng n
ng n
ó
ó
i yêu c
i yêu c


u nh
u nh


ng hi
ng hi


u bi
u bi

ế
ế
t trên nhi
t trên nhi


u
u
l
l
ĩ
ĩ
nh v
nh v


c ng
c ng
à
à
y c
y c
à
à
ng đa d
ng đa d


ng: t
ng: t



ng
ng


âm v
âm v
à
à
ngôn ng
ngôn ng


h
h


c cho đ
c cho đ
ế
ế
n x
n x


lý t
lý t
í
í

n hi
n hi


u
u
1. M
1. M


t s
t s


kh
kh
á
á
i ni
i ni


m cơ b
m cơ b


n
n
2
5

5
M
M


c đ
c đ
í
í
ch
ch


Mã ho
Mã ho
á
á
m
m


t c
t c
á
á
ch c
ch c
ó
ó
hi

hi


u qu
u qu


t
t
í
í
n hi
n hi


u
u
ti
ti
ế
ế
ng n
ng n
ó
ó
i đ
i đ


truy

truy


n v
n v
à
à
lưu tr
lưu tr


ti
ti
ế
ế
ng n
ng n
ó
ó
i.
i.


T
T


ng h
ng h



p
p
v
v
à
à
nh
nh


n d
n d


ng
ng
ti
ti
ế
ế
ng n
ng n
ó
ó
i ti
i ti
ế
ế
n

n
t
t


i giao ti
i giao ti
ế
ế
p ngư
p ngư


i
i
-
-
m
m
á
á
y b
y b


ng ti
ng ti
ế
ế
ng n

ng n
ó
ó
i.
i.


T
T


t c
t c


c
c
á
á
c
c


ng d
ng d


ng c
ng c



a x
a x


lý ti
lý ti
ế
ế
ng
ng
n
n
ó
ó
i đ
i đ


u c
u c


n ph
n ph


i d
i d



a trên c
a trên c
á
á
c k
c k
ế
ế
t qu
t qu


c
c


a
a
phân t
phân t
í
í
ch
ch
ti
ti
ế
ế
ng n

ng n
ó
ó
i
i
6
6
M
M


t s
t s


kh
kh
á
á
i ni
i ni


m cơ b
m cơ b


n
n



Phân bi
Phân bi


t ti
t ti
ế
ế
ng n
ng n
ó
ó
i v
i v
à
à
âm thanh
âm thanh
Ti
Ti
ế
ế
ng n
ng n
ó
ó
i đư
i đư



c phân bi
c phân bi


t v
t v


i c
i c
á
á
c âm
c âm
thanh kh
thanh kh
á
á
c b
c b


i c
i c
á
á
c đ
c đ



c t
c t
í
í
nh âm h
nh âm h


c c
c c
ó
ó
ngu
ngu


n g
n g


c t
c t


cơ ch
cơ ch
ế
ế
t

t


o ti
o ti
ế
ế
ng n
ng n
ó
ó
i.
i.


C
C
ó
ó
2 lo
2 lo


i ngu
i ngu


n âm
n âm



tu
tu


n ho
n ho
à
à
n (dây thanh rung)
n (dây thanh rung)


t
t


p âm (dây thanh không rung)
p âm (dây thanh không rung)
7
7
B
B


m
m
á
á
y ph

y ph
á
á
t âm
t âm
8
8
B
B


m
m
á
á
y ph
y ph
á
á
t âm
t âm
3
9
9
B
B


m
m

á
á
y ph
y ph
á
á
t âm
t âm
NASAL CAVITY: Khoang mũi
SOFT PALATE: Vòm miệng mềm
EPIGLOTTIS: Nắp thanh quản
VOCAL FOLDS (CORDS): Dây thanh
OESOPHAGUS: Thực quản
TRACHEA: Khí quản
PHARYNX: Họng
10
10
Sơ đ
Sơ đ


kh
kh


i b
i b


m

m
á
á
y ph
y ph
á
á
t âm
t âm
11
11
Thanh môn
Dây thanh
Thanh môn
Thanh môn
12
12
1.
1.
M
M
é
é
t s
t s
è
è
kh
kh
¸

¸
i ni
i ni
Ö
Ö
m c
m c
¬
¬
b
b


n
n
A. Glotte pendant la respiration B. Glotte pour la phonation
1. Glotte 2. Cordes vocales 3. Epiglotte 5. Cartilages aryténoïdes
Thanh môn
Thanh môn




c
c
á
á
c v
c v



tr
tr
í
í
h
h
í
í
t, th
t, th


,ph
,ph
á
á
t âm, n
t âm, n
ó
ó
i th
i th
ì
ì
th
th
à
à
o

o
4
13
13
Dây thanh trong m
Dây thanh trong m


t chu k
t chu k




dao đ
dao đ


ng
ng
14
14
Bi
Bi


u di
u di



n t
n t
í
í
n hi
n hi


u ti
u ti
ế
ế
ng n
ng n
ó
ó
i
i


D
D


ng s
ng s
ó
ó
ng theo th
ng theo th



i gian
i gian
15
15


T
T


n s
n s


l
l


y m
y m


u: 8kHz, F1= 11025 Hz,
u: 8kHz, F1= 11025 Hz,
2F1, 4F1 (16kHz, 10kHz)
2F1, 4F1 (16kHz, 10kHz)



S
S


bit/m
bit/m


u: 8,16
u: 8,16


Mono, Stereo
Mono, Stereo
File WAV
File WAV
16
16
Bi
Bi


u di
u di


n t
n t
í
í

n hi
n hi


u ti
u ti
ế
ế
ng n
ng n
ó
ó
i
i


Ph
Ph


t
t
í
í
n hi
n hi


u ti
u ti

ế
ế
ng n
ng n
ó
ó
i
i
5
17
17
Bi
Bi


u di
u di


n t
n t
í
í
n hi
n hi


u ti
u ti
ế

ế
ng n
ng n
ó
ó
i
i


Spectrogram (Sonagram)
Spectrogram (Sonagram)
18
18
Bi
Bi


u di
u di


n t
n t
í
í
n hi
n hi


u ti

u ti
ế
ế
ng n
ng n
ó
ó
i
i
19
19
Bi
Bi


u di
u di


n t
n t
í
í
n hi
n hi


u ti
u ti
ế

ế
ng n
ng n
ó
ó
i
i
20
20
Bi
Bi


u di
u di


n t
n t
í
í
n hi
n hi


u ti
u ti
ế
ế
ng n

ng n
ó
ó
i
i


Thu b
Thu b


ng micro kh
ng micro kh
á
á
c lo
c lo


i
i
6
21
21
Bi
Bi


u di
u di



n t
n t
í
í
n hi
n hi


u ti
u ti
ế
ế
ng n
ng n
ó
ó
i
i


Hai gi
Hai gi


ng kh
ng kh
á
á

c nhau cho c
c nhau cho c
ù
ù
ng m
ng m


t âm
t âm
22
22
Bi
Bi


u di
u di


n t
n t
í
í
n hi
n hi


u ti
u ti

ế
ế
ng n
ng n
ó
ó
i
i


C
C
ù
ù
ng ngư
ng ngư


i n
i n
ó
ó
i, c
i, c
ù
ù
ng m
ng m



t âm
t âm
23
23
Năng lư
Năng lư


ng, t
ng, t


l
l


bi
bi
ế
ế
n thiên qua gi
n thiên qua gi
á
á
tr
tr


không
không

0 0.5 1 1.5 2 2.5 3 3.5
-0.6
-0.4
-0.2
0
0.2
0.4
amplitude
file:C:\wav\1-6-5-8-10-0.wav, ss,es:1, 43029, window length, shift (samples):160, 40, wtype:1
Signal
0.5 1 1.5 2 2.5 3 3.5
1
2
3
4
short-time energy
En
0.5 1 1.5 2 2.5 3 3.5
5
10
15
short-time magnitude
Mn
0.5 1 1.5 2 2.5 3 3.5
0
20
40
60
80
time in seconds

zero crossing rate
ZC
24
24
T
T


o âm h
o âm h


u thanh
u thanh
Formant v
Formant v
à
à
antiformant
antiformant
7
25
25
T
T


o âm vô thanh
o âm vô thanh
26

26
M
M


t s
t s


đ
đ


c đi
c đi


m ng
m ng


âm
âm
ti
ti
ế
ế
ng Vi
ng Vi



t
t


Đơn âm ti
Đơn âm ti
ế
ế
t
t


C
C
ó
ó
thanh đi
thanh đi


u (6), bi
u (6), bi
ế
ế
n đ
n đ


i thanh đi

i thanh đi


u
u
k
k
è
è
m theo bi
m theo bi
ế
ế
n đ
n đ


i ngh
i ngh
ĩ
ĩ
a
a


Không bi
Không bi
ế
ế
n đ

n đ


i h
i h
ì
ì
nh th
nh th
á
á
i
i
27
27
1
1
i,y
i,y
ý ch
ý ch
í
í
2
2
ê
ê
ê ch
ê ch



3
3
e
e
e d
e d
è
è
4
4
a
a
a ha
a ha
5
5
ă
ă
m
m


t
t
6
6
ơ
ơ
bơ ph

bơ ph


7
7
â
â
ân c
ân c


n
n
8
8
ư
ư
t
t


t
t


9
9
ô
ô
ôtô

ôtô
10
10
o
o
co ro
co ro
11
11
u
u
l
l
ù
ù
m
m
ù
ù
1
1
ia,yê,ya,iê
ia,yê,ya,iê
(
(
đ
đ


c ia, yê)

c ia, yê)
kia k
kia k
ì
ì
a, yêu
a, yêu
ki
ki


u, khuya, tiên
u, khuya, tiên
ti
ti
ế
ế
n
n
2
2
ua,uô
ua,uô
(
(
đ
đ


c ua)

c ua)
tua rua, luôn
tua rua, luôn
3
3
ưa
ưa
,
,
ươ
ươ
(
(
đ
đ


c ưa
c ưa
)
)
lưa thưa
lưa thưa
,
,




t

t
M
M


t s
t s


đ
đ


c đi
c đi


m ng
m ng


âm
âm
ti
ti
ế
ế
ng Vi
ng Vi



t
t


H
H


th
th


ng âm v
ng âm v


: 14 nguyên âm
: 14 nguyên âm
(11
(11
nguyên âm đơn
nguyên âm đơn
, 3
, 3
nguyên âm đôi
nguyên âm đôi
, 22 ph
, 22 ph



âm)
âm)
28
28
1
1
b
b
b
b


ng b
ng b


nh
nh
2
2
p
p


p
p
é
é
p

p
3
3
v
v
v
v


n vơ
n vơ
4
4
ph
ph
phôi pha
phôi pha
5
5
m
m
mơ m
mơ m
à
à
ng
ng
6
6
đ

đ
đ
đ


t đai
t đai
7
7
t
t
tin tư
tin tư


ng
ng
8
8
th
th
thơ th
thơ th


n
n
9
9
d,gi

d,gi
duyên, gi
duyên, gi


10
10
n
n
n
n
ó
ó
ng
ng
11
11
l
l
long lanh
long lanh
12
12
tr
tr
tr
tr


ng

ng
13
13
s
s
sinh viên
sinh viên
14
14
r
r
r
r


ng
ng
15
15
ch
ch
chông
chông
16
16
nh
nh
nh
nh



c
c
17
17
ng,ngh
ng,ngh
ngô nghê
ngô nghê
18
18
c,k,q
c,k,q
con,k
con,k


t,qua
t,qua
19
19
kh
kh
kh
kh
ú
ú
c
c
20

20
g,gh
g,gh
g
g


gh
gh


21
21
h
h
h
h




22
22
x
x
xa xôi
xa xôi
M
M



t s
t s


đ
đ


c đi
c đi


m ng
m ng


âm
âm
ti
ti
ế
ế
ng Vi
ng Vi


t
t



H
H


th
th


ng âm v
ng âm v


: 22 ph
: 22 ph


âm
âm
8
29
29
Đ
Đ


nâng
nâng
H
H

à
à
ng
ng
cao
cao
trung b
trung b
ì
ì
nh
nh
th
th


p
p
trư
trư


c
c
i e
i e
e
e
ơ â
ơ â

o
o
gi
gi


a
a
ư
ư
a ă
a ă
sau
sau
u ô
u ô
M
M


t s
t s


đ
đ


c đi
c đi



m ng
m ng


âm
âm
ti
ti
ế
ế
ng Vi
ng Vi


t
t


Phân lo
Phân lo


i nguyên âm theo đ
i nguyên âm theo đ


nâng
nâng

c
c


a lư
a lư


i v
i v
à
à
chuy
chuy


n đ
n đ


ng c
ng c


a lư
a lư


i
i

30
30
H
H
à
à
ng
ng
Đ
Đ


m
m


h
h
à
à
ng trư
ng trư


c
c
h
h
à
à

ng sau không
ng sau không
tròn môi
tròn môi
h
h
à
à
ng sau
ng sau
tròn môi
tròn môi
h
h


p
p
i
i
ia,yê,ya,iê
ia,yê,ya,iê
ư ưa
ư ưa
ơ â
ơ â
r
r



ng
ng
a ă
a ă
u ua
u ua
hơi h
hơi h


p
p
ê
ê
ô
ô
hơi r
hơi r


ng
ng
e
e
o
o
M
M



t s
t s


đ
đ


c đi
c đi


m ng
m ng


âm
âm
ti
ti
ế
ế
ng Vi
ng Vi


t
t



Phân lo
Phân lo


i nguyên âm theo đ
i nguyên âm theo đ


m
m


c
c


a
a
mi
mi


ng v
ng v
à
à
chuy
chuy



n đ
n đ


ng c
ng c


a lư
a lư


i
i
31
31
th

thanh
p t tr ch c,k,qu
Hữu
thanh
b đ
m n nh ng,ngh
ph x s kh h
vd,gi r g
l
Xát
Bật hơi
Vang mũi

Vô thanh
Hữu thanh
Vang bên
Ồn
Không bật
hơi
Ồn
Cuối lưỡiHọng
Phương thức cấu âm
Vị trí cấu âm Đầu lưỡi
Môi Răng Vòm miệng
Tắc
Mặt lưỡi
M
M


t s
t s


đ
đ


c đi
c đi


m ng

m ng


âm
âm
ti
ti
ế
ế
ng Vi
ng Vi


t
t


Phân lo
Phân lo


i ph
i ph


âm theo t
âm theo t


c hay x

c hay x
á
á
t,
t,
h
h


u thanh hay vô thanh, m
u thanh hay vô thanh, m
ũ
ũ
i h
i h
ó
ó
a
a
32
32
M
M


t s
t s


đ

đ


c đi
c đi


m ng
m ng


âm
âm
ti
ti
ế
ế
ng Vi
ng Vi


t
t


Âm t
Âm t


c: ti

c: ti
ế
ế
ng n
ng n


, ph
, ph
á
á
t sinh do lu
t sinh do lu


ng kh
ng kh
í
í
t
t


ph
ph


i đi ra b
i đi ra b



c
c


n tr
n tr


ho
ho
à
à
n
n
to
to
à
à
n, ph
n, ph


i ph
i ph
á
á
v
v



s
s


c
c


n tr
n tr


đ
đ
ó
ó
đ
đ


tho
tho
á
á
t ra.
t ra.


Âm x

Âm x
á
á
t: ti
t: ti
ế
ế
ng c
ng c


x
x
á
á
t, ph
t, ph
á
á
t sinh do lu
t sinh do lu


ng không kh
ng không kh
í
í
đi ra b
đi ra b



c
c


n tr
n tr


không ho
không ho
à
à
n to
n to
à
à
n (ch
n (ch


b
b


kh
kh
ó
ó
khăn

khăn
), ph
), ph


i l
i l
á
á
ch qua m
ch qua m


t khe h
t khe h


nh
nh


v
v
à
à
trong khi tho
trong khi tho
á
á
t ra như v

t ra như v


y ph
y ph


i c
i c


x
x
á
á
t v
t v
à
à
o th
o th
à
à
nh c
nh c


a b
a b



m
m
á
á
y ph
y ph
á
á
t
t
âm.
âm.


Ph
Ph


âm bên
âm bên
:
:
đ
đ


u lư
u lư



i ti
i ti
ế
ế
p x
p x
ú
ú
c v
c v


i l
i l


i ch
i ch


n l
n l


i tho
i tho
á
á
t c

t c


a không kh
a không kh
í
í
,
,
bu
bu


c n
c n
ó
ó
ph
ph


i l
i l
á
á
ch qua khe h
ch qua khe h





hai bên c
hai bên c


nh lư
nh lư


i ti
i ti
ế
ế
p gi
p gi
á
á
p v
p v


i m
i m
á
á
m
m
à
à
ra ngo

ra ngo
à
à
i t
i t


o nên ti
o nên ti
ế
ế
ng x
ng x
á
á
t nh
t nh


(l).
(l).


Lu
Lu


ng không kh
ng không kh
í

í
tho
tho
á
á
t ra ngo
t ra ngo
à
à
i b
i b


c
c


n tr
n tr


, t
, t


o nên ti
o nên ti
ế
ế
ng x

ng x
á
á
t hay ti
t hay ti
ế
ế
ng
ng
n
n


, d
, d


ng t
ng t
í
í
n hi
n hi


u không tu
u không tu


n ho

n ho
à
à
n g
n g


i l
i l
à
à
ti
ti
ế
ế
ng đ
ng đ


ng (
ng (


n).
n).


Trong khi ph
Trong khi ph
á

á
t âm m
t âm m


t s
t s


ph
ph


âm, dây thanh c
âm, dây thanh c
ũ
ũ
ng ho
ng ho


t đ
t đ


ng đ
ng đ


ng

ng
th
th


i t
i t


o nên ti
o nên ti
ế
ế
ng thanh.
ng thanh.


Ph
Ph


âm c
âm c
ó
ó
t
t


l

l


ti
ti
ế
ế
ng đ
ng đ


ng l
ng l


n hơn g
n hơn g


i l
i l
à
à
ph
ph


âm
âm



n.
n.


Ph
Ph


âm c
âm c
ó
ó
t
t


l
l


ti
ti
ế
ế
ng thanh l
ng thanh l


n hơn g

n hơn g


i l
i l
à
à
ph
ph


âm vang.
âm vang.
9
33
33
phê

vẽ
chè
D
D


ng s
ng s
ó
ó
ng m
ng m



t s
t s


t
t


ti
ti
ế
ế
ng Vi
ng Vi


t
t
34
34
trị
tìm
tám
đánh
D
D



ng s
ng s
ó
ó
ng m
ng m


t s
t s


t
t


ti
ti
ế
ế
ng Vi
ng Vi


t
t
35
35
kệ
lạ

khả
D
D


ng s
ng s
ó
ó
ng m
ng m


t s
t s


t
t


ti
ti
ế
ế
ng Vi
ng Vi


t

t
36
36
0 50 100 150 200 250 300 350 400 450 500
-0.5
-0.4
-0.3
-0.2
-0.1
0
0.1
0.2
0.3
0.4
0.5
CHUR.WAV, Fs = 11025Hz, 5669 samples, Time = 514ms
Amplit ude
Time in ms
D
D


ng s
ng s
ó
ó
ng m
ng m



t s
t s


t
t


ti
ti
ế
ế
ng Vi
ng Vi


t
t
10
37
37
0 50 100 150 200 250 300 350 400 450
-0.4
-0.3
-0.2
-0.1
0
0.1
0.2
0.3

0.4
DDEER.WAV, Fs = 11025Hz, 5278 samples, Time = 479ms
Amplitude
Time in ms
D
D


ng s
ng s
ó
ó
ng m
ng m


t s
t s


t
t


ti
ti
ế
ế
ng Vi
ng Vi



t
t
38
38
0 100 200 300 400 500 600
-0.8
-0.6
-0.4
-0.2
0
0.2
0.4
KHAR.WAV, Fs = 11025Hz, 7718 samples, Time = 700ms
Amplitude
Time in ms
D
D


ng s
ng s
ó
ó
ng m
ng m


t s

t s


t
t


ti
ti
ế
ế
ng Vi
ng Vi


t
t
39
39
0 100 200 300 400 500 600
-0 .3
-0 .2
-0 .1
0
0.1
0.2
0.3
NG HIR.W A V , Fs = 11025H z, 6707 sam ples, Tim e = 608m s
Amplitude
Time in ms

D
D


ng s
ng s
ó
ó
ng m
ng m


t s
t s


t
t


ti
ti
ế
ế
ng Vi
ng Vi


t
t

40
40
0 100 200 300 400 500 600
-0.8
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
XOA.WAV, Fs = 11025Hz, 7690 samples, Time = 697ms
Amplitude
Time in ms
D
D


ng s
ng s
ó
ó
ng m
ng m


t s
t s



t
t


ti
ti
ế
ế
ng Vi
ng Vi


t
t
11
41
41
0 100 200 300 400 500 600
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
PHAIR.W A V, Fs = 11025Hz, 6934 sam ples, Time = 629ms
Amplitude
Time in ms
D
D



ng s
ng s
ó
ó
ng m
ng m


t s
t s


t
t


ti
ti
ế
ế
ng Vi
ng Vi


t
t
42
42

0 50 100 150 200 250 300 350 400
-0.2
-0.15
-0.1
-0.05
0
0.05
0.1
0.15
0.2
MEJ.WAV, Fs = 11025Hz, 4922 samples, Time = 446ms
Amplitude
Time in ms
D
D


ng s
ng s
ó
ó
ng m
ng m


t s
t s


t

t


ti
ti
ế
ế
ng Vi
ng Vi


t
t
43
43
0 100 200 300 400 500 600
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
BUF.WAV, Fs = 11025Hz, 6779 samples, Time = 615ms
Amplitude
Time in ms
D
D



ng s
ng s
ó
ó
ng m
ng m


t s
t s


t
t


ti
ti
ế
ế
ng Vi
ng Vi


t
t
44
44
0 50 100 150 200 250 300 350 400 450
-0.6

-0.5
-0.4
-0.3
-0.2
-0.1
0
0.1
0.2
0.3
0.4
TAMS.WAV, Fs = 11025Hz, 4989 samples, Time = 452ms
Amplitude
Time in ms
D
D


ng s
ng s
ó
ó
ng m
ng m


t s
t s


t

t


ti
ti
ế
ế
ng Vi
ng Vi


t
t
12
45
45
0 100 200 300 400 500 600 700
-0.5
-0.4
-0.3
-0.2
-0.1
0
0.1
0.2
0.3
0.4
GIAF.WAV, Fs = 11025Hz, 8772 samples , Time = 796ms
Amplitude
Time in ms

D
D


ng s
ng s
ó
ó
ng m
ng m


t s
t s


t
t


ti
ti
ế
ế
ng Vi
ng Vi


t
t

46
46
0 100 200 300 400 500 600 700 800
-0.3
-0.2
-0.1
0
0.1
0.2
0.3
VIF.WAV, Fs = 11025Hz, 9872 samples, Time = 895ms
Amplitude
Time in ms
D
D


ng s
ng s
ó
ó
ng m
ng m


t s
t s


t

t


ti
ti
ế
ế
ng Vi
ng Vi


t
t
47
47
0 100 200 300 400 500 600
-0.6
-0.4
-0.2
0
0.2
0.4
KHOONG.WAV, Fs = 11025Hz, 6743 samples, Time = 612ms
Amplitude
Time in ms
D
D


ng s

ng s
ó
ó
ng m
ng m


t s
t s


t
t


ti
ti
ế
ế
ng Vi
ng Vi


t
t
48
48
0 50 100 150 200 250 300 350 400 450 500
-0.4
-0.2

0
0.2
0.4
0.6
NHAAN.WAV, Fs = 11025Hz, 5713 samples, Time = 518ms
Amplit ude
Time in ms
D
D


ng s
ng s
ó
ó
ng m
ng m


t s
t s


t
t


ti
ti
ế

ế
ng Vi
ng Vi


t
t
13
49
49
0 50 100 150 200 250 300 350 400 450
-0.6
-0.4
-0.2
0
0.2
0.4
LAJ.WAV, Fs = 11025Hz, 5442 samples, Time = 494ms
Amplitude
Time in ms
D
D


ng s
ng s
ó
ó
ng m
ng m



t s
t s


t
t


ti
ti
ế
ế
ng Vi
ng Vi


t
t
50
50
0 50 100 150 200 250 300 350
-0.3
-0.2
-0.1
0
0.1
0.2
0.3

0.4
TRIJ.WAV, Fs = 11025Hz, 4108 samples, Time = 373ms
Amplitude
Time in ms
D
D


ng s
ng s
ó
ó
ng m
ng m


t s
t s


t
t


ti
ti
ế
ế
ng Vi
ng Vi



t
t
51
51
0 100 200 300 400 500 600 700 800
-0.5
-0.4
-0.3
-0.2
-0.1
0
0.1
0.2
0.3
0.4
SOOS.WAV, Fs = 11025Hz, 8888 samples, Time = 806ms
Amplitude
Time in ms
D
D


ng s
ng s
ó
ó
ng m
ng m



t s
t s


t
t


ti
ti
ế
ế
ng Vi
ng Vi


t
t
52
52
0 50 100 150 200 250 300 350 400 450 500
-0.4
-0.2
0
0.2
0.4
0.6
TIMF.WAV, Fs = 11025Hz, 5589 samples, Time = 507ms

Amplitude
Time in ms
D
D


ng s
ng s
ó
ó
ng m
ng m


t s
t s


t
t


ti
ti
ế
ế
ng Vi
ng Vi



t
t
14
53
53
Mô h
Mô h
ì
ì
nh t
nh t


o ti
o ti
ế
ế
ng n
ng n
ó
ó
i
i
(Fant
(Fant
-
-
1960)
1960)


=
−−
++
=
K
1k
2
k2
1
k1
)zbzb1(
B
)z(V
)z1(C)z(R
1


=
T
0
Lọc thông
thấp G(z)
Lọc thông
thấp G(z)
Tuyến âm
V(z)
Tuy
Tuy
ế
ế

n âm
n âm
V(z)
V(z)
Tải bức xạ
R(z)
T
T


i b
i b


c x
c x


R(z)
R(z)
u(n)
x(n)
)z1)(z1(
A
)z(G
11 −−
β+α+
=
54
54

)z(A
)z(R)z(V)z(G)z(T
σ
==
p
2K 1
ii
ii0
i1 i0
A(z) 1 a z A(z) a z a 1
+
−−
==
=
+==
∑∑
)n(u)in(xa)n(x
p
1i
i
σ=−+

=
)z(A
)z(T
σ
=
P = 2K+1
Mô h
Mô h

ì
ì
nh to
nh to
à
à
n đi
n đi


m c
m c


c (AR)
c (AR)


A(z): H
A(z): H
à
à
m truy
m truy


n đ
n đ



t c
t c


a b
a b


l
l


c đ
c đ


o
o
55
55
Mô h
Mô h
ì
ì
nh ARMA
nh ARMA
)z(A
)z(C
)z(A)z(A
)z(T

2
2
1
1
σ=
σ
+
σ
=
1zc)z(C
-i
q
0i
i
==

=
0
c
)in(uc)in(xa)n(x
q
0i
i
p
1i
i
−σ=−+
∑∑
==
56

56
1
Tần số
Biên độ
Dải thông
F
k
B
k
12/
D
D


i thông
i thông
15
57
57
2. X
2. X


lý t
lý t
í
í
n hi
n hi



u ti
u ti
ế
ế
ng n
ng n
ó
ó
i
i


Phân t
Phân t
í
í
ch ph
ch ph




B
B


l
l



c hi
c hi


u ch
u ch


nh H(z) = 1
nh H(z) = 1


az
az
-
-
1
1
, a = 0,95 0,98
, a = 0,95 0,98
Bộ lọc
hiệu chỉnh
Cửa sổ
Hamming
FFT Log |.|
58
58
N
x(n)

frame
<= N/2, >0
59
59
X
X


lý đ
lý đ


ng h
ng h
ì
ì
nh (homomorphic)
nh (homomorphic)


s(n)=h(n)*e(n) S(
s(n)=h(n)*e(n) S(
ω
ω
) = H(
) = H(
ω
ω
).E(
).E(

ω
ω
)
)


log[S(
log[S(
ω
ω
)]= log[H(
)]= log[H(
ω
ω
)]+ log[E(
)]+ log[E(
ω
ω
)]
)]
F
F
-
-
1
1
{log[S(
{log[S(
ω
ω

)]} = F
)]} = F
-
-
1
1
{log[H(
{log[H(
ω
ω
)]} + F
)]} + F
-
-
1
1
{log[E(
{log[E(
ω
ω
)]}
)]}
F
F
-
-
1
1
{log[S(
{log[S(

ω
ω
)]} =
)]} =
F
F
-
-
1
1
{log[H(
{log[H(
ω
ω
)]} =
)]} =
F
F
-
-
1
1
{log[H(
{log[H(
ω
ω
)]} =
)]} =
$
s(n)

$
h
(
n
)
$
e
(
n
)
$
$
=+
$
s
(
n
)
h
(
n
)
e
(
n
)
60
60
$
s

(
n
)
Sơ đ
Sơ đ


kh
kh


i x
i x


lý đ
lý đ


ng h
ng h
ì
ì
nh
nh
Bộ lọc
hiệu chỉnh
Cửa sổ
Hamming
FFT Log |.|

FFT
-1
16
61
61
T
0
h
(
n
)
)
c(n)
T
0
V
V
í
í
d
d


62
62


Mô h
Mô h
ì

ì
nh AR
nh AR
Tiên đo
Tiên đo
á
á
n
n
Sai s
Sai s


tiên đo
tiên đo
á
á
n
n
Sai s
Sai s


b
b
ì
ì
nh phương to
nh phương to
à

à
n ph
n ph


n
n
T
T


i thi
i thi


u h
u h
ó
ó
a sai s
a sai s


$$
=
=
−−

p
i

i1
x(n) a x(n i)
$
=−e(n) x(n) x(n)
=

2
n
Ee
(
n
)
$

==

i
E
0, i 1,2, ,p
a
=
+−=σ

p
i
i1
x
(
n
)

ax
(
ni
)
u
(
n
)
Tiên đo
Tiên đo
á
á
n tuy
n tuy
ế
ế
n t
n t
í
í
nh (Linear
nh (Linear
Prediction Coding)
Prediction Coding)
63
63
X
X
á
á

c đ
c đ


nh t
nh t


n s
n s


cơ b
cơ b


n
n


Gi
Gi
á
á
tr
tr


F
F

0
0
ph
ph


thu
thu


c v
c v
à
à
o gi
o gi


i t
i t
í
í
nh v
nh v
à
à
l
l



a tu
a tu


i
i


Gi
Gi


ng nam: 80 250 Hz
ng nam: 80 250 Hz


Gi
Gi


ng n
ng n


: 150 500 Hz
: 150 500 Hz
Xác định
Fo
Đánh giá
kết quả

Tiền
xử lý
Tín hiệu
tiếng nói
64
64
M
M


t s
t s


phương ph
phương ph
á
á
p x
p x
á
á
c đ
c đ


nh Fo
nh Fo



D
D


a v
a v
à
à
o h
o h
à
à
m t
m t


tương quan
tương quan


D
D


a v
a v
à
à
o h
o h

à
à
m vi sai biên đ
m vi sai biên đ


trung b
trung b
ì
ì
nh
nh


D
D
ù
ù
ng b
ng b


l
l


c đ
c đ



o v
o v
à
à
h
h
à
à
m t
m t


tương
tương
quan
quan


X
X


lý đ
lý đ


ng h
ng h
ì
ì

nh
nh
17
65
65
1
0
( ) ( ) ( ) 0,1, ,
−−
=
=+=


Nk
n
R
kxnxnkk K
D
D


a v
a v
à
à
o h
o h
à
à
m t

m t


tương quan
tương quan


T
T
í
í
nh h
nh h
à
à
m t
m t


tương quan
tương quan
R(k)
R(k)
c
c


a t
a t
í

í
n hi
n hi


u ti
u ti
ế
ế
ng n
ng n
ó
ó
i
i
x(n)
x(n)
Fs = 10 kHz, N = 300, K = 150.T
Fs = 10 kHz, N = 300, K = 150.T
ì
ì
m c
m c


c đ
c đ


i trong kho

i trong kho


ng (0, K)
ng (0, K)
66
66
Phương ph
Phương ph
á
á
p t
p t


tương quan c
tương quan c
ó
ó
c
c


i ti
i ti
ế
ế
n
n



H
H


n ch
n ch
ế
ế
, lo
, lo


i b
i b


|
|
x
x
| < C
| < C
L
L
67
67
D
D



a v
a v
à
à
o h
o h
à
à
m vi sai biên đ
m vi sai biên đ


trung
trung
b
b
ì
ì
nh
nh
(Average Magnitude Difference Function)
(Average Magnitude Difference Function)
( ) 0, 0,1, DiP i==
1/ 2
11
2
00
11
() ()

NN
nn
un u n
NN
−−
==







∑∑
2
1/ 2
1
() [( ) ( )]
1
[2 (0) 2 ( )] 0,1, ,
1
⎧⎫
=+−+−
⎨⎬
⎩⎭
⎧⎫
=− =
⎨⎬
⎩⎭
<


1/2
N-1
m=0


Dk xn m xn m k
N
rrk k K
N
λ
λ
λ
víi
1
0
( ) ( ) ( ) 0,1, ,

=
=+−+−=

N
m
Dk xn m xn m k k K
68
68
700 750 800 850 900 950 1000 1050 1100 1150
-0.2
-0.1
0

0.1
0.2
0.3
x(n)
n
0 50 100 150 200 250 300
-0.01
-0.005
0
0.005
0.01
0.015
r(k)
k
0 50 100 150 200 250 300
0
0.05
0.1
0.15
0.2
D(k)
k
700 750 800 850 900 950 1000 1050 1100 1150
-0.2
-0.1
0
0.1
0.2
0.3
x(n)

n
0 50 100 150 200 250 300
-0.01
-0.005
0
0.005
0.01
0.015
r(k)
k
0 50 100 150 200 250 300
0
0.05
0.1
0.15
0.2
D(k)
k
V
V
í
í
d
d


18
69
69
Thông th

Thông th


p
p
Thông thấp 1-z
-1
W(n)
W(n)
LPC(p=4)
LPC(p=4)
A(z) Hàm tự tương quan
Tìm cực đạiNội suyĐánh giá kết quả
Fo
Fo
HT/VT
HT/VT
10kHz
10kHz
4700Hz
4700Hz
900Hz
900Hz
D
D
ù
ù
ng b
ng b



l
l


c đ
c đ


o
o
(Simplified Inverse
(Simplified Inverse
Filter Tracking)
Filter Tracking)
70
70
X
X


lý đ
lý đ


ng h
ng h
ì
ì
nh

nh
71
71
X
X
á
á
c đ
c đ


nh formant
nh formant


Tham s
Tham s


c
c


n x
n x
á
á
c đ
c đ



nh
nh


Formant Fk
Formant Fk


D
D


i thông Bk
i thông Bk


Phương ph
Phương ph
á
á
p
p


X
X


lý đ

lý đ


ng h
ng h
ì
ì
nh
nh


LPC
LPC
72
72
Bộ lọc
hiệu chỉnh
Cửa sổ FFT
Log
10
|.|
FFT
-1
FFT
Wc(n)
X
X


lý đ

lý đ


ng h
ng h
ì
ì
nh
nh
Tín hiệu
tiếng nói
19
73
73
X
X


lý đ
lý đ


ng h
ng h
ì
ì
nh
nh
74
74

F
F
k
k
,
,
B
B
k
k
s(n)
s(n)
Bộ lọc
hiệu chỉnh
Cửa sổ
Tính hệ
số a
i
Tính1/ |A(e

)|
bằng FFT
Tìm
cực đại
Tính nghiệm
củaA(z)
Quyết định
Phương ph
Phương ph
á

á
p LPC
p LPC
75
75
Mã hoá
Mã hoá
Lọc1
Lọc1
AD
AD
Giải mã
Giải mã
DA
DA
Lọc2
Lọc2
Nhiễu, suy giảm,
sai số
Nhiễu, suy giảm,
sai số
3. Mã h
3. Mã h
ó
ó
a ti
a ti
ế
ế
ng n

ng n
ó
ó
i
i


Dãy thao t
Dãy thao t
á
á
c mã ho
c mã ho
á
á
v
v
à
à
gi
gi


i mã
i mã
76
76
0
() lim[ /(2 1)]
x

N
pNN
ξ
ξ
ξ
→∞
∆→
=
+
M
M


t s
t s


t
t
í
í
nh ch
nh ch


t th
t th


ng kê c

ng kê c


a
a
t
t
í
í
n hi
n hi


u ti
u ti
ế
ế
ng n
ng n
ó
ó
i
i


M
M


t đ

t đ


x
x
á
á
c su
c su


t
t
N
N
ξ
ξ
:
:
s
s






ng m
ng m



u x(n)
u x(n)
c
c
ó
ó
biên đ
biên đ


trong
trong
kho
kho


ng [
ng [
ξ
ξ
-
-
∆ξ
∆ξ
/2,
/2,
ξ
ξ
+

+
∆ξ
∆ξ
/2]
/2]
n
n


[
[
-
-
N
N
, ,
, ,
N
N
]
]
x egodic v
x egodic v
à
à
d
d


ng

ng
20
77
77
1
()d lim ()
21
N
xx
N
nN
p
xn
N
µξξξ

→∞
=−
−∞
==
+


22 2
1
()d lim ()
21
N
xx
N

nN
p
xn
N
σξξξ

→∞
=−
−∞
==
+


Gi
Gi
á
á
tr
tr


trung b
trung b
ì
ì
nh v
nh v
à
à
phương sai

phương sai


Gi
Gi
á
á
tr
tr


trung b
trung b
ì
ì
nh c
nh c


a t
a t
í
í
n hi
n hi


u d
u d



ng
ng
v
v


i t
i t
í
í
n hi
n hi


u ti
u ti
ế
ế
ng n
ng n
ó
ó
i
i
µ
µ
x
x
= 0

= 0


Phương sai
Phương sai
78
78




ng t
ng t


t
t


c th
c th


i (không nh
i (không nh


)
)



Lu
Lu


t lư
t lư


ng t
ng t


y
y
= Q
= Q
(x)
(x)
đư
đư


c đ
c đ


nh ngh
nh ngh
ĩ

ĩ
a:
a:


(L+1) m
(L+1) m


c t
c t
í
í
n hi
n hi


u x(0), x(1), , x(L)
u x(0), x(1), , x(L)


L m
L m


c lư
c lư


ng t

ng t


ho
ho
á
á


M
M


i m
i m


c lư
c lư


ng t
ng t


ho
ho
á
á
bi

bi


u di
u di


n b
n b


ng t
ng t


b bit
b bit
L = 2
L = 2
b
b
.
.


Sai s
Sai s







ng t
ng t


(t
(t


p âm lư
p âm lư


ng t
ng t


) e
) e
=
=
Q(x)
Q(x)
-
-
x
x







c lư
c lư


ng t
ng t


: hi
: hi


u 2 m
u 2 m


c t
c t
í
í
n hi
n hi


u k

u k


nhau
nhau
δ
δ
(i)
(i)
= x
= x
(i)
(i)
-
-
x(i
x(i
-
-
1)
1)


Thông lư
Thông lư


ng I = bFs (bit/s). Fs : t
ng I = bFs (bit/s). Fs : t



n s
n s


l
l


y m
y m


u
u
79
79


T
T
í
í
n hi
n hi


u lư
u lư



ng t
ng t


8 bit (256 m
8 bit (256 m


c), Fs = 8
c), Fs = 8
kHz
kHz


Thông lư
Thông lư


ng = 64 kbit/s
ng = 64 kbit/s


T
T
í
í
n hi
n hi



u lư
u lư


ng t
ng t


16 bit (65536 m
16 bit (65536 m


c),
c),
Fs = 16 kHz
Fs = 16 kHz


Thông lư
Thông lư


ng = 256 kbit/s ,
ng = 256 kbit/s ,
1 gi
1 gi


ti

ti
ế
ế
ng n
ng n
ó
ó
i ~
i ~
100 Mbyte
100 Mbyte


C
C


n ph
n ph


i mã ho
i mã ho
á
á
t
t
í
í
n hi

n hi


u ti
u ti
ế
ế
ng n
ng n
ó
ó
i
i
(MPEG,
(MPEG,
GSM, G723, )
GSM, G723, )
đ
đ


truy
truy


n ti
n ti
ế
ế
ng n

ng n
ó
ó
i trên m
i trên m


ng
ng
ho
ho


c lưu tr
c lưu tr


Thông lư
Thông lư


ng
ng
80
80
T
T


n s

n s


l
l


y
y
m
m


u (kHz)
u (kHz)
S
S


bit cho
bit cho
1 m
1 m


u
u
Thông
Thông
lu

lu


ng kbit/s
ng kbit/s
Dung lư
Dung lư


ng /
ng /
ph
ph
ú
ú
t (kbyte)
t (kbyte)
L
L
ĩ
ĩ
nh v
nh v


c
c
48
48
16

16
768
768
11520
11520
Ghi âm chuyên
Ghi âm chuyên
nghi
nghi


p
p
44,1
44,1
16
16
705,6
705,6
10584
10584
CD Audio
CD Audio
32
32
16
16
512
512
7680

7680
Radio FM
Radio FM
22
22
12
12
264
264
3960
3960
Radio AM
Radio AM
8
8
8
8
64
64
960
960
Đi
Đi


n tho
n tho


i

i
Thông lư
Thông lư


ng
ng
21
81
81




ng t
ng t


đ
đ


u
u


T
T



ng qu
ng qu
á
á
t,
t,




c lư
c lư


ng t
ng t


l
l
à
à
h
h
à
à
m c
m c



a biên đ
a biên đ


t
t
í
í
n
n
hi
hi


u x (
u x (




ng t
ng t


không đ
không đ


u)
u)



đơn gi
đơn gi


n nh
n nh


t l
t l
à
à






ng t
ng t


đ
đ


u.
u.



M
M


c lư
c lư


ng t
ng t


đư
đư


c ch
c ch


n gi
n gi


a 2 m
a 2 m



c t
c t
í
í
n hi
n hi


u
u
y(i) = (1/2)[x(i
y(i) = (1/2)[x(i
-
-
1)+x(i)]
1)+x(i)]


Lu
Lu


t lư
t lư


ng t
ng t



đ
đ


u v
u v
à
à
đ
đ


i x
i x


ng đ
ng đ


c trưng b
c trưng b


i:
i:


c
c

á
á
c m
c m


c bão ho
c bão ho
à
à
±
±
xs
xs


m
m


c lư
c lư


ng t
ng t


L ho
L ho



c (L+1) = 2
c (L+1) = 2
b
b
.
.






c lư
c lư


ng t
ng t


δ
δ
= 2x
= 2x
s
s
/L
/L

82
82




ng t
ng t


đ
đ


u
u


L = 9
L = 9
83
83
0 2 4 6 8 10 12 14
-1
-0.8
-0.6
-0.4
-0.2
0
0.2

0.4
0.6
0.8
1
0 2 4 6 8 10 12 14
-1
-0.8
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
0.8
1




ng t
ng t


đ
đ


u
u

84
84
0 2 4 6 8 10 12 14
-1
-0.8
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
0.8
1
0 2 4 6 8 10 12 14
-1
-0.8
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
0.8
1





ng t
ng t


đ
đ


u
u


L = 16
L = 16
22
85
85
0 2 4 6 8 10 12
-1
0
1
0 2 4 6 8 10 12
-1
0
1
0 2 4 6 8 10 12
-1
0
1
0 2 4 6 8 10 12

-0.2
0
0.2
Quantification Error
0 2 4 6 8 10 12
-1
0
1
0 2 4 6 8 10 12
-1
0
1
0 2 4 6 8 10 12
-1
0
1
0 2 4 6 8 10 12
-0.2
0
0.2
Quantification Error




ng t
ng t


đ

đ


u
u
86
86
C
C
á
á
c t
c t
í
í
nh ch
nh ch


t lư
t lư


ng t
ng t


đ
đ



u
u


M
M


t đ
t đ


x
x
á
á
c su
c su


t sai s
t sai s






ng t

ng t




phân b
phân b


đ
đ


u gi
u gi


a
a
-
-
δ
δ
/2 v
/2 v
à
à
+
+
δ

δ
/2
/2


Trung b
Trung b
ì
ì
nh t
nh t


p âm lư
p âm lư


ng t
ng t


=
=
0
0


Phương sai
Phương sai
() ( ), ( 1)/2

ex
i
ppi L
ξδξ
=−
=+=−

l
l
l
/2
22 2
/2
/d /12
e
δ
δ
σξδξδ

==

() ( ), ( 1)/2
ex
i
ppi L
ξδξ
=−
=+=−

l

l
l
() 1/ , /2
0, / 2

e
p
ξ
δξ δ
ξδ
=≤
=>
87
87
2
2
10 lg (d B) 6,02 4, 77 20lg
xs
x
e
x
SN b
σ
σ
σ
⎛⎞
⎛⎞
==+−
⎜⎟ ⎜⎟
⎝⎠

⎝⎠
max
4(dB)67,3NÕu
s
xSNb
σ
=→ =−
C
C
á
á
c t
c t
í
í
nh ch
nh ch


t lư
t lư


ng t
ng t


đ
đ



u
u


T
T


s
s


t
t
í
í
n hi
n hi


u trên nhi
u trên nhi


u
u
V
V



i b
i b


6,
6,
tăng
tăng
6 dB
6 dB
m
m


i khi tăng
i khi tăng
1 b
1 b
it lư
it lư


ng t
ng t


.
.
Đ

Đ


c
c
ó
ó
ch
ch


t lư
t lư


ng th
ng th
í
í
ch h
ch h


p c
p c


n c
n c
ó

ó
b
b


11
11
88
88
T
T


s
s


t
t
í
í
n hi
n hi


u trên nhi
u trên nhi


u

u
ho
ho


c
c
s
n
dB 10
W
SN
W
SN 10log SN
==
=
N¨ng l−îng tÝn hiÖu
N¨ng l−îng nhiÔu
dB 10
SN 20log=
Biªn ®é tÝn hiÖu
Biªn ®é nhiÔu
23
89
89
Năng lư
Năng lư


ng

ng
SN (dB)
SN (dB)
T
T
í
í
n hi
n hi


u = Nhi
u = Nhi


u
u
0
0
T
T
í
í
n hi
n hi


u = 2 Nhi
u = 2 Nhi



u
u
2
2
T
T
í
í
n hi
n hi


u = 10 Nhi
u = 10 Nhi


u
u
10
10
T
T
í
í
n hi
n hi


u = 100 Nhi

u = 100 Nhi


u
u
20
20
T
T
í
í
n hi
n hi


u = 1000 Nhi
u = 1000 Nhi


u
u
30
30
T
T
í
í
n hi
n hi



u = 10
u = 10
N
N
Nhi
Nhi


u
u
N x 10
N x 10
T
T


s
s


t
t
í
í
n hi
n hi


u trên nhi

u trên nhi


u
u
90
90
log[]
log[]
Q[]
Q[]
Mã hóa
Mã hóa
signe[]
signe[]
x(n) c(n)
y(n)
ˆ
y'(n)
exp[]
exp[]
Giảimã
Giảimã
signe[x(n)]
c’(n)
ˆ
x'(n)
ˆ
x'(n)
y(

n
)
)




ng t
ng t


logarit
logarit


Sau khi l
Sau khi l


y logarit biên đ
y logarit biên đ


t
t
í
í
n hi
n hi



u s
u s


mã ho
mã ho
á
á
tuy
tuy
ế
ế
n
n
t
t
í
í
nh
nh
91
91
log(1 )
log(1 )
x
y
µ
µ
+

=
+




ng t
ng t


logarit
logarit


Hai gi
Hai gi


i ph
i ph
á
á
p d
p d
ù
ù
ng cho đi
ng cho đi



n tho
n tho


i
i


Lu
Lu


t
t
µ
µ
(d
(d
ù
ù
ng
ng


M
M


)
)

92
92
1log
1log
A
x
y
A
+
=
+
255 87,56 A
µ
=
=




ng t
ng t


logarit
logarit


Hai gi
Hai gi



i ph
i ph
á
á
p d
p d
ù
ù
ng cho đi
ng cho đi


n tho
n tho


i
i


Lu
Lu


t A(d
t A(d
ù
ù
ng

ng


châu Âu
châu Âu
)
)
8 b
8 b
it logarit ~
it logarit ~
12 bi
12 bi
t lư
t lư


ng t
ng t


đ
đ


u
u
24
93
93

y(n)= x(n) G(n)
y(n)= x(n) G(n)
Q[]
Q[]
Mã hóa
Mã hóa
x(n)
x(n)
c(n)
c(n)
Thích nghi
độ k.đại
Thích nghi
độ k.đại
G(n)
G(n)
δ
δ
G(n)
G(n)
ˆ
y(n)
ˆ
y'(n)
Giải mã
Giải mã
c
c



(n)
(n)
:
:
ˆ
ˆ
y'(n)
x'(n) =
G'(n)
G
G


(n)
(n)




ng t
ng t


th
th
í
í
ch nghi
ch nghi







c lư
c lư


ng t
ng t


tu
tu


thu
thu


c v
c v
à
à
o biên đ
o biên đ


t

t
í
í
n hi
n hi


u
u


Th
Th
í
í
ch nghi trư
ch nghi trư


c
c
94
94
Q[]
Q[]
Mã hóa
Mã hóa
x(n)
x(n)
c(n)

c(n)
y(n)
y(n)
Thích nghi
độ k.đại
Thích nghi
độ k.đại
G(n)
G(n)


Giải mã
Giải mã
c
c


(n)
(n)
:
:
G
G


(n)
(n)
Thích nghi
độ k.đại
Thích nghi

độ k.đại




ng t
ng t


th
th
í
í
ch nghi
ch nghi


Th
Th
í
í
ch nghi sau
ch nghi sau
ˆ
ˆ
y'(n)
x'(n) =
G'(n)
ˆ
y'(n)

ˆ
y(n)
95
95
M
M


t s
t s


chu
chu


n mã ho
n mã ho
á
á
âm thanh/ti
âm thanh/ti
ế
ế
ng n
ng n
ó
ó
i
i



G.721
G.721
: A
: A
DPCM, 32
DPCM, 32
kbps, 4bi
kbps, 4bi
ts, 8
ts, 8
kHz
kHz


G.722
G.722
: ~
: ~
ADPCM, 48
ADPCM, 48
đ
đ
ế
ế
n 64 kbps,
n 64 kbps,



G.723
G.723
: ~
: ~
ADPCM, 24 k
ADPCM, 24 k
bps, 3
bps, 3
bits, 8kH
bits, 8kH
z
z


G.728
G.728
: 1
: 1
6 K
6 K
bps
bps


GSM :
GSM :
đi
đi



n tho
n tho


i di đ
i di đ


ng, 13 kbps
ng, 13 kbps


Linear Predictive Encoding (Xerox), 5 kbps
Linear Predictive Encoding (Xerox), 5 kbps


Code Excited Linear Prediction (CELP)
Code Excited Linear Prediction (CELP)


Digital Video Interactive : ~ADPC
Digital Video Interactive : ~ADPC
M,
M,
4
4
đ
đ
ế
ế

n 8 bits
n 8 bits


VoIP: G723.1 (6.4kbits/s), G728, G729 (8kbits/s)
VoIP: G723.1 (6.4kbits/s), G728, G729 (8kbits/s)
96
96
4. T
4. T


ng h
ng h


p ti
p ti
ế
ế
ng n
ng n
ó
ó
i
i


T
T



o ti
o ti
ế
ế
ng n
ng n
ó
ó
i xu
i xu


t ph
t ph
á
á
t t
t t


bi
bi


u di
u di



n
n
ng
ng


âm c
âm c


a l
a l


i n
i n
ó
ó
i
i


K
K


thu
thu



t t
t t


ng h
ng h


p ti
p ti
ế
ế
ng n
ng n
ó
ó
i:
i:


T
T


ng h
ng h


p tr
p tr



c ti
c ti
ế
ế
p
p


T
T


ng h
ng h


p d
p d


a trên mô h
a trên mô h
ì
ì
nh
nh



B
B


t
t


ng h
ng h


p formant
p formant


B
B


t
t


ng h
ng h


p d
p d

ù
ù
ng LPC
ng LPC


B
B


t
t


ng h
ng h


p mô ph
p mô ph


ng b
ng b


m
m
á
á

y ph
y ph
á
á
t âm
t âm
25
97
97
Phân lo
Phân lo


i
i


Ch
Ch


t lư
t lư


ng b
ng b


t

t


ng h
ng h


p: M
p: M


c đ
c đ


t
t


nhiên
nhiên


M
M


c đ
c đ







Thanh đi
Thanh đi


u
u


Ng
Ng


đi
đi


u
u


S
S







ng t
ng t


v
v


ng:
ng:


H
H


n ch
n ch
ế
ế


Không h
Không h


n ch

n ch
ế
ế


B
B


t
t


ng h
ng h


p ti
p ti
ế
ế
ng n
ng n
ó
ó
i t
i t


văn b

văn b


n (Text
n (Text
-
-
to
to
-
-
Speech)
Speech)
98
98
T
T


ng h
ng h


p tr
p tr


c ti
c ti
ế

ế
p
p


Ghi âm ti
Ghi âm ti
ế
ế
ng n
ng n
ó
ó
i t
i t


nhiên
nhiên
-
-
Đơn v
Đơn v


ghi âm
ghi âm
-
-
Gh

Gh
é
é
p c
p c
á
á
c đơn v
c đơn v


ghi âm: t
ghi âm: t


, câu.
, câu.


Đơn v
Đơn v


ghi âm
ghi âm


âm v
âm v





âm ti
âm ti
ế
ế
t (diphone)
t (diphone)


t
t




t
t


h
h


p t
p t





câu
câu
99
99
T
T


ng h
ng h


p formant
p formant
Tạo tạp âm
T
T


o t
o t


p âm
p âm
Tạo xung
T
T



o xung
o xung
Kênh mũi
Kênh m
Kênh m
ũ
ũ
i
i
F
F
1
1
F
F
2
2
F
F
3
3
B
B
1
1
B
B
2
2

B
B
3
3
F
F
0
0
Khoang mi
Khoang mi


ng
ng
A
2
A
1
A
3
A
4
100
100
T
T


ng h
ng h



p LPC
p LPC
Tạo xung
T
T


o xung
o xung
Bộ lọc số
bậc p
B
B


l
l


c s
c s


b
b


c p

c p
Tạo tạp âm
T
T


o t
o t


p âm
p âm
F
F
0
0
A
a
1
a
2
a
p
Synthesis-by-Analysis

×