Tải bản đầy đủ (.docx) (18 trang)

Công nghệ cơ sở

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (227.4 KB, 18 trang )

Công nghệ cơ sở
1.1 Kỹ thuật nén tín hiệu thoại
1.1.1 Tổng quan
Trong mạng điện thoại thông thường tín hiệu được mã hoá theo luật A hoặc
luật µ với tốc độ 64kbs .Với cách mã hoá này ,cho phép khôi phục một cách tương
đối trung thực các âm thanh trong giải tần tiếng nói .Tuy nhiên trong một số ứng
dụng đặc biệt yêu cầu truyền âm thanh với tốc độ thấp hơn ví dụ như truyền tín hiệu
thoại trên Internet .Từ đó đã xuất hiện một số kỹ thuật mã hoá và nén tín hiệu tiếng
nó xuống tốc độ thấp cụ thể như G.723.1,G.729A,GSM...
Về cơ bản các bộ mã hoá tiếng nói có ba loại :mã hoá dạng sóng (waveform)
,mã hoá nguồn (source)và mã hoá lai (hybrid) (có nghĩa là kết hợp cả hai loại mã hoá
dạng trên ).
Nguyên lý của mã hoá dạng sóng là mã hoá dạng sóng của tiếng nói.Tại phía
phát ,bộ mã hóa sẽ nhận các tín hiệu nói tương tự liên tục và mã thành tín hiệu số
trước khi truyền đi.Tại phía thu sẽ làm nhiệm vụ ngược lại để khôi phục tín hiệu
tiếng nói.Khi không có lỗi truyền dẫn thì dạng sóng của tiếng nói khôi phục sẽ rất
giống với dạng sóng tiếng nói gốc.Cơ sở của bộ mã hoá dạng sóng là :nếu người
nghe nhận được một bản sao dạng sóng của tiếng nói gốc thì chất lượng âm thanh sẽ
rất tuyệt vời.Tuy nhiên , trong thực tế,qúa trình mã hoá lại sinh ra tạp âm lượng tử
(mà thực chất là một dạng méo dạng sóng ),song do tạp âm lượng tử này thường đủ
nhỏ để không ảnh hưởng đến chất lượng tiếng nói thu được.Ưu điểm của bộ mã hoá
loại này là :độ phức tạp,giá thành thiết kế ,độ chễ và công suất tiêu thụ thấp.Người ta
có thể áp dụng chúng để mã các tín hiệu khác như: tín hiệu báo hiệu,số liệu ở giải âm
thanh...và đặc biệt với những thiết bị ở điều kiện nhất định thì chúng còn có khả
năng mã hoá được cả tín hiệu âm nhạc .Bộ mã hoá dạng sóng đơn giản nhất là điều
chế xung mã (PCM).điều chế Delta (DM)...Tuy nhiên , nhược điểm của bộ mã hoá
dạng sóng là không tạo được tiếng nói chất lượng cao tại tốc độ bit dưới 16 kbps ,mà
điều này được khắc phục ở bộ mã hoá nguồn.Nguyên lý bộ mã hoá nguồn là mã hóa
kiểu phát âm(vocoder),ví dụ như bộ mã hoá dự báo tuyến tính (LPC).Các bộ mã hoá
này có thể thực hiện được tại tôc độ bít cõ 2 Kbps .Hạn chế chủ yếu của mã hoá kiểu
phát âm LPC là giả thiết rằng: tín hiệu tiếng nói bao gồm cả âm hữu thanh và vô


thanh.Do đó ,đối với âm hữu thanh thì nguồn kích thích bộ máy phát âm sẽ là một
dãy xung ,còn đối với các âm vô thanh thì nó sẽ là một nguồn nhiễu ngẫu
nhiên.Trong thực tế , có rất nhiều cách để kích thích cơ quan phát âm .Và để đơn
giản hoá,người ta giả thiết rằng chỉ có một điểm kích thích trong toàn bộ giai đoạn
lên giọng của tiếng nói ,dù cho đó là âm hữu thanh hay vô thanh.
Vào năm 1982 .Atal đã đề ra một mô hình mới về kích thích ,được gọi là
kích thích đa xung.Trong mô hình này ,không cần biết trước đó là âm hữu thanh hay
vô thanh ,đó có phải là giai đoạn lên giọng hay không.Sự kích thích được mô hình
hoá bởi một số xung (thông thường là 3 xung trên 5ms ) có biên độ và vị trí được xác
nh bng cc tiu hoỏ sai lch ,cú tớnh n trng s th cm ,gia ting núi gc v
ting núi tng hp.Vic a ra mụ hỡnh ny ó to lờn mt s chỳ ý to ln v ú l
mụ hỡnh u tiờn ca mt th h mi ca cỏc b mó hoỏ ting nú phõn tớch bng tng
hp.Chỳng cú kh nng cho ting núi cht lng cao ti tc bit quanh 10 kbps v
cú th n tn 4,8 kbps.Tớn hiu kớch thớch s c ti u hoỏ mt cỏch k lng v
ngi ta s dng k thut mó hoỏ dng súng mó hoỏ tớn hiu kớch thớch ny mt
cỏch cú hiu qu..Hỡnh 2.1 a ra mụ hỡnh tng quỏt ca mó hoỏ ting núi theo
phng phỏp LPC phõn tớch tng hp.
S* (n)
Tiéng nói tông hợp
b/ Bộ Giải mã
Tiếng nói gốc
Bộ tạo tín hiệu
kích thích
Bộ lọc tổng hợp
Tính trọng
số sai số
Cực tiểu hoá sai
số
Bộ tạo tín hiệu
kích thích

Bộ lọc tổng hợp
u(n)

S*(n)
e(n)
a/ Bộ mã hoá
e w (n)
Hỡnh 2- Mụ hỡnh mó hoỏ ting núi LPC phõn tớch bng tng hp
Trong ú u(n) :tớn hiu kớch thớch
S*(n): :tớn hiu ting núi tng hp
S(n) : Tớn hiu ting núi gc
E
w
(n ) :tớn hiu sai s
Mụ hỡnh bao gm 3 phn chớnh:
Phn th nht : B lc tng hp LPC ,l b lc ton cc bin i theo thi gian
mụ hỡnh hoỏ ng bao ph ngn hn ca dng súng ting núi .u ra ca
n lc tng hp l tớn hiu núi tng hp.
Phn th 2 : B to kớch thớch .B ny s cho ra dóy kớch thớch cp cho b lc
tng hp to ra ting núi tỏi to mỏy thu.Vic kớch thớch s c ti u
hoỏ bng cỏc cc tiu hoỏ sai lch,cỏc tớnh trng s th cm,gia ting núi gc
v ting núi tng hp.
Phn th 3 : Thur tc c s dng trong vic ti thiu hoỏ sai lch (Gm 2
khi :tớnh trng s sai s v cc tiu hoỏ sai s). Tiờu chun cc tiu hoỏ sai
lch c s dng rng rói nht l sai lch bỡnh phng trung bỡnh (mes:mean
squared error).Trong mô hình này ,tiêu chuẩn cực tiểu hoá sai số được sử dụng
là :tín hiệu sai lệch e
w
(n) được đưa qua một bộ lọc đánh giá trọng số sai số ,có
tính trọng số thụ cảm ,và bộ lọc này sẽ tạo dạng phổ tạp âm theo một cách nào

đó để công suất tín hiệu sẽ tập chung nhất tại các tần số formant của phổ tiếng
nói.
Thủ tục mã hoá :bao gồm 2 bước :bước 1 :thông số của bộ lọc tổng hợp được xác
định từ mẫu tiếng nói.Bước 2 :dãy kích thích tối ưu đối với bộ lọc này được xác định
bằng cách cực tiểu hoá sai số,có tính trọng số thụ cảm ,giữa tiếng nói gốc và tiếng
nói tổng hợp.Khoảng thời gian tối ưu hoá kích thích khoảng 4÷7.5 ms, thấp hơn
khung thời gian cập nhật thông số LPC.Khung tiếng nó được chia thành nhiều khung
con ,việc kích thích được xác định riêng rẽ cho từng khung con .Các tham số của bộ
lọc và tín hiệu kích thích sẽ được lượng tử hoá trước khi gửi đến phía thu
Thủ tục giải mã :Cho tín hiệu kích thích đã được giải mã qua bộ lọc tổng hợp để
tiếng nói được khôi phục.
Có rất nhiều phương pháp mô hình hoá sự kích thích:Phương pháp kích thích đa
xung (MPE),phương pháp kích thích xung đều (RPE),phương pháp dự đoán tuyến
tính kích thích mã (CELP).ở đây em chỉ đề cập đến phương pháp dự đoán tuyến tính
kích thích mã CELP. Hiện nay phương pháp này đã trở thành công nghệ chủ yếu cho
mã hoá tiếng nói tốc độ thấp.
1.1.2 Nguyên lý chung của bộ mã hoá CELP
Tín hiệu kích thích là một mục từ của một bảng mã rất lớn được phân bố một cách
ngẫu nhiên .
Sơ đồ nguyên lý của phương pháp tổng hợp CELP được đưa ra trong hình 2.2
S*(n)
Tiếng nói tổng hợp
Bộ lọc tổng
hơp
Trễ khung
con
Bảng mã thích ứng
Khuếch đại
Khuếch đại
Bảng mã ngẫu nhiên

u(n)
Hỡn
h 2- S nguyờn lý ca phng phỏp tng hp CELP
Ti phớa phỏt :Cỏc tham s ca b lc tng hp cựng tng ớch v tr ca
cỏc bng mó (bao gm bng mó thớch ng v bng mó ngu nhiờn )c truyn i
.Ti phớa thu :cng s dng nhng bng thớch ng v ngu nhiờn nh th xỏc nh
tớn hiu kớch thớch ti li vo b lc tng hp LPC to ting núi tng hp.
Bng mó kớch thớch gm L t mó (l cỏc vộc t ngu nhiờn ) cú di N mu (thụng
thng L=1024,N=40 mu ng vi mt khung kớch thớch 5ms) .Bng cỏch tỡm kim
trit ton b bng mó ngu nhiờn ngi ta s chn c tớn hiu kớch thớch ca
mt khung ting núi di N mu.B lc tng hp ó tớnh trng s c cho bi :
)(1/(1)/(/1)(
1

=

==
P
k
kk
k
zazAzw

Trong ú :

l mt phõn s t 0 n 1.
{a
k
} l cỏc tham s b lc tng hp LPC hay cũn gi l h s d oỏn.
P l bc ca b lc tng hpLPC hay bc ca b d oỏn.

Sau khi ó xỏc nh c cỏc tham s ca bng mó thớch ng ( bao gm cú tng ớch
v tr lờn ging) thỡ ting nú tng hp ó tớnh trng s s*(n) c cho l :
)(*)()(*)()(*
0
nsnGynhncns
k
++=


Trong ú :
Tích chập là không nhớ.
c
k
(n) là từ mã kích thích với chỉ số k.
β là hệ số tỷ lệ.
h(n) là phản ứng xung của bộ lọc tổng hợp đã tính trọng số W(z).
s
0
*(n) là phản ứng lối vào của bộ lọc tổng hợp đã tính trọng số.
G là tăng ích của bảng mã thích ứng.
y
α
(n) = c’
α
(n)*h(n) là phản ứng trạng thái không của bộ lọc tổng hợp đã tính trọng số
với từ mã c’
α
(n) được lựa chọn từ bảng mã thích ứng.
Sai số đã tính trọng số giữa tiếng nó tổng hợp và tiếng nói gốc được cho bởi:
)(*)()(

­
nsnsne
−=
Trong đó:
s*(n) : Tín hiệu tiếng nói tổng hợp
s(n) : Tín hiệu tiếng nói gốc.
e
w
(n) : Tín hiệu sai số
Sau đó sai số này sẽ được cực tiểu hoá bằng phương pháp sai lệch bình phương trung
bình (mes):
[ ]


=
=
1
0
2
­
)(
N
n
neE
Độ phức tạp của bộ mã hoá này tăng khi tốc độ bit giảm.Thí dụ CELP có thể cho
tiếng nói tốc độ thấp tới 4.8 kbps với trả giá rất cao về đòi hỏi tính toán do : tín hiệu
kích thích tối ưu được tìm kiếm thông qua bảng mã rất lớn (kích thước bảng mã
thường gồm khoảng 1024 mục từ ) .Đối với bảng mã có 1024 từ mã và một khung
kích thước 40 mẫu thì cần thực hiện khoảng 40.000 phép nhân để soát bảng mã .
Có thể nhận xét rằng : nhược điểm của phương pháp CELP là : có một thủ tục đòi

hỏi tính toán rất lớn rất khó có thể thực hiện trong thời gian thực .Vậy có một
phương pháp đơn giản hoá thủ tục soát bảng mã sao cho không ảnh hưởng tới chất
lượng tiếng nói .Đó là phương pháp sử dụng các bảng mã đại số ACELP (Algebraic
CELP) trong đó các bảng mã được tạo ra nhờ các mã sửa lỗi nhị phân đặc biệt .Và để
nâng cao hiệu quả rà soát bảng mã,người ta sử dụng các bảng mã đại số có cấu liên
kết CS­ACELP (Conjugate­Structure ACELP) .Khuyến nghị ITU G.729 đưa ra
nguyên lý của bộ mã hoá tiếng nói sử dụng phương pháp CS­ACELP mã hoá tiếng
nói tốc độ thấp 8kbps.
1.1.3 Nguyên lý mã hoá CS-ACELP
Tín hiệu PCM 64 kbps đầu vào (theo quy luật A hoặc µ) qua bộ mã hoá thuật toán
CS­ACELP ,được lẫy mẫu tại tần số 8khz ,sau đó qua bộ chuyển đổi thành tín hiệu
PCM đều 16 bit đưa tới đầu vào bộ mã hoá .Tín hiệu đầu ra bộ giải mã sẽ được
chuyển đổi thành tín hiệu PCM (theo quy luật A hoặc µ) theo đúng tín hiệu vào .Các
đặc tính đầu vào / đầu ra khác ,giống tín hiệu PCM 64 kbps (theo khuyến nghị ITU
G.711),sẽ được chuyển đổi thành tín hiệu ra PCM theo đúng quy luật của tín hiệu
đầu vào ở bộ giải mã .
1.1.3.1 Nguyên lý chung cuả bộ mã hoá
Bộ mã hoá CS­ACELP dựa trên cơ sở của bộ mã dự báo tuyến tính kích thích mã
CELP .
Bộ mã hoá CS­ACELP thực hiện trên các khung tiếng nói chu kỳ 10 ms tương
đương với 80 mẫu tại tốc độ lâý mẫu 8000 mẫu /s.Cứ mỗi một khung 10 ms ,tín hiệu
tiếng nó lại được phân tích để trích lấy các tham số của bộ mã CELP (đó là :các hệ
số của bộ lọc dự báo thích ứng ,chỉ số các bảng mã cố định và bảng mã thích ứng
cùng với tăng ích của bảng mã ). Các tham số này sẽ được mã hoá và truyền đi.Sự
phân bố bit của các tham số mã hoá được trình bầy ở bảng 2.1.3.1
Tham số Từ mã
Số bit
trong
khung
con 1

Số bit
trong
khung
con 2
Tổng số
bit trong
1 khung
Các cặp vạch phổ L0,L1,L2,L3 18
Độ trễ mã thích ứng P1,p2 8 5 13
Độ chẵn lẻ trễ trước P0 1 1
Chỉ số mã cố định C1,C2 13 13 26
Dấu mã cố định S1,S2 4 4 8
Các độ khuếch đại mã
(bước1)
GA1,GA2 3 3 6
Các độ khuếch đại mã
(bước2)
GB1,GB2 4 4 8
Tổng cộng 80
bảng 2.1.3.1 Sự phân bố bit của các tham số của thuật toán CS-ACELP tốc độ 8
kbit/s (khung 10 ms)
Tại phía thu :sử dụng các tham số này để khôi phục các tham số tín hiệu kích thích
và các tham số của bộ lọc tổng hợp .Tín hiệu tiếng nói sẽ được khôi phục bằng cách
lọc các tham số tín hiệu kích thích này thông qua bộ lọc tổng hợp ngắn hạn.
Bộ lọc tổng hợp ngắn hạn dựa trên cơ sở bộ lọc dự báo tuyến tính LP bậc 10 .Bộ lọc
tổng hợp dài hạn ,hay bộ lọc tổng hợp độ cao dung cho việc làm tròn mã thích ứng
.Sau khi khôi phục ,nhờ bộ lọc sau tiếng nói sẽ làm tăng độ trung thực.
1.1.3.2 Nguyên lý bộ mã hoá CS-ACELP
Sơ đồ khối bộ mã hoá được mô tả như hình 2.3
Khối tiền

xử lý
Khối tổng hợp LP
sự lượng tử hoá và
nội suy
Bộ lọc
tổng hợp
+
+
Bảng mã
thích ứng
Bảng mã
cố định
Bộ lọc tổng
hợp độ cao
Tìm bảng
mã cố định
Độ cảm
nhận
Sự lượng tử hoá
độ khuếch đại
Sự lượng tử
hoá độ
khuếch đại
luồng bit
phát đi
LPC info
LPC info
tiếng nói
đầu vào
LPC info

Gc
Gp
Hỡnh 2-S khi b mó hoỏ
Tớn hiu u vo a qua b tin x lý ,b ny cú hai chc nng :lc thụng
cao v tớnh toỏn tớn hiu.Tớn hiu u ra b tin x lý l tớn hiu u vo ca cỏc
khi tng
hp tip sau.S tng hp d bỏo tuyn tớnh (LP)c thc hin mt ln trong mt
khung 10ms tớnh cỏc h s ca b lc d bỏo tuyn tớnh (LP).Cỏc h s ny c
bin i thnh cỏc cp vch ph (LSP) v c lng t bng phng phỏp lng t
hoỏ vộc t d bỏo hai bc (VQ) 8 bit.Tớn hiu kớch thớch c la chn bng cỏch
cc tiu hoỏ sai s ,cú tớnh n trng s th cm ,gia ting núi gc v ting núi tng
hp.Cỏc tham s kớch thớch (gm :bng mó c nh v bng mó thớch ng)c xỏc
dnh qua tng khung con 5ms(tng ng 40mu).Cỏc h s ca b lc LP ó c
lng t v cha c lng t c s dng cho phõn khung th 2 ,cũn ti phõn
khung th nht cỏc h s ca b lc LP ó c ni suy s c s dng (trong c
hai trng hp ó lng t v cha lng t). tr bc mch vũng h s c
tớnh toỏn mt ln trong mt khung 10ms da trờn ln tớn hiu thoi .Sau ú cỏc
phộp tớnh ny s lp li trong tng phõn khung tip theo.Tớn hiu ban u x(n) c
tớnh bng cỏc lc d LP thụng qua b lc tng hp W(z)/A(z).Trng thỏi ban u
ca b lc ny L Tớn hiu li gia tớn hiờu d LP v tớn hiu kớch thớch .S phõn
tớch bc ca mch vũng úng s thc hin sau ú ( tỡm tr mó thớch ng v
khuch i )dựng tớn hiu ban u x(n) v c tuyn xung h(n) ,bng cỏch lm trũn
giỏ tr tr bc ca mch vũng h. tr bc c mó hoỏ bng mó 8 bit trong
phõn khung th nht , vi sai ca tr c mó hoỏ bng mó 5 bit trong phõn
khung th 2 .Tớn hiu x(n) l tớn hiu ca 2 tớn hiu :tớn hiu ban u x(n) v tớn
hiu mó thớch ng l tớn hiu mó c nh.Tớn hiu ny c dựng trong vic tỡm tớn

Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×