Tải bản đầy đủ (.pdf) (5 trang)

Báo cáo khoa học: "PHÂN TÍCH THỐNG KÊ MÃ HÓA CELP" doc

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (542.58 KB, 5 trang )



ĐT

I. GIỚI THIỆU
Chúng ta xem xét phân tích sự hoạt động của bộ Mã hoá CELP với sơ đồ được giới thiệu
trên hình 1. Tín hiệu kích thích U(h) được hình thành bằng cách cộng tín hiệu tỷ lệ từ sổ mã hoá
thích ứng (AKK) (bổ xung thành phần trên số thời gian dài của tín hiệu tiếng nói) và tín hiệu tỷ
lệ từ sổ mã cố định lớn (CKK). Tín hiệu kích động nhận được điều khiển bộ lọc tổng hợp, nó
mô phỏng hiệu ứng thiết bị tiếng nói. Trong bộ giải mã tín hiệu kích động đi qua bộ lọc tổng
hợp, khi tái tạo tín hiệu tiếng nói (h) ta nhận thấy, đầu tiên các tham số của bộ lọc được xác
định, còn sau đó là các chỉ số của sổ mã  và k. Các hệ số khuếch đại tương ứng G
1
và G
2
, các
tham số của sổ mã được chọn sao cho sai lệch gây ra giữa tín hiệu tiếng nói gốc và tín hiệu tiếng
nói tái tạo được cực tiểu hoá, đạt được việc truyền mỗi tế bào của sổ mã đến bộ lọc tổng hợp với
mục đích xuất hiện lớn nhất các mẫu giống nhất.
Tất nhiên trên thực tế đưa ra 2 sự đơn giản hoá phân tích. Đầu tiên gắn liền với xác định
tham số bộ lọc tổng hợp đặc tính của nó để đơn giản lựa chọn bộ lọc đảo dự đoán tuyến tính
thời gian ngắn, được cực tiểu hoá năng lượng tín hiệu sai lệnh dự đoán. Tham số của bộ lọc tổng
hợp được xác định với tính toán tín hiệu kích động U(h), tất nhiên sau đó chúng được xác định,
các thay đổi nào đó lớn hơn của tín hiệu sẽ không được tính đến, điều đó có nghĩa là, khi xác
định tham số của bộ lọc có thể các thành phần thời gian dài bị ảnh hưởng, khi đó sự mô phỏng
của chúng tốt hơn cả là “dừng lại” đối với sổ mã thích ứng. Sự đơn giản hoá thứ 2 của phân tích
được thực hiện khi xác định các tham số của sổ mã. Nếu thay xác định đồng thời tham số sổ mã
(thích ứng và cố định) để cực tiến hoá sai lệch. Ban đầu xác định trễ và hệ số khuếch đại AKK,
khi đó cho rằng tín hiệu CKK bằng 0, còn sau đó khi có tín hiệu AKK thì xác định tham số
PHÂN TÍCH THỐNG KÊ MÃ HÓA CELP



TS. TRẦN QUỐC THỊNH
Bộ môn Kỹ thuật viễn thông
Khoa Điện – Điện tử
Trường Đại học Giao thông Vận tải


Tóm tắt: Bài báo đề cập đến phương pháp đánh giá các bộ Mã hoá tiếng nói CELP,
cách xử lý các tham số, để tạo ra bộ mã hoá tiếng nói CELP. Vừa bảo đảm hiệu quả kinh tế
vừa bảo đảm chất lượng tiếng nói. Đây là một vấn đề thời sự trong lĩnh vực mã hoá tiếng nói
trong các hệ thống thoại của mạng viễn thông, đang được các nhà nghiên cứu quan tâm.
Summary: This paper presents the methods to analyse CELP encoder and deal with
parameters which produce encoder CELP for ensuring both economic efficiency and quality of
voice. It takes much researchers’ attention in area of voice coding of telecommunication
network now.




ĐT
CKK. Cách giải quyết như vậy làm giảm độ phức tạp của các bộ mã hoá CELP đến mức chấp
nhận được, tất nhiên dẫn đến làm giảm chất lượng tiếng nói tái tạo.
Chúng ta xem xét sự ảnh hưởng của hai phương pháp đơn giản trên đến chất lượng tiếng
nói tái tạo.

Hình 1. Sơ đồ mã hóa CELP
II. TÍNH TOÁN THAM SỐ BỘ LỌC TỔNG HỢP
Như nhận xét ở trên, đặc tính đơn giản của bộ lọc tổng hợp là đảo đối với đặc tính của bộ
lọc dự đoán sai lệch.
A(z) = 1 - 

1
z
-1
- 
2
z
-2
- - 
p
z
-p

Bộ lọc này tối thiểu hoá năng lượng còn lại từ sự dự đoán tín hiệu tiếng nói vào (h). Ở đây
P là bậc của bộ lọc. Rõ ràng điều đó còn xa thực tế xác định tham số bộ lọc tổng hợp: vì vậy khi
tín hiệu kích thích (h) được xác định, các hệ số của bộ lọc tổng hợp có thể được tính toán kỹ
với mục đích làm tăng tỉ số S/N của tiếng nói tái tạo. Chúng ta xem xét đến các phương pháp
khác nhau khi tiến hành tối thiểu hoá.
Một trong các phương pháp tối thiểu hoá, nó có thể được đề nghị khi phân tích bộ mã hoá
với kích thích nhiều xung điện gọi là lặp theo phương pháp bình phương bé nhất. Khi có tín
hiệu kích thích (h) và bộ hệ số bộ lọc α
k
= 1, 2, 3, …, P. Tín hiệu tiếng nói tái tạo có thể được
tính toán với biểu thức



P
1k
k
)kh()h(U)h(



(1)
Tối thiểu hoá E – năng lượng tín hiệu sai lệch
e(h) = (h) -


(h)
Theo chiều dài L đoạn tín hiệu - được thực hiện với sự trợ giúp của biểu thức.
T
ối thiểu hóa
sai lệch



ĐT

   
 
     
2
1L
0h
P
1k
k
2
1L
0h
khλ

ˆ
αhUhλ

ˆ
hλE
 


 












(2)
Rõ ràng E phụ thuộc không chỉ vào hệ số bộ lọc, mà còn phụ thuộc vào tín hiệu tái tạo


(h), nó cũng phụ thuộc vào hệ số của bộ lọc và kết quả không thể nhận được đạo hàm riêng
E/
i
tiến đến “0” và nhận hệ thống P phương trình tuyến tính để xác định bộ hệ số tối ưu.
Với mục đích đơn giản hoá phân tích chúng ta cho phép





khλ
ˆ
k-hλ 
(3)
Khi đó ta nhận được:
     
2
1L
0h
P
1k
k
khλαhUhλE
 

 









(4)

Bây giờ thực hiện đạo hàm E/
i
cho bằng 0. Đối với i = 1, 2,…, P có thể nhận được P
phương trình tuyến tính, khi giải nó chúng ta nhận được các hệ số lặp của bộ lọc. Cùng với điều
đó sự ứng dụng phương pháp này có thể dẫn đến làm kém đi S/N. Nguyên nhân là do ta làm gần
đúng ở phương trình (3). Để làm tốt hơn các S/N thành phần trong tiếng nói tái tạo, cần thiết
trong mỗi đoạn xác định các tham số của bộ lọc, khi sử dụng các hệ số gốc, cũng như hệ số lặp
và đưa ra những tham số từ các hệ số trên, nó bảo đảm S/N max.
Tính toán tham số kích thích
Để làm giảm độ phức tạp của bộ mã hoá, bộ lọc tín hiệu sai lệch (hình 1) thường được đưa
vào để tín hiệu vào (h) và tín hiệu tái tạo


(h) xem xét riêng biệt trước khi tiến hành so sánh
chúng và tính toán sai lệch, đối với bộ lọc tổng hợp với đặc tính H(z) = 1/A(z), ở đây
A(z) = 1 - 
1
z
-1
- 
2
z
-2
- - 
p
z
-p
, và bộ lọc tính toán tín hiệu sai lệch A(z)/A(z/) ở đây  là
hằng số và thực tế bằng 0.9. Sự nối tầng đương nhiên được sử dụng bộ lọc tổng hợp tính toán
1/A(z/). Sai lệch trong trường hợp này

e
w
(h) = 
w
(h) -


w
(h) = 
w
(h) -


0
(h) - G
1
u(h - )v(h) - G
2
e
k
(h)v(h) (5)
ở đây 
w
(h) - tín hiệu vào,


o
(h) - đáp ứng bộ lọc tổng hợp đối với giá trị vào của khoảng
tín hiệu trước, v(h) - đặc tính xung của bộ lọc tổng hợp.
Trong quá trình của trình tự tìm kiếm các giá trị hệ số khuếch đại xuất hiện G

1
và trễ  đối
với AKK, còn chỉ số k và hệ số khuếch đại G
2
đối với CKK, nó được tối thiếu hoá sai lệch bình
phương trung bình E
w
, nhận được trong các khoảng tín hiệu có chiều dài H


ĐT

 











H
0n
αk
2
w
Thλ

H
1
E
(6)
ở đây
T
k
= 2 (G
1
R

+ G
2
R
k
- G
1
G
2
Y
k
) -
k
GG


2
1
2
1

 (7)
là đại lượng, tăng lên trong quá trình tìm kiếm trong sổ mã (có nghĩa giá trị lớn nhất T
k
chỉ
ra được bộ tham số của số mã).






h
ˆ
hhU
0w

- tín hiệu - dấu hiệu tìm kiếm
và 

=
   
 
2
1H
0h
hvhu



 - năng lượng tín hiệu lọc AKK


     
 
hvhuhuR
1H
0h





(8)
là sự tương quan tín hiệu lọc AKK và tín hiệu tìm kiếm U(h).
Tương tự 
k
- là năng lượng tín hiệu lọc CKK, e
k
(h) v(h), còn R
k
- sự tương quan giữa tín
hiệu này và tín hiệu tìm kiếm. Ta có
   
  




1H
0h
kk

)k()h(ehhuR
(9)
là tương quan giữa các tín hiệu lọc của 2 sổ mã.
Ở phương pháp bình thường tìm kiếm tham số sổ mã trong (7) bắt đầu bằng giả thiết
G
2
= 0. Sau đó đối với giá trị số liệu đã cho  có thể xác định hệ số khuếch đại tối ưu G
1
, nếu
đưa đến ‘0’ giá trị đạo hàm riêng T
k
tương ứng G
1
, kết quả chúng ta tìm được giá trị T
k
đối với
mỗi giá trị  và chọn giá trị trước đó nó tương ứng với giá trị lớn nhất T
k
. Các tham số AKK cố
định và trình tự tương tự diễn ra đối với việc xác định tham số CKK R và G
2
.
Có thể đề xuất một vài phương pháp tối ưu như sau:
Phương pháp A:  và k tìm được với sử dụng trình tự tìm kiếm bình thường, còn sau đó
biểu thức được sử dụng để xác định giá trị tối ưu G
1
, G
2

Phương pháp B: Đề xuất G

2
= 0 trễ AKK  được xác định sau đó sử dụng giá trị này, thực
hiện tìm kiếm trong CKK, từ đó giá trị G
1
, G
2
và k được xác định
Phương pháp C: Các hệ số a, k, G
1
và G
2
được tính tương tự như phương pháp B, còn sau
đó đối với k đã biết  được lặp, nói cách khác, đối với khả năng có thể , G
1
, G
2
và T
k
được
xác định và lựa chọn giá trị  như thế, nó tương ứng với giá trị lớn nhất T
k
.

Chúng ta tiến hành so sánh các phương pháp tính toán lại với sự tìm kiếm liên tiếp bình
thường và với sự tìm kiếm mô phỏng đồng thời trong hai số mã. Nếu lấy đạo hàm riêng T
k

tương ứng với G
1
và G

2
cho đến 0, chúng ta nhận được hệ thống 2 phương trình, qua nó tìm
được giá trị tối ưu của hệ số khuếch đại đối với trị số sổ mã đặt ra  và k
2
kk
kkk
1
R
RRR
G





(10)


ĐT


2
kk
kk
2
R
RRR
G






 (11)
Bảng 1. Đặc tính CELP
Phương pháp S/N
Độ phức
tạp
Liên tục tìm kiếm a,7 i
A 10.10 1.02
B 10.3 1.3
C 10.6 1.4
Tìm kiếm đủ 10.8 60
Trình tự tìm kiếm đầy đủ, dự tính 
α
, 
k
, R

, R
k
và R
k
đối với mỗi cặp trị số  và k, để
theo chúng tìm hệ số khuếch đại G
1
và G
2
. Các hệ số khuếch đại này có thể sau đó đưa vào (7)
để tính T

R
max. Tối thiểu hoá nó cần thiết để lựa chọn bộ chỉ số đúng. Khó khăn chính tìm
kiếm đầy đủ nảy sinh khi xác định sự tương quan liên hệ R
R
đối với mỗi cặp chỉ số của sổ mã.
Sử dụng sổ mã cố định. Cho phép đồng thời với 
k
và R
k
, xác định R
k
hiệu quả hơn, khi sử
dụng chỉ số trong 4 khung đặt ra.
Theo bảng 1 trình bày đặc tính CELP đối với tốc độ 48kb/s các quan hệ S/N và độ phức tạp
kéo theo đối với các phương pháp tìm kiếm khác nhau.
Có thể nhìn thấy, tìm kiếm đầy đủ đưa ra trội hơn theo chỉ số S/N khoảng 1dB so với tìm
kiếm liên tiếp, nhưng độ phức tạp của nó cao hơn gấp 60 lần. Phương pháp C làm tăng độ phức
tạp của bộ mã hóa cỡ 40%, còn tỷ số S/N như của bộ mã hoá với tìm kiếm đầy đủ.
Cuối cùng phương pháp A làm tăng tính phức tạp của bộ mã hoá lên 2% nhưng sự tăng S/N
chỉ lên chút ít.
III. KẾT LUẬN
Chúng ta có thể đưa ra các phương pháp xác định các tham số và cấu trúc của bộ mã hoá
tiếng nói CELP. Như trên đã phân tích việc lựa chọn các phương pháp có liên quan chặt chẽ đến
chất lượng mã hoá tiếng nói, tái tạo tiếng nói, giá thành sản phẩm, những đánh giá này được dựa
vào các phân tích và suy luận được trình bày ở phần trên của bài báo.
Tài liệu tham khảo
[1]. Bellami Đ. D, “Điện thoại số”, NXB Vô tuyến điện - thông tin liên lạc, 1986.
[2]. Duain. G, “Điện thoại gọi”, NXB Vô tuyến điện - thông tin liên lạc,1988.
[3]. Pintkuk, “Điện thoại IP”, NXB Vô tuyến điện - thông tin liên lạc, 2000.
[4]. Smalko, “Mạng thông tin số”, NXB Vô tuyến điện - thông tin liên lạc, 2001.

[5]. Oliphep, “Công nghệ và trang bị mạng IP mới”, NXB Vô tuyến điện - thông tin liên lạc, 2000.
[6]. Selukhin O. I., “Gia công số và truyền tiếng nói”, NXB Vô tuyến điện - thông tin liên lạc, 2002.
[7]. Lomakin, “IP- Telephone/ mobile system”,1999

×