Tải bản đầy đủ (.ppt) (34 trang)

CÁC CHUẨN NÉN AUDIO PCM- LPC-GSM

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (679.09 KB, 34 trang )

ĐỀ TÀI : CÁC CHUẨN
NÉN AUDIO
PCM- LPC-GSM
PCM- LPC-GSM
GIẢNG VIÊN HD: TRẦN BÍCH THẢO
NHÓM : 17 – TIN 3A1
NỘI DUNG
1.Tổng quan nén Audio
2.Phương pháp nén PCM
3.Phương pháp nén LPC
4.Phương pháp nén GSM
5.Kết luận
1. Đặc điểm của âm thanh số:
a, Số hóa tiếng nói thoại:
+ Giới hạn giải phổ: ≈4 KHz
+ Tần số lấy mẫu f
s
= 8 KHz, T
e

=125µs
+ Lượng tử hóa giá trị: mã hóa bằng
8 bits
+ Tốc độ cần thiết: 8000 x 8 =
64000 bits/s (64Kb/s)
+ Các chuản nén GSM: 15.2 Kbit/s,
ADPCM: 32Kbit/s
b, Audio Hi-Fi (CD):
+ Giới hạn giải phổ: ≈4 KHz
Các phương pháp cơ bản mã hóa tiếng nói



1, Pulse Code Modulation - PCM = G.711
: Là
phương pháp mã hóa cơ bản, mã hóa trực tiếp tín
hiệu lấy mẫu tiếng nói, âm thanh với các luật lượng tử
hóa µ-law và a-law.
+ a-law: lấy một mẫu âm thanh 13 bit có dấu (sign)
và biến đổi thành một giá trị 8 bit
Mã đầu vào tuyến tính Mã đã được nén
s0000000wxyza s000wxyz
s0000001wxyza s001wxyz
s000001wxyzab s010wxyz
s00001wxyzabc s011wxyz
s0001wxyzabcd s100wxyz
s001wxyzabcde s101wxyz
s01wxyzabcdef S110wxyz
s1wxyzabcdefg s111wxyz
Trong đó
s
là bit dấu (sign bit).
Dấu
….
thể hiện các bit có mức ưu tiên thấp không
được mã hóa.
Ví dụ:
1000'0000'1010'1111 được mã hóa thành 1000'1010
0000'0001'1010'1111 được mã hóa thành
0001'1010
+ µ-law: lấy một mẫu âm thanh 14 bit có dấu (sign)
và biến đổi thành một giá trị 8 bit

Mã đầu vào tuyến tính Mã đã được nén
s00000001wxyza s000wxyz
s0000001wxyzab s001wxyz
s000001wxyzabc s010wxyz
s00001wxyzabcd s011wxyz
s0001wxyzabcde s100wxyz
s001wxyzabcdef s101wxyz
s01wxyzabcdefg s110wxyz
s1wxyzabcdefgh s111wxyz
3, Mã hóa dự đoán tuyến tính- Linear Prediction
Coding- LPC:
LPC là một công cụ được sử dụng hầu hết trong xử lý
tín hiệu âm thanh và xử lý tiếng nói để biểu diễn
đường bao phổ của tín hiệu số của tiếng nói trong
dạng nén sử dụng thông tin của một mô hình dự đoán
tuyến tính.
LPC là một trong các kỹ thuật phân tích tiếng nói
mạnh mẽ và là một công cụ hiệu quả cho việc mã hóa
tiếng nói chất lượng cao với tốc độ bit thấp.
Mô hình LPC dựa trên việc xấp xỉ toán học về giọng
nói của con người. Tại thời điểm
t
mẫu tiếng nói
s(t)

được biểu diễn như là một tổng của
p
mẫu trước đó.
Trong LPC bộ lọc dự báo tuyến tính cho phép giá trị
của mẫu tiếp theo sẽ được xác định bằng sự kết hợp

của các mẫu trước đó.
Trong điều kiện bình thường các mẫu được lấy với tần
số 8000 mẫu, mỗi một mẫu được biểu diễn bằng 8 bit
tốc độ sẽ là 64000bit (64 Kbit). LPC sẽ giảm tốc độ
này xuống còn 24000 bit/s  sẽ dãn đến hiện tượng
mất mát thông tin, tuy nhiên chúng ta vẫn có thể
nghe và hiểu được
4.Mã hóa GSM
Codec này sử dụng chuẩn mã hóa RPE-LPC (Regular
Pulse Excited – Linear Predictive Coder ). Đây là loại
codec mã hóa tiếng nói đầu tiên được sử dụng trong
GSM .Chuẩn mã hóa tiếng nói này dựa trên LPC kích
xung đều với dự đoán dài.Nguyên tắc cơ bản dựa
trên 2 codec : RELP (Residual Excited Linear) và
MPE-LPC(Multi Pulse Excited LPC)
Chuẩn nén GSM 06.10 là chuẩn mã hóa tiếng nói có
mất mát do dựa trên sơ đồ mã hóa Kích thích dự
đoán dài xung đều (RPE-LTP).
*Bộ mã hóa chuẩn nén GSM 06.10
Các khung tín hiệu tiếng nói đầu vào bao gồm 160
mẫu tín hiệu (theo mẫu PCM 13 bit) đầu tiên sẽ
được tiền xử lý tạo đối tượng tín hiệu xử lý cho bộ
lọc làm rõ nét trước. 160 mẫu tín hiệu đạt được sẽ
được phân tích để xác định các tham số cho bộ lọc
phân tích ngắn hạn (LPC analysis).
Các thông số này được sử dụng để lọc chính 160 mẫu
tín hiệu đó .Kết quả ta sẽ có được 160 mẫu tín hiệu
dư ngắn hạn. Các thông số của của bộ lọc,hệ số
phản xả tới hạn sẽ được chuyển đến LAR (log area
ratios) trước khi được truyền đi.Khung tín hiệu sẽ

được phân tách thành 4 khung con với 40 mẫu trong
mỗi khung.Mỗi khung con sẽ được xử lý theo từng
block bởi các thành phần chức năng nối tiếp sau
-
Trước khi xử lý từng khối nhỏ của 40 mẫu tín hiệu
ngắn hạn, các thông số của bộ lọc phân tích dài
hạn : trễ LTP và đạt LTP sẽ được ước lượng và cập
nhật trong bộ phân tích LTP dựa trên cơ sở của
khối hiện tại và dãy 120 mẫu tín hiệu ngắn hạn
trước đó được lưu trữ
- Một block 40 tín hiệu dài hạn sẽ được tạo ra bằng
việc trừ 40 mẫu tín hiệu ngắn hạn cho chính 40 ước
lượng của chúng. Các blocks đạt được sẽ được đưa
vào bộ phân tích kích xung đều để thực hiện quá
trình nén cơ bản của thuật toán.
- Kết quả sau quá trình phân tích RPE, block 40 mẫu
tín hiệu dài hạn được biểu diễn bởi 4 chuỗi con mỗi
chuỗi gồm 13 xung.Sự chọn lọc sau đó được xác
định bởi vị trí RPE lưới. 13 xung RPE sẽ được mã hóa
sử dụng APCM với ước lượng biên độ block con –
thông số cũng sẽ được chuyển đến bộ giải mã.
Thông số RPE cũng được chuyển tới bộ giải mã RPE
cục bộ và module tái tạo để tạo ra 40 mẫu tín hiệu
dài hạn đã được lượng tử hóa.
- Bằng việc cộng 40 mẫu tín hiệu dài hạn đã lượng tử
hóa vào block các ước lượng tín hiệu ngắn hạn trước
đó, ta sẽ có các tín hiệu ngắn hạn được xây dựng
lại.Các tín hiệu này sau đó được đưa vào bộ lọc
phân tích dài hạn để tạo 40 ước lượng tín hiệu ngắn
hạn sẽ được sử dụng cho block con tiếp theo và tiếp

tục vòng lặp
*Bộ giải mãi của chuẩn nén GSM 06.10
2. Chuẩn nén GSM 06.20:
Chuẩn GSM cho phép tách một kênh thoại đơn thành
hai kênh thoại con có thể duy trì các cuộc gọi riêng
biệt.Với cách chia này các tổng đài mạng có thể
nhân đôi số lượng các cuộc gọi có thể được thực
hiện trong mạng với một chi phí đầu tư nhỏ.
a)Công nghệ sử dụng trong chuẩn nén GSM 06.20
Chuẩn codec GSM 06.20 sử dụng code thuật toán
VSELP.Thuật toán VSELP sử dụng công nghệ mã hóa
phân tích-bằng-tổng hợp,nó thuộc lớp công nghệ mã
hóa tiếng nói CELP (Mã hóa dự đoán tuyến tính kích
thích).
Các đặc tính kĩ thuật:
Tần số lấy mẫu:
Bit rate: B = 5.6 kbps
Chất lượng: - thấp hơn một chút so với chuẩn nén GSM
06.10
- không phù hợp cho tín hiệu modem và tín hiệu âm
nhạc
Ứng dụng: - các hệ thống thông tin di động theo
chuẩn GSM (kênh half-rate với B’=11.4 kbps cho mã
hóa kênh thoại)
- phiên bản sửa đổi với B= 6.9 kbps trong các hệ thống di động của Nhật
(JDC) và với B= 7.95 trong hệ thống thông tin di động của Mĩ (digital
AMPS)
Thuật toán: -VSELP (Vector Sum Excited Linear Prediction)
-độ rộng khung T = 20 ms , độ rộng sub-frame = 1/4T= 5 ms
- bộ lọc LPC theo thứ tự với n=10 , lượng tử hóa của các tham số phản xạ

với ba vectow lượng tử 3 chiều, giảm độ phức tạp bằng việc sử dụng tiền-
lượng tử hóa.
- dự đoán dài hạn với sự kết hợp tìm kiếm vòng đóng/vòng mở
- lượng tử hóa vectơ của các yếu tố thu được
- bộ lọc thích nghi đánh giá lỗi
- độ trễ tín hiệu thuật toán : 20ms
- độ phức tạp khoảng 18.5 MOPS (Mega Operations Per Second)
-
dự đoán dài hạn với sự kết hợp tìm kiếm vòng
đóng/vòng mở
- lượng tử hóa vectơ của các yếu tố thu được
- bộ lọc thích nghi đánh giá lỗi
- độ trễ tín hiệu thuật toán : 20ms
- độ phức tạp khoảng 18.5 MOPS (Mega Operations
Per Second)

×