Tải bản đầy đủ (.ppt) (20 trang)

Nén âm thanh tiếng nói thoại theo chuẩn ITU

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (656.2 KB, 20 trang )

XỬ LÝ DỮ LIỆU ĐA PHƯƠNG TIỆN
NHÓM 16 : NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU

10/4/2016

Giáo viên hướng dẫn

:

Sinh viên thực hiện

:

PGS.TS Nguyễn Thị Hoàng
Lan
Phạm Thành Đạt – 20121503
Đỗ Xuân Cường – 20121358
Doãn Tuấn Vũ - 20122814
Trương Văn Lai – 20101751


PHÂN CÔNG
Thành viên

2

Nội dung

Phạm Thành Đạt

Tìm hiểu một số khái niệm sound và đặc điểm của hai loại tín hiệu audio:


tín hiệu tiếng nói thoại và audio HiFi + Tìm hiểu các chuẩn ITU dùng trong
các ứng dụng VOIP

Doãn Tuấn Vũ

Phân tích một sơ đồ mã hóa tiếng nói thoại theo chuẩn ITU G726

Đỗ Xuân Cường
Trương Văn Lai

Xây dựng thuật toán mã hóa theo sơ đồ phân tích trên, đặt thực nghiệm và
đo lường hiệu năng giải pháp nén này

NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU


Khái niệm âm thanh
 Âm thanh (Sound) là các dao động cơ học của các phần tử, nguyên tử hay các hạt vật chất lan

truyền trong không gian, được cảm nhận trực tiếp qua tai người bởi sự va đập vào màng nhĩ và
kích thích bộ não. Sóng âm tần được đặc trưng bởi biên độ, tần số (bước sóng) và vận tốc lan
truyền. Đối với tai người, âm thanh cảm nhận được bởi sóng có dao động trong dải tần từ 20Hz
đến 20kHz. Tín hiệu âm thanh được chia thành 2 loại dựa trên dải tần:
- Âm thanh dải tần cơ sở (âm thanh tiếng nói thoại, gọi tắt là âm thanh thoại): có dải tần từ
300Hz đến 4kHz.
- Âm thanh dải rộng (tiếng nói trình diễn, hát, âm nhạc…): có dải tần số từ 100Hz đến 20kHz

3

NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU



Đặc điểm của các loại âm thanh
 Một số đặc điểm của âm thanh được chỉ ra:
Âm thanh tiếng nói thoại
- Giới hạn dải phổ tín hiệu 300Hz - 4kHz.
- Tần số lấy mẫu fs = 8kHz tương đương với
chu kỳ Te = 125µs.
- Mỗi mẫu được mã hóa bởi 8bits.
- Tốc độ cần thiết = 8bit x 8kHz = 64Kbit/s

4

NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU

Audio HiFi
- Giới hạn phổ tín hiệu: 20KHz
- Tần số lấy mẫu fs = 44.1 kHz , fs chuyên dụng:
48kHz
- Mỗi mẫu được mã hóa bởi 16bits.
2 kênh stereo
- Tốc độ dữ liệu stereo: 176 Kbyte/s


Các chuẩn ITU dùng trong ứng dụng VOIP
 Sử dụng trên các thiết bị đường dây số
 G.711 ( a-law và u-law hàm lượng tử hóa của PCM ở tốc độ 64kbits/s)
 G.721 (ADPCM ở tốc độ 32 kbits/s)
 G.723 (ADPCM ở tốc độ 40, 24 kbits/s)
 G.726 (ADPCM ở tốc độ 16, 24, 32, 40 kbits/s)

 Sử dụng trên các thiết bị di động
 G.728 (tốc độ 16 Kbps, độ trễ < 2ms, chất lượng giống hoặc tốt hơn G.721)
 G.723.1 (CELP ở tốc độ 5.3 và 6.4 kbits/s)
 G.729 (CELP ở tốc độ 8 kbits/s)
 GMS 06.10 ( ở tốc độ 13 và 6.5 kbits/s)

5

NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU


Đặc điểm các chuẩn mã hóa nén tiếng nói

6

Encoder

PCM

MICDA

RPE-LTP

CELP

CS-ACELP

LPC

Đánh giá hiệu năng

(Standar)

G.711

G.726

ETSI GMS
06 -10

DOD
FS1016

G729

DOD LPC
10 FS 1015

Tốc độ sau nén
(Debit)

64 kbit/s

32 kbit/s

13kbit/s

4.8 kbit/s

8 kbit/s


2.4 kbit/s

Chất lượng
(MOS)

4.2

4.0

3.6

3.5

4.0

2.3

Độ trễ
(Delay)

125µs

300µs

50ms

50ms

30ms


50ms

MISP

0.1

12.0

2.5

16.0

20.0

7.0

NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU


Thuật toán mã hóa ADPCM:

7

NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU


Khối biến đổi PCM đồng dạng

8


NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU


Khối biến đổi PCM đồng dạng

9

NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU


Khối lượng tử thích nghi

10

NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU


Khối lượng tử thích nghi

11

NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU


QUAN

12

NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU



SUBTB
 Đầu vào: DL, Quantizer scale factor –Y.
 Đầu ra: DLN.
 Có chức năng: Scale logarithmic version of difference signal by subtracting scale factor,
 DLN = (DL + 4096 − (Y >> 2)) & 4095.


13

Giá trị sau khi lượng tử của tín hiệu vi phân được truyền đến phía thu. Một bộ lượng tử hóa
thích ứng đảo tạo ra các tín hiệu vi phân lượng tử từ các mẫu bit này. Tín hiệu ước lượng được
cộng vào tín hiệu vi phân lượng tử để phục hồi lại dạng của tín hiệu. Cả hai tín hiệu hồi phục và
tín hiệu vi phân lượng tử được đưa vào bộ tiên đoán tương thích, có tác dụng ước lượng tín hiệu
đầu vào và hoàn thành vòng lặp.

NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU


Khối lượng tử hóa thích ứng đảo

14

NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU


Khối lượng tử hóa thích ứng đảo

15


NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU


Khối lượng tử hóa thích ứng đảo

16

NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU


Cài đặt thử nghiệm và đo lường hiệu năng:
 Demo sử dụng phần mềm Matlab để mô phỏng thuật toán mã hóa ADPCM.
 Tín hiệu đầu vào là file âm thanh sp_encoded.wav
 alpha là hệ số dự đoán của bộ lọc thích ứng.
 deltamin và deltamax là khoảng của bước lượng tử thích ứng.
 nbits là số bit dùng để lượng tử.
 Sau khi chạy chương trình, ta thu được phổ của tín hiệu lượng tử và tín hiệu lỗi với hệ số lỗi

SNR=34.50 dB mã hóa cho 4 bit, với deltamin=16, deltamax=1600, hệ số alpha=0.8.

17

NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU


Giao diện

18

NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU



Tính tỷ số nén
 Thử nghiệm trênMatlab sử dụng bộ CODEC theo chuẩn G. 726(Sử dụng phương





19

pháp mã hóa ADPCM)
Tín hiệu đầu vào là file âm thanh input.wav , file thu được sau nén là file
output.wav.
File để mã hóa tín hiệu : adpcm_encoder.m.
File để giải mã tín hiệu : adpcm_decoder.m
Tính tỉ số nén : tinh_ty_so_nen.m.

NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU


CẢM ƠN CÔ VÀ CÁC BẠN ĐÃ LẮNG NGHE

20

NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU




×