XỬ LÝ DỮ LIỆU ĐA PHƯƠNG TIỆN
NHÓM 16 : NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU
10/4/2016
Giáo viên hướng dẫn
:
Sinh viên thực hiện
:
PGS.TS Nguyễn Thị Hoàng
Lan
Phạm Thành Đạt – 20121503
Đỗ Xuân Cường – 20121358
Doãn Tuấn Vũ - 20122814
Trương Văn Lai – 20101751
PHÂN CÔNG
Thành viên
2
Nội dung
Phạm Thành Đạt
Tìm hiểu một số khái niệm sound và đặc điểm của hai loại tín hiệu audio:
tín hiệu tiếng nói thoại và audio HiFi + Tìm hiểu các chuẩn ITU dùng trong
các ứng dụng VOIP
Doãn Tuấn Vũ
Phân tích một sơ đồ mã hóa tiếng nói thoại theo chuẩn ITU G726
Đỗ Xuân Cường
Trương Văn Lai
Xây dựng thuật toán mã hóa theo sơ đồ phân tích trên, đặt thực nghiệm và
đo lường hiệu năng giải pháp nén này
NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU
Khái niệm âm thanh
Âm thanh (Sound) là các dao động cơ học của các phần tử, nguyên tử hay các hạt vật chất lan
truyền trong không gian, được cảm nhận trực tiếp qua tai người bởi sự va đập vào màng nhĩ và
kích thích bộ não. Sóng âm tần được đặc trưng bởi biên độ, tần số (bước sóng) và vận tốc lan
truyền. Đối với tai người, âm thanh cảm nhận được bởi sóng có dao động trong dải tần từ 20Hz
đến 20kHz. Tín hiệu âm thanh được chia thành 2 loại dựa trên dải tần:
- Âm thanh dải tần cơ sở (âm thanh tiếng nói thoại, gọi tắt là âm thanh thoại): có dải tần từ
300Hz đến 4kHz.
- Âm thanh dải rộng (tiếng nói trình diễn, hát, âm nhạc…): có dải tần số từ 100Hz đến 20kHz
3
NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU
Đặc điểm của các loại âm thanh
Một số đặc điểm của âm thanh được chỉ ra:
Âm thanh tiếng nói thoại
- Giới hạn dải phổ tín hiệu 300Hz - 4kHz.
- Tần số lấy mẫu fs = 8kHz tương đương với
chu kỳ Te = 125µs.
- Mỗi mẫu được mã hóa bởi 8bits.
- Tốc độ cần thiết = 8bit x 8kHz = 64Kbit/s
4
NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU
Audio HiFi
- Giới hạn phổ tín hiệu: 20KHz
- Tần số lấy mẫu fs = 44.1 kHz , fs chuyên dụng:
48kHz
- Mỗi mẫu được mã hóa bởi 16bits.
2 kênh stereo
- Tốc độ dữ liệu stereo: 176 Kbyte/s
Các chuẩn ITU dùng trong ứng dụng VOIP
Sử dụng trên các thiết bị đường dây số
G.711 ( a-law và u-law hàm lượng tử hóa của PCM ở tốc độ 64kbits/s)
G.721 (ADPCM ở tốc độ 32 kbits/s)
G.723 (ADPCM ở tốc độ 40, 24 kbits/s)
G.726 (ADPCM ở tốc độ 16, 24, 32, 40 kbits/s)
Sử dụng trên các thiết bị di động
G.728 (tốc độ 16 Kbps, độ trễ < 2ms, chất lượng giống hoặc tốt hơn G.721)
G.723.1 (CELP ở tốc độ 5.3 và 6.4 kbits/s)
G.729 (CELP ở tốc độ 8 kbits/s)
GMS 06.10 ( ở tốc độ 13 và 6.5 kbits/s)
5
NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU
Đặc điểm các chuẩn mã hóa nén tiếng nói
6
Encoder
PCM
MICDA
RPE-LTP
CELP
CS-ACELP
LPC
Đánh giá hiệu năng
(Standar)
G.711
G.726
ETSI GMS
06 -10
DOD
FS1016
G729
DOD LPC
10 FS 1015
Tốc độ sau nén
(Debit)
64 kbit/s
32 kbit/s
13kbit/s
4.8 kbit/s
8 kbit/s
2.4 kbit/s
Chất lượng
(MOS)
4.2
4.0
3.6
3.5
4.0
2.3
Độ trễ
(Delay)
125µs
300µs
50ms
50ms
30ms
50ms
MISP
0.1
12.0
2.5
16.0
20.0
7.0
NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU
Thuật toán mã hóa ADPCM:
7
NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU
Khối biến đổi PCM đồng dạng
8
NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU
Khối biến đổi PCM đồng dạng
9
NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU
Khối lượng tử thích nghi
10
NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU
Khối lượng tử thích nghi
11
NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU
QUAN
12
NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU
SUBTB
Đầu vào: DL, Quantizer scale factor –Y.
Đầu ra: DLN.
Có chức năng: Scale logarithmic version of difference signal by subtracting scale factor,
DLN = (DL + 4096 − (Y >> 2)) & 4095.
13
Giá trị sau khi lượng tử của tín hiệu vi phân được truyền đến phía thu. Một bộ lượng tử hóa
thích ứng đảo tạo ra các tín hiệu vi phân lượng tử từ các mẫu bit này. Tín hiệu ước lượng được
cộng vào tín hiệu vi phân lượng tử để phục hồi lại dạng của tín hiệu. Cả hai tín hiệu hồi phục và
tín hiệu vi phân lượng tử được đưa vào bộ tiên đoán tương thích, có tác dụng ước lượng tín hiệu
đầu vào và hoàn thành vòng lặp.
NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU
Khối lượng tử hóa thích ứng đảo
14
NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU
Khối lượng tử hóa thích ứng đảo
15
NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU
Khối lượng tử hóa thích ứng đảo
16
NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU
Cài đặt thử nghiệm và đo lường hiệu năng:
Demo sử dụng phần mềm Matlab để mô phỏng thuật toán mã hóa ADPCM.
Tín hiệu đầu vào là file âm thanh sp_encoded.wav
alpha là hệ số dự đoán của bộ lọc thích ứng.
deltamin và deltamax là khoảng của bước lượng tử thích ứng.
nbits là số bit dùng để lượng tử.
Sau khi chạy chương trình, ta thu được phổ của tín hiệu lượng tử và tín hiệu lỗi với hệ số lỗi
SNR=34.50 dB mã hóa cho 4 bit, với deltamin=16, deltamax=1600, hệ số alpha=0.8.
17
NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU
Giao diện
18
NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU
Tính tỷ số nén
Thử nghiệm trênMatlab sử dụng bộ CODEC theo chuẩn G. 726(Sử dụng phương
19
pháp mã hóa ADPCM)
Tín hiệu đầu vào là file âm thanh input.wav , file thu được sau nén là file
output.wav.
File để mã hóa tín hiệu : adpcm_encoder.m.
File để giải mã tín hiệu : adpcm_decoder.m
Tính tỉ số nén : tinh_ty_so_nen.m.
NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU
CẢM ƠN CÔ VÀ CÁC BẠN ĐÃ LẮNG NGHE
20
NÉN ÂM THANH TIẾNG NÓI THOẠI THEO CHUẨN ITU