Tải bản đầy đủ (.pptx) (38 trang)

MÃ HÓA ÂM THANH CHUẨN WAV

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (503.69 KB, 38 trang )




 !"#$

Vai trò xử lý âmthanh

Điều xung mã PCM

Các chuẩn nén audio

Các khái niệm trong âm thanh

Giải thuật nén âm thanh

Cấu trúc Wave File
%&'()*
+&, /0+123456,7+)778)79)7,-:)*,-(;<),7=)*>+?7@A)*,&B)

Xu hướng phát triển của viễn thông: các nhu cầu về dịch vụ và các hạn chế của công nghệ truyền dẫn, chuyển
mạch liên quan để thấy được vai trò của xử lý âm thanh và hình ảnh;

Các chuẩn nén âm thanh và hình ảnh đang được sử dụng phổ biến trong truyền thông: G711, G729; JPEG;
MPEG; H264…
C/>D/>&E6/0+7B,7F)*,7G)7*&C/
/:))*@H&
Click to edit Master text styles
Second level
Third level
Fourth level
Fifth level


I/96,7J/0+,+&)*@H&>F&KL&
56,7+)7

Khoảng cách dải âm lớn nhất và yếu nhất mà tai con người có thể nghe là 120dB, tức là dải 1 triệu lần biên độ. Người
nghe có thể phát hiện sự thay đổi độ ồn âm thanh khi tín hiệu bị thay đổi khoảng 1dB (biên độ thay đổi 12%)

Nhận biết mức độ ồn liên quan mật thiết với công suất âm thanh theo bậc mũ 1/3.

Nếu tăng công suất âm lên 10 lần, người nghe nhận được rằng độ ồn tăng lên tầm 2 lần (101/3≈2 lần)

Dải nghe của con người thông thường từ 20Hz đến 20kHz, độ nhạy âm lớn nhất từ 1kHz đến 4kHz.

Khả năng xác định hướng nguồn âm tốt nhưng xác định khoảng cách đến nguồn âm kém.
*@M)*)*7N
D,)O,7H&*&+)
D,)O,P)QF


T/h số
010011
T/h tương tự x
a
(t)
Lượng tử
hóa
Mã hóa
Lấy mẫu
T/h rời rạc x(n)
T/h số x
q

(n)
Mã hóa
ADC
8/11/15 9
&R)>S&
Điều xung mã PCM được đặc trưng bởi 3 quá trình :

Lấy mẫu

Lượng tử hóa

Mã hóa
&<(1()*6T
Click to edit Master text styles
Second level
Third level
Fourth level
Fifth level
Lượng tử hóa và mã hóa không đều
7I/7&B)
1. Nén tín hiệu tương tự bằng bộ khuếch đại nén phi tuyến
2. Lượng tử hóa & mã hóa PCM đề
U(V,)W)
3. Luật (Smith 1957)
8/11/15 11
X,7(V,
µ
)1ln(
))t(s1ln(
)t(s

1
2
µ+
µ+
=
Đặc tuyến nén luật A
YZ[
YZ[
YZ[
YZ[[
\]^Z_
\Y
\`
s
1
(t)
s
2
(t)
W)3(V,
8/11/15 12
X,7(V,







≤<

+
+
≤≤
+
=
1)t(s
A
1
,
Aln1
))t(sAln(1
A
1
)t(s0,
Aln1
)t(sA
)t(s
1
1
1
1
2
Đặc tuyến nén xấp xỉ hóa tuyến tính luật A
YZ[YabYacYa]YaY_
Ya]
]
_
^
`
c

d
b
Y
^a]
_a]
`a]
YZ[
ca]
da]
ba]
[
Đặc tuyến xấp xỉ có 13 đoạn: 6 đoạn phần dương, 6 đoạn phần âm và 1 đoạn giữa
8/11/15 13
X,7(V,
Khái niệm : Lấy mẫu là quá trình rời rạc hóa tín hiệu theo thời gian
Ue;6f(
Click to edit Master text styles
Second level
Third level
Fourth level
Fifth level
1. Lượng tử hóa đều: Chia biên độ xung lấy mẫu thành các khoảng đều nhau, mỗi khoảng là một bước lượng tử đều ∆
U@g)*,27h+
Click to edit Master text styles
Second level
Third level
Fourth level
Fifth level
2. Lượng tử hóa không đều : Chia biên
độ xung lấy mẫu thành các khoảng

không đều nhau theo nguyên tắc khi biên
độ xung lấy mẫu càng lớn thì độ dài
bước lượng tử càng lớn.
U@g)*,27h+
1. Chức năng: Chuyển đổi biên
độ xung lượng tử thành một từ
mã 8 bít.
2.Đặc tính bộ mã hóa A=87,6/13
T7h+
&<(1()*6TK&Q+&
Click to edit Master text styles
Second level
Third level
Fourth level
Fifth level
&R?

Mã hóa nguồn: Mục đích là lấy dữ liệu nguồn và thu nhỏ chúng bằng cách loại bỏ những phần dư thừa
không cần thiết còn tồn tại trong nguồn, để lại phần nguồn với số lượng bít ít hơn, nhưng nhiều tin tức.

Mã hóa kênh: Là tìm ra những mã có thể truyền thông nhanh chóng chứa đựng nhiều mã ký hợp lệ và có
thể sửa lỗi hoặc ít nhất phát hiện lỗi (Mã khối tuyến tính: mã chẵn lẻ, mã tuần hoàn, Mã kết hợp…).
Mô hình miền thời gian
Việc mô tả âm thanh trong miền tần số rất có hiệu quả, tuy nhiên trong một vài ứng dụng, để tiện việc nghiên cứu việc
tổng hợp âm thanh, việc phân tích trong miền thời gian lại có ưu thế hơn.

iN+3+('&:: Định dạng của công ty RealNetworks, chủ yếu dùng cho phát nhạc trực tuyến, định dạng đầu tiên ra đời
năm 1995, đến nay đã có RealAudio 10

$: Định dạng âm thanh của Microsoft, ra mắt năm 1999, trên lý thuyết có thể nén 96 kbps với chất lượng của

MP3 128 kbps. WMA cũng phổ biến trong thế giới âm thanh phát trực tuyến.
7(j))W)+('&:

Hiệu ứng che (masking)

Ngưỡng nghe và mức nhạy cảm

Che tần số (Frequency Masking)

Che nhất thời. (che thời gian)
C/k7C&)&B6,-:)*56,7+)7
Hiệu ứng che (masking): là âm lớn át âm bé, âm mạnh át âm yếu:
C/k7C&)&B6,-:)*56,7+)7
7N,P)QFlm-Nn(N)/;+Qk&)*o
Phát ra 1 âm có tần số 1 kHz với mức to cố định là 60dB, gọi là “âm che” (masking tone). Phát ra một âm khác (gọi là test
tone) ở mức tần số khác (ví dụ 1.1kHz), và tăng mức to của âm này cho đến khi có thể nghe được nó (phân biệt được
âm 1.1 kHz và âm che 1kHz).
C/k7C&)&B6,-:)*56,7+)7
Làm thí nghiệm với các “masking tones” có các tần số khác nhau, ta có được hình vẽ:
7N,P)QFlm-Nn(N)/;+Qk&)*o

×