Tải bản đầy đủ (.docx) (29 trang)

Tìm hiểu về kỹ thuật nén audio số

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (218.03 KB, 29 trang )

Tìm hiểu về kỹ thuật nén Audio số

GVHD: Dương Tuấn Quang

MỤC LỤC

SVTH: Lê Minh Toản

1


Tìm hiểu về kỹ thuật nén Audio số
Từ viết tắt
PCM
CD
DBS
AES
EBU
RDAT
DAT
LFE
MPEG
MUSICAM
DAB

SVTH: Lê Minh Toản

GVHD: Dương Tuấn Quang
Từ đầy đủ

Pulse Code Modulation


Compact Disc
Digital Broadcast Satelite
Audio Engineeting Society
European Broadcasting Union
Rotary Drgital audio tabe
Digital audio tape
Low Frequecy Enhancement
Moving Picture Experts Group
Maskingpatterm Universal Suband Intergrated Coding and
Multiplexing
Digital Audio Broadcasling

2


Tìm hiểu về kỹ thuật nén Audio số

GVHD: Dương Tuấn Quang

DANH MỤC HÌNH ẢNH

SVTH: Lê Minh Toản

3


Tìm hiểu về kỹ thuật nén Audio số

GVHD: Dương Tuấn Quang


LỜI MỞ ĐẦU
Tín hiệu audio số PCM được sử dụng trong TV, truyền thông đa phương tiện
cũng như trong nhiều ứng dụng khác. Các dòng số này có tốc độ rất cao. Ví dụ khi âm
thanh được lấy mẫu với tần số 48 KHz và độ phân giải là 16 bit thì dòng số tạo ra sẽ có
tốc độ 1.54Mbit/s.
Một hệ thống âm thanh surround cung cấp dòng số có tốc độ lên đến 4.5 Mbps.
Bởi vậy, yêu cầu phải có một phương pháp nén hiệu quả cho lưu trữ dữ liệu thời gian
dài cung như khi phân phối dữ liệu qua các kênh có bề rộng dải thông hẹp.
Việc nén audio hiện nay được tổ hợp trong các ứng dụng đa phương tiện trên cơ
sở là máy tính, cho sự phân phối chương trình trên đĩa CD-ROM và mạng. Nó cũng
được sử dụng trong truyền dẫn qua vệ tinh quảng bá (Digital Broadcast Satelite-DBS).
Em xin chân thành cảm ơn thầy Dương Tuấn Quang đã nhiệt tình giúp đỡ em
hoàn thành đồ án này.

SVTH: Lê Minh Toản

4


Tìm hiểu về kỹ thuật nén Audio số

GVHD: Dương Tuấn Quang

CHƯƠNG I
GIỚI THIỆU CHUNG VỀ ÂM THANH
1.1. Khái niệm âm thanh.
Âm thanh là do vật thể rung động, phát ra tiếng và lan truyền đi trong không
khí. Sở dĩ tai ta nghe được nhờ có màng nhĩ. Màng nhĩ nối liền với hệ thống thần kinh.
Âm thanh cũng truyền lan được trong các chất khí, chất lỏng, chất rắn…nhưng
không truyền lan được trong chân không.

Một số chất truyền âm rất kém, thường là loại mềm, xốp như bông, da, cỏ khô.
Các chất này gọi là chất hút ẩm, được dùng làm lót tường các rạp hát, các phòng cách
âm …để hút âm, giảm tiếng vang.
Vận tốc truyền lan của âm thanh phụ thuộc vào chất truyền âm . Ví dụ như
không khí là 340m/s, trong nước là 1480m/s, trong sắt là 5000m/s.
Tần số của một âm đơn là số lần dao động của không khí truyền âm trong một
giấy đồng hồ. Tai người có thể nghe thấy tần số từ khoảng 16Hz đến 20.000Hz.
* Dải tần số từ 16Hz đến 20.000Hz gọi là tần số âm thanh (hay âm tần)
*Dải tần số dưới 16Hz gọi là hạ âm .
* Dải tần số trên 20.000Hz gọi là siêu âm.
1.2. Phát tín hiệu âm thanh.
1.2.1. Sơ đồ khối máy phát tín hiệu âm thanh.
An ten

Chủ sóng

Trung gian

Công suất
Fidơ

Điều khiển

Nguồn

Điều chế
Tín hiệu

âm thanh


Hình 1.1: Sơ đồ khối máy phát

SVTH: Lê Minh Toản

5


Tìm hiểu về kỹ thuật nén Audio số

GVHD: Dương Tuấn Quang

1.2.2. Chức năng từng khối.
 Khối chủ sóng: Có thể là một tầng hoặc một số tầng có kết cấu phức tạp.

Nhiệm vụ của nó là tạo ra dao động điện tần số gốc để cung cấp cho các tần số sau. Vì
vậy gọi là chủ sóng.
 Khối trung gian: Có thể là một tầng khuyếch đại để tăng điện áp và công suất
từ chủ sóng đưa sang. Tuỳ theo yêu cầu của mỗi máy phát mà tầng trung gian có thể là
các tầng đệm, nhân hoặc chia. Tầng đệm vừa để khuyếch đại vừa để cách ly ảnh hưởng
của tầng sau đối với chủ sóng, giữ cho chủ sóng ổn định. Tầng nhân hoặc chia để tăng
tần số hoặc giảm tần số hai ba lần… so với tần số chủ sóng đưa sang tuỳ theo yêu cầu
của máy phát.
Để đảm bảo cho yêu cầu cung cấp cho khối công suất trước khi ra ăng ten, trong
khối trung gian có thể có thêm một vài tầng khuyếch đại điện áp và công suất cao tần
tuỳ theo từng máy.
 Khối công suất: Là tầng khuyếch đại công suất để đảm bảo có đủ công suất
yêu cầu phát ra anten.
 Anten: Có nhiệm vụ biến dao động điện cao tần thành sóng điện từ truyền làn
ra không gian, tuỳ theo máy phát và yêu cầu thông tin mà thiết bị anten có thể đơn
giản hay phức tạp, có thể bức xạ sóng điện từ có hướng hoặc không hướng.

 Hệ thống fidơ truyền dẫn năng lượng cao tần ở đầu ra máy phát đến anten.
 Khối điều chế: Trong máy phát thanh thường có liền tăng âm vô nén, xén, các
tầng khuyếch đại âm tần và thiết bị điều chế.
 Khối nguồn: Thường là tập hợp các loại chính lưu và các thiết bị cung cấp
điện cho toàn máy phát.
 Khối điều khiển: Dùng để điều khiển máy hoạt động, giữ an toàn cho người
khai thác và cho thiết bị.
1.3. Sáu chỉ tiêu chất lượng cho máy phát tín hiệu âm thanh.
1.3.1. Độ ổn định tần số.
Là một chỉ tiêu rất nghiêm ngặt đối với máy phát. Bên máy thu chỉ có thể thu
được thông tin liên tục và tốt khi tần số bên phát không xê dịch ra giới hạn cho phép.
Do đó, tần số máy phát phải đảm bảo giới hạn độ ổn định cho phép VD máy phát tần
số 7MHz được phép xê dịch không quá±3.10-6. Độ ổn định tần số do khối chủ sóng
quyết định là chủ yếu.
1.3.2. Méo tần số:
Là mức độ khuyếch đại không đồng đều đối với các tần số có tín hiệu có ích
cần phát đi, làm cho tương quan về mức độ của các tần số âm thanh trong nội dung tin
tức không còn trung thực nữa.
1.3.3. Méo phi tuyến:

SVTH: Lê Minh Toản

6


Tìm hiểu về kỹ thuật nén Audio số

GVHD: Dương Tuấn Quang

Chính là méo dạng của tín hiệu hay còn gọi là méo không đường thẳng. Tín

hiệu cần truyền đi là hình sin nhưng qua máy phát sóng hài nên bị biến dạng đi không
còn là hình sin nữa. Meo phi truyền to lớn thì âm thanh sẽ bị nghẹt, rè…
Méo phi tuyến càng ít thì tiếng nói càng trung thực. Méo ghi tuyến chủ yếu do
chế độ công tác của tầng khuyếch đại tín hiệu , điều chế, khuyếch đại dao động đã điều
chế quyết định.
1.3.4. Độ sâu điều chế:
Còn gọi là hệ số điều chế là mộ chỉ tiêu rất quan trọng trong các máy phát điều
chế biên độ. Nó là tỷ số giữa biên độ điện áp tín hiệu với điện áp giao động cao tần.
Trong các máy phát thanh điều chế biên độ thì độ sâu điều chế đạt trung bình là : 70%
đến 80%.
1.3.5. Mức bức xạ sóng hài:
Là sóng có tần số gấp hai, ba lần tần số công tác của máy phát. Người ta phải
hạn chế bức xạ sóng hay của máy phát, nhất là máy phát có công suất lớn. Vì khi có
sóng hài phát ra sẽ làm giảm hiệu suất phát sóng của máy phát và gây ra can nhiễu
cho các đài khác, nếu sóng hài trùng tần số hoặc ngay kề tần số công tác của đài đó.
1.3.6. Mức tạp âm và tiếng ù:
Là những tiếng ồn trong máy phát tạo ra, sẽ cạn nhiễu đến tín hiệu có ích, khi
mức tạp âm có tiếng ù lớn có thể không còn nhận biết được nội dung tin tức nữa. Mứa
tạp âm và tiếng ù được so sánh với mức tín hiệu có ích.
Để ổn định tần số , méo tần số, méo phi tuyến, độ sâu điều chế , mức bức xạ
sóng hài, mức tạp âm và tiếng ù là những chi tiết cơ bản đối với máy phát thanh sóng
dài,trung, ngắn.
1.4. Nguyên lý ghi âm
1.4.1. Các phương pháp ghi âm .
Đối với tín hiệu âm thanh tương tự có các phương pháp ghi truyền thống sau:
 Ghi âm cơ giới

Dùng thiết bị cơ giới khắc những tín hiệu âm thanh thành dạng các rãnh vòng
tròn trên đĩa nhựa. Khi cần phát lại tín hiệu âm thanh trên đĩa ghi, thì cho kim đĩa hát
chuyển động trên những rãnh vòng đó, ứng dụng trong đĩa hát.

 Ghi âm quang học:

Là phương pháp dùng Micro và bộ điều chế quang để đưa âm thanh cần ghi vào
những phiên nhựa cảm quang. Rồi đem phiến nhựa đã định hình ghi âm, khống chế
ánh sáng của đèn quang học chiếu tới, để phát ra tín hiệu ban đầu. Phương pháp này
ứng dụng trong điện ảnh.

SVTH: Lê Minh Toản

7


Tìm hiểu về kỹ thuật nén Audio số

GVHD: Dương Tuấn Quang

 Ghi âm từ:

Là phương pháp dùng dòng điện âm tần tác động lên băng từ và để lại từ dư
trên băng từ theo quy luật của dòng điện âm tần. Lúc phát lại thì những mức từ dư trên
băng qua đầu từ đọc lại biến thành dòng điện âm tần. Phương pháp này ứng dụng trong
truyền thanh và đời sống.
1.4.2. Các chi tiêu chất lượng của máy ghi âm .
 Tốc độ chuyển băng định dạng

Đó là tốc độ chuyển động danh định của băng từ chạy qua đầu từ. Tốc độ
chuyển băng tính theo cm/s. Máy ghi âm có chất lượng càng cao thì tốc độ chuyển
băng càng lớn. Thường là 76,2cm/s-38cm/s-19,05cm/s- 9,53 cm/s- 4,76cm/s.
Nếu tốc độ nhanh hay chậm quá mức thì sẽ phát sinh mẹo tần số, nhanh quá thì
tiếng nghe eo éo chậm quá thì nghe ề à…khi đọc băng ở máy khác thì tốc độ chuyển

băng sai lệch không quá 0,2% so với tốc độ khi ghi.
 Mức sai điệu.

Là sự méo do tốc độ chuyển băng không đều trong khi ghi hoặc trong khi đọc
băng.
 Giài tần số công tác:

Các máy ghi âm có chất lượng cao bao giờ cũng có giải tần số công tác rất rộng.
Tốc độ nhanh dải tần số rộng hơn khi dùng tốc độ chậm. VD ứng với 19.05cm/s thì dải
tần công tác là 40÷12.000Hz với tốc độ 9,53cm/s thì dải tần

số công tác là

60÷10.000Hz.
 Méo tần số:

Do các nguyên nhân sau:
- Khi ghi, hay đọc, tốc độ chuyển băng không ổn định.
- Tốc độ đọc không cùng với tốc độ ghi.
- Bộ khuyếch đại không khuyếch đại đồng đều cả ở dải tần số công tác.
- Các đầu từ có kết cấu hoàn chỉnh, băng từ sấu.
Độ méo tần số của máy ghi âm phụ thuộc vào đáp tuyến tần số của hệ thống ghi
từ và mức hiểu chỉnh tần số của bộ khuyếch đại.
 Méo không đường thẳng:

Của máy ghi âm phụ thuộc vào độ méo không đường thẳng của hệ thống ghi từ
và của phần khuyếch đại tín hiệu độ méo không đường thẳng của hệ thống ghi từ gây
ra do tương quan không đường thẳng giữa lượng cảm ứng từ dư và trị số dòng điện ở
đầu từ ghi .
Méo không đường thẳng sinh ra do nhiều nguyên nhân


SVTH: Lê Minh Toản

8


Tìm hiểu về kỹ thuật nén Audio số

GVHD: Dương Tuấn Quang

- Do các đường cong từ hoá của băng từ
- Do đặc tuyến , chế độ làm việc của tranzitor có sai lệch
- Do các đầu từ và biến áp.
 Công suất ra danh định

Là công suất âm tần ra của bộ khuyếch đại đọc, ứng với độ méo không đường
thẳng cho phép các máy chạy pin thường có công suất bé hơn máy chạy điện, máy
chạy pin có công suất vai trăm mili – oát, máy chạy điện một vài oát.
 Độ nhạy đầu vào: là điện áp đầu vào bộ khuếch đại ghi đảm bảo mức ghi lớn mất trên

băng từ.
 Dải động:Dải động là tỷ số giữa mức tín hiệu ghi và đọc lớn nhất của mức tín hiệu ghi
và đọc nhỏ nhất. Dải động phụ thuộc vào tính chất của băng từ và mức độ tạp âm.
1.5.3. Nhược điểm của các phương pháp ghi tín hiệu âm thanh tương tự
- Do méo phi tuyến sở dĩ là do ghi âm dựa trên cơ sở của việc biên độ tín hiệu
tỷ lệ với một đại lượng vật lý nào đó của vật liệu ghi ( từ dư trên băng, độ lớn của
rãnh ghi trên đĩa, vật ghi trên đĩa…).
- Sự hạn chế của tỷ số tín hiệu trên tạp âm. Do vậy đã làm đi sự phong phú của
âm thanh trong tự nhiên.
Để khắc khục những nhược điểm này người ta đã chuyển sang ghi âm thanh

bằng kỹ thuật số thay vì ghi âm tương tự, ghi âm số chuyển mức tín hiệu sang mã số
nhị phân để ghi lại theo chuỗi các con số "0" và "1" do vậy độ lớn bé của tín hiệu cần
ghi sẽ không còn là trở ngại nữa.

SVTH: Lê Minh Toản

9


a)

c)

Tìm hiểu về kỹ thuật nén Audio số

GVHD: Dương Tuấn Quang

CHƯƠNG II
CÁC VẤN ĐỀ SỐ HOÁ TÍN HIỆU AUDIO.
2.1. Số hoá tín hiệu audio.
Tín hiệu audio thường đi kèm tín hiệu video trong truyền hình. Để có chất
lượng âm thanh tốt người ta tìm cách nén tín hiệu audio.
2.1.1. Số hoá tín hiệu audio.
Để biến tín hiệu audio sang tín hiệu số, người ta dùng PCM đơn giản. Tín hiệu
âm thanh thường có băng tần 40Hz15KHz. Nếu theo Nyquist, fsa≥2×15KHz=30KHz.
Để giảm méo do lồng phổ, ta chọn f sa=32KHz±2.6× 10-6.Muốn đạt chất lượng cao về
Ura
âm thanh khôi phục, thì tỷ số tín hiệu trên méo lượng tử phải có giá trị lớn. do đó phải
mã hoá mỗi mẫu với độ chính xác ít nhất là 14 bit. Tốc độ bit của tín hiệu là
Uvào

500KB/s,nhỏ hơn nhiều tốc độ video (220Mb/s). Tín hiệu
Audio thường được nén và
dãn nhờ đặc tuyến (phi tuyến) lượng tử hoá tín hiệu .

512
448
384
320nhỏ.
256
192
128
64

b)

Trong tín hiệu âm thanh, các mức có giá trị lớn ít hơn nhiều các mức có giá trị
Nên có thể mã hoá với độ chính xác thấp.
Đặc tuyến nén thích hợp được biểu diễn dưới đây:
0

1/8

¼

1/64 1/32 1/16

½

1


1
-1

-1

Hình 2.1: Đặc tuyến nén tín hiệu.
a) Một phần của đặc tuyến A. b) Nguyên tắc nén. c) Đặc tuyến A

SVTH: Lê Minh Toản

10


Tìm hiểu về kỹ thuật nén Audio số
X =

Ta có sự phụ thuộc:

u
U

GVHD: Dương Tuấn Quang
Y=

x



u
U


y
y

Trong đó ux, uy : trị tức thời tín hiệu vào và ra của mạch co dãn tín hiệu
Ux Uy : biên độ cực đại của tín hiệu vào và ra của mạch co dãn.
Mỗi biến x và y có thể có giá trị từ -1 đến +1. Vị trí dương và âm của tín hiệu
video có cùng công suất. Nên đặc tính nén sẽ đối xứng qua điểm gốc của hệ toạ độ.
Cần chọn đặc tính nén sao cho chất lượng tín hiệu âm thanh có chất lượng cao là đặc
tuyến A.
2.1.2. Truyền tín hiệu âm thanh trong tín hiệu video.
Trong trường hợp truyền các tín hiệu video số với một hoặc một vài tín hiệu âm
thanh số di kèm, thì tốt nhất là ghép kênh theo thời gian với tín hiệu video, nhằm tạo
một tia số liên tục.
Các tín hiệu âm thanh số có thể được truyền trong tín hiệu video tương tự.
Trong tín hiệu video, khoảng 20% thời gian dùng để truyền các xung đồng bộ và xung
xoá. Các khoảng thời gian này có thể sử dụng để truyền âm thanh số. Việc làm này
phải đảm bảo không gây nhiễu cho hoạt động kênh video và máy thu.
Tín hiệu âm thanh cần cấy vào tín hiệu Video tương tự phải được biến đổi thành
tín hiệu số. Tần số lấy mẫu có thể đồng bộ có thể đồng bộ với tần số dòng hoặc không.
Nếu chuyển tín hiệu âm thanh thanh tín hiệu số một cách trực tiếp, tốt nhất chọn tần số
lấy mẫu bằng nhiều lần tần số lấy mẫu f H. Ví dụ fsa=2fH=2x15.625KHz=31.250. Nếu
tín hiệu âm thanh đã ở dạng số rồi, thì nó được lấy mẫu với tần số không đồng bộ f H
với fH. Để cấy tín hiệu âm thanh số vào tín hiệu Video càn phải nén tín hiệu. Để không
gây méo tín hiệu Video do cấy tín hiệu Video vào nó, các xung có sườn dốc của tín
hiệu số phải được tạo dạng nhờ mạch lọc có đặc trưng gần với đặc trưng phổ tín hiệu
Video. Ví dụ mạch lọc có đặc trưng sin22T (T=1/fgh), fgh là tần số cao nhất của tín hiệu
Video , ví dụ fgh=6MHz đối với hộ PAL.
Có nhiều công trình nghiên cứu truyền tín hiệu âm thanh số trong tín hiệu Video
. Các phương pháp này cho phép truyền tín hiệu âm thanh trong các hệ thống NTSC,

PAL, SECAM.
Có các phương pháp đa năng, cho phép cấy và truyền tín hiệu âm thanh cho
mọi hệ thống truyền hình. Có thể truyền thêm từ 1 đến 8 kênh âm thanh cùng với một
tín hiệu Video .

SVTH: Lê Minh Toản

11


Tìm hiểu về kỹ thuật nén Audio số

GVHD: Dương Tuấn Quang

Xung đồng bộ dòng

1V±30mV

3.62μs±10ns
300mV
±9mV

3.8μs
4.7μs chuẩn

Một trong các phương pháp đa năng nói trên là hệ thống SIS (Sound - InSync). Nó cho phép truyền một tín hiệu âm thanh cùng với tín hiệu PAL, và NTSC mà
không cần thay đổi vị trí xung đồng bộ màu.

Hình 2.3: Tín hiệu của hệ thống SIS


SVTH: Lê Minh Toản

12


Tìm hiểu về kỹ thuật nén Audio số

GVHD: Dương Tuấn Quang

CHƯƠNG III
KỸ THUẬT NÉN AUDIO SỐ
3.1. Khái niệm cơ bản của audio số.
Vào đầu thập kỷ 80 các thiết bị audio số đã dần thay thế và chiếm lĩnh các
audio tương tự trong sản xuất và phát sóng , ưu điểm nổi bật của audio số là ghi âm
số nhiều lần mà chất lượng không suy giảm, độ méo tín hiệu nhỏ một cách lý tưởng
0,01%), dải động âm thanh lớn gần ở mức tự nhiên (>90dP), việc tìm kiếm dữ liệu
nhanh chóng, lưu trữ số và các hệ thống sản xuất chương trình audio số dựa trên cơ sở
máy tính tỏ ra rất hiệu quả. Công nghệ số cho phép ghi, xử lý, truyền dẫn phát sóng và
thu nhanh hoàn toàn trong môi trường số.
Một tiêu chuẩn audio số ra đời với sự liên kết của hai hiệp hội, hiệp hội kỹ
thuật audio AES (Audio Engineeting Society) và hiệp hội truyền thanh truyền hình
Châu Âu EBU (European Broadcasting Union) đã xây dựng cho nền tảng phát triển
của thiết bị ghi âm và các thiết bị tại Studio, nơi xử lý tín hiệu và phân phối hoàn toàn
số.
Thiết bị audio số có tín hiệu vào ra tương tự, dùng để thay thế trực tiếp các thiết
bị số và hoạt động trong môi trường tương tự. Trong kỹ thuật sản xuất và truyền dẫn
có xu hướng sẽ tiến tới thay thế hoàn toàn quá trình ghi, xử lý và truyền dẫn đều làm
việc trong môi trường số.
Để các thiết bị số có thể hoà nhập vào môi trường tương tự thì các tín hiệu
tương tự cần phải được chuyển đổi sang số và ngược lại, tín hiệu số thực sự trở lên hấp

dẫn khi tín hiệu tương tư qua bộ biến đổi A/D để tạo thành tín hiệu số và có độ sai lệch
không đáng có.
3.2. Mã hoá kênh truyền.
Được sử dụng trong các hệ thống ghi số và truyền dẫn nhằm làm cho các đặc
tính của dữ liệu sau mã hoá nguồn phù hợp với các đặc tính của máy ghi hay kênh
truyền, mã kênh truyền sẽ sửa đổi dữ liệu gốc nhằm đạt được mật độ bít cao nhất có
thể được trong giới hạn đặc tính của dải thông kênh truyền. Dòng điện một chiều hay
các tần số thấp sẽ không được chuyển đổi trong quá trình này trong truyền dẫn, dữ liệu
truyền dẫn phụ thuộc vào tốc độ chuyển đổi thông tin phải nhỏ hơn dung lượng kênh
truyền, dẫn đến sự không thích ứng với kênh truyền, dải thông kênh truyền được cải
thiện khi dữ liệu truyền dẫn đạt được có đặc tính tốt nhất do đó giải thích cho quá trình
mã hoá kênh truyền. Mã hoá kênh truyền là làm cho hình dạng phổ tín hiệu audio số bị
méo nhỏ nhất.

SVTH: Lê Minh Toản

13


Tìm hiểu về kỹ thuật nén Audio số

GVHD: Dương Tuấn Quang

Hai tổ chức AES và EBU đã đưa ra các tiêu chuẩn truyền dẫn tín hiệu audio số
như tiêu chuẩn AES3-1992, ANSI S4-1992, IEC -958.
3.3. Đặc điểm của tín hiệu số liệu AES/EBU
Đặc trưng giao diện của định dạng chuyên dùng AES/EBU
- Định dạng: Sự truyền dẫn nối tiếp của hai kênh số liệu được lấy mẫu và mã
hoá tuyến tính .
- Các thông số phát:

+ Tín hiệu ra cân bằng
+ Các bộ nối XLR (ổ cắm:XLR) với chân đực và giá cái.
. Chân 1: Đầu cáp, tín hiệu mát (đất)
. Chân 2: chân tín hiệu (không phân biệt cực)
. Chân 3: chân tín hiệu (không phân biệt cực)
. Trở kháng nguồn: 110±20% ohm
. Cân bằng <-30 dB (6MHz)
. Biên độ tín hiệu ra từ 2 đến 7v quá tải 110 ohm.
Cân bằng
. Thời gian quá độ lên và xuống : 5 đến 30ns.
- Các thống số thu:
. Đầu vào cân bằng
. Các bộ nối XLR (ổ cắm XLR)
. Chân 1 : Đấu cáp, chân mát (đất)
. Chân 2: chân tín hiệu (không phân biệt cực)
. Chân 3: Chân tín hiệu (không phân biệt cực)
. Trở kháng vào 110±20% ohm.
. Hệ số thu không tin cậy : quá 7v tại 20 KHz
. Mức tín hiệu cực đại 7v
. Loại cáp : cáp đôi dây xoắn có vỏ bọc cự ly cho phép là 100 đến 250m.
3.4. Các đặc điểm giao diện kênh chuẩn AES/EBU.
Định dạng kênh người ta sử dụng được dùng trong các thiết bị CD s và RDATs
(CD – Compact DISK và RDAT-Rotary Drgital audio tabe - bằng audio số quay) với
tín hiệu vào và ra số. Nó cũng được biết đến trong giao diện số của hãng sony philips.
- Định dạng :
+ Truyền dẫn nối tiếp của hai kênh số liệu được lấy mẫu và mã hoá
tuyến tính.

SVTH: Lê Minh Toản


14


Tìm hiểu về kỹ thuật nén Audio số

GVHD: Dương Tuấn Quang

- Các thông số phát:
+ Tín hiệu ra không cân bằng
+ Các bộ nối (Rắc cắm âm thanh RCA)
+ Biên độ tín hiệu ra : 500mv ứng với tải 75 ohm
- Các thông số thu:
+ Tín hiệu vào không cân bằng
+ Các bộ nối giắc cắm âm thanh
+ Trở kháng vào 75 ohm
3.5. Giải mã và ghép kênh tín hiệu AES/EBU.
Bộ giải mã BPM được dùng để khôi phục chuỗi tín hiệu audio số AES/EBU đã
mã hoá BPM thành dòng số liệu. Sau đó, các tín hiệu số liệu từ hai kênh , của bộ ghép
dòng số liệu, được tách ra thành hai dòng bít số liệu audio song song. Các bít phụ
(V,U,C,P) Cũng được trích từ mỗi khung con để điều chỉnh quá trình xử lý và đồng bộ
các khung phụ và toàn bộ khung.

SVTH: Lê Minh Toản

15


Tín hiệu AES/EBU

CK


Tìm hiểu về kỹ thuật nén Audio số

GVHD: Dương Tuấn Quang
VUCD bits

CK

CK

Hình 3.1: Bộ giải
mã và tách kênh
dòng số liệu
audio AES/EBU
nối tiếp
Kênh1

liệu, khi có sự

Data
Xét số liệu

Bộ xén số

hiện diện của tạp

Syne
(dòng)

âm,


được

giới

thiệu như một bộ
biến động tại bên
Kênh2 thu. Bộ biến động

Bộ đệm kênh 1
Bộ đệm kênh 2
Chuyển đổi nối tiếp-song song và tách kênh
Giải mã đánh dấu lưỡng pha BPM
Khôi phục xung clock
(đệm)

được hiểu là có
đặc tính để thay
đổi trong thời gian
truyền dẫn của bộ
giải mã bít. Bộ lọc
được sử dùng để
loại trừ tạp âm
trước khi xén số
liệu.

SVTH: Lê Minh Toản

16



Tìm hiểu về kỹ thuật nén Audio số

GVHD: Dương Tuấn Quang

3.6. Đồng bộ audio số
Các tín hiệu audio số được tạo thành từ các mẫu rời rạc. Nếu ta muốn chèn, trộn
hay ghép các tín hiệu audio số từ các nguồn khác nhau, đòi hỏi phải có tín hiệu đồng
bộ của mỗi mẫu từ nguòn chuẩn.
Tín hiệu audio cần phải được bổ xung nhằm tạo ra một tín hiệu audio số đầy đủ,
trong đó không còn các sự cố như tiếng lách cách hay ồn trong tín hiệu. Sự phức tạp
của đông bộ hoá có thể thay đổi tuỳ theo vấn đề quan tâm là đồng bộ giữa các nguồn
tín hiệu audio hay giữa các nguồn tín hiệu audio và Video
3.6.1. Đồng bộ giữa các tín hiệu audio số
Tiêu chuẩn AESII-1991 đã chỉ rõ khả năng đồng bộ hoá cả tần số và pha của
các thiết bị vận hành trongChuyển
audio. đổi
Các máy
Lọc phát chuyên dụng phân phối các tín hiệu
chuẩn rất ổn định và phục vụ cho việc đồng bộ hoá tần số tạo điều kiện cho chương
trình audio lớn. Trong trường hợp này thiết bị sản xuất là các thiết bị con , còn các
máy phát chuẩn là máy chủ. Trong các audio nhỏ, có thể dùng tín hiệu ra của bộ thiết
bị làm chuẩn để cung cấp và phân phát cho các thiết bị khác thông qua bộ khuyếch đại
phân phối tín hiệu số. Tiêu chuẩn AESII chỉ rõ các mẫu tín hiệu audio số phải cùng
pha với tín hiệu chuẩn , độ lệch pha cho phép của khung audio tại đầu phát là ±5% và
tại đầu thu ±25%.
Hai tín hiệu của audio số có tần số lấy mẫu khác nhau hoặc không thể đồng bộ
cùng nhau thì các bộ chuyển đổi tốc độ lấy mẫu và đồng bộ được sử dụng. Quá trình
đồng bộ thực hiện được khi tốc độ của hai dòng số liệu được kiểm soát và có mối
quan hệ với nhau độ phức tạp và chi phí của thiết bị cao hơn khi quá trình đồng bộ

không được thực hiện được. Vì các mẫu tín hiệu ở đầu phát và đầu thu không có môi
liên hệ nào.
3.6.2. Đồng bộ giữa tín hiệu audio số và tín hiệu video.
Trong truyền hình tín hiệu âm thanh số chuẩn cần phải được đồng bộ với tín
hiệu video chuẩn nhằm ngăn chặn hiện tượng trễ giữa tín hiệu audio và tín hiệu video,
và cho phép chuyển mạch giữa tín hiệu audio và tín hiệu video không có tiếng lách
tách.
Trong hệ thống 625/50, số lượng các mẫu audio trên một khung video được quy
định chính xác (1920 mẫu audio với tần số lấy mẫu 48 KHz). Mối quan hệ về pha
giữa tín hiệu audio và tín hiệu video được duy trì một cách rễ dàng. Tín hiệu âm thanh
tiêu chuẩn audio AES 3 có thể giữ đồng bộ với tín hiệu video bởi vì tín hiệu chuẩn
48KHz nhận được từ tín hiệu video chuẩn trong hệ thống 625 dòng.

SVTH: Lê Minh Toản

17


Tìm hiểu về kỹ thuật nén Audio số

GVHD: Dương Tuấn Quang

3.6.3. Ghi audio số
Định dạng băng audio số DAT (digital audio tape) đầu tiên được phát truyền
cho máy ghi âm dân dụng (đầu từ quay nên còn gọi là R-DAT, Rotary digital audio
tape). Tuy nhiên DAT có chất lượng cao, nên được dùng cho mục đích chuyên dụng.
Các tín hiệu vào tương tự được số hoá, mã hoá kênh (đều chế 8-10) trước khi
ghi âm trên băng kim loại 3,81mm. Định dạng R-DAT gồm 4 mode ghi /phát, lấy mẫu
48KHz, và 2 mode phát lại tốc độ lấy mẫu 44,1 KHz.
- Các đặc trưng của R-DAT

Đặc trưng chung:
+ Số kênh audio :2
+ Thời gian ghi: 2h (4h,32KHz,mode2).
+ Đầu từ không tiếp đất, đầu ghi chùng với đầu phát .
+ Thời gian dò mành: 200 lần so với bình thường
+ Kích thước Casselte : 73x54x10,5mm
Đặc trưng điện:
+ Đáp ứng tần số: phẳng 10Hz÷22KHz (fs = 48KHz)
+ Dải động : 96 dB
+ Tần số lấy mẫu
+ 32KHz
+ 44,1 KHz
+ 48 KHz (chất lượng cao)
Lấy mẫu
+ 16bit tuyến tính, 48 và 44,1 KHz
+ 12 Bit phi tuyến, 32 KHz (mode2)
+ Méo : <0,005%
Đặc trưng cơ:
+ 30mm trống đầu từ ,900
+ Trống : 2000r/min(1000r/min@ 32KHz mode 2)
+ Tốc độ bằng : 8,15monls (4,075mm/s @ 32 KHz, mode2)
+ Độ rộng rãnh : 13,591mm
+ Độ rộng bằng : 3,81mm
+ Độ dầy bằng : 13mm

SVTH: Lê Minh Toản

18



Tìm hiểu về kỹ thuật nén Audio số

GVHD: Dương Tuấn Quang

3.7. Cơ sở về nén audio.
3.7.1. Khái niệm kỹ thuật nén số liệu audio.
Ngày nay, trong các hệ thống truyền hình đã sử dụng các hệ thống âm thanh đa
kênh tới tận hộ gia đình. Khi dung lượng lưu trữ và độ rộng kênh truyền số liệu được
quan tâm đúng mức, tốc độ dòng số liệu của các tín hiệu âm thanh này sẽ có đủ độ lớn
để giữ được mức âm thanh trung thực. Ví dụ với 16 bít mã hoá tín hiệu audio lấy mẫu
tại tần số lấy mẫu 48KHz tạo ra dòng số liệu có tốc độ 1,54 Mbit/s. Như vậy, tốc độ
dòng số liệu trong hệ thống âm thanh đa kênh đạt được tổng cộng là 4,5 Mbit/s. Tuy
nhiên thời gian lưu trữ và giá thành thiết bị rất cao. Vậy để giảm giá thành và tốc độ
lưu trữ là ta phải nén dòng số liệu audio số.
Hệ thống nén tín hiệu âm thanh là loại bỏ đi những thành phần thông tin dư
thừa trong các tín hiệu audio. Tín hiệu audio đã nén được tổ hợp trong máy tính tạo
cho các ứng dụng đa truyền thông như phân phối chương trình trên đĩa CD-ROMS và
qua mạng. Và nó cũng có thể đem sử dụng trong truyền hình quảng bá qua vệ tinh
(DSB)
3.7.2. Kỹ thuật nén số liệu audio
Kỹ thuật mã hoá nguồn được dùng để loại bỏ độ dư thừa của tín hiệu audio và
các kỹ thuật "psychoa causlic masking - che mặt nạ tâm sinh lý nghe" được dùng để
nhận dạng và loại bỏ nội dung không thích hợp (các mẫu không phải là audio). Có hai
kỹ thuật nén dữ liệu chính sau đây.
3.7.2.1.Nén không tốn hao.
Nén không tốn hao cho phép khôi phục thông tin dữ liệu gốc sau bộ giải nén mà
không gây ra tốn hao (ngược lại với nén). Nó loại bỏ độ dư thừa thống kê tồn tại trong
tín hiệu audio bằng các giá trị dự báo từ các mẫu trước. Có thể đạt tỷ lệ nén thấy (tốt
nhất là 2:1) và phụ thuộc vào độ phức tạp của tín hiệu audio gốc.
Nhờ mã hoá dự báo miền thời gian mà ta có thể nén không tổn hao.

- Thuật toán visai: tín hiệu audio có chứa các âm lặp lại cũng như số lượng lớn
độ dư thừa và các âm thanh không thích hợp. Dữ liệu lặp lại được loại bỏ trong quá
trình mã hoá và được khôi phục lại tại phần giải mã. Kỹ thuật DTCM ( Điều xung mã
visai) cũng được sử dụng trong tín hiệu audio. Tín hiệu audio được tách ra thành một
số các băng tần con có chứa một số âm rời rạc. Sau đó mã hoá bằng DPCM và bộ dự
báo thích hợp cho các tín hiệu có chu kỳ ngắn. Loại mã hoá thích nghi này thực hiện
trên cơ sở quan sát năng lượng tín hiệu đầu vào nhằm sửa chữa kích cỡ bước lượng tử
phù hợp . Bước này được gọi là bộ thích nghi DPCM (ADPCM).

SVTH: Lê Minh Toản

19


Tìm hiểu về kỹ thuật nén Audio số

GVHD: Dương Tuấn Quang

- Bộ mã hoá entropy tách độ dư thừa bằng cách biểu diễn các hệ số lượng tử
hoá của băng tần con nhằm nâng cao hiệu quả mã hoá. Các hệ số này được truyền theo
bậc tăng tần số, tạo các giá trị lớn tại các tần số thấp và bước chạy dài của các giá trị
nhỏ hoặc gần bằng 0 cho các tần số cao.
- Các thông số quá tải khối dữ liệu : Các giá trị nhị phân từ quá trình biến đổi
(số sang tương tự) ADC, được nhóm thành các khối dữ liệu cả trong miền thời gian lẫn
trong miền tần số.
3.7.2.2. Nén tín hiệu có tốn hao.
Nén có tốn hao nhờ kết hợp hai hay nhiều kỹ thuật xử lý để sử dụng đặc điểm
các HAS là tách các thành phần phổ có biên độ nhỏ giữa các thành phần phổ có biên
độ lớn. Phương pháp giảm số liệu xử lý cao có hệ số nén từ 2:1 đến 20:1 nó phụ thuộc
vào quá trình nén và giải nén, và vào yêu cầu chất lượng audio.

Hệ thống nén số liệu có tổn hao sử dụng kỹ thuật mã hoá thụ cảm, nguyên lý
của nó là loại bỏ độ dư thừa trong tín hiệu audio bằng cách bỏ đi nhứng tín hiệu nằm
dưới đồ thị ngưỡng âm. Do đó người ta gọi các hệ thống nén số liệu có tổn hao là mất
các thành phần âm.
Nén có tổn hao kết hợp nhiều kỹ thuật
*.Kỹ thuật “masking – che” che phủ miền thời gian và tần số các thành phần tín
hiệu
*.Che phủ nhiễu lượng tử cho mỗi âm audio bằng cách xắp xếp đủ các bít để
làm cho mức nhiễu lượng tử luôn dưới đồ thị che mặt nạ. Tại các tần số gần tín hiệu
audio, tỉ số SNR = 20÷ 30 db (độ phân giải 4 ÷ 5 bit)
*.Mã hoá nối (Joint Coding). Kỹ thuật này tách độ dư thừa trong hệ thống đa
kênh audio (một số đáng kể dữ liệu giống nhau tồn tại trong tất cả các kênh). Do đó,
giảm dữ liệu được thực hiện nhờ mã hoá các dữ liệu giống nhau và chỉ thị cho bộ giải
mã lặp lại
3.8. Nén tín hiệu audio theo chuẩn MPEG
Hiện nay trên thế giới tồn tại nhiều hộ âm thanh dùng trong truyền hình như hệ
MICAM số, hệ MUSICAM số, A-2 (Two audio) tương tự hệ AC – 3 (audio coding 3)
số có nén.
3.8.1. Tiêu chuẩn nén Audio MPEG.
Tiêu chuẩn nén audio MPEG –1 (ISO/IEC 11172-3) thường được biết dưới tên
gọi MUSICAM (Maskingpatterm Universal Suband Intergrated Coding and
Multiplexing) gồm ba lớp (layer) mã hoá I, II và III tương ứng với hiệu quả nén và độ
phức tạp tăng dần, đã được ứng dụng trong nhiều lĩnh vực khác nhau, đặc biệt là trong

SVTH: Lê Minh Toản

20


Tìm hiểu về kỹ thuật nén Audio số


GVHD: Dương Tuấn Quang

phát thanh, truyền hình. Tiêu chuẩn nén audio MPEG –2 (ISO/IEC 13818-3) là bước
phát triển mở rộng dựa trên cơ sở MPEG –1. Phương thức nén Dolby AC-3 ứng dụng
trong hệ HDTV số Grand Alliance (ATSC) cũng là một biến thể từ Audio MPEG –2.
Đối với lĩnh vực truyền hình, tiêu chuẩn MPEG đặc điểm nổi bật là đảm bảo
khả năng đồng bộ giữa video và audio khi phân kênh và giải nén.
Những đặc tính kỹ thuật cơ bản của tiêu chuẩn nén Audio MPEG –1 và MPEG –2
được trình bày tóm tắt trong bảng sau:
Bảng: Đặc điểm của Audio MPEG-1, MPEG-2.

Độ phân giải đầu vào

MPEG –1
16 bit.

MPEG –2
16 bit, có thể lên tới 24 bit.
48 KHz- 44.132 KHz

Tần số lấy mẫu

48 KHz—44.132KHz
24 KHz- 22.0516 KHz

Tốc độ bit

Tự do, có thể lên đến 448 Tự do, có thể lên đến 256
Kbps.

Kbps.

Số lượng kênh.

6 kênh: Left, Right,
Center, Left Surround,
2 kênh với các mode:
Right Surround và LFE
mono,
stereo,
dual,
(Low
Frequecy
jointstereo.
Enhancement- Kênh tăng
cường tần số thấp)

Tính tương hợp

Thuận và ngược

Khả năng co giãn

Các kênh Left, Right có
thể giải mã độc lập nhau

SVTH: Lê Minh Toản

21



Tìm hiểu về kỹ thuật nén Audio số

GVHD: Dương Tuấn Quang

Sơ đồ khối bộ mã hoá MPEG audio như sau:
0
1
Dãy bộ lọc 32 băng phụ
Dữ liệu vào
2

Xếp
loại

n
31

0
0
1
1
2 Lượng tử hoá 2
n
31

Multiplexer

n
31


Dòng bit mã hoá

-Phân phối bit
Phân phối tham số xếp loại, bit động-Tham
và mã số
hoáxếp loại
Biến đổi FFT 512 hoặc 1024 điểm
Ngưỡng che lấp

Dữ liệu phụ

Hình 3.2: Sơ đồ khối bộ mã hoá Audio MPEG.
3.8.2. Thuật toán nén tín hiệu audio MPEG bao gồm các bước sau:
 Audio được chuyển về miền tần số, và toàn bộ dải phổ của nó được chia

thành 32 băng con thông qua bộ lọc băng con
*Lọc băng con : phổ tín hiệu được chia thành các băng con có độ rộng dải
thông bằng nhau , thành các băng tới hạn có thể thay đổi, nó tăng tới vài KHz khi tần
số trên 10 KHz, tần số dưới 500Hz độ rộng dải băng là 100 Hz, một băng con có tới
vài băng tới hạn .
Bộ lọc băng con có một phần gối lên nhau và thường sử dụng cho các mẫu kề
nhau trong miền thời gian. VD trong mức II của chuẩn MPEG một khung audiocó
1152 mẫu gốc được chia thành 32 băng con có độ rộng bằng nhau (750 Hz @ tần số
lấy mẫu 48 KHz) mỗi băng con có 36 mẫu
Sau đó mỗi tín hiệu băng con được lượng tử hoá đều với các bít chỉ định đặc
trưng để bảo vệ băng con bằng tỷ số tích cực masking trên tạp âm (MNR). Tỷ số có
tính tích cực khi đường cong các mức chặn ở trên mức tạp âm
*.Băng chuyển đổi : Thuật toán sửa đổi DCT (MDCT) được sử dụng để biến
đổi tín hiệu: audio từ miền thời gian sang miền tần số thành một số lượng lớn các bít

con, Giống như bộ lọc băng con chuyển đổi các băng con cũng nằm kề nhau
Lọc băng ghép : Đây là sự kết hợp giữa bộ lọc băng con và bộ lọc băng chuyển
đổi. Tín hiệu được chia thành 32 băng con do bộ lọc băng, sau đó thuật toán sửa đổi
MDCT được áp dụng cho 18 mẫu trong từng băng con tạo ra tổng cộng 576 băng con
đạt được độ phân tích thời gian là 3,8 ms

SVTH: Lê Minh Toản

22


Tìm hiểu về kỹ thuật nén Audio số

GVHD: Dương Tuấn Quang

Đặc tính quan trọng của bộ lọc băng là độ phân tích có tính thoả hiệp. Một bộ
lọc băng có độ phân tích thấp sẽ cho số lượng nhỏ các băng con và thành phần âm của
phổ tín hiệu audio nằm trong băng con. Khi Kỹ thuật mức ngưỡng masking giảm đi thì
cần rất nhiều bít cho lượng tử hoá tín hiệu của mỗi băng con, số lượng các băng con
giảm đi trong bộ lọc dẫn đến độ phức tạp của bộ mã hoá và giải mã giảm đi trong khi
đạt được độ phân tích trong khoảng thời gian ngắn
Một bộ lọc băng có độ phân tích cao cho ra một lượng lớn các băng tần con và
các thành phần âm của phổ tín hiệu audio nhưng không nằm trong tất cả các băng
con.Các băng con không có thành phần âm không cần mã hoá, kết quả bộ mã hoá số
liệu không gây tổn hao.Các băng con có thể tái tạo tốt hơn băng tới hạn bằng đặc tính
HAS nhưng độ phân tích thời gian kém
Như vậy bộ lọc băng chuyển đổi 256 dải có độ phức tạp giống bộ lọc băng 32
dải băng con
 Với mỗi băng con người ta xác định mức biên độ tín hiệu và mức nhiểu băng “mô hình


tâm sinh lý nghe – psychoacaushic model”đây là thành phần chính của bộ mã hoá
MPEG Audio và chức năng của nó là phân tích tín hiệu vào. Psychoacoushic model
các xác định tỷ lệ Signal- mask cho mỗi băng tỉ lệ Sigmal mask được sử dụng để xác
định số bit cho quá trình lượng tử hoá mỗi băng để giảm đi khả năng nghe thấy của âm
thanh.
 Mỗi băng con được lượng tử hoá thông qua lượng tử các thành phần nghe thấy trong
mỗi băng. Nó đi kèm với mã Huffman để mã hoá các giá trị phổ tín hiệu và cho nén số
liệu tốt hơn và định dạng số liệu
Chuẩn MPEG áp dụng với audio đưa na ba mức nén.Mức I nén cơ bản với tốc
độ bit lớn nhất 448 bit/S, mức II và III là mức mở rộng mức I và tốc độ của chúng đạt
được 320 Kbit/S và 384 Kbit/S. Nếu ta đạt được tỉ lệ nén cao bù vào đó chi phí cũng
tăng theo cho bộ giải mã và mã hoá
3.8.3. Ứng dụng và đặc điểm của 3 mức tiêu chuẩn MPEG
* Mức I : ứng dụng trong các thiết bị dân dụng
* Mức II : ứng dụng trong các thiết bị chuyên dụng và Multimedia
* Mức III : Dùng trong các hệ thống mã hoá biếng nói 64 K bit/s và thấp hơn,
dùng mã hoá chất lượng cao cho tín hiệu âm nhạc
Đặc điểm của từng mức
3.8.3.1. Đặc điểm của mức I
*Tốc độ dòng số liệu từ 32 đến 448 K bit/s (tổng cộng)
*Tín hiệu vào chia thành các khung bao gồm 384 mẫu trên một kênh
*Chu kỳ khung là 8ms cho kênh 48KHz

SVTH: Lê Minh Toản

23


Tìm hiểu về kỹ thuật nén Audio số


GVHD: Dương Tuấn Quang

*32 băng con có độ rộng bằng nhau tạo ra từ các khối block gồm 12 mẫu (32
x12 = 384 mẫu)
*Hệ số tỉ lệ 6 bit trên một băng, hệ số tỉ lệ khác nhau cho mỗi băng
*Phân phối bit theo phương thức thích ứng trước
*Mỗi mẫu băng con được lượng tử hoá một cách chính xác bằng cách tính toán
phân bổ các bít .
Sử dụng cho các kênh đơn hay đa kênh – Stereo
*Đáp ứng được các ứng dụng của người sử dụng
3.8.3.2. Đặc điểm của mức 2
MPEG mức II audio đã cải thiện phương thức hoạt động của mức I cho phép
nén tốt hơn đạt được tốc độ 128 K bit/s
*Đạt được tốc độ dòng số liệu từ 32 đến 384 K bit/s (tổng cộng)
*Tín hiệu vào được chia thành các khung chứa 1152 mẫu trên một kênh
*32 băng con có độ rộng bằng nhau tạo ra từ các khối block gồm 36 mẫu (32 x
36 = 1152 mẫu)
*Chu kỳ khung là 24 ms cho kênh 48 KHz
*Hệ số tỷ lệ 6 bit trên một băng, hệ số tỷ lệ khác nhau cho mỗi băng
*Phân phối bit theo phương thức thích ứng trước
*Mỗi mẫu băng con được lượng tử hoá một cách chính xác bằng cách tính toán
phân bổ các bit
*Sử dụng kênh đơn (mono) hay Stereo
*Tiêu chuẩn nén audio MPEG có nhiều ứng dụng rộng rãi trong chuyển đổi
ROM, DVB, DBS, Multimedia vv...
3.8.3.3. Đặc điểm mức III
Mức III là lớp cho tốc độ dòng bit thấp, đạt được tốc độ 64 K bit/s
*Đạt được tốc độ dòng số liệu từ 32 đến 320 K bit/s
*Tín hiệu vào được chia thành các khung chứa 1152 mẫu trên một khung
*Chu kỳ khung là 24 ms cho kênh 48 KHz

*32 băng con có độ rộng bằng nhau được chia thành 18 MDCT (32 x36 = 1152
mẫu)
*Hệ số tỷ lệ được sử dụng làm giảm các mức lượng tử và tạp âm lượng tử
*Phân phối bit theo phương thức thích ứng trước
*Sử dụng mã VLC (Huffman) các giá trị lượng tử
*Sử dụng kênh đơn (mono) hay stereo

SVTH: Lê Minh Toản

24


Tìm hiểu về kỹ thuật nén Audio số

GVHD: Dương Tuấn Quang

*Sử dụng trong các ứng dụng cần tốc độ bít thấy như vậy mạng ISDN viến
thông, đường truyền vệ tinh và âm thanh chất lượng cao qua mạng Intenet
3.8.3.4 Chuẩn nén MPEG 2
Tiêu chuẩn MPEG - 2 (ISO/IEC 13818) có từ năm 1994 được ứng dụng là sự
mở rộng của tiêu chuẩn MPEG – 1 nhằm đáp ứng cho các nhu cầu của các ứng dụng
mới
*Tiêu chuẩn MPEG là đa năng, cho phép đạt chất lượng cao, tốc độ truyền số
liệu nhanh và thiết bị phức tạp. Chất lượng audio có thể thay đổi trong một phạm vi
rộng tuỳ thuộc vào tốc độ dòng bit từ thấp đến cao, tốc độ số liệu từ 32 đến 1066 K
bit/s
Phạm vi rộng được thực hiện nhờ chia khung số liệu audio MPEG - 2 thành hai
phần
Một phần là dòng bít gốc thích ứng với MPEG–1(384 Kb/s của mức II) phần
còn lại là bit mở rộng. Với layer III (mức III cho tốc độ dòng bít là 64 Kb/s trên một

kênh, có thể nên tốc độ là 320 K bit/s tức là có thể nén mã hoá được tín hiệu có độ
rộng bằng 5 kênh audio đầy đủ băng tần. Như vậy các thuật toàn mã hoá mới được
dùng ở phía máy phát hình mà không cần thay đổi ở phía máy thu
Sự mở rộng trên có thể thực hiện được nhờ cộng thêm vào mỗi mức
*1/2 tốc độ lấy mẫu (16 : 22,05; 24 Kb/s)
*Dụng lượng đa kênh (tốc độ bit đa kênh mở rộng đến 1 Mb/s cho phép đạt
chất lượng cao). Các dữ liệu nàu được lấy vào không gian dữ liệu phụ của cấu trúc
MPEG - 1 audio khung
Tiêu chuẩn audio MPEG - 2 phát triển sau và tương thích với tiêu chuẩn
MPEG – 1. Tuy nhiên bộ giải mã MPEG - 1 chỉ có thể giải mã được các kênh trái và
phải của dòng dữ liệu MPEG - 2 audio . Tất cả các lớp của MPEG - 1 và MPEG - 2
đều giống nhau
3.8.4. Ưu điểm của hai tiêu chuẩn MPEG
*Dòng bít MPEG -1 có thể mở rộng thành dòng MPEG - 2 một cách dễ dàng
*Từ dòng bit MPEG, mỗi bộ giải mã MPEG -1 có thể tách các tín hiệu Mono
hoặc các tín hiệu Stereo và các tín hiệu MPEG -2 còn lại
*Trong hệ thống MPEG có thể đồng thời truyền nhiều thông tin phụ
Dòng số liệu phụ có thể thay đổi trong quá trình phát sóng, nó có thể liên kết
hai chiều giữa phía phát và thu. Hệ thống tương tác cho phép thu chương trình riêng
mà mình yêu thích

SVTH: Lê Minh Toản

25


×