Tải bản đầy đủ (.docx) (23 trang)

KỸ THUẬT PHÁT THANH TRUYỀN HÌNH

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (423.01 KB, 23 trang )

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
KHOA VIỄN THÔNG 1
----- -----

Bảng phân chia công việc

Nguyễn Thị Hồng
Lê Đức Nam

BÀI TIỂU LUẬN

Trần Thanh Phong

MÔN HỌC:
KỸ THUẬT PHÁT THANH TRUYỀN HÌNH

Giảng viên
Sinh viên

:
:

Nguyễn Thị Thu Nga

Hà Nội, ngày 19 tháng 05 năm 2019


MỤC LỤC
3.1 Giới thiệu chung

1



3.2. Audio Coding (Mã hóa Âm thanh)

2

3.2.1. Nguyên tắc cơ bản.........................................................................................2
3.2.2. Mặt nạ (tính che đậy) của các thành phần âm thanh.....................................4
3.2.3. Mô hình âm thanh - tâm lý............................................................................5
3.2.4. Bộ lọc............................................................................................................7
3.2.5. Xác định các yếu tố tỷ lệ...............................................................................8
3.2.6. Phân bổ bit và mã hóa thông tin phân bổ bit.................................................8
3.2.7. Định lượng và mã hóa các mẫu băng con.....................................................9
3.2.8. Cấu trúc luồng bit lớp II................................................................................9
3.2.9. Giải mã âm thanh lớp II..............................................................................10
3.3 Đặc điểm và tính năng của MPEG-1 Layer II cho DAB 11

3.3.1 Hệ thống âm thanh.......................................................................................11
3.3.2 Tỷ lệ lấy mẫu và độ phân giải đầu vào........................................................12
3.3.3 Cấu trúc khung âm thanh DAB....................................................................12
3.3.4 Tốc độ bit âm thanh.....................................................................................13
3.3.5 Lớp II có phù hợp cho DAB không?...........................................................15
3.4 Dữ liệu liên quan đến chương trình 16

3.4.1 Chức năng của điều khiển dải động.............................................................17
3.4.2 Chức năng của Điều khiển âm nhạc/lời nói (M /S).....................................18
3.4.3 Cơ chế vận chuyển của dữ liệu DRC và M/S..............................................19


Bảng phân chia công việc


Nguyễn Thị Hồng

3.1-3.2.3

Lê Đức Nam

3.2.4-3.3.2

Trần Thanh Phong

3.3.3-3.4.3


Bài tiểu luận Kỹ thuật phát thanh truyền hình
3
Ứng dụng và dịch vụ âm thanh
Thomas Boltze, Neil Gilchrist, Wolfgang Hoeg và Gerhard Stoll
3.1 Giới thiệu chung
Hệ thống phát thanh kỹ thuật số được thiết kế để cung cấp dịch vụ vô tuyến
và dịch vụ dữ liệu ngoài.Dịch vụ âm thanh sử dụng MPEG Audio Layer II cung cấp
âm thanh đơn và âm thanh nổi, các trường trình đa kênh dành cho người nghe.Mặc
dù các ứng dụng của máy thu phát sóng đầu tiên sẽ chỉ cung cấp các chương trình
âm thanh nổi, nhưng khi chuyển sang dịch vụ đa kênh vẫn được sử dụng trong hệ
thống.Trong Internet dụng lượng dữ liệu của hệ thống phát thanh kỹ thuật số được
sử dụng cho các dịch vụ rất giống nhau.
Với sự ra đời của đĩa compact và định dạng PCM 16 bit, kỹ thuật số âm
thanh trở nên phổ biến, mặc dù tốc độ bit của nó là 706 kbit / s trên mỗi kênh đơn
âm là khá cao. Trong độ phân giải sản xuất âm thanh lên đến PCM 24 bit đang
được sử dụng. Thấp hơn tốc độ bit là bắt buộc nếu tín hiệu âm thanh được truyền
qua các kênh bị giới hạn dung lượng hoặc sẽ được lưu trữ trong phương tiện lưu trữ

có dung lượng hạn chế.Do vậy, để làm giảm tỷ lệ PCM người ta dùng mã hoá âm
thanh.Tuy nhiên kỹ thuật mã hoá âm thanh ban đầu thì chất lượng lượng âm thanh
không tốt.Chính vì vậy kỹ thuật mã hoá âm thanh mới để sử dụng âm thanh chất
lượng cao dựa trên các tính chất nhận thức âm thanh của con người như khai thác
quang phổ và thời gian tác dụng lên tai người. Chất lượng âm thanh được tái tạo
phải tốt như thu được bằng PCM 16 bit với tốc độ lấy mẫu 44,1 hoặc 48 kHz.Với
tốc độ bít thấp nhất mà mức độ tổ hợp tiền mã hoá thích hợp, mà không có sự khác
biệt rõ ràng giữa âm thanh gốc và tín hiệu âm thanh giải mã được tái tạo thì khi đó
ta đạt mức tối ưu. Một hệ thống mã hóa nguồn như vậy, gần đây được tiêu chuẩn
hóa bởi ISO/ IEC là Âm thanh MPEG-1 và Âm thanh MPEG-2, cho phép giảm tốc
độ bit từ 768 kbit / s xuống còn khoảng 100 kbit / s trên mỗi kênh đơn âm duy trì
chất lượng chủ quan của tín hiệu phòng thu kỹ thuật số cho bất kỳ tín hiệu quan
trọng nào. Mức tăng cao này trong mã hóa là có thể bởi vì tiếng ồn được điều chỉnh

Nhóm 4

1


Bài tiểu luận Kỹ thuật phát thanh truyền hình
phù hợp với mặt nạ các ngưỡng và chỉ những chi tiết của tín hiệu được truyền đi sẽ
được cảm nhận bởi người nghe.
3.2. Audio Coding (Mã hóa Âm thanh)
3.2.1. Nguyên tắc cơ bản
Có 2 cơ chế có thể được sử dụng để giảm tốc độ bit của tín hiệu âm thanh.
Một cơ chế được xác định chủ yếu bằng cách loại bỏ sự dư thừa của tín hiệu âm
thanh bằng cách sử dụng tương quan thống kê. Ngoài ra, chương trình mã hóa mới
này làm giảm sự không liên quan của tín hiệu âm thanh bằng cách xem xét các hiện
tượng âm thanh, như mặt nạ quang phổ và thời gian. Chỉ với cả hai kỹ thuật này, sử
dụng mối tương quan thống kê và hiệu ứng che lấp của tai người, có thể giảm đáng

kể tốc độ bit xuống tới 200 kbit/s trên mỗi tín hiệu lập thể và dưới đây có thể thu
được.
Sơ đồ khối bộ mã hóa của MPEG Audio Layer II, được gọi là
‘‘MUSICAM” trong suốt thời gian phát triển và trước khi chuẩn hóa trong ISO /
IEC, được hiển thị trong Hình 3.1. Do đó, Lớp II giống hệt với sơ đồ mã hóa
MUSICAM, trong khi đó Lớp I phải được hiểu là một phiên bản đơn giản hóa của
hệ thống MUSICAM. Cấu trúc cơ bản của kỹ thuật mã hóa ít nhiều phổ biến đối
với cả hai, Lớp I và Lớp II, được đặc trưng bởi thực tế là âm thanh MPEG dựa trên
mã hóa âm thanh tri giác.
Một trong những chức năng cơ bản của bộ mã hóa là ánh xạ tín hiệu đầu
vào PCM rộng 20 kHz từ miền thời gian thành các thành phần phổ được lấy mẫu
phụ. Đối với cả hai lớp, một bộ lọc đa âm bao gồm 32 dải con cách đều nhau được
sử dụng để cung cấp chức năng này.
Đầu ra của biến đổi Fourier được áp dụng cho tín hiệu âm thanh PCM
băng thông rộng song song với quá trình lọc, được sử dụng để tính toán ước tính
ngưỡng thực tế phụ thuộc vào thời gian. Với mục đích này, một mô hình âm thanh
tâm lý, dựa trên các quy tắc từ âm học tâm lý, được sử dụng như một khối chức
năng bổ sung trong bộ mã hóa. Khối này mô phỏng quang phổ, đến một mức độ
nhất định, mặt nạ tạm thời cũng vậy. Các mẫu băng con được định lượng và mã hóa
với ý định giữ nhiễu, được đưa ra bằng cách định lượng, dưới ngưỡng che lấp. Lớp
I và II sử dụng kỹ thuật nén khối với hệ số tỷ lệ gồm 6 bit hợp lệ cho dải động
Nhóm 4

2


Bài tiểu luận Kỹ thuật phát thanh truyền hình
khoảng 120 dB và chiều dài khối của 12 mẫu băng con. Với loại kỹ thuật chia tỷ lệ
này, Lớp I và Lớp II có thể xử lý dải động cao hơn nhiều so với CD hoặc DAT, đó
là PCM 16 bit thông thường.


Trong trường hợp tín hiệu âm thanh stereo, tùy chọn mã hóa “Joint
Stereo” có thể được sử dụng như một tính năng bổ sung. Nó khai thác sự dư thừa
và không liên quan của vật liệu chương trình lập thể điển hình và có thể được sử
dụng để tăng chất lượng âm thanh ở tốc độ bit thấp và (hoặc) giảm tốc độ bit cho
tín hiệu lập thể. Sự gia tăng độ phức tạp của bộ mã hóa nhỏ và độ phức tạp của bộ
giải mã bổ sung không đáng kể là điều bắt buộc. Điều quan trọng là phải đề cập
rằng mã hóa âm thanh nổi chung không làm tăng độ trễ mã hóa tổng thể.
Sau khi mã hóa tín hiệu âm thanh, một khối lắp ráp được sử dụng để tạo
khung cho luồng âm thanh MPEG Audio bao gồm các khung âm thanh liên tiếp.
Bản chất dựa trên khung của MPEG Layer II dẫn đến độ trễ thông qua
chuỗi mã hóa/giải mã theo thứ tự của hai khung (48 ms) khi không tính đến việc xử
lý và liên kết để truyền. Độ trễ điển hình thông qua các chuỗi truyền thực sự là 80
ms.

Nhóm 4

3


Bài tiểu luận Kỹ thuật phát thanh truyền hình
3.2.2. Mặt nạ (tính che đậy) của các thành phần âm thanh
Để giảm tốc độ bit của tín hiệu âm thanh trong khi vẫn giữ băng thông,
cấu trúc động và cân bằng điều hòa, bộ giải mã âm thanh phải giảm kích thước
bước định lượng của tín hiệu. Tín hiệu CD thường được lượng tử hóa với 16 bit
trên mỗi mẫu, điều này cho sóng hình sin 0 dBFS dẫn đến tỷ lệ nhiễu tín hiệu lượng
tử hóa là 96 dB.
Giảm kích thước bước lượng tử hóa sẽ làm tăng nhiễu lượng tử hóa so với
tín hiệu âm thanh. Nếu hệ thống thính giác của con người dễ bị ảnh hưởng bởi sự
gia tăng này trong mọi điều kiện, chúng ta không thể giảm tốc độ bit.

May mắn, tai là một cơ quan rất không hoàn hảo. Khi chúng ta tiếp xúc
với âm ở một tần số, điều này sẽ kích thích tai trong và tế bào thần kinh trong ốc tai
theo cách mà tín hiệu gần (tần số) với tín hiệu này có thể không nghe thấy được,
nếu mức độ của chúng đủ thấp. Hiệu ứng này, được gọi là mặt nạ, giảm theo
khoảng cách của mặt nạ và tín hiệu bị che.
Điểm không hoàn hảo thứ hai là thực tế chúng ta không nghe thấy tín hiệu
âm thanh dưới một mức nhất định. Điều này tạo thành một ngưỡng nghe tuyệt đối.
Cả hai hiệu ứng khác nhau đối với con người và đã được đo lường trong
quá khứ. Chúng tạo thành cơ sở của mã hóa nhận thức. Cách để khai thác các hiệu
ứng này trong tiền mã hóa là chia tín hiệu thành các vùng tần số nhỏ và tăng nhiễu
lượng tử hóa ở từng vùng tần số sao cho càng lớn càng tốt trong khi vẫn bị các tín
hiệu trong vùng tần số đó che lấp.
Hiệu ứng che lấp của một âm hình sin đơn và sự kết hợp của nó với
ngưỡng nghe tuyệt đối được mô tả trong Hình 3.2. Hai âm sin bị che đi cũng được
thể hiện trong hình.
Trong Hình 3.3, cùng một lượng nhiễu đã được thêm vào âm hình sin. Ở
phần bên trái của hình, nhiễu có biên độ bằng nhau trên tất cả các tần số và do đó
có thể nghe được. Ở nửa bên phải của hình, nhiễu có cùng năng lượng nhưng được
định hình theo đường cong che lấp. Trong trường hợp này, tiếng ồn là không thể
nghe thấy. Trong tiền mã hóa âm thanh MPEG, việc định hình nhiễu được thực hiện
bằng cách chia tín hiệu thành 32 băng con trước khi giảm kích thước bước lượng tử
hóa.
Nhóm 4

4


Bài tiểu luận Kỹ thuật phát thanh truyền hình

Các đặc tính che lấp đã được đo cho các âm hình sin đơn và cho các tín hiệu nhiễu

băng hẹp. Số lượng mặt nạ phụ thuộc vào bản chất của tín hiệu và hơn nữa là mức
độ cảm nhận của tín hiệu. Tín hiệu càng mạnh thì mặt nạ càng mạnh. Do đó, cần
phải đo âm lượng của một thành phần để quyết định tính chất che lấp của nó. Một
giả định sẵn sàng được thực hiện trong mã hóa nhận thức là việc che dấu cũng xảy
ra đối với các tín hiệu phức tạp, chẳng hạn như âm nhạc và lời nói.
3.2.3. Mô hình âm thanh - tâm lý
Mô hình âm thanh tâm lý tính toán ngưỡng che khuất tối thiểu, đó là yếu
tố cần thiết để xác định mức độ tiếng ồn đáng chú ý cho mỗi dải trong bộ lọc.
Ngưỡng mặt nạ tối thiểu là tổng của tất cả các đường cong mặt nạ riêng lẻ như
được mô tả trong phần trước. Sự khác biệt giữa mức tín hiệu tối đa và ngưỡng che
khuất tối thiểu được sử dụng trong phân bổ bit hoặc nhiễu để xác định mức lượng
tử hóa thực tế trong mỗi băng con cho mỗi khối. Có 2 mô hình âm thanh - tâm lý cơ
bản được đưa ra trong phần thông tin của tiêu chuẩn MPEG-1 [IS 11172]. Mặc dù
cả hai đều có thể được áp dụng cho bất kỳ lớp nào của thuật toán MPEG Audio,
nhưng trong thực tế, hầu hết các bộ mã hóa đều sử dụng mô hình 1 cho Lớp I và II.
Trong cả hai mô hình âm thanh tâm lý, đầu ra cuối cùng của mô hình là tỷ lệ tín
Nhóm 4

5


Bài tiểu luận Kỹ thuật phát thanh truyền hình
hiệu trên mặt nạ cho mỗi băng con của Lớp II. Một mô hình âm thanh - tâm lý rất
cần thiết chỉ trong bộ mã hóa. Điều này cho phép các bộ giải mã có độ phức tạp ít
hơn đáng kể. Do đó, có thể cải thiện hiệu suất của bộ mã hóa ngay cả sau này, bằng
cách liên quan đến tỷ lệ tốc độ bit và chất lượng chủ quan. Đối với một số ứng
dụng không yêu cầu tốc độ bit rất thấp, thậm chí có thể sử dụng một bộ mã hóa rất
đơn giản mà không cần bất kỳ mô hình tâm lý nào.
Cơ sở cơ bản để tính ngưỡng che khuất trong bộ mã hóa được đưa ra bằng
kết quả của các phép đo ngưỡng bị che cho các tín hiệu băng tần hẹp khi xem xét

nhiễu âm che và ngược lại. Liên quan đến khoảng cách về tần số và sự khác biệt về
mức áp suất âm thanh, các mối quan hệ mặt nạ/giai điệu thử nghiệm rất hạn chế và
nhân tạo được mô tả trong tài liệu. Các kết quả trường hợp xấu nhất liên quan đến
độ dốc trên và dưới của các đường cong mặt nạ đã được xem xét, giả sử rằng các
ngưỡng mặt nạ giống nhau có thể được sử dụng cho cả tình huống âm thanh đơn
giản và âm thanh phức tạp.
Đầu ra của FFT được sử dụng để xác định các mặt nạ âm có liên quan
(nghĩa là hình sin) và không âm (tức là nhiễu) của tín hiệu âm thanh thực tế. Nó
được biết đến từ nghiên cứu tâm lý học âm thanh rằng âm sắc của một thành phần
mặt nạ có ảnh hưởng đến ngưỡng mặt nạ. Vì lý do này, nó rất đáng để phân biệt
giữa các thành phần âm và phi âm.
Chúng ta cũng biết rằng nhận thức về âm điệu của một thành phần phụ
thuộc vào thời gian. Một giai điệu thuần khiết không được coi là âm điệu ban đầu
và tích tụ theo thời gian. Sự phụ thuộc thời gian này là một phần của các mô hình
âm thanh - tâm lý phức tạp hơn.
Ngưỡng mặt nạ riêng cho từng mặt nạ trên ngưỡng che khuất tuyệt đối
được tính tùy thuộc vào vị trí tần số, mức độ lớn và âm sắc. Tất cả các ngưỡng mặt
nạ riêng lẻ, bao gồm ngưỡng tuyệt đối, được thêm vào ngưỡng được gọi là ngưỡng
mặt nạ toàn cầu. Đối với mỗi băng con, giá trị tối thiểu của đường cong mặt nạ này
được xác định. Cuối cùng, sự khác biệt giữa mức tín hiệu tối đa được tính theo cả
hai yếu tố tỷ lệ và phổ mật độ công suất của FFT và ngưỡng che khuất tối thiểu
được tính cho từng băng con và từng khối.

Nhóm 4

6


Bài tiểu luận Kỹ thuật phát thanh truyền hình
Độ dài khối cho Lớp II được xác định bởi 36 mẫu băng con, tương ứng

với 1152 mẫu PCM âm thanh đầu vào. Sự khác biệt này của mức tín hiệu tối đa và
ngưỡng mặt nạ tối thiểu được gọi là tỷ lệ tín hiệu trên mặt nạ (SMR) và là hàm đầu
vào có liên quan để phân bổ bit.
3.2.4. Bộ lọc
Độ phân giải tần số cao là các dải con nhỏ ở vùng tần số thấp hơn, trong
khi độ phân giải thấp hơn ở vùng tần số cao hơn với dải tần rộng sẽ là cơ sở để tính
toán đầy đủ các ngưỡng được che trong miền tần số. Điều này sẽ dẫn đến một cấu
trúc cây của bộ lọc. Mạng bộ lọc đa âm được sử dụng để lọc băng con có cấu trúc
song song, không cung cấp các băng con có độ rộng khác nhau. Tuy nhiên, một lợi
thế lớn của bộ lọc là điều chỉnh tối ưu các khối âm thanh theo yêu cầu của các hiệu
ứng che lấp tạm thời và tiếng vang trước không nghe được. Lợi thế lớn thứ hai là
độ trễ nhỏ và phức tạp. Để bù cho sự thiếu chính xác của phân tích phổ của bộ lọc,
1 biến đổi FFT 1024-điểm dành cho Lớp II được sử dụng song song với quá trình
lọc tín hiệu âm thanh thành 32 băng tần phụ.
Bộ lọc QMF nguyên mẫu có thứ tự 511, được tối ưu hóa về độ phân giải
phổ và loại bỏ các búp (tốt hơn 96 dB). Điều này là cần thiết để loại bỏ đủ các biến
dạng răng cưa. Bộ lọc này cung cấp sự trao đổi hợp lý giữa hành vi tạm thời ở một
bên và độ chính xác quang phổ ở phía bên kia. Ánh xạ thời gian/tần số cung cấp số
lượng băng tần phụ cao tạo điều kiện giảm tốc độ bit, do thực tế là tai người nhận
thấy thông tin âm thanh trong miền phổ với độ phân giải tương ứng với các dải tới
hạn của tai hoặc thậm chí thấp hơn. Các dải tần quan trọng này có độ rộng khoảng
100 Hz ở vùng tần số thấp, dưới 500 Hz và độ rộng khoảng 20% tần số trung tâm ở
tần số cao hơn.
Yêu cầu phải có độ phân giải phổ tốt mâu thuẫn với sự cần thiết phải giữ
đáp ứng xung tạm thời (trước và sau tiếng vang) trong giới hạn nhất định về vị trí
và biên độ tạm thời so với sự tấn công của âm thanh bộ gõ . Kiến thức về hành vi
che dấu tạm thời cho thấy vị trí và biên độ thời gian cần thiết của tiếng vang trước
được tạo bởi ánh xạ thời gian/tần số theo cách mà tiếng vang trước (thường là quan
trọng hơn nhiều so với tiếng vang sau) bị che dấu bởi cuộc tấn công ban đầu. Kết
hợp với bộ lọc tổng hợp kép nằm trong bộ giải mã, kỹ thuật lọc này cung cấp chức

năng chuyển toàn cầu được tối ưu hóa về mặt nhận thức đáp ứng xung hoàn hảo.
Nhóm 4

7


Bài tiểu luận Kỹ thuật phát thanh truyền hình
3.2.5. Xác định các yếu tố tỷ lệ
Các mẫu băng con được thể hiện bằng sự kết hợp giữa hệ số tỷ lệ và giá
trị mẫu thực tế. Hệ số tỷ lệ là một đại diện thô của biên độ của một mẫu riêng lẻ
hoặc một nhóm mẫu. Cách tiếp cận này cho phép giảm tốc độ bit cao hơn so với mã
từng mẫu riêng lẻ.
Việc tính toán hệ số tỷ lệ cho từng băng con được thực hiện cho một khối
gồm 12 mẫu băng con. Tối đa giá trị tuyệt đối của 12 mẫu này được xác định và
định lượng với độ dài từ 6 bit, bao trùm dải động tổng thể 120 dB trên mỗi băng
con với độ phân giải 2 dB trên mỗi lớp hệ số tỷ lệ. Trong Lớp I, một hệ số tỷ lệ
được truyền cho từng khối và từng băng con, không có phân bổ bit 0.
Lớp II sử dụng mã hóa bổ sung để giảm tốc độ truyền cho các yếu tố tỷ
lệ. Do thực tế là trong Lớp II, một khung tương ứng với 36 mẫu băng con, gấp ba
lần chiều dài của khung Lớp I, theo nguyên tắc ba yếu tố tỷ lệ phải được truyền đi.
Để giảm tốc độ bit cho các yếu tố tỷ lệ, một chiến lược mã hóa khai thác các hiệu
ứng che lấp tạm thời của tai đã được nghiên cứu. Ba yếu tố tỷ lệ liên tiếp của mỗi
dải con của một khung được xem xét cùng nhau và được phân loại thành các mẫu
yếu tố tỷ lệ nhất định. Tùy thuộc vào mẫu, một, hai hoặc ba yếu tố tỷ lệ được
truyền cùng với thông tin chọn hệ số tỷ lệ bổ sung bao gồm 2 bit trên mỗi băng con.
Nếu chỉ có độ lệch nhỏ từ yếu tố tỷ lệ này sang yếu tố tiếp theo, thì chỉ có yếu tố
lớn hơn phải được truyền đi. Điều này xảy ra tương đối thường xuyên cho âm thanh
cố định. Nếu các cuộc tấn công của âm thanh gõ phải được mã hóa, hai hoặc cả ba
yếu tố quy mô phải được truyền đi, tùy thuộc vào biên tăng và giảm của cuộc tấn
công.

Kỹ thuật mã hóa bổ sung này cho phép trung bình hệ số 2 trong việc giảm
tốc độ bit cho các yếu tố tỷ lệ so với Lớp I.
3.2.6. Phân bổ bit và mã hóa thông tin phân bổ bit
Trước khi điều chỉnh tốc độ bit cố định, số lượng bit có sẵn để mã hóa các
mẫu phải được xác định. Con số này phụ thuộc vào số lượng bit cần thiết cho các
yếu tố tỷ lệ, thông tin chọn hệ số tỷ lệ, thông tin phân bổ bit và dữ liệu phụ trợ.
Quy trình phân bổ bit được xác định bằng cách giảm thiểu tổng tỷ lệ
nhiễu trên mặt nạ trên mỗi băng con và toàn khung. Quy trình này là một quy trình
Nhóm 4

8


Bài tiểu luận Kỹ thuật phát thanh truyền hình
lặp, trong đó, trong mỗi bước lặp, số lượng mức lượng tử hóa của băng con có lợi
ích lớn nhất được tăng lên với ràng buộc là số bit được sử dụng không vượt quá số
bit có sẵn cho khung đó. Lớp II chỉ sử dụng 4 bit để mã hóa thông tin phân bổ bit
cho mức thấp nhất và chỉ có 2 bit cho dải cao nhất, băng con trên mỗi khung âm
thanh.
3.2.7. Định lượng và mã hóa các mẫu băng con
Đầu tiên, mỗi băng con trong số 12 mẫu băng con của một khối được
chuẩn hóa bằng cách chia giá trị của nó cho hệ số tỷ lệ. Kết quả được lượng tử hóa
theo số lượng bit được sử dụng bởi khối phân bổ bit. Chỉ có số lẻ các mức lượng
hóa là có thể, cho phép biểu diễn chính xác số 0. Lớp I sử dụng 14 lớp lượng tử hóa
khác nhau, chứa 2n - 1 bước, với 2 ≤ n ≤ 15 mức lượng hóa khác nhau. Điều này là
giống nhau cho tất cả các băng con. Ngoài ra, không thể sử dụng lượng tử hóa nếu
không có bit nào được phân bổ cho một băng con.
Trong lớp II, số lượng các mức lượng tử hóa khác nhau phụ thuộc vào số
băng con, nhưng phạm vi của các mức lượng hóa luôn bao gồm phạm vi từ 3 đến
65535 với khả năng bổ sung không có lượng tử hóa nào cả. Các mẫu của các dải

con trong vùng tần số thấp có thể được định lượng bằng 15, trong dải tần số trung
bình với bảy và trong dải tần số cao chỉ với ba mức lượng tử hóa khác nhau. Các
lớp có thể chứa 3, 5, 7, 9, 15, 63, ..., 65535 mức lượng hóa. Do các mức lượng tử
hóa 3, 5 và 9 không cho phép sử dụng hiệu quả một từ mã, chỉ bao gồm 2, 3 hoặc 4
bit, ba mẫu băng con liên tiếp được nhóm lại với nhau thành một “khối hạt”. Sau
đó, hạt được mã hóa với một từ mã. Mức tăng mã hóa bằng cách sử dụng nhóm lên
tới 37,5%. Do nhiều băng con, đặc biệt là ở vùng tần số cao, thường được lượng tử
hóa chỉ với các mức lượng hóa 3, 5, 7 và 9, nên hệ số giảm độ dài của từ mã là rất
đáng kể.
3.2.8. Cấu trúc luồng bit lớp II
Luồng bit của Lớp II được xây dựng theo cách có thể sử dụng bộ giải mã
có độ phức tạp thấp và độ trễ giải mã thấp và tín hiệu âm thanh được mã hóa chứa
nhiều điểm vào với khoảng thời gian ngắn và không đổi. Biểu diễn kỹ thuật số
được mã hóa của một thuật toán mã hóa hiệu quả đặc biệt phù hợp để lưu trữ ứng
dụng phải cho phép nhiều điểm nhập trong luồng dữ liệu được mã hóa để ghi, phát
Nhóm 4

9


Bài tiểu luận Kỹ thuật phát thanh truyền hình
và chỉnh sửa các chuỗi âm thanh ngắn và để xác định chính xác các vị trí chỉnh sửa.
Để phát sóng, điều này rất quan trọng để cho phép chuyển đổi nhanh giữa các
chương trình âm thanh khác nhau.
Để cho phép thực hiện đơn giản bộ giải mã, khung giữa các điểm nhập đó
phải chứa tất cả thông tin cần thiết để giải mã luồng bit. Do các ứng dụng khác
nhau, một khung như vậy phải mang thêm tất cả thông tin cần thiết để cho phép
phạm vi mã hóa lớn với nhiều tham số khác nhau. Định dạng của luồng bit âm
thanh được mã hóa cho Lớp II được hiển thị trong Hình 3.4. Các khung âm thanh
ngắn, tự trị tương ứng với 1152 mẫu PCM đặc trưng cho cấu trúc của luồng bit.

Mỗi khung âm thanh bắt đầu bằng một tiêu đề, theo sau là thông tin phân bổ bit, hệ
số tỷ lệ và các mẫu băng con được lượng tử hóa và mã hóa. Ở cuối mỗi khung âm
thanh là trường dữ liệu phụ trợ có độ dài thay đổi có thể được chỉ định cho các ứng
dụng nhất định. Mỗi khung có thể được truy cập và giải mã trên chính nó. Với tần
số lấy mẫu 48 kHz, thời lượng khung hình là 24 ms cho Lớp II.

Hình 3.4 Cấu trúc khung âm thanh của luồng bit được mã hóa MPEG-1 Lớp II
3.2.9. Giải mã âm thanh lớp II
Sơ đồ khối của bộ giải mã được hiển thị trong Hình 3.5. Trước hết, thông
tin tiêu đề, kiểm tra CRC và 12 mẫu liên tiếp của mỗi tín hiệu băng con được trích
xuất từ luồng bit ISO / MPEG / AUDIO Lớp II.
Quá trình tái cấu trúc để thu được âm thanh PCM một lần nữa được đặc
trưng bằng cách điền vào định dạng dữ liệu của các mẫu băng con liên quan đến hệ
số tỷ lệ và phân bổ bit cho từng băng con và khung. Bộ lọc tổng hợp tái tạo lại tín
Nhóm 4

10


Bài tiểu luận Kỹ thuật phát thanh truyền hình
hiệu âm thanh băng thông rộng hoàn chỉnh với băng thông lên tới 24 kHz. Quá
trình giải mã tính toán ít hơn đáng kể so với quá trình mã hóa. Mối quan hệ cho
Lớp II là khoảng 1/3. Do tính toán dễ dàng và cấu trúc đơn giản của thuật toán, Lớp
II có thể được thực hiện dễ dàng trong các chip VLSI đặc biệt. Kể từ năm 1993, do
đó, chip giải mã âm thanh nổi và đa kênh đã có sẵn từ nhiều nhà sản xuất.

Hình 3.5 Sơ đồ khối của bộ giải mã MPEG-1 Audio Layer II
3.3 Đặc điểm và tính năng của MPEG-1 Layer II cho DAB
Hệ thống mã hóa nguồn DAB EU147 cho phép máy thu phát sóng âm
thanh kỹ thuật số sử dụng bộ giải mã chuẩn MPEG-1 và MPEG-2 Layer II. Bên

cạnh việc phát ra tín hiệu phát âm thanh kỹ thuật số, kỹ thuật mã hóa MPEG Audio
Layer II và luồng bit âm thanh được mã hóa của nó có thể được sử dụng trong một
số ứng dụng khác, bao gồm đóng góp giữa các phòng phát sóng, phân phối chính
và phụ và báo cáo tin tức / thể thao liên kết. Các ứng dụng khác nhau này yêu cầu
sơ đồ mã hóa linh hoạt cung cấp nhiều tham số, đặc biệt là tốc độ bit, chế độ âm
thanh (ví dụ như biểu diễn đơn âm, âm thanh nổi và đa kênh), mức độ bảo vệ của
luồng bit được mã hóa và khả năng mang theo Chương trình Dữ liệu (PAD), cho
phép các ứng dụng hoàn toàn mới.
3.3.1 Hệ thống âm thanh.
Hệ thống mã hóa âm thanh, được sử dụng trong Eureka 147 DAB, hỗ trợ các chế
độ sau:
- Chế độ mono (một kênh).
Nhóm 4

11


Bài tiểu luận Kỹ thuật phát thanh truyền hình
- Chế độ âm thanh nổi (hai kênh).
- Chế độ kênh đôi.
Trong chế độ này, hai kênh âm thanh có thể là song ngữ, hoặc hai kênh đơn
sắc, nhưng chỉ có một tiêu đề. Tại bộ giải mã, một lựa chọn được đưa ra trên đó
trong hai chương trình nên được giải mã.
- Chế độ âm thanh nổi chung
Trong chế độ Âm thanh nổi chung, bộ mã hóa khai thác sự dư thừa và không
liên quan của tín hiệu âm thanh để giảm dữ liệu hơn nữa. Phương pháp được sử
dụng cho Âm thanh nổi chung trong lớp II là mã hóa âm thanh stereo cường độ âm
thanh. Kỹ thuật này vẫn bảo toàn đường bao phổ của kênh trái và phải của tín hiệu
âm thanh nổi, nhưng chỉ truyền tín hiệu tổng của các mẫu băng tần phụ của kênh
trái và phải trong vùng tần số âm thanh cao.

- Mã hóa tần số lấy mẫu thấp với fS 24 kHz.
- Các quy định được thực hiện theo tiêu chuẩn Eureka 147 DAB để đưa vào của mã
hóa Âm thanh vòm tương thích ngược MPEG-2 Audio Layer II 5.1.
3.3.2 Tỷ lệ lấy mẫu và độ phân giải đầu vào
Thuật toán mã hóa âm thanh của DAB cho phép hai tốc độ lấy mẫu: 48 kHz
và 24 kHz. Tốc độ lấy mẫu cao hơn có thể được chọn để có băng thông âm thanh
đầy đủ 20 kHz cho tín hiệu truyền đi và cho phép truyền phát trực tiếp tín hiệu
phòng thu mà không cần chuyển đổi tốc độ lấy mẫu. Chất lượng âm thanh của tín
hiệu PCM được cải thiện khi tăng độ phân giải của tín hiệu đầu vào. Do đó, chuẩn
MPEG Audio Layer II có thể xử lý độ phân giải của tín hiệu đầu vào lên đến 22
bit / mẫu.
Lưu ý: Ngược lại với các hệ thống phát sóng khác (ví dụ: ADR), tần số lấy
mẫu là 44,1 kHz không được áp dụng, điều đó có nghĩa là nguồn được lấy từ CD
phải được chuyển đổi tốc độ mẫu.
Tốc độ bit thấp hơn có thể được chọn để cung cấp chất lượng cao, đặc biệt là tín
hiệu giọng nói ở tốc độ bit rất thấp, đó là ở tốc độ bit 64 kbit / s trên mỗi kênh. Tuy
nhiên, điều này không có nghĩa là tần số lấy mẫu mới sẽ được đưa ra bên ngoài hệ
thống DAB. Thay vào đó, bộ lọc lấy mẫu xuống từ 48 kHz đến 24 kHz trong bộ mã
hóa âm thanh và bộ lọc lấy mẫu tăng từ 24 kHz đến 48 kHz trong bộ giải mã được
sử dụng.
Nhóm 4

12


Bài tiểu luận Kỹ thuật phát thanh truyền hình
3.3.3 Cấu trúc khung âm thanh DAB
Khung âm thanh DAB dựa trên khung âm thanh MPEG Layer II bao gồm tất
cả thông tin chính và thông tin phụ cần thiết cho bộ giải mã để tạo lại tín hiệu âm
thanh ở đầu ra. Ngoài ra, mỗi khung âm thanh DAB chứa một số byte có thể được

sử dụng để mang PAD, đó là thông tin có liên quan mật thiết đến chương trình âm
thanh. Cấu trúc này được mô tả trong Hình 3.6. Trường PAD chứa 2 byte PAD cố
định (F-PAD) và một phần mở rộng tùy chọn được gọi là PAD mở rộng (X-PAD).
Các chức năng có sẵn cho PAD bao gồm Kiểm soát phạm vi động (DRC), chỉ báo
nhạc /giọng nói, văn bản liên quan đến chương trình và bảo vệ lỗi bổ sung.
3.3.4 Tốc độ bit âm thanh
Tùy thuộc vào loại chương trình, số lượng chương trình trong bộ ghép kênh
DAB và mức bảo vệ, tốc độ bit khác nhau trong khoảng 32 đến 192 kbit / s ở chế
độ kênh đơn có thể được chọn tại bộ mã hóa âm thanh. Sự lựa chọn tốc độ bit
không hoàn toàn độc lập với chế độ âm thanh. Tùy thuộc vào tốc độ bit, các chế độ
âm thanh được cho trong Bảng 3.1 có thể được sử dụng. Bất kỳ sự kết hợp nào của
các tùy chọn này có thể được sử dụng trong bộ ghép DAB. Đối với mã hóa tốc độ
lấy mẫu một nửa là 24 kHz.

STUFF

CRC

SCFSI

B vS4S bSF
A XAbS fF
a XyCH itu Sau
-Det
Cm-tiF
E Ad c rib
b
P te
F xP
A lli a a- ypr- Pee

AP
C
D oo l bbt lpr
A
b
Cd
DA
E cDe l aeeot
RDyRD
Nhóm
4
R aa F enssec
CtsC
tit a sd te ei
oa c i d Lz

13


r
s

ar 1
t L

Bài tiểu luận Kỹ thuật phát thanh truyền hình
Hình 3.6: Cấu trúc của khung âm thanh DAB

Sampling
Rate


48 kHz

Mode

Single
Ch.

24 kHz

Dual
Ch.

Stereo

Int.
Stereo

All

Bit
Rate
[kbit/s]

Bit
Rate
[kbit/s]

32
48

56
64
80
96
112
128
160
192
224
256
320
384

8
16
24
32
40
48
56
64
80
96
112
128
144
160

X
X

X
X
X
X
X
X
X
X

x

X

x

x
x
x
x
x
x
x
x
x

X
X
X
X
X

X
X
X
X

x
x
x
x
x
x
x
x
x

Bảng 3.1 Chế độ âm thanh và tốc độ bit cho tốc độ lấy mẫu 48 kHz, 24 kHz
Có thể chọn 14 tốc độ bit khác nhau trong phạm vi từ 8 đến 160 kbit/s, bất kể chế
độ âm thanh đã chọn. Đối với phần mở rộng đa kênh, Bảng 3.1 chỉ hợp lệ cho
luồng bit cơ sở. Chi tiết về tỷ lệ mẫu thấp hơn và phần mở rộng đa kênh được giải
thích trong phần 3.5.
Phạm vi tốc độ bit rộng cho phép các ứng dụng yêu cầu tốc độ bit thấp và
chất lượng âm thanh cao; ví dụ, nếu chỉ có một quá trình mã hóa phải được xem
xét và xếp tầng có thể tránh được. Nó cũng cho phép các ứng dụng có tốc độ dữ
liệu cao hơn lên tới khoảng 180 kbit / s trên mỗi kênh có thể được tính nếu xếp
tầng hoặc xử lý hậu kỳ phải được tính đến. Các thí nghiệm do ITU-R thực hiện đã
Nhóm 4

14



Bài tiểu luận Kỹ thuật phát thanh truyền hình
chỉ ra rằng quy trình mã hóa có thể được lặp lại 9 lần với MPEG-1 Layer II mà
không có sự suy giảm chủ quan nghiêm trọng nào, nếu tốc độ bit đủ cao, đó là 180
kbit/s mỗi kênh. Tuy nhiên, nếu tốc độ bit chỉ là 120 kbit / s, thì không quá ba quá
trình mã hóa sẽ xảy ra.
3.3.5 Lớp II có phù hợp cho DAB không?
Hệ thống mã hóa âm thanh MPEG-1 Layer II đã được phát triển và thử
nghiệm mạnh mẽ vào đầu những năm 1990, và được chuẩn hóa để sử dụng với hệ
thống DAB vào năm 1993. Ngay cả lần sửa đổi cuối cùng của tiêu chuẩn DAB
cũng dựa trên MPEG-2 Layer II , hiện bao gồm tỷ lệ lấy mẫu thấp hơn.
Trong thời gian sau đó, một số hệ thống mã hóa âm thanh khác nhau đã được
khai thác, đặc biệt là để sử dụng với tốc độ bit rất thấp (từ 8 kbit/s đến 64 kbit/s).
Chúng đặc biệt nhắm vào các ứng dụng phát trực tuyến trên Internet và các dịch vụ
liên quan. Đây là sơ đồ mã hóa MP3 được sử dụng trên toàn thế giới (dựa trên
MPEG-1 Layer III) và hệ thống MPEG- 2/4 AAC (Mã hóa âm thanh nâng cao). Về
nguyên tắc, ở tốc độ bit thấp hơn, codec AAC có thể cung cấp chất lượng âm thanh
tốt hơn Lớp II, nhưng nó hoàn toàn không tương thích với Lớp II. Kết quả từ các
thử nghiệm khác nhau [BPN 029] cho thấy rằng chất lượng của MPEG Layer II ở
mức 192 kbit/s có thể đạt được với MPEG-2/4 AAC đã ở mức 128 kbit/s, đôi khi
cũng ở mức 96 kbit/s. Điều đó có nghĩa là hiệu quả phổ cao hơn đáng kể nếu được
sử dụng cho DAB. Do đó, câu hỏi đã được đặt ra, nếu Lớp II vẫn là lựa chọn phù
hợp để sử dụng với hệ thống DAB. Các cuộc khảo sát đã được thực hiện để so sánh
các hệ thống mã hóa. Các kết quả được mô tả như sau: MPEG-1 Layer II ở 192 kbit
/s ở 7 trong 8 trường hợp tốt hơn đáng kể so với AAC ở 96 kbit/s, và 6 trong 8
trường hợp tốt hơn AAC ở 128 kbit / s. Trong điều kiện xếp tầng hai lần, chất lượng
của AAC kém hơn Lớp II. Cũng cần lưu ý rằng sẽ có sự khác biệt đáng kể về độ trễ
thời gian xử lý giữa Lớp II (cần khoảng 70 ms) và AAC (khoảng 300 ms). Cho đến
nay những sự thật này xác nhận sự lựa chọn trước đây của Lớp II là sơ đồ mã hóa
duy nhất và độc quyền cho hệ thống DAB.
Một trong những kết quả cuối cùng của nghiên cứu mã hóa âm thanh là công

nghệ được gọi là Công nghệ tái tạo dải quang phổ (SBR). Đây là một kỹ thuật để
tăng cường hiệu quả của các codec âm thanh cảm nhận hiện có. Dựa trên mối tương
quan cao giữa các thành phần tần số thấp và cao của tín hiệu âm thanh, phần tần số
Nhóm 4

15


Bài tiểu luận Kỹ thuật phát thanh truyền hình
cao của tín hiệu âm thanh được xử lý riêng và truyền trong dữ liệu phụ trợ, do đó
bộ mã hóa âm thanh thông thường có thể tập trung vào mã hóa phần tần số thấp. Ở
phía bộ giải mã, dữ liệu SBR đó được xây dựng lại và sau đó được thêm vào phần
âm thanh tần số thấp được mã hóa. Do đó, có thể đạt được mức giảm tốc độ bit cao
hơn (tức là khoảng 30%) trong khi vẫn duy trì chất lượng âm thanh chủ quan của
chương trình. Các thử nghiệm gần đây trong EBU (Liên minh Phát thanh Châu
Âu), đã chỉ ra rằng, sự kết hợp của Tái tạo dải quang phổ (SBR) và mã hóa dạng
sóng giúp cải thiện đáng kể chất lượng âm thanh ở tốc độ bit thấp hơn. Các phiên
bản đã biết là mp3PRO và aacPlus; cái cuối cùng được dự đoán cho hệ thống phát
sóng kỹ thuật số mới ở tần số dưới 30 MHz, đây là DRM (Radio kỹ thuật số
Mondiale, xem thêm phần 1.6). Kỹ thuật SBR đặc biệt này gần đây cũng đã được
điều chỉnh theo MPEG 1/2 Layer II (đôi khi được gọi là Layer2plus hoặc Layer II
SBR), với mục tiêu cải thiện chất lượng âm thanh trong DAB ở tốc độ bit thấp. Một
trong những lợi thế quan trọng nhất là khả năng tương thích ngược với định dạng
mã hóa âm thanh hiện có trong DAB. Điều này có nghĩa là, các bộ thu DAB hiện
tại có thể dễ dàng giải mã phần II (giới hạn băng thông) của luồng bit Layer2plus.
Do đó, có thể tăng số lượng chương trình âm thanh trong DAB mà không thay đổi
định dạng mã hóa âm thanh. Tương lai gần sẽ cho thấy liệu có phù hợp để hoàn
thành tiêu chuẩn DAB theo cách đó hay không - mặc dù việc thay đổi tiêu chuẩn
theo cách này sẽ trở nên rất khó khăn
3.4 Dữ liệu liên quan đến chương trình

Hệ thống DAB không chỉ cung cấp chất lượng âm thanh rất cao cho người
nghe mà còn bao gồm việc cung cấp cho nhiều dịch vụ dữ liệu bổ sung. Phần lớn
trong số các dịch vụ dữ liệu này độc lập với chương trình âm thanh, nhưng một số
trong số chúng có liên quan chặt chẽ với tín hiệu âm thanh. Hình thức thứ hai là cái
gọi là Dữ liệu liên quan đến Chương trình (PAD). Một số byte cố định và tùy chọn
được cung cấp để mang PAD trong luồng bit âm thanh DAB, xem Hình 3.6. Dung
lượng bổ sung được cung cấp ở những nơi khác trong bộ ghép kênh DAB (hoặc bộ
ghép kênh ghép) để mang dữ liệu độc lập hơn hoặc thông tin bổ sung, như văn bản,
hình ảnh tĩnh hoặc chuyển động, xem Chương 4 và 5.
Ví dụ về Dữ liệu liên quan đến Chương trình cố định (F-PAD) bao gồm:
- Thông tin điều khiển dải động (DRC), có thể được sử dụng trong máy thu để nén
Nhóm 4

16


Bài tiểu luận Kỹ thuật phát thanh truyền hình
phạm vi động của âm thanh.
- Chỉ báo lời nói / âm nhạc để cho phép xử lý âm thanh khác nhau của âm nhạc và
lời nói (ví dụ: điều khiển âm lượng độc lập).
Vì các tính năng này liên quan trực tiếp đến tín hiệu chương trình âm thanh, chúng
được mô tả chi tiết trong phần sau. Để biết thêm chi tiết về các thông tin liên quan
đến chương trình khác được mang trong F-PAD hoặc X-PAD (Dữ liệu liên quan
đến chương trình mở rộng). Trong việc tái tạo các chương trình phát âm thanh,
thường sẽ cần phải áp dụng nén dải động cho một số loại tài liệu chương trình vì
yêu cầu của người nghe. Hơn nữa, sự cân bằng thỏa đáng về độ ồn của các loại
chương trình khác nhau, đặc biệt là âm nhạc và lời nói, chủ yếu phụ thuộc vào yêu
cầu của người nghe. Trong truyền hình thông thường, chưa bao giờ có thể thỏa
mãn những thói quen nghe khác nhau.
3.4.1 Chức năng của điều khiển dải động

Tính năng DAB DRC cho phép các đài truyền phát truyền các chương trình
với dải động rộng tương đối, kèm theo tín hiệu DRC mà người nghe có thể sử dụng
để thực hiện nén động chương trình
Phạm vi động của tín hiệu chương trình âm thanh (đôi khi được gọi là động
của chương trình) là phạm vi giữa mức tín hiệu chương trình hữu ích cao nhất và
thấp nhất. Các vấn đề liên quan đến các chương trình có dải động rộng và đạt được
sự cân bằng âm lượng thỏa đáng giữa các phần khác nhau của chương trình radio
(như lời nói hoặc âm nhạc), được biết đến từ kinh nghiệm với phát sóng VHF / FM
[Mu¨ ller, 1970] . Trong nhiều trường hợp, chương trình nguồn nhuộm hoặc dải
động thường được các đài truyền hình sử dụng (khoảng 40 dB) có thể lớn hơn
nhiều so với dải động có thể sử dụng (được gọi là động tái tạo) trong môi trường ồn
ào như trong xe hơi đang di chuyển . Mức giảm cần thiết trong dải động của
chương trình có thể là 10 đến 30 dB (hoặc hơn).
Có tính đến các điều kiện nghe và các yêu cầu của người nghe, những vấn đề
này chỉ có thể được giải quyết tại máy thu. Để điều này khả thi, thông tin bổ sung
phải được cung cấp bởi đài truyền hình liên quan đến các điều chỉnh khuếch đại, có
thể cần thiết để giảm phạm vi động. Do đó, tại Bộ phát sóng mở rộng tín hiệu DRC
được tạo ra ở phía phòng thu, mô tả mức tăng âm thanh được áp dụng trong máy
thu, như là một chuỗi các giá trị. Tín hiệu DRC này được truyền dưới dạng mã hóa
Nhóm 4

17


Bài tiểu luận Kỹ thuật phát thanh truyền hình
(dữ liệu DRC DRCD) cùng với tín hiệu âm thanh. Yêu cầu của đặc tả DAB là tín
hiệu âm thanh được truyền với chương trình gốc của nó, không có bất kỳ nén trước
nào. Dữ liệu DRC được kết hợp trong luồng bit DAB dưới dạng PAD. Trong máy
thu, tín hiệu DRC được tái tạo có thể được sử dụng tùy ý để kiểm soát mức tăng âm
thanh để phù hợp với dải động của chương trình âm thanh nhận được với các yêu

cầu của người nghe hoặc để cải thiện khả năng nghe trong điều kiện khó khăn.
Người dùng có thể chọn bất kỳ tỷ lệ nén thích hợp giữa các neo:
 Không nén: chương trình âm thanh được sao chép với dải động như được
phát bởi đài phát;
 Nén danh nghĩa: chương trình âm thanh được sao chép với một thích hợp
mức độ nén động được điều chỉnh bởi đài phát sóng (thông thường là dải
động được nén khoảng 1.3:1);
 Nén tối đa: chương trình âm thanh có thể được sao chép với mức nén cực
mạnh của dải động (ví dụ: > 2.0:1). Điều này có ý nghĩa trong điều kiện kém
phát lại (ví dụ: trong xe hơi) và chỉ dành cho các loại chương trình đặc biệt,
vì chất lượng âm thanh có khả năng bị ảnh hưởng.
3.4.2 Chức năng của Điều khiển âm nhạc/lời nói (M /S)
Bất kỳ loại truyền dẫn chương trình radio nào cũng được biết rằng có thể có
những yêu cầu rất khác nhau trong sự cân bằng âm lượng giữa các chương trình
âm nhạc và lời nói, tùy thuộc vào sở thích của người nghe. Tín hiệu điều khiển Âm
nhạc/lời nói (M/S), cũng được truyền trong luồng bit DAB, giờ đây cho phép
người nghe cân bằng âm lượng của các loại chương trình khác nhau theo sở thích.
Có tùy chọn để báo hiệu bốn trạng thái của cờ được gọi là M/S trong PAD:
- 00 nội dung chương trình Âm nhạc
- 01 nội dung chương trình Bài phát biểu
- 10 nội dung chương trình không được báo hiệu
- 11 dành riêng cho sử dụng trong tương lai (ví dụ: đối với chương trình có
chứa âm nhạc và lời nói với mức độ cân bằng nghệ thuật, ví dụ như một bộ
phim truyền hình hoặc âm nhạc).
Thông tin cờ M/S này có thể được tạo tự động ở phía studio (ví dụ: xuất phát
Nhóm 4

18



Bài tiểu luận Kỹ thuật phát thanh truyền hình
từ fader kênh tương ứng tại bàn điều khiển trộn). Là một mục của dữ liệu liên quan
đến chương trình, thông tin được vận chuyển trong PAD và có thể được sử dụng tại
máy thu để kiểm soát mức tín hiệu đầu ra (âm lượng) theo cách được xác định
trước, có thể trong phạ vi mức khoảng 0 đến 15 dB.
3.4.3 Cơ chế vận chuyển của dữ liệu DRC và M/S
Dữ liệu di chuyển trong kênh PAD có liên quan mật thiết đến chương trình âm
thanh. Nó được lắp ráp cùng với âm thanh được mã hóa trong cùng một khung
DAB, vì vậy mối quan hệ thời gian được thiết lập tại nguồn được duy trì trong
suốt chuỗi truyền DAB hoàn chỉnh. Âm thanh và PAD không được chịu sự chậm
trễ truyền khác nhau.
Hình 3.7 cho thấy một sơ đồ khối đơn giản hóa của hệ thống DRC cho DAB, về
nguyên tắc cũng có giá trị để truyền cờ điều khiển M/S. Tín hiệu DRC được tạo
bởi một đặc tính tuyến tính trên hầu hết phạm vi động, với tỷ lệ nén phù hợp. Một
phạm vi tổng thể của biến thiên khuếch đại khoảng 15 dB được mã hóa tuyến tính
trong một từ kỹ thuật số 6 bit, cho mỗi khung hình 24 ms của tín hiệu âm thanh
phát sóng. Mục đích là cung cấp khả năng nén dài hạn của dải động trong khi vẫn
duy trì tác động của những thay đổi mạnh mẽ trong dải động chương trình (ví dụ:
gây ra bởi một crisscendo hoặc subito fortissimo). Do đó, các thuật toán tạo sử
dụng các tập hợp cụ thể của các đặc điểm thời gian do chương trình âm thanh
kiểm soát, không phải là chủ đề của bất kỳ đặc điểm kỹ thuật nào.
Bản thân tín hiệu chương trình âm thanh DAB được truyền đi mà không có
bất kỳ nén động nào được áp dụng sau giai đoạn sản xuất/giai đoạn hậu kỳ. Trong
quá trình sản xuất một số loại chương trình, việc nén có thể được áp dụng vì lý do
nghệ thuật. Tuy nhiên, tín hiệu chương trình được nén ở giai đoạn này được xử lý
theo cách tương tự như tín hiệu không nén bởi hệ thống DRC.
Do dữ liệu DRC được truyền không liên tục theo từng đợt theo các khoảng
thời gian của một khung DAB (24 ms) nên cần có thời gian xem trước của một
khung DAB hoàn chỉnh để phân tích mức tín hiệu, để tránh bị quá mức (nghĩa là
thời gian ngắn trong đó tín hiệu tái tạo quá lớn). Điều này có nghĩa là độ trễ tối

thiểu 24 ms phải được đưa vào đường dẫn tín hiệu tại bộ tạo DRCD để tín hiệu âm
thanh đến có thể được kiểm tra trước khi tạo dữ liệu DRC. Dữ liệu DRC cho từng
khung âm thanh DAB được truyền tải theo byte L của PAD của khung âm thanh
Nhóm 4

19


Bài tiểu luận Kỹ thuật phát thanh truyền hình
DAB trước đó của tín hiệu phát. Do đó, dữ liệu DRC đến máy thu ngay trước khi
âm thanh được liên kết với nó, tránh sự chậm trễ hơn nữa được đưa ra bởi máy
thu.
Một số thuật toán điều khiển phạm vi động có thể yêu cầu độ trễ dài hơn,
vượt quá 24 ms và lên đến vài giây. Chúng sẽ được liên kết với trình tạo DRCD ở
đầu phát và sẽ không yêu cầu bất kỳ triển khai hoặc xử lý nào khác trong máy thu.

Hình 3.7 Sơ đồ khối của hệ thống DRC cho DAB

Nhóm 4

20



×