Tải bản đầy đủ (.doc) (68 trang)

PHÂN TÍCH DÒNG TRUYỀN TẢI MPEG (MPEG TRANSPORT STREAM)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (375.14 KB, 68 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Trần Văn Hoan
PHÂN TÍCH DÒNG TRUYỀN TẢI MPEG
(MPEG TRANSPORT STREAM)
KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY
Ngành: Công nghệ điện tử viễn thông
Cán bộ hướng dẫn: TS Ngô Thái Trị
HÀ NỘI - 2008
Trần Văn Hoan K49Đ Khóa luận tốt nghiệp
Tóm tắt nội dung
Luận văn được trình bày trong 3 chương :
Chương 1: Giới thiệu tổng quát nhất về chuẩn nén MPEG, lý do cần phải nén dữ
liệu, các nguyên tắc cơ bản được sử dụng trong chuẩn nén MPEG áp dụng cho dữ liệu
hình ảnh cũng như âm thanh, giới thiệu những đặc điểm chung nhất của các chuẩn nén
MPEG1, 2, 4 và 7, chương này cũng chỉ ra cách hình thành dòng bit MPEG.
Chương 2: Mô tả cách thức hình thành, cấu trúc của dòng cơ sở ES, lý do cần thiết
phải chia dòng cơ sở thành các gói, cách thức tạo ra các gói cơ sở đóng gói PES đồng
thời phân tích cấu tạo của một gói PES.
Chương 3: Phân tích cách tạo thành dòng truyền tải MPEG, hoạt động của dòng
truyền tải, phân tích chi tiết cấu tạo và nhiệm vụ của từng trường trong gói truyền tải,
cuối cùng là chỉ ra những đặc điểm ưu việt của dòng truyền tải MPEG làm cho chuẩn
nén này có những ứng dụng rộng rãi trong thực tế.
- i -
Trần Văn Hoan K49Đ Khóa luận tốt nghiệp
Mục lục
Trang phụ bìa
Tóm tắt nội dung i
Mục lục ii
Bảng các kí hiệu viết tắt iv
Mở đầu 1


Chương 1 : Tổng quan về MPEG 2
1.1. Giới thiệu 2
1.2. Ứng dụng của nén dữ liệu: 4
1.3. Mã hóa không tổn hao và mã hóa dự đoán được 5
1.4. Nguyên lí cơ bản của nén 7
1.5. Nén video 9
1.5.1. Nén trong ảnh 11
1.5.2. Nén liên ảnh 11
1.5.3. Giới thiệu về phép
bù chuyển động. 12
1.6. Giới thiệu về MPEG-1 13
1.7. MPEG-2 cùng với các Profile và Level 14
1.8. Giới thiệu về MPEG -4 16
1.9. Giới thiệu về MPEG-7 18
1.10. Nén âm thanh 18
1.11. Dòng bit MPEG 20
Chương 2: Dòng cơ sở (elementary stream) và dòng cơ sở đóng gói (packetized
elementary stream) 22
2.1. Dòng cơ sở (elementary stream) 22
2.2. Dòng cơ sở đóng gói (packetized elementary stream) 24
2.2.1. Giới thiệu chung về dòng cơ sở đóng gói 24
2.2.2. Cú pháp dòng cơ sở đóng gói 27
2.2.3. Cấu trúc chi tiết 32
Chương 3: Dòng truyền tải 38
- ii -
Trần Văn Hoan K49Đ Khóa luận tốt nghiệp
3.1. Giới thiệu chung về dòng truyền tải: 38
3.2. Chuẩn đồng hồ (clock references) 39
3.3. Giải mã dòng truyền tải 41
3.4. Phân tích cú pháp dòng truyền tải 43

3.5. Đặc điểm dòng truyền tải MPEG 60
3.6. Tính linh hoạt của dòng truyền tải: 61
Kết luận 62
Tài liệu tham khảo 63
- iii -
Trần Văn Hoan K49Đ Khóa luận tốt nghiệp
Bảng các kí hiệu viết tắt
ABU Asia-Pacific Broadcasting Union
ANSI American National Standard Institute
ATSC Advance Television System Committee
CAT Conditional Access Table
CRC Cyclical Redundancy Checking
DCT Discrete Cosine Transform
DTS Decoding Time Stamp
DVB Digital Video Broadcasting
EBU European Broadcasting Union
ES Elementary Stream
GOP Group of Picture
HDTV High-definition Television
IEC International Electrotechnical Commission
ISO International Organization for Standardization
ITU International Telecommunication Union
MPEG Moving Pictures Experts Group
NIT Network Information Table
PAT Program Association Table
PCR Program Clock Reference
PES Packetized Elementary Stream
PID Packet Identification
PMT Program Map Table
PSI Program Specific Information

PTS Presentation Time Stamp
RLC Run Length Coding
SCR System Clock Reference
SDTV Standard Definition Television
TS Transport Stream
- iv -
Trần Văn Hoan K49Đ Khóa luận tốt nghiệp
Mở đầu
Công nghệ số từ khi ra đời đã ngày càng thể hiện tính ưu việt và thay thế dần công
nghệ tương tự vốn không hiệu quả và lỗi thời. Ngày nay việc số hóa được thực hiện trên
mọi dạng thức của dữ liệu, từ văn bản tới hình ảnh và âm thanh. Các mạch điện tử tích
hợp được nghiên cứu chế tạo ngày càng nhiều có hiệu năng tính toán ngày càng cao, độ
tin cậy ngày càng chính xác làm cho công nghệ số ngày càng phát triển.
Trong xu hướng số hóa mọi dạng dữ liệu như trên thì việc số hóa tín hiệu video là
một sự tất yếu. Tuy nhiên tín hiệu video được số hóa có dung lượng quá lớn dẫn đến việc
lưu trữ và truyền dẫn hầu như không thể thực hiện được. Do đó nảy sinh nhu cầu nén tín
hiệu video. Nhiều chuẩn nén được ra đời là kết tinh công sức của các chuyên gia, các nhà
khoa học hàng đầu trên thế giới. Trong số các chuẩn nén đó thì chuẩn MPEG là chuẩn
nén phổ biến nhất, có ứng dụng rộng rãi nhất. Chuẩn nén này đã được nghiên cứu, phát
triển trong nhiều năm và đã giải quyết tốt bài toán nén tín hiệu video, kết quả là có thể
đáp ứng một cách rất đa dạng các yêu cầu trong thực tế.
Một thành phần quan trọng bậc nhất trong chuẩn nén MPEG là dòng truyền tải
MPEG (MPEG Transport Stream). Nhờ có dòng truyền tải mà dữ liệu có thể được đưa từ
nơi phát tới nơi thu một cách dễ dàng, chính xác và an toàn. Hơn nữa dòng truyền tải còn
rất mềm dẻo và linh hoạt, vừa hỗ trợ tốt cho các ứng dụng hiện tại vừa đảm bảo dễ dàng
cho sự phát triển trong tương lai.
Nhằm mục đích tìm hiểu một cách sâu sắc về cấu tạo và hoạt động của dòng truyền
tải MPEG, em đã chọn đề tài này với mong muốn có được sự hiểu biết về một chuẩn nén
có ứng dụng rộng rãi nhất trong thực tế.
Em xin chân thành cảm ơn thầy Ngô Thái Trị, người đã tận tình chỉ bảo và giúp đỡ

em trong quá trình làm luận văn, thầy đã chỉ cho em phương pháp nghiên cứu và cách
trình bày luận văn một cách khoa học. Em cũng xin cảm ơn các thầy cô trong Khoa Điện
tử viễn thông đã chỉ bảo cho em trong suốt quá trình học tập. Em xin cảm ơn gia đình và
bạn bè đã giúp đỡ để em có thể hoàn thành luận văn này.
Hà Nội, 5/2008
- 1-
Chương 1: Giới thiệu tổng quan về MPEG
Chương 1: Giới thiệu tổng quan về MPEG
1.1. Giới thiệu:
MPEG là viết tắt của cụm từ Moving Pictures Experts Group được thành lập bởi tổ
chức ISO (International Standards Organization) nhằm thiết lập chuẩn cho việc nén và
truyền tải cả dữ liệu hình ảnh và dữ liệu âm thanh.
Hình 1.1: (a) tổng quan của một hệ thống có nén, bên phía nguồn sử dụng bộ nén
gọi là compressor hay coder, bên phía nhận sử dụng bộ giải nén là expander hay decoder,
(b) minh họa sự bất đối xứng trong hệ thống, bộ mã hóa luôn phải phức tạp hơn bộ giải
mã.
Việc nén dữ liệu là tất yếu cần thiết do hai lý do chính sau đây. Thứ nhất là do lưu
trữ: dữ liệu sau khi nén có dung lượng nhỏ hơn, do vậy cần ít không gian lưu trữ hơn. Thứ
hai là do băng thông: dữ liệu sau khi nén có tốc độ bit thấp hơn nên cần băng thông ít hơn.
Tỉ lệ giữa tốc độ bit của nguồn so với tốc độ bit của kênh truyền gọi là tỉ lệ nén
Compression factor hay là Coding gain.
Hệ thống truyền tải là bất đối xứng. Bộ mã hóa cần phải thông minh để thích ứng
linh hoạt với phần dữ liệu cần mã hóa, còn bộ giải mã chỉ cần làm đơn giản để có thể hiểu
được thông tin của kênh truyền mang tới. Điều này thích hợp cho hoạt động quảng bá khi
- 2-
Nguồn dữ
liệu
Bộ giải nén
Bộ nén
Kênh truyền

Dữ liệu đã
giải nén
Bộ giải mã
đơn giản
Bộ mã hóa
phức tạp
Dòng bit
chuẩn
(a)
(b)
Dữ liệu vào
Chương 1: Giới thiệu tổng quan về MPEG
mà số lượng thiết bị mã hóa ít còn số lượng bộ giải mã là rất nhiều. Với những ứng dụng
kiểu điểm-điểm thì hướng thiết kế như vậy không thể hiện được tính ưu việt.
Hình 1.2: (a) MPEG định nghĩa giao thức giữa bộ mã hóa và bộ giải mã. (b) Hướng
thiết kế của MPEG là cho phép tạo ra bộ mã hóa tốt hơn trong tương lai nhưng vẫn đảm
bảo tương thích với bộ giải mã hiện có. (c) Chi tiết thiết kế của bộ mã hóa không nhất
thiết phải công khai, đó có thể là bí mật thương mại của nhà sản xuất.
Hướng tiếp cận của MPEG là hết sức đúng đắn bởi vì chuẩn nén này không chuẩn
hóa bộ mã hóa hay giải mã mà là chuẩn hóa dòng bít. Dòng bít đảm bảo cho sự phát triển
của bộ mã hóa trong tương lai có thể cho chất lượng tốt hơn nhưng những bộ giải mã hiện
- 3-
Bộ mã hóa Bộ giải mã
Tín hiệu Video
Tín hiệu Video
Dòng bit
MPEG
định
nghĩa
phần

này
Bộ mã hóa
không được
định nghĩa
bởi MPEG
trừ việc phải
tạo ra dòng
bit chuẩn
Bộ giải mã
phải có khả
năng hiểu
được tất cả
mọi dòng
bit chuẩn
Không định nghĩa
Bộ mã hóa hiện
tại
Bộ giải mã
hiện tại
Bộ mã hóa trong
tương lai
Bộ mã hóa có
cấu trúc bí mật
Dòng bit
chuẩn
Dòng bit
chuẩn
Dòng bit
chuẩn
Bộ giải mã hiện tại vẫn

có khả năng làm việc
Bộ giải mã có thể
làm việc được
(a)
(b)
(c)
Chương 1: Giới thiệu tổng quan về MPEG
nay vẫn có thể làm việc được, thậm chí có thể giải mã ngay cả khi bộ mã hóa là một bí
mật thương mại.
MPEG hầu như không đề cập gì về cấu trúc và hoạt động của bộ giải mã, mà chỉ đưa
ra cấu trúc của dòng bít và mọi bộ giải mã đều có khả năng giải mã dòng bit chuẩn này,
mặc dù một số thiết kế sẽ cho ra chất lượng tốt hơn thiết kế khác. Cấu trúc của bộ giải mã
không cần phải thể hiện ra dòng bít và do vậy nhà sản xuất có thể sử dụng những thuật
toán khác nhau, chi tiết trong công nghệ của họ không cần phải công khai cho tất cả cùng
biết. Điều này tạo nên sự cạnh tranh giữa các nhà sản xuất nhằm tạo ra thiết bị tối ưu nhất.
Và người sử dụng có thể có nhiều lựa chọn hơn.
MPEG không những là một chuẩn nén, mà còn định nghĩa cách thức và cú pháp để
có thể kết hợp hoặc trộn lẫn audio và video để tạo nên một chương trình truyền hình số
tương đương. Nhiều chương trình có thể kết hợp với nhau tạo ra một dòng kết hợp.
MPEG định nghĩa cách tạo và vận chuyển dòng kết hợp này. Định nghĩa này cũng nêu ra
những yêu cầu phần cứng mà bộ giải mã cần phải thỏa mãn để có thể giải mã chính xác
và người sử dụng cần gì để có thể tìm thấy chương trình của mình.
Vấn đề đồng bộ ở đây là vấn đề phức tạp bởi dòng kết hợp được tạo ra bởi nhiều
chương trình không nhất thiết phải đồng bộ với nhau.
1.2. Ứng dụng của nén dữ liệu:
Ứng dụng của nén dữ liệu là vô cùng rộng lớn và do vậy tổ chức ISO đã cố gắng tạo
ra một chuẩn nén có thể đáp ứng nhu cầu rộng lớn trong các ứng dụng cần nén.
Chuẩn nén MPEG bao hàm tất cả từ những chuẩn cho màn hình nhỏ cỡ màn hình
của máy điện thoại cho tới những ứng dụng phân giải cao phục vụ cho việc chiếu phim
trong rạp, từ những ứng dụng âm thanh mono đến âm thanh đa kênh và âm thanh vòng.

Trong truyền thông, giá phải trả cho một đường truyền thường tỉ lệ với tốc độ dữ
liệu, và do áp lực tài chính mà người ta luôn muốn sử dụng hệ số nén cao. Song luôn luôn
phải nhớ trong đầu rằng bản thân việc làm tăng được hệ số nén cũng luôn có cái giá phải
trả về mặt kinh tế và điều này là không thể tránh khỏi.
Trong trường hợp video theo yêu cầu, công nghệ được nghiên cứu để có thể truyền
tải đầy đủ băng thông của video đến người sử dụng, song nếu như vậy thì quá đắt đỏ, nếu
không nén HDTV cần quá nhiều băng thông, nếu được nén HDTV có thể truyền được qua
- 4-
Chương 1: Giới thiệu tổng quan về MPEG
kênh SDTV sẵn có với yêu cầu băng thông tương tự. Việc nén này không phải là điều băt
buộc về công nghệ mà chỉ là do yêu cầu kinh tế.
Trong các studio có nhiệm vụ dựng phim, người ta cần lưu trữ những đoạn video,
audio vào đĩa cứng để có thể tăng thời gian truy xuất. Mặc dù hệ thống xử lý ở cấp cao
nhất phải sử dụng dữ liệu không nén nhưng người ta vẫn nén lại để tăng được dung lượng
lưu trữ của đĩa cứng.
Việc sử dụng hệ số nén như thế nào trong truyền thông có ý nghĩa rất quan trọng khi
mà phổ tần bị hạn chế trong khi nó lại cần thiết cho rất nhiều dịch vụ khác ví dụ như điện
thoại di động. Do đó yêu cầu sử dụng phổ tần một cách hiệu quả là một yêu cầu bắt buộc.
Truyền hình tương tự là công nghệ cũ và sử dụng phổ tần kém hiệu quả nhất do đó nó bị
thay thế bởi truyền hình số là một sự tất yếu do trong thực tế phổ tần còn cần cho nhiều
việc khác.
Trên thị trường hiện nay có rất nhiều bộ giải mã cho người dùng chọn lựa được sản
xuất từ những mạch tích hợp giá rẻ. Trong khi chỉ có một số ít bộ mã hóa nên việc chúng
có đắt thì cũng không quan trọng lắm. Xu hướng hiện nay là thiết bị lưu trữ thì càng này
càng rẻ còn phổ tần thì càng ngày càng đắt do vậy trong tương lai việc nén trong việc lưu
trữ là không cần thiết trong khi nén để truyền thông sử dụng sóng vô tuyến sẽ càng tăng
lên.
1.3. Mã hóa không tổn hao và mã hóa dự đoán được.
Mặc dù có nhiều công nghệ được sử dụng để nén nhưng chúng có thể được phân
thành các loại sau đây.

Với nén không tổn hao, đầu ra của bộ giải mã là tương ứng bit-bit so với dữ liệu gốc.
Nó cũng được gọi như là một chương trình stacker sử dụng trong máy tính cá nhân để
tăng dung lượng đĩa sử dụng những bộ codec không tổn hao. Sự sai lệch dù chỉ một bit
với chương trình máy tính có thể có hậu quả nghiêm trọng. Bằng cách này hệ số nén
thường chỉ đạt được khoảng 2:1.
Chúng ta có thể nhận thấy rằng bộ mã hóa không tổn hao không thể đảm bảo một hệ
số nén cho trước và do đó đường truyền hoặc là bộ ghi sẽ phải làm việc với tốc độ dữ liệu
ra luôn biến đổi. Bộ mã không tổn hao có thể đi kèm với quá trình kiểm lỗi.
- 5-
Chương 1: Giới thiệu tổng quan về MPEG
Hệ số nén cao chỉ có thể đạt được với bộ nén có tổn hao. Dữ liệu đi ra khỏi bộ giải
mã không phải tương ứng bit-bit với dữ liệu nguồn và so sánh giữa chúng ta sẽ thấy sự
khác nhau. Nén có tổn hao không thích hợp với việc sử dụng cho dữ liệu máy tính, nhưng
được sử dụng trong chuẩn MPEG cho hệ số nén cao hơn rất nhiều so với nén không tổn
hao. Bộ nén có hiệu quả là bộ nén làm cho những lỗi xuất hiện ở nơi mà cơ quan thị giác
hoặc thính giác của con người rất khó có thể phát hiện được. Do vậy bộ codec này phải
dựa trên sự hiểu biết về cảm nhận của mắt và tai người và chúng được gọi là bộ mã cảm
nhận (perceptive codec).
Trong bộ mã hóa có tổn hao, hệ số nén đạt được cao hơn nhiều. Các cơ quan cảm
nhận của con người cần được mô hình chính xác. Bộ mã này có thể cho một hệ số nén cố
định. Điều này thuận lợi cho việc truyền thông trong thực tế khi mà dữ liệu tốc độ cố định
luôn luôn dễ dàng làm việc hơn là dữ liệu có tốc độ thay đổi. Kết quả của việc hệ số nén
cố định là chất lượng đầu ra thay đổi theo độ phức tạp của đầu vào. Bộ mã kiểu này
không thể móc nối vào nhau một cách tùy ý nếu chúng sử dụng những thuật toán khác
nhau. Do dữ liệu sau bộ giải mã không phải tương ứng bit-bit với dữ liệu nguồn do vậy
không có bộ kiểm lỗi nào trong bộ codec này và cũng không thể phân biệt được lỗi do bộ
mã hóa hay là lỗi do truyền thông.
Hình 1.3: Công nghệ nén sử dụng trong truyền hình tương tự
- 6-
Progressive

scan source
Intelaced
signal
RGB
source
Y. Pr. Pb
Component
source
Composite
NTSC/PALL/
SECAM
Compress
(lossy)
Compress
Compress
(lossy)
(a)
(b)
(c)
Chương 1: Giới thiệu tổng quan về MPEG
Dù là công nghệ số mới được chấp nhận gần đây song việc nén thì đã có từ rất lâu
khi mà có công nghệ truyền hình. Hình 1.3 chỉ ra những công nghệ nén sử dụng trong TV
truyền thống.
Hầu hết tín hiệu video đều có mối liên hệ không tuyến tính giữa độ sáng và mức thế
của tín hiệu được gọi là hiện tượng gamma. Gamma là công nghệ nén cảm nhận dựa trên
sự cảm nhận của con người về lỗi hình ảnh là một hàm của độ sáng. Công nghệ này cho
phép mức độ lỗi do mã hóa 8-bit chỉ như là mã hóa tuyến tính 14-bit.
Một công nghệ sử dụng lâu đời nhất là công nghệ trộn (interlace) được sử dụng
trong công nghệ tương tự để làm giảm băng thông.
Việc tạo ra tín hiệu TV màu từ RGB là một minh họa của bộ mã cảm nhận. Hệ thống

cảm nhận của con người không cảm thấy sự khác biệt về chất lượng mặc dù băng thông
của tín hiệu màu được giảm đi. Điều này là do cảm nhận của mắt người về thay đổi màu
sắc kém hơn nhiều so với thay đổi độ sáng. Hướng tiếp cận này còn được sử dụng trong
chuẩn nén MPEG.
1.4. Nguyên lí cơ bản của nén.
Trong hệ thống PCM, tốc độ bit được quyết định do tần số lấy mẫu và số bit trên
mỗi mẫu, giá trị này thường là cố định.
Ngược lại, lượng thông tin thì luôn thay đổi. Với những tín hiệu thực luôn có những
phần có thể biết trước từ phần trước đó hoặc sau đó, một bộ giải mã có khả năng dự đoán
có thể đoán được phần này và do vậy việc gửi những dữ liệu này đi là không cần thiết, chỉ
có thông tin thực sự mới được gửi đi. Nếu đặc điểm của bộ giải mã là biết trước thì phía
gửi có thể bỏ qua những thông tin mà bên thu có thể tự tái tạo lại được. Và do vậy thì bộ
mã hóa luôn hoạt động với một kiểu của bộ giải mã.
Sự khác biệt giữa tốc độ thông tin và tốc độ dòng bit gọi là độ dư thừa. Hệ thống nén
được thiết kế để làm giảm càng nhiều càng tốt sự dư thừa này trong phạm vi có thể. Một
cách làm điều này là khai thác tính chất dự đoán trước bằng thống kê. Entropy hay lượng
thông tin là hàm của sự khác biệt giữa giá trị của nó với giá trị được dự báo trước. Hầu
hết các tín hiệu có một số bậc dự đoán. Tín hiệu hình sin hoàn toàn có thể đoán trước bởi
mọi chu kì chúng đều như nhau. Theo lý thuyêt Shanon thì một tín hiệu hoàn toàn có thể
dự báo trước thì không mang thông tin. Trong trường hợp sóng sin thì điều này là hoàn
- 7-
Chương 1: Giới thiệu tổng quan về MPEG
toàn đúng bởi nó biểu diễn một tần số đơn và không chiếm dải thông. Ngược lại với
trường hợp trên, tín hiệu như là ồn thì hoàn toàn không thể đoán trước được.
Một điểm cần lưu ý là một bộ mã làm việc tốt với dữ liệu “sạch” có thể sẽ không
làm việc tốt nữa khi mà có ồn cộng thêm vào. Hầu hết các bộ nén trong thực tế luôn đi
kèm với bộ tiền xử lý, một bộ giảm ồn thường được thêm vào bộ này khi mà tín hiệu ồn là
không thể dự đoán trước được.
Hình 1.4: (a) bộ mã hóa lý tưởng không tổn hao chỉ tách ra phần dư thừa của dữ
liệu, dữ liệu ban đầu không hề bị mất thông tin, với bộ mã hóa có tổn hao thì một phần

lượng thông tin sẽ bị mất đi. (b) Khi hệ số nén tăng thì độ phức tạp của bộ mã phải tăng
lên để đảm bảo chất lượng. (c) Hệ số nén cao có xu hướng làm tăng độ trễ của hệ thống.
Hình a cho thấy lượng entropy cần được truyền đi. Bộ mã lý tưởng cần tách ra được
phần này và chất lượng tín hiệu được khôi phục lại là hoàn hảo. Hình b cho thấy hệ số
nén càng cao thì càng phức tạp. Hình c cho thấy càng nén nhiều thì trễ càng tăng.
- 8-
Tần số
Bậc tín
hiệu
Độ phức tạp
Hệ
số

n
Chất lượng
xấu
Chất
lượng tốt
Độ trễ
Hệ
số

n
Chất lượng
xấu
Chất
lượng tốt
Entropy
Dư thừa
Entro

Entropy
Mã hóa lý
tưởng không
tổn hao
Mã hóa có
tổn hao
(a)
(b) (c)
Chương 1: Giới thiệu tổng quan về MPEG
Hiển nhiên rằng chúng ta cần phải cung cấp một kênh truyền đủ để có thể truyền đi
entropy được bộ mã hóa lấy ra. Nếu dung năng kênh truyền không đủ thì bộ mã hóa sẽ
phải bỏ qua một phần entropy kèm theo đó là phần thông tin có ích.
Một kênh truyền đơn có tốc độ thay đổi là kênh truyền có từ lâu nhưng không phổ
biến lắm với các nhà cung cấp, hiện nay đã có những hệ thống mới như là ATM hỗ trợ
kênh có tốc độ thay đổi. Truyền thông số sử dụng trong DVB là tốc độ cố định. Yêu cầu
tốc độ biến đổi có thể được khắc phục bằng cách kết hợp một số kênh có tốc độ thay đổi
thành một kênh có tốc độ cố định bằng cách phân bố hợp lí tốc độ dữ liệu giữa các kênh.
Khả năng tất cả các kênh truyền cùng một lúc đều đạt đỉnh entropy là rất nhỏ do vậy với
một kênh có tốc độ cho trước thì những kênh có dữ liệu ít phức tạp, yêu cầu ít băng thông
sẽ được truyền cùng với những kênh có dữ liệu phức tạp, yêu cầu băng thông lớn. Đây là
nguyên lí cơ bản của việc kết hợp các kênh.
Với những nguồn thông tin được tạo nên từ những phần tử cơ bản giống nhau, ví dụ
những bản tin viết bằng tiếng Anh chẳng hạn, ta có thể tiến hành thống kê xác suất xuất
hiện của từng chữ cái. Mã hóa chiều dài thay đổi là mã mà sử dụng những từ mã ngắn cho
những kí tự có tần số xuất hiện cao, còn những kí tự tần số xuất hiện thấp sử dụng mã có
chiều dài lớn hơn. Mã này là một loại mã không mất thông tin. Mã rất nổi tiếng là mã
Morse là mã sử dụng phương pháp này. Chữ cái e thường xuyên xuất hiện trong tiếng
Anh vì vậy nó được biểu thị bởi một chấm đơn (single dot), còn chữ cái z ít xuất hiện và
nó được minh họa bởi một mã rất dài. Hoàn toàn có thể nhận thấy là bộ mã này dựa trên
sự hiểu biết về tần số các kí tự đã được thống kê trước. Nếu sử dụng mã này cho ngôn

ngữ khác có thể sẽ không hiệu quả nữa, ví dụ như chữ cái z là rất phổ biến với tiếng Séc.
Mã Huffman là mã làm việc với những số liệu thống kê của nguồn dữ liệu đã biết
trước. Việc truyền thông được nghiên cứu trước, sau đó người ta sẽ dành những từ mã
ngắn để mô tả cho những tín hiệu có tần số xuất hiện cao, ngược lại từ mã dài sẽ cho
những tín hiệu có tần số xuất hiện thấp.
1.5. Nén video
- 9-
Chương 1: Giới thiệu tổng quan về MPEG
Hình 1.5: (a) Nén trong ảnh chỉ làm việc trên 1 ảnh đơn duy nhất. (b) Nén liên ảnh
làm việc với một chuỗi các ảnh
Hình 1.5a là mã hóa của một hình ảnh riêng rẽ. Đây được gọi là mã hóa đơn ảnh hay
mã hóa không gian (spatial compress). Một lợi điểm của việc nén trong ảnh là có thể biên
tập trực tiếp từng ảnh một không cần liên quan tới các ảnh khác trong chuỗi. Một số
chuẩn nén sử dụng nén trong ảnh là Digital Betacam, DVC, D-9. Chuẩn ISO JPEG là một
trong các chuẩn nén kiểu này. Ứng dụng của chuẩn JPEG trong truyền hình là ‘Motion
JPEG’.
Hệ số nén cao hơn thu được bằng cách giảm lượng dư thừa thông tin từ ảnh này so
với ảnh trước đó. Nén theo cách này là nén theo trục thời gian. Được gọi là nén liên ảnh
hay inter-coding compress. Nén kiểu này cho hệ số nén cao nhưng có một nhược điểm là
một ảnh chỉ có được bằng cách có ảnh trước đó cộng thêm với phần sai khác. Việc can
thiệp vào một ảnh riêng lẻ trong dòng bit MPEG là không thể và sự sai lệch của một ảnh
có thể kéo theo sự khôi phục không chính xác cho các ảnh tiếp theo đó.
Các thuật ngữ thường được sử dụng là:
Ảnh I (Intra-picture): là ảnh chỉ sử dụng nén trong ảnh, mang thông tin về một
ảnh hoàn chỉnh. Ảnh I cho phép truy cập ngẫu nhiên, có độ nén thấp nhất.
Ảnh P (Predicted-picture): ảnh dự đoán trước, là ảnh được mã hóa có bù chuyển
động từ ảnh I hoặc ảnh P phía trước.
- 10-
Nén trong ảnh
loại bỏ phần dư

thừa trong một
ảnh
Nén liên ảnh
loại bỏ phần dư
thừa giữa các
ảnh
(a)
(b)
Chương 1: Giới thiệu tổng quan về MPEG
Ảnh B (Bi-directional predicted picture): ảnh dự đoán hai chiều, là ảnh được mã
hóa sử dụng bù chuyển động từ các ảnh I hoặc P trước và sau. Ảnh B cho hệ số nén là
cao nhất.
1.5.1. Nén trong ảnh.
Đây là loại nén làm giảm độ dư thừa trong miền không gian, chỉ thực hiện nén trên
dữ liệu của một ảnh, không sử dụng thông tin của các ảnh trước hoặc sau đó.
Phân tích hình ảnh TV thông thường chỉ ra rằng các thành phần tần số cao thể hiện
chi tiết của hình ảnh, và chỉ có phần nhỏ năng lượng là của các thành phần này. Trong
hình ảnh cũng tồn tại những vùng mà trong đó các điểm là tương tự giống nhau, những
điểm như thế này nằm ở vùng tần số thấp. Vùng có độ sáng như nhau nằm ở tần số bằng
0. Việc bỏ qua những vùng có tần số cao là không thể được bởi nó tạo nên độ rõ ràng,
mềm mại của hình ảnh.
Tuy vậy các thành phần tần số cao chỉ chiếm một phần nhỏ năng lượng nên cần it bit
để mã hóa hơn, đồng thời sai số ở những vùng có tần số cao thì con người cũng khó nhận
biết hơn. Nhờ sử dụng đặc điểm này mà việc nén trở nên có hiệu quả.
1.5.2. Nén liên ảnh.
Nén liên ảnh sử dụng tính chất tương tự giữa các ảnh kế tiếp. Thay vì truyền thông
tin của từng ảnh riêng rẽ, phương pháp này truyền đi sự sai khác giữa ảnh hiện tại với ảnh
trước đó bằng kiểu mã hóa vi sai.
Hệ thống mô tả ở hình 1.6a bị hạn chế ở chỗ nếu kênh truyền có lỗi thì nó sẽ gây tác
động đến mọi ảnh tiếp theo đó. Để khắc phục hiện tượng này một ảnh chính xác sẽ được

truyền đi theo chu kỳ thay vì truyền sự sai khác so với ảnh trước đó.
Việc biên tập dòng bit chỉ có thể thực hiện ở tại những điểm mà ảnh I xuất hiện.
- 11-
Chương 1: Giới thiệu tổng quan về MPEG
Hình 1.6: (a) Hệ thống nén liên ảnh sử dụng một ảnh trễ để so sánh sự khác biệt với
ảnh hiện tại. (b) Để tránh lỗi xảy ra trên đường truyền, ảnh I được gửi đi theo chu kỳ.
1.5.3. Giới thiệu về phép bù chuyển động.
Trong khi thực hiện quay một chương trình TV, một đối tượng có thể đứng yên trước
một camera chuyển động hoặc bản thân đối tượng chuyển động trước một camera đặt cố
định. Bù chuyển động là quá trình mà đo đạc chính xác hướng chuyển động của đối tượng
từ hình ảnh hiện tại sang hình kế tiếp, do đó mà phần chuyển động được tách riêng ra, làm
giảm độ dư thừa giữa các hình ảnh. Hình 1.7 mô tả một ví dụ của chuyển động của đối
tượng giữa các ảnh.
Tất cả hình ảnh thì chuyển động theo trục thời gian, còn bản thân đối tượng thì di
chuyển theo trục optic flow axis . Trục này sẽ chỉ ra hướng chuyển động của đối tượng từ
ảnh này sang ảnh kế tiếp.
Một điều hiển nhiên là dữ liệu diễn tả sự chuyển động của đối tượng sẽ thay đổi tương
ứng với thời gian. Tuy nhiên nếu nhìn theo trục optic flow axis thì hình ảnh của đối tượng
chỉ thay đổi nếu chính bản thân đối tượng đó bị biến dạng, di chuyển vào bóng tối hoặc bị
- 12-
Trễ 1 ảnh
+
-
Sự khác
biệt
Thời gian
Điểm ảnh
hiện tại
Điểm ảnh ở
ảnh trước

đó
(a)
Gửi ảnh
I
Gửi ảnh
I
Gửi sai khác
D
Gửi sai khác
D
Gửi sai khác
D
(b)
Chương 1: Giới thiệu tổng quan về MPEG
xoay đi. Do vậy dữ liệu dư thừa được loại bỏ đáng kể nếu như chúng ta biết được trục
chuyển động. Khi ấy hệ số nén thu được sẽ cao hơn nhiều.
Hình 1.7: Chuyển động của đối tượng trong không gian 3 chiều sẽ theo trục optic
flow axis.
Một bộ mã hóa bù chuyển động hoạt động theo nguyên tắc sau. Một ảnh tham chiếu
được gửi đi, nhưng được lưu trữ để so sánh với các ảnh khác để tìm ra vector chuyển
động cho những phần khác nhau trên ảnh. Ảnh tham chiếu này được dịch đi theo các
vector chuyển động để loại bỏ đi phần chuyển động giữa các ảnh. Ảnh này được gọi là
ảnh dự đoán trước. Sau đó ảnh này sẽ được so sánh với ảnh thực để phát hiện ra sai số dự
đoán. Sai số dự đoán được truyền đi cùng với vector chuyển động. Ở nơi thu, ảnh tham
chiếu được lưu giữ trong bộ nhớ. Nó được dịch đi bởi các vector chuyển động và cuối
cùng là lỗi được sửa lại để tạo ra ảnh gốc.
1.6. Giới thiệu về MPEG-1
MPEG-1 được thiết kế ban đầu nhằm mã hóa ảnh động và âm thanh thành dòng bit
có tốc độ của audio Compact Disc. Kết quả tạo ra Video- CD nhưng hiện nay đã được
thay thế bởi DVD. Để có được tốc độ bít thấp MPEG-1 chỉ sử dụng tỉ lệ hình ảnh từ 24-

30Hz cho kết quả là chất lượng chỉ ở mức trung bình.
Để đạt được tốc độ bit này, MPEG-1 giảm tốc độ lấy mẫu bằng một nửa TV chuẩn.
Cụ thể là với hệ thống 25Hz hình ảnh có kích thước là 352 × 288 điểm ảnh, còn với hệ
30Hz là 352 × 240 điểm ảnh. Định dạng như vậy được gọi là common intermediate
- 13-
Trục thời gian
Trục tung
Trục hoành
Optic
flow axis
Chương 1: Giới thiệu tổng quan về MPEG
format (CIF). Với tín hiệu đầu vào là tín hiệu video tổng hợp, CIF có thể nhận được bằng
cách giảm tốc lấy mẫu các dòng tích cực xuống một nửa.
Chuẩn nén này dường như có vẻ rất đơn sơ, song cho tốc độ bit thấp. Tuy vậy nó
cũng được đánh giá là đã cung cấp những công cụ mã hóa quan trọng mà còn được tiếp
tục sử dụng trong MPEG-2 và MPEG-4. Chúng bao gồm cú pháp dòng cơ sở, bù chuyển
động, điều khiển tốc độ bit …. Nhiều nguyên lí mã hóa của MPEG-1 được lấy ra từ
JPEG. Chuẩn MPEG-1 cũng định ra việc mã hóa audio hai kênh.
1.7. MPEG-2 cùng các Profile và Level
MPEG-2 được xem là một chuẩn có ứng dụng rất rộng lớn. Ví dụ MPEG-2 hỗ trợ độ
phân giải cao (HD) mà MPEG-1 không có. Chuẩn này càng trở nên quan trọng khi nó
được chọn làm chuẩn nén cho DVB và DVD. Chuẩn MPEG-3 dự định thiết kế cho
HDTV nhưng người ta nhận thấy MPEG-2 (cùng với các mở rộng của chuẩn này) có thể
đáp ứng các yêu cầu này do vậy mà ko có chuẩn MPEG-3.
Profile
Level
Simple Main 4:2:2 SNR Spatial High
High
4:2:0
1920 x1152

80 Mb/s
4:2:0, 4:2:2
1920 x1152
100 Mb/s
High – 1440
4:2:0
1440 x1152
60 Mb/s
4:2:0
1440 x1152
60 Mb/s
4:2:0, 4:2:2
1440 x1152
80 Mb/s
Main
4:2:0
720 x 576
15 Mb/s
4:2:0
720 x 576
15 Mb/s
4:2:2
720 x 608
50Mb/s
4:2:0
720 x 576
15 Mb/s
4:2:0, 4:2:2
720 x 576
20 Mb/s

Low
4:2:0
352 x 288
4 Mb/s
4:2:0
352 x 288
4 Mb/s
Hình 1.8: Các Profile và Level trong MPEG-2
MPEG-2 được xây dựng trên cơ sở MPEG-1 với sự mở rộng về phạm vi kích thước
hình ảnh và tốc độ bit. Việc ghép các dòng bit với nhau cũng được giải quyết trong chuẩn
- 14-
Chương 1: Giới thiệu tổng quan về MPEG
MPEG-2. Chuẩn MPEG-2 là sự mở rộng của chuẩn MPEG-1 vì vậy một điều dễ hiểu là
bộ giải mã MPEG-2 có thể làm việc được với dòng bit của MPEG-1.
Với một chuẩn duy nhất nhưng MPEG-2 có thể giải quyết được rất nhiều yêu cầu
ứng dụng. Chuẩn này được chia nhỏ thành các Profile và Level. Các Profile thể hiện độ
phức tạp còn các Level thể hiện kích cỡ hình ảnh hoặc độ phân giải đi kèm với Profile
tương ứng. Không phải tất cả các Level đều hỗ trợ mọi Profile.
Một bộ giải mã MPEG-2 với Profile và Level cho trước có thể giải mã Profile và
Level thấp hơn.
Một số hệ thống nén có khả năng tạo ra tín hiệu có thể phân cấp (scaleable signal).
Quá trình này là quá trình mà sau khi cho tín hiệu đầu vào thì ta sẽ thu được tín hiệu đầu
ra gồm có một tín hiệu chính (main signal) và một tín hiệu hỗ trợ ( helper signal). Bản
thân tín hiệu chính có thể được giải mã độc lập cho chất lượng hình ảnh nhất định, nhưng
nếu có thêm tín hiệu hỗ trợ thì chất lượng hình ảnh sẽ được tăng lên.
Hình 1.9: (a) Bộ phân cấp theo tỉ lệ tín/tạp cho ra một tín hiệu có tỉ số tín/ồn ở mức
trung bình và một tín hiệu để giảm ồn. (b) Bộ phân cấp theo không gian cho ra một tín
hiệu ở mức trung bình và một tín hiệu để tăng chất lượng hình ảnh.
- 15-
Bộ mã hóa có

khả năng phân
cấp theo SNR
Hình ảnh
chất lượng
trung bình
Hình ảnh có
chất lượng
tốt hơn
Tín hiệu cơ bản
Tín hiệu tăng
cường
Tín hiệu vào
(a)
Bộ mã hóa có khả
năng phân cấp
theo không gian
Hình ảnh độ
phân giải thấp
Hình ảnh độ
phân giải cao
Tín hiệu cơ bản
Tín hiệu tăng
cường
(b)
Tín hiệu vào
Chương 1: Giới thiệu tổng quan về MPEG
Hình 1.9a chỉ ra một bộ mã hóa MPEG, bằng cách lượng tử lại có trọng số sẽ thu
được một hình ảnh có tỉ lệ tín/tạp ở mức trung bình. Tại bộ giải mã, hình ảnh này hoàn
toàn có khả năng tái tạo lại, nhưng kèm theo đó chắc chắn là có ồn lượng tử lớn làm chất
lượng hình kém hơn. Sự sai khác do ồn này có thể được nén và gửi đi như là tín hiệu hỗ

trợ. Một bộ giải mã đơn giản thì chỉ giải mã tín hiệu chính còn bộ giải mã phức tạp hơn
thì có thể giải mã cả tín hiệu chính và tín hiệu hỗ trợ cho kết quả là một hình ảnh ở mức
ồn thấp. Đây là nguyên lí của bộ phân cấp theo tỉ lệ tín/tạp.
Hình 1.9b là nguyên lí của bộ phân cấp theo không gian. Nếu chỉ cần mã hóa ở mức
trung bình thì một tí hiệu có độ phân giải trung bình được tạo ra và có thể được giải mã
bằng TV có độ phân giải tiêu chuẩn SDTV. Nhưng nếu gửi kèm vào đó một tín hiệu tăng
cường thì một bộ giải mã thích hợp tại nơi thu có thể kết hợp cả hai tín hiệu để cho ra
hình ảnh có độ phân giải cao HDTV.
Chuẩn MPEG-2 tăng số kênh âm thanh lên tới 5 kênh nhưng vẫn đảm bảo tương
thích với MPEG-1. Ngoài ra MPEG-2 còn có những phương pháp mã hóa âm thanh khác
hiệu quả hơn nhưng không tương thích ngược với MPEG-1. Đó là chuẩn nén MPEG-2
AAC (advance audio coding).
1.8. Giới thiệu về MPEG -4
MPEG-4 sử dụng những công cụ phức tạp hơn nữa nhằm mang lại hệ số nén cao
hơn MPEG-2. MPEG-4 được mong đợi là sẽ có nhiều ứng dụng trong Internet và
Wireless như là MPEG-2 đã có trong DVB và DVD.
MPEG-4 đưa ra một số các công cụ mã hóa mới được minh họa trong hình 1.10. Ở
chuẩn MPEG-1 và MPEG-2 việc bù chuyển động được thực hiện trên từng khối ảnh có
kích thước cố định gọi là macroblocks. Điều này cho phép bộ mã làm việc tốt ở tốc độ đã
được thiết kế, tuy nhiên các macroblocs này không phải lúc nào cũng được tính toán
chính xác với chiều chuyển động của vật thể thực. Điều này làm tăng số bit dư thừa. Ở
chuẩn MPEG-4, đối tượng động có thể được mã hóa với hình dạng tùy ý. Đối tượng động
có thể được mô tả bởi các vector chuyển động và sẽ làm giảm được nhiều dữ liệu dư thừa.
Tùy theo từng Profile, đối tượng động có thể là hai chiều hoặc ba chiều, chắn sáng hay là
trong suốt. Bộ giải mã phải có khả năng xắp xếp từng lớp đối tượng theo độ gần xa của
đối tượng đó so với người xem thành một hình ảnh thực. Mã hóa hình ảnh trong chuẩn
MPEG-4 được gọi là mã hóa xếp lớp (texture coding) và cho kết quả tốt hơn MPEG-2.
- 16-
Chương 1: Giới thiệu tổng quan về MPEG
Hình 1.10: MPEG-4 đưa ra một số các công cụ mới mà các chuẩn trước đó không

có. Bao gồm mã hóa đối tượng, mã hóa dạng lưới (mesh coding), mã hóa ảnh tĩnh, thể
hiện trạng thái của khuôn mặt và cơ thể.
Để tăng cường việc bù chuyển động, chuẩn MPEG-4 còn có khả năng mô tả một đối
tượng di chuyển theo hướng về gần hoặc ra xa là bao nhiêu bằng cách sử dụng công nghệ
gọi là mã hóa dạng lưới (mesh coding). Bằng cách làm cong hình ảnh (warping image),
việc dự đoán hình ảnh hiện tại được tăng cường. MPEG-4 cũng đưa ra cách mã hóa hình
ảnh dùng biến đổi cosin rời rạc DCT hoặc dùng wavelet.
Chuẩn MPEG-2 đã hỗ trợ một số dạng phân cấp như đã mô tả ở trên, chuẩn MPEG-4
còn phát triển xa hơn nữa. Ngoài phân cấp theo không gian và theo tín/tạp như MPEG-2
thì MPEG-4 còn hỗ trợ phân cấp theo thời gian. Một dòng bit ở cấp cơ sở có tỉ lệ khung
hình nhất định có thể kết hợp với một dòng bít hỗ trợ thêm để giải mã cho ra hình ảnh có
tỉ lệ khung hình cao hơn. Điều này quan trọng ở chỗ nó cho phép chúng ta phát triển
những chương trình có tốc độ khuôn hình cao hơn so với tốc độ chuẩn của TV và phim
hiện tại nhưng vẫn đảm bảo tương thích với các thiết bị truyền thống. Nó cũng được ứng
dụng trong mạng internet, cho phép người dùng có chất lượng hình ảnh tốt nhất ứng với
khả năng đường truyền mà họ có.
MPEG-4 còn đưa ra những chuẩn cho việc thể hiện kích thích tình cảm trên khuôn
mặt và cơ thể. Những vector đặc biệt cho phép một hình ảnh tĩnh của khuôn mặt hoặc có
- 17-
Visual object:
Part of scene which can be
independently accessed and
manipulated
Object coding
Video
Object
Still
texture
object
Mesh

object
Face and body
animation
object
Chương 1: Giới thiệu tổng quan về MPEG
thể kèm theo cả phần cơ thể được kích thích kèm theo cả giọng nói với tốc độ bit rất thấp.
Điều này rất có ý nghĩa với những hệ thống như là hệ thống giả lập hay trò chơi điện tử,
khi đối tượng mà người sử dụng điều khiển di chuyển khắp màn hình. Điểm bất lợi của
việc nén theo kiểu này là tăng thêm độ phức tạp của bộ mã nhưng với sự phát triển trong
công nghệ xử lí số, mạch tích hợp giá thành ngày càng rẻ thì đây rõ ràng không phải là
vấn đề quá lớn.
Như đã được mong đợi trước khi ra đời, với hệ thống công cụ rất lớn, chuẩn MPEG-
4 đã đáp ứng một cách hoàn hảo cho rất nhiều ứng dụng, cũng như là MPEG-2 đã hỗ trợ
các ứng dụng khác nhau bằng cách chia ra các Profile và Level.
1.9. Giới thiệu về MPEG-7
Ngày nay khi mà các dữ liệu hình ảnh và âm thanh được số hóa ngày càng trở nên
phổ biến cùng với sự phát triển của máy tính và internet thì khối lượng các dữ liệu trên trở
thành khổng lồ. Điều đó dẫn đến việc tìm kiếm được một đoạn âm thanh hoặc hình ảnh
phù hợp với sở thích của người sử dụng là vô cùng khó khăn. Với những dữ liệu dạng kí
tự (như văn bản kiểu text, doc, html… ) thì đã có những giải pháp tìm kiếm hiệu quả,
trang web www.google.com là một ví dụ điển hình trong lĩnh vực tìm kiếm. Tuy nhiên
với dữ liệu đa phương tiện thì vấn đề là vô cùng phức tạp.
MPEG-7 ra đời nhằm mục đích giải quyết vấn đề này. Chuẩn này thường được gọi là
Giao diện mô tả nội dung đa phương tiện - Multimedia Content Description Interface. Nó
cho phép tìm kiếm một cách nhanh chóng và hiệu quả các dữ liệu đa phương tiện theo nội
dung. Ban đầu MPEG-7 được thiết kế với mục đích cung cấp thêm một chức năng bổ
sung cho các chuẩn MPEG trước đó để đưa ra thông tin về nội dung của dữ liệu. Sau này
thì chức năng này trở thành tiêu chuẩn của việc mô tả nội dung đa phương tiện. Như
chúng ta đã biết, chuẩn MPEG-4 là chuẩn nén được xây dựng trên việc mã hóa đối tượng
do vậy đây là nền tảng tốt để xây dựng MPEG-7. MPEG-7 có thể được sử dụng độc lập

với các chuẩn nén trước đó. Nhưng cũng cần lưu ý là chuẩn MPEG-7 không thể thay thế
hoàn toàn các chuẩn MPEG-1, MPEG-2 hay MPEG-4.
1.10. Nén âm thanh
Các hệ thống nén audio được xây dựng trên cơ sở nghiên cứu về đặc tính sinh lí
cũng như giới hạn thính giác của con người nhằm loại bỏ thành phần thông tin dư thừa
trong các tín hiệu audio.
- 18-
Chương 1: Giới thiệu tổng quan về MPEG
Hệ thống thính giác con người (HAS – Human Auditory System) hoạt động như một
bộ phân tích phổ, các thành phần phổ của âm thanh được phân tích độc lập qua các bộ lọc
thông dải gọi là các dải băng chuẩn. Các dải băng chuẩn có độ rộng 100Hz khi tần số
dưới 500Hz còn khi tần số lớn hơn 500Hz thì độ rộng băng tỉ lệ với tần số. Do vậy trên
thực tế âm thanh được chia thành 25 dải băng con tương ứng với 25 bộ lọc ốc tai theo quy
luật tự nhiên. Các dải băng này sẽ được xử lí riêng rẽ, rồi được tổng hợp lại trên cơ sở
đánh giá mức năng lượng và độ nhạy của HAS với từng băng.
• Nén không tổn hao
Nén không tổn hao cho phép khôi phục lại một cách y hệt dòng bit trước khi nén.
Cách nén này loại bỏ những dư thừa thống kê, những thông tin trong tín hiệu có thể dự
đoán từ các mẫu trước đó. Cách nén này có ưu điểm là chất lượng âm thanh tốt nhưng hệ
số nén đạt được lại quá thấp, thường chỉ giới hạn ở tỉ lệ 2:1 tùy thuộc vào độ phức tạp của
dữ liệu nguồn.
Nén không tổn hao thường sử dụng các kỹ thuật sau đây:
 Thuật toán vi phân: Độ sai khác giữa các mẫu tín hiệu liền nhau thường nhỏ
hơn nhiều so với bản thân độ lớn của mẫu tín hiệu. Do vậy có một độ dư thừa thông
tin lớn. Kĩ thuật DPCM lợi dụng đặc điểm này. DPCM mã hóa phần khác nhau giữa
các tín hiệu chứ không mã hóa bản thân mẫu tín hiệu. Hệ thống ADPCM thì lại mã
hóa phần khác nhau giữa mẫu thực với mẫu dự đoán cho hiệu quả nén tốt hơn nữa so
với hệ thống DPCM.
 Mã hóa với từ mã có độ dài thay đổi làm tăng tính hiệu quả của việc mã hóa
thông tin.

• Nén có tổn hao
Nén có tổn hao lợi dụng đặc điểm của hệ thống HAS là không thể phân biệt một
thành phần tần số nào đó khi có một tần số gần đó với biên độ lớn hơn được phát. Bằng
cách nén này hệ số nén đạt được trong khoảng từ 2:1 đến 10:1 tùy thuộc vào quá trình mã
hóa và yêu cầu chất lượng của tín hiệu sau nén.
Nguyên lí cơ bản của nén có tổn hao là loại bỏ đi những thành phần nằm dưới đường
cong ngưỡng âm. Vì lý do này nén có tổn hao được gọi là làm mất các thành phần âm.
Nén có tổn hao thường sử dụng kết hợp các kỹ thuật sau đây:
 Kỹ thuật ‘che’ (masking) đối với các thành phần tín hiệu trong miền thời gian
và miền tần số. Số bit lượng tử dùng để mã hóa cho mỗi băng là khác nhau.
- 19-
Chương 1: Giới thiệu tổng quan về MPEG
 Chặn mức tạp âm lượng tử cho từng âm độ của tín hiệu âm thanh bằng cách
đưa ra số bit để đảm bảo mức nhiễu lượng tử nằm dưới mức giá trị cần chặn.
 Mã hóa nối: sử dụng tính dư thừa trong hệ thống âm thanh đa kênh. Người ta
nhận thấy rằng có nhiều thành phần tín hiệu giống nhau trên các kênh của một hệ
thống đa kênh. Do đó những thành phần chung này được mã hóa riêng ra và được
chỉ thị giải mã lặp lại trên tất cả các kênh.
1.11. Dòng bit MPEG
Hình 1.11: Cấu trúc dòng bit MPEG
MPEG hỗ trợ một số loại dòng bit cho nhiều mục đích khác nhau được mô tả ở hình
1.11. Đầu ra của một bộ nén được gọi là dòng cơ sở (elementary stream). Nhiều dòng cơ
sở có thể được trộn lại để thành một dòng truyền tải (transport stream). Việc ghép kênh
này đòi hỏi những khối hoặc gói có kích thước cố định. Cấu trúc của dòng truyền tải là
phức tạp vì nó cần cho biết để kết hợp với một dòng cơ sở hình ảnh thì cần dòng cơ sở âm
- 20-
Bộ nén Đóng gói
Bộ nén Đóng gói
Bộ nén Đóng gói
Bộ nén Đóng gói

Video 1
Ghép kênh
dòng
chương trình
Ghép kênh
dòng truyền
tải
Ghép kênh
dòng truyền
tải
Video 2
Audio 1
Audio 2
Dòng cơ sở
Dòng cơ sở
đóng gói
Dòng
chương trình
Dòng truyền
tải đơn
chương trình
(SPTS)
Dòng
truyền tải

×