Tải bản đầy đủ (.docx) (101 trang)

Ths nghiên cứu, chuẩn hóa định dạng file phát sóng cho các chương trình của đài truyền hình việt nam

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.91 MB, 101 trang )

MỤC LỤC

Trang
Trang phụ bìa.......................................................................................................
Bản xác nhận chỉnh sửa luận văn........................................................................
Bản cam đoan......................................................................................................
Mục lục................................................................................................................
Tóm tắt luận văn..................................................................................................
Danh mục ký hiệu và chữ viết tắt........................................................................
Danh mục bảng biểu............................................................................................
Danh mục hình vẽ................................................................................................


Tên đề tài: Nghiên cứu, chuẩn hóa định dạng file phát sóng cho các chương
trình của Đài truyền hình Việt Nam.
Tóm tắt: Luận văn khảo sát thực trạng về giải pháp cơng nghệ phát sóng các
định dạng file đang sử dụng tại Việt Nam. Đồng thời, luận văn cũng đi sâu phân tích
cấu trúc và đánh giá một số định dạng file phổ biến trong truyền hình. Từ đó đưa ra
định dạng file phù hợp cho quy trình sản xuất chương trình của Đài truyền hình Việt
Nam.


DANH MỤC KÝ HIỆU VÀ CHỮ VIẾT TẮT
AAF
ADC

Advanced Authoring Format
Analog Digital Converter

Định dạng thực thi cải tiến
Bộ chuyển đổi tín hiệu tương tự



AES
AMWA

sang tín hiệu số
Audio Engineering Society
Tiêu chuẩn của hội kỹ thuật audio
Advanced
Media
Workflow Hội quy trình truyền thơng nâng

ATM
AVC

Association
Asynchronous Transfer Mode
Advanced Video Coding

cao
Chế độ truyền dẫn không đồng bộ
Phương pháp mã hóa video tiên
tiến
Âm thanh và hình ảnh kết hợp
Quy tắc mã hóa cơ bản

AVI
BER
CABAC

Audio Video Interleaved

Basic Encoding Rules
Context-adaptive
Arithmetic

CAVLC

Coding
Context-adaptive Variable Length

CG
DAC

Coding
Character Generator
Digital Analog Converter

DCT
DM
DV
EBU
ENG
EOS
FP
FTP
GOP
GXF
HD SDI

hiệu tương tự
Discrete Cosine Transform

Biến đổi cosin rời rạc
Descriptive Metadata
Dữ liệu mơ tả chương trình đặc tả
Digital Video
Video số
European Broadcasting Union
Liên Hiệp Phát Sóng Châu Âu
Electronic New - Gathering
Thu thập tin tức điện tử
End Of Stream
Gói kết thúc dịng
File Package
Gói thơng tin về file
File Transfer Protocol
Giao thức truyền file
Group Of Picture
Nhóm ảnh
General Exchange Format
Định dạng trao đổi chung
High Definition Serial Digital Giao diện số nối tiếp độ phân giải

HDTV
H.264

Interface
High Definition Television

Bộ tạo kí tự
Bộ chuyển đổi tín hiệu số sang tín


cao
Truyền hình độ nét cao
Là một chuẩn nén tín hiệu hiện đại
hay cịn gọi là AVC/ MPEG-4 part

IEC

International

10
Electrotechnical Ủy ban kỹ thuật điện quốc tế


IEEE

Commission
Institute of

ISO

Electronics Engineers
International Organization

ITU

Standardization
International Telecommunication Liên minh viễn thông quốc tế

KLV
LAN

MAM
MB
MCS
MJPEG
MPEG
MP
MP@ML
MXF
NAL
NAS
OID
PCM
SDI
SDTV
SDTI
SMPTE

Union
Key Length Value
Local Area Network
Media Asset Management
Macro block
Master Control System
Motion JPEG
Moving Picture Experts Group
Material Package
Main Profile - Main Level
Material Exchange Format
Network Abstraction Layer
Network Attached Storage

Object Identifier
Pulse-Code Modulation
Serial Digital Interface
Standard Definition Television
Serial Data Transport Interface
Society Of Motion Picture And

SNR

Television Engineers
Signal Noise Ratio

truyền hình
Tỉ số tín hiệu trên tạp âm

(S/N)
SP
TS
UL
VCL
VTR
XML

Source Package
Transport Stream
Universal Label
Video Coding Layer
Video Tape Recorder
Extensible Markup Language


Gói thơng tin về dữ liệu nguồn
Dịng vận tải
Nhãn tồn thể
Lớp mã hóa video
Máy ghi băng từ
Ngôn ngữ đánh dấu mở rộng

Electrical

and Viện kỹ nghệ Điện và Điện tử
for Tổ chức tiêu chuẩn hóa quốc tế

Mã hóa khóa - độ dài - giá trị
Mạng nội bộ
Hệ thống quản lý tài nguyên số
Khối macro
Hệ thống điều khiển chính
Định dạng JPEG động
Nhóm chun gia về ảnh động
Gói thơng tin về tư liệu
Định dạng trao đổi dữ liệu
Lớp mạng trừu tượng
Hệ thống lưu trữ trên mạng
Giá trị định danh đối tượng
Điều Biến Mã Xung
Giao diện số nối tiếp
Truyền hình độ nét tiêu chuẩn
Tập đồn các kỹ sư ảnh động và



DANH MỤC CÁC BẢNG


DANH MỤC HÌNH VẼ


7

LỜI NĨI ĐẦU
Truyền hình Việt Nam đang trong giai đoạn chuyển đổi công nghệ
mạnh mẽ, đang từng bước dịch chuyển từ cơng nghệ sản xuất và phát sóng
trên băng sang sản xuất phát sóng trên nền tảng file (filebase), trên cơ sở đó
chúng ta phát triển thêm các ứng dụng công nghệ thông tin cho việc quản lý,
chia sẻ, sử dụng tài ngun khơng hạn chế cho sản xuất. Góp phần hỗ trợ cho
nội dung chương trình thể hiện ngày càng thêm phong phú, đặc sắc.
Việc chuyển tư duy từ cách làm việc trên băng sang file là một quá trình
gian khó, với nhiều thách thức. Cơng nghệ trên băng đã tồn tại trong một thời
gian khá dài, đi theo đó là cách làm việc, tư duy quản lý, chia sẻ chương trình
đã thành lối mịn. Việc sở hữu, cầm, nắm các băng chương trình, tư liệu như
một vật thể hữu hình vơ hình chung tạo ra một khó khăn khi chuyển đổi sang
môi trường file. Việc chuyển đổi là tất yếu và là xu thế chung của công nghệ
truyền hình thế giới, cơng nghệ hội tụ (Technology Convergence) mà chúng ta
khơng thể đứng ngồi cuộc.
Việc chuyển đổi cơng nghệ đòi hỏi chúng ta phải xây dựng các hệ thống
kết nối dựa trên công nghệ thông tin (CNTT), trao đổi file chương trình, sử
dụng chung tài nguyên chương trình, quản lý thống nhất tài nguyên chương
trình, sản xuất và phát sóng trên nền tảng file, duyệt chương trình trên nền tảng
file vv…Một trong những thách thức đầu tiên đó là xây dựng hệ thống. Có
thuận lợi là trong q trình thực hiện đề tài, khảo sát thực tế các Trung tâm
Truyền hình Việt Nam tại các khu vực, các đơn vị cung cấp nội dung chương

trình trực thuộc Đài Truyền hình Việt Nam (THVN) cơ bản đã chuyển sang làm
việc trên môi trường file, xây dựng hệ thống trên nền tảng file, quy trình cho
sản xuất dựa trên file. Một trong những khâu chính thuộc phạm vi khảo sát của
đề tài là hệ thống phát sóng đã ứng dụng cơng nghệ phát sóng tự động trong


8

phát sóng các chương trình truyền hình. Tuy nhiên do nhiều nguyên nhân
khách quan cũng như chủ quan các hệ thống phát sóng tự động tại các Trung
tâm khu vực, cũng như các đơn vị cung cấp nội dung vẫn cịn chưa hồn thiện,
chưa có sự đầu tư phù hợp, nó làm cho việc xây dựng các hệ thống CNTT hỗ
trợ sản xuất, quản lý trên nền tảng file gặp rất nhiều khó khăn.
Việc chuẩn hóa định dạng file phát sóng các đơn vị đã thực hiện tuy
nhiên vẫn dựa chủ yếu trên cơ sở nguồn lực thiết bị hiện có, chưa tính hướng
tới một định dạng chuẩn hóa theo tiêu chuẩn của các tổ chức tiêu chuẩn, hiệp
hội truyền hình thế giới.
Việc chuẩn hóa định dạng file phát sóng giúp chúng ta có thể trao đổi dễ
dàng nội dung chương trình truyền hình giữa Đài THVN tại Hà Nội, với các
Trung tâm truyền hình khu vực, các đơn vị cung cấp nội dung. Nhất là với các
đối tác xã hội hóa cung cấp nội dung chương trình. Đây là một thực tế vì nếu
chúng ta khơng chuẩn hóa, việc trao đổi nội dung sẽ rất khó khăn, khơng kiểm
sốt được chất lượng kỹ thuật. Hơn nữa việc chuẩn hóa giúp chúng ta liên kết,
kết nối các hệ thống CNTT của các đơn vị khác nhau, để truyền dẫn, trao đổi
nội dung và nhiều ứng dụng tương tác khác trong bối cảnh việc trang bị hệ
thống MAM (Quản lý phát sóng) của Đài THVN đang được triển khai, nó
như là trục chính liên kết, kết nối các hệ thống hậu kỳ kết nối mạng trong Đài
THVN và trong tương tai có thể nghĩ tới việc kết nối băng rộng truyền file với
các Trung tâm THVN tại khu vực, thường trú.
Việc chuẩn hóa định dạng file giúp chúng ta định hướng được việc đầu

tư công nghệ, thiết bị, phù hợp. Cùng với đó là đưa ra quy trình làm việc dựa
trên file tại các khâu sản xuất giúp chúng ta hệ thống hóa các quy trình đó,
kiểm sốt kỹ thuật, bổ sung hiệu chỉnh để phù hợp hoàn thiện hơn.
Việc chuẩn hóa định dạng file phát sóng cũng giúp chúng ta hệ thống
hóa về mặt kỹ thuật định dạng file, nâng cao hiểu biết về định dạng file trong
dây chuyền sản xuất chương trình cho kỹ sư, kỹ thuật viên của Đài THVN.


9

Trên cơ sở thực tiễn, luận văn tiến hành nghiên cứu, chuẩn hóa định
dạng file phát sóng cho các chương trình của Đài THVN. Trong khn khổ
luận văn, sẽ trình bày 3 chương:
Chương 1: Các yếu tố liên quan đến chất lượng và dung lượng của hệ
thống truyền hình.
Chương 2: Định dạng file MXF
Chương 3: Đánh giá, lựa chọn các chuẩn định dạng nén và định dạng file.
Chương 1
CÁC YẾU TỐ LIÊN QUAN ĐẾN CHẤT LƯỢNG VÀ DUNG LƯỢNG
CỦA HỆ THỐNG TRUYỀN HÌNH
1.1. Các yếu tố ảnh hưởng tới chất lượng và dung lượng của hệ
thống truyền hình
Khi nghiên cứu một hệ thống truyền hình số ta thấy các yếu tố sau ảnh
hưởng lớn tới dung lượng và chất lượng hệ thống:
• Định dạng file (File Format).
• Chuẩn nén Video (Video codec).
• Định dạng lấy mẫu (Format Profile).
• Độ phân giải (Resolution).
• Phương thức qt.
• Tỷ lệ khn hình (Aspect Ratio).

• Tốc độ khung hình (Frame Rate).
• Tốc độ bit (Bit rate).
• Kích thước nhóm ảnh (GOP size).
Trong nội dung của chương này, luận văn tập trung phân tích các
vấn đề về các chuẩn nén và định dạng file trong hệ thống truyền hình số.
1.1.1. Các chuẩn nén
1.1.1.1. DVCPRO


10

DVCPRO là định dạng thu nhận tin tức thông dụng vì các camera gọn
nhẹ và giá thành hợp lý. DVCPRO là định dạng nén trong ảnh có các tốc độ
25Mbit/s, 50Mbit/s và 100Mbit/s. Trong đó, DVCPRO 25 sử dụng tín hiệu
vào 4:1:1, DVCPRO 50 và 100 sử dụng tín hiệu vào là 4:2:2. Tín hiệu
DVCPRO dễ dàng dựng, thêm các kỹ xảo.
Ưu điểm: Với các camera sử dụng định dạng DVCPRO, người sử dụng
có thể quay các tư liệu và nạp vào server hay hệ thống dựng phi tuyến mà
không phải chuyển đổi lại băng tần video cơ bản, thiết bị tương đối gọn nhẹ,
sử dụng giao diện DV hay IEEE 1394. Điều này đảm bảo chất lượng từ quá
trình nhập dữ liệu tới phát sóng. Ngồi ra, các file DVCPRO có thể được
truyền với tốc độ 1x hoặc 4x (4 lần thời gian thực) bằng cách sử dụng SDTI.
Nhược điểm: DVCPRO chỉ có 3 tốc độ là DVCPRO 25, 50, 100Mb/s
nên giới hạn sự linh hoạt của người sử dụng trong việc lựa chọn chất lượng
video và không lý tưởng cho phát sóng. Nhiều người sử dụng DVCPRO cho
quá trình nhập tư liệu và dựng, sau đó chuyển sang định dạng MPEG có nhóm
ảnh (GOP) dài để phát sóng. Hơn nữa do Panasonic chiếm ít thị phần, do đó
việc ứng dụng trong sản xuất và phát sóng các chương trình truyền hình cũng
ít, dẫn đến giá thành cao.
1.1.1.2. Tiêu chuẩn MPEG-2

MPEG-2 [4] là dự án giai đoạn 2 của ủy ban ISO/PEC MPEG. MPEG-2
hướng tới các ứng dụng rộng rãi hơn và có tốc độ bit cao hơn MPEG-1, bao
gồm điện tử viễn thơng và truyền hình số thế hệ kế tiếp.
a) Cấu trúc dòng bit video MPEG-2:
Cấu trúc dịng bit video MPEG-2 (hình 1.1.b) có dạng phân lớp và là sự
mở rộng cú pháp của cấu trúc MPEG-1. Trước hết, dòng bit video MPEG-2
bao gồm các chức năng của MPEG-1, có nghĩa là chúng tương hợp với nhau.


11

Do đó, có hai hướng đi trong dịng bit MPEG-2 (hình 1.1.a), cho phép hoặc
theo quy trình của MPEG-1, hoặc theo các chức năng mở rộng thêm riêng
của MPEG-2. Người thiết kế có thể lựa chọn 1 trong 2 hướng đi, nhưng
hướng mở rộng phải thể hiện mọi ích lợi của MPEG-1, chấp nhận mức độ
phức tạp cao.


12

Hình 1.1 a) Hai hướng đi trong dịng bit
MPEG-2 [4].
Hình 1.1: b) Cấu trúc
dòng bit MPEG-2 [4].


13

Dịng bit MPEG-2 có đặc điểm:



Với chuẩn nén MPEG-2, chuỗi video được mã hóa bắt đầu bằng chuỗi mở
đầu (Sequence Header), sau đó là chuỗi mở rộng (nếu có) và các nhóm ảnh.
Nếu phần chuỗi mở rộng (Sequence extension) khơng được xác định, các lớp
tiếp theo khi đó sẽ thực hiện một quy trình giống như MPEG-1 và đó là tương
hợp thuận. Khi có thêm phần mở rộng thì phải có thêm các đặc tính mở rộng
để mã hóa hữu hiệu hơn.



Phần đầu (header) của nhóm ảnh (GOP) có chức năng tương tự như phần
đầu (header) của MPEG-1 và không có chức năng đặc biệt trong phần đầu mở
rộng (extension header) của nhóm ảnh. Các thơng số quan trọng dùng để mã
hóa ảnh mở rộng được định nghĩa trong phần đầu mở rộng (extension header)
của ảnh.



Các lớp dưới slice khơng bị ảnh hưởng đáng kể, slice bao gồm tất cả các
khối macro (MB) trong một ảnh. Cấu trúc slice tổng qt khơng cần mã hóa
các vùng nhất định nào đó trên ảnh cũng là bộ phận mở rộng (extension) của
MPEG-2.
b) Đặc tính (profile) và mức (level) của tiêu chuẩn MPEG-2:
Nén MPEG-2 có một chuỗi các mức (Level) và đặc tính (Profile), được
dùng cho nhiều ứng dụng khác nhau.
Cấu trúc tín hiệu số trong tiêu chuẩn MPEG-2 rất phức tạp. Việc sử
dụng tiêu chuẩn MPEG-2 không phải lúc nào cũng cần thiết hoặc có ý nghĩa.
Vì vậy, dẫn đến việc phân chia cấu trúc thành các tập con gọi là các đặc tính
(profile) (bảng 1.1). Trong phạm vi mỗi đặc tính (profile), chỉ cho phép sử
dụng các phần của các phần tử vừa phải trong cấu trúc tín hiệu đầy đủ. Có 6

định nghĩa về đặc tính (profile) như sau:



Simple profile (đặc tính đơn giản): Số bước nén thấp nhất, chỉ cho phép mã
hóa các ảnh loại I hoặc P.


14


Main profile (đặc tính chính): Cho phép sử dụng tất cả các loại ảnh, nhưng
không tạo các mức bất kỳ. Chất lượng tốt hơn đặc tính đơn giản nhưng tốc độ
bit khơng thay đổi.
Bảng 1.1: Bảng đặc tính và mức tiêu chuẩn MPEG-2.

• SNR profile scalable (đặc tính phân cấp theo tỉ số tín hiệu trên
tạp âm): Tiêu chuẩn MPEG-2 cho phép phân cấp theo tỷ số tín
hiệu trên tạp âm. Tính phân cấp theo tỷ số tín hiệu trên tạp âm
có nghĩa là chất lượng hình ảnh và tỷ số tín hiệu trên tạp âm có
tính thỏa hiệp. Chuỗi ảnh có thể chia thành hai lớp phân biệt
nhau về chất lượng. Các lớp thấp bao gồm ảnh có chất lượng cơ
sở. Lớp cao bao gồm các lớp hoàn thiện hơn đối với lớp thấp
hơn, cho phép khôi phục cùng ảnh đó nhưng chất lượng tốt hơn.
Lớp thấp hơn, ví dụ chứa tín hiệu video theo chuẩn 4:2:0, cịn
lớp cao hơn với tín hiệu video trong chuẩn 4:2:2.


15
• Spatially Scalable Profile (Phân cấp theo khơng gian): Tính phân cấp theo

khơng gian có nghĩa là có sự thỏa hiệp đối với độ phân giải. Chuỗi ảnh được
chia ra thành hai lớp tương ứng với các độ phân giải khác nhau của ảnh. Lớp
thấp hơn bao gồm ảnh có độ phân giải thấp (ví dụ như truyền hình tiêu
chuẩn), lớp cao hơn bao gồm ảnh có độ phân giải cao (HDTV).
• High profile (đặc tính cao): Cho phép đối với cả hai loại thang mức và chuẩn
4:2:2 của tín hiệu video. Nó bao gồm tồn bộ các cơng cụ của đặc tính trước
cộng thêm khả năng mã hóa các tín hiệu màu khác nhau cùng một lúc.
• 4:2:2 profile: Được tiêu chuẩn hóa vào năm 1996. Có khả năng giải mã trong
phạm vi 15÷50 Mb/s với bất kỳ loại phối hợp nào giữa các ảnh I, P và B.
4:2:2 Profile được khuyến nghị sử dụng cho lĩnh vực sản xuất chương trình
(u cầu chất lượng tín hiệu cao).
Vấn đề hạn chế các mức có liên quan đến độ phân giải cực đại của ảnh.
Có 4 mức hạn chế sau:
• Low level (mức thấp): Ứng với độ phân giải của MPEG-1, có nghĩa là bằng
1/4 độ phân giải truyền hình tiêu chuẩn.
• Main level (mức chính): Độ phân giải của truyền hình tiêu chuẩn.
• High-1440 level (mức cao 1440): Độ phân giải của HDTV với 1440
mẫu/dịng.
• High level (mức cao): Độ phân giải HDTV với 1920 mẫu/dòng.
Kết hợp 4 mức (level) và 6 đặc tính (profile) ta được tổ hợp 24 khả
năng và hiện nay đã có 13 khả năng được ứng dụng như bảng.
*Tiêu chuẩn MPEG-2 4:2:2P@ML


16

Trong bảng đặc tính và mức tiêu chuẩn MPEG-2 (bảng 1.1), các chuẩn
đều lấy mẫu theo tiêu chuẩn 4:2:0 và cho tốc độ bit thấp rất phù hợp với công
đoạn truyền dẫn phát sóng. Tuy nhiên nó khơng thỏa mãn yêu cầu chất lượng
cho công đoạn sản xuất hậu kỳ. Chuẩn 4:2:0 khơng thể cho một hình ảnh có

chất lượng studio sau một vài thế hệ gia cơng tín hiệu bởi phép nội suy tín
hiệu hiệu màu. Sử dụng tốc độ bit 15Mbit/s với nhóm ảnh (GOP) nhỏ chất
lượng hình ảnh sẽ kém nhóm ảnh lớn sẽ gây khó khăn cho tất cả các thiết bị
có chuyển đổi tín hiệu trong thời gian xóa mành. Từ năm 1994, nhiều nhà sản
xuất và sử dụng thấy cần phải có tiêu chuẩn MPEG-2 4:2:2P@ML với tốc độ
bit đạt 50 Mbit/s có thể đáp ứng được nhu cầu chất lượng trong các ứng dụng
chuyên nghiệp.
Tháng 1/1996 MPEG-2 4:2:2P@ML trở thành tiêu chuẩn quốc tế.
MPEG-2P@ML có tốc độ bit tối đa bằng 50Mbit/s và có thể đáp ứng được cả
hai chuẩn video 4:2:2 và 4:2:0. Hệ thống này có đặc điểm chính sau đây:
• Có độ mềm dẻo cao và tính khai thác hỗn hợp. Có khả năng giải mã trong
phạm vi 15÷50 Mbit/s với bất kỳ loại phối hợp nào giữa các ảnh I, P và B.
• Chất lượng và độ phân giải màu tốt hơn MP@ML (Main Profile - Main
Level).
• Xử lý hậu kỳ sau khi nén và giải nén.
• Cho phép nén và giải nén nhiều lần mà vẫn đảm bảo chất lượng tín hiệu.
• Nhóm ảnh nhỏ, thuận tiện cho cơng nghệ dựng hình.
• Có khả năng biểu thị tất cả các dịng tích cực của tín hiệu video và biểu thị
thơng tin trong khoảng thời gian xóa mành.
* Định dạng MPEG2- I frame
MPEG2-I frame là định dạng mã hóa mà trong đó nhóm ảnh (GOP Group of Picture) chỉ bao gồm các ảnh I. Đặc trưng của định dạng này là nén


17

trong ảnh (Intra-frame) với tỷ lệ lấy mẫu là 4:2:2. Định dạng này có tốc độ tối
đa 25 Mbps, tương đương với DV25. Tuy nhiên do sử dụng tỷ số lấy mẫu
4:2:2 nên định dạng này có chất lượng màu cao, vì chỉ sử dụng tồn ảnh I, ảnh
chứa thơng tin để tái tạo toàn bộ ảnh, cho phép truy cập ngẫu nhiên trong
nhóm ảnh, nên rất phù hợp cho việc hậu kỳ.

*Định dạng IMX
IMX là một định dạng chất lượng cao dành cho truyền hình với độ phân
giải tiêu chuẩn, được phát triển trên định dạng MPEG2 của hãng SONY vào
năm 2000. IMX sử dụng nén trong ảnh (Intraframe), với định dạng lấy mẫu
4:2:2, ở các tốc độ 30,40,50 Mpbs. Hỗ trợ audio lên tới 8 kênh, 16bit. IMX
được đóng gói MXF cho các yêu cầu trao đổi video.
IMX là phiên bản giới hạn của MPEG-2 4:2:2Profile@ML, theo tiêu
chuẩn SMPTE 356 M, ấn hành năm 2001, IMX là định dạng video chuyên
dụng hay còn gọi là D10.


18

c) Nhận xét về tiêu chuẩn MPEG-2
Định dạng MPEG -2 lấy mẫu 4:2:2 đưa ra định dạng nén hiệu quả nhất
cho phát sóng và khơi phục được thơng tin màu tốt. MPEG-2 đưa ra các tốc
độ bit khác nhau (tối đa là 50Mbit/s) và sử dụng nén thời gian. Nó cho phép
dịng tín hiệu chất lượng rất cao ở tốc độ bit thấp hơn. Nén thời gian sử dụng
độ dư thừa giữa các khung để giảm bớt dữ liệu cần thiết. Trong nhiều trường
hợp, chất lượng video có thể so sánh được có thể đạt được với MPEG II ở 1/2
tới 1/3 tốc độ bit của M-JPEG. Định dạng này có các ưu điểm và nhược điểm:


Ưu điểm: MPEG-2 có phương pháp nén hiệu quả, cho phép chất lượng cao ở
tốc độ bit thấp. MPEG-2 là một tiêu chuẩn được tiêu chuẩn hóa cho phép các
hệ thống MPEG khác nhau sử dụng các file dữ liệu như nhau (mặc dù cách dữ
liệu lưu trữ trong file có thể cần phải được chuyển đổi). Các file MPEG-2 có
thể được truyền như là dữ liệu nén trong dòng truyền tải MPEG (MPEG
Transport Streams) hoặc với SDTI-CP.


• Nhược điểm: Các dữ liệu MPEG có nhóm ảnh (GOP) dài gây khó khăn cho
dựng, cắt và xử lý vì mỗi một khung khơng chứa tất cả các dữ liệu cần thiết
để tạo lại khung đó. Do đó, khi sử dụng cho các mục đích dựng hình, tín hiệu
phải được mã hóa dưới dạng MPEG -2 I frame (Dịng MPEG-2 chỉ có khung
I) với các tốc độ 30Mbit/s, 40Mbit/s hoặc 50Mbit/s.
1.1.1.3. Chuẩn nén MPEG - 4 H.264/AVC
a) Giới thiệu tiêu chuẩn MPEG-4
Phiên bản đầu tiên của MPEG-4 xuất hiện vào 2/1999. Cuối 1999
MPEG-4 v2 ra đời và trở thành tiêu chuẩn quốc tế vào đầu năm 2000. So với
MPEG-1, MPEG-2 thì MPEG-4 có nhiều nổi bật hơn như hiệu suất nén cao,
vận hành trên cơ sở nội dung…và rõ ràng có nhiều ứng dụng hơn. MPEG-4
định nghĩa một tiêu chuẩn cho các ứng dụng truyền thông đa phương tiện, các
hình ảnh, âm thanh và dữ liệu đồ hoạ và việc tái hợp chúng trên thiết bị thu,


19

hay nói cách khác nó là sự hội ngộ giữa truyền hình và Web. Đặc điểm chính
của MPEG-4 là mã hóa video và audio ở tốc độ bit rất thấp. Thực tế tiêu
chuẩn này tối ưu ở ba ngưỡng tốc độ bit sau:
+

Dưới 64kbps|

+

Từ 64 đến 384 kbps|

+


Từ 384 đến 4Mbps|
Hơn nữa, một đặc điểm quan trọng của MPEG-4 là cho phép khơi phục
lỗi tại phía thu nên rất thích hợp cho các ứng dụng truyền qua môi trường sẽ
xảy ra lỗi như moblie, wireless…Chuẩn MPEG-4 là chuẩn quốc tế đầu tiên
định nghĩa các VOP mà trong đó các phần của một cảnh có thể được thao tác
riêng rẽ trong khi những phần khác vẫn khơng đổi. Những đặc tính (profile)
và mức (level) khác nhau trong MPEG-4 cho phép sử dụng tốc độ bit lên đến
38.4Mbps và việc xử lý chất lượng studio lên đến 1.2Gbps. MPEG-4 đạt yêu
cầu ứng dụng cho các dịch vụ nội dung video có tính tương tác và các dịch vụ
truyền thông video trực tiếp hay lưu trữ.
Các đối tượng khác nhau trong ảnh gốc được mã hóa và truyền đi một
cách riêng biệt, như ta đã biết khơng có một phương pháp mã hóa nào là tối ưu
hoàn toàn. Biến đổi cosin rời rạc (DCT) và phép lượng tử chỉ tối ưu với các
ứng dụng có băng thơng hạn chế, các ảnh có độ chói ít thay đổi, nhưng với ảnh
nhiều chi tiết, có kích thước nhỏ thì khơng tối ưu. Lấy ví dụ nếu một cảnh có
chứa các dịng ký tự (text), nếu mã hóa bằng MPEG-1, MPEG-2 thì sẽ khơng
hiệu quả vì nó chỉ xem đó như là chi tiết ảnh thơng thường. Trái lại, MPEG-4
cho phép giải mã luồng ký tự kết hợp với video và các thông tin trong luồng bit
có thể hiện thị nhiều dạng khác nhau tùy thuộc vào lựa chọn của người sử dụng
ví dụ như tùy chọn ngôn ngữ... nên mang lại hiệu suất cao hơn.
Tuy nhiên MPEG-4 cũng có một số nhược điểm là bộ giải mã phải có
khả năng giải mã hết tất cả các luồng bit mà nó hỗ trợ và có khả năng kết hợp.


20

Do đó phần cứng bộ giải mã MPEG-4 phức tạp hơn MPEG-2 rất nhiều. Cũng
chính vì vậy mà các nhà nghiên cứu ln nỗ lực tìm tịi, phát minh những
cơng cụ mã hóa tối ưu hơn.
b) Lịch sử phát triển của MPEG-4 H.264/AVC

Từ các bộ mã hoá đơn giản, hoạt động tốt nhưng đơi khi có một số hình
ảnh mà nó khơng thể nén được, điều này đã thúc đẩy các nhà thiết kế phát
triển các công cụ nén mới dựa trên nền của các chuẩn trước, trong đó hiệu quả
mã hóa là vấn đề được quan tâm nhất, vì thế MPEG-4 ra đời là điều tất yếu
trong tiến trình phát triển. Sự phát triển của MPEG-4 H.264/AVC trải qua
nhiều giai đoạn như: MPEG-4 part 2 được ISO công bố vào 1999, nó là tiêu
chuẩn cho những ứng dụng truyền thông đa phương tiện với tốc độ bit thấp và
cho ứng dụng truyền hình quảng bá trong tương lai. Tuy nhiên chất lượng của
nó vẫn chưa đạt được như mong muốn, chính vì vậy mà ISO/IEC (MPEG) và
ITU đã cùng nhau hợp tác và thành lập nhóm Joint Video Team (JVT), để
nghiên cứu phát triển chuẩn mã hóa tiên tiến là Advanced Video Coding
(AVC). Và đến 2003 đã cho ra đời chuẩn MPEG-4 part 10, tên theo tiêu chuẩn
ISO/IEC 14496-10 và H.246 AVC trong ITU hay còn gọi là MPEG-4
H.264/AVC (gọi tắt là H.264/AVC).


21

c) Những đặc tính nổi bật của tiêu chuẩn nén H.264/AVC


Dự đốn khơng gian định hướng trong kiểu mã hóa Intra: hỗ trợ tới 17 kiểu
dự đoán, làm cho việc dự đốn mẫu được chính xác hơn, đạt hiệu quả nén cao
hơn.



Bù chuyển động với kích thước nhỏ có thể thay đổi: Tiêu chuẩn này mang lại
sự mềm dẻo cho sự lựa chọn kích thước và hình dạng, kích thước bù chuyển
động nhỏ nhất là 4x4. Điều này đã mang lại hiệu suất 15% so với MPEG-2.

Bù chuyển động ¼ làm giảm tính phức tạp của xử lý nội suy so với các tiêu
chuẩn trước đó.



Bù chuyển động với nhiều hình tham khảo: Do camera thay đổi góc quay hay
chuyển qua lại giữa các cảnh, việc đoán trước các chuyển động là rất phức tạp
ta cần phải có nhiều khung hình (frame) tham khảo để nâng cao hiệu suất và
chất lượng. H.264/AVC cho phép sử dụng tối đa 32 khung hình tham khảo
trong khi MPEG-2 chỉ sử dụng 2 khung hình tham khảo mang tính chất chu
kỳ. Bù chuyển động với nhiều hình tham khảo sẽ là chậm quá trình mã hóa và
giải mã nhưng sẽ tăng chất lượng ảnh với cùng tỉ số nén.



Tách riêng hình tham khảo và hình hiển thị: ở các tiêu chuẩn trước có sự phụ
thuộc giữa hình tham khảo và hình hiển thị, cịn trong H.264/AVC bộ mã hóa
có thể chọn hình ảnh để tham khảo gần nhất với hình ảnh được mã hóa cho
mục đích tham khảo dự đốn nên có thể hiển thị với tính linh hoạt cao, do đó
khoảng thời gian trễ sẽ được loại bỏ.



Giảm dư thừa về khơng gian tốt hơn: sử dụng phép biến đổi nguyên thay vì sử
dụng phép biến đổi cosin rời rạc (DCT) như MPEG-2, làm giảm ảnh hưởng
do sai số làm trịn.



Lượng tử hóa thích nghi: trong q trình mã hóa với tốc độ bit biến thiên, khi

sử dụng lượng tử hóa thích nghi, mỗi khung hình có thể được nén với những
bộ lượng tử khác nhau phụ thuộc vào bản chất hình ảnh của chúng thông qua


22

việc điều khiển tốc độ bit. Ví dụ những phần chuyển động hay những phần
hình ảnh sẫm màu khó nhận biết sẽ được xử lý với hệ số lượng tử lớn hơn (độ
nén cao hơn, dung lượng nhỏ hơn), những phần hay được hệ thống mắt người
chú ý nhiều hơn sẽ được xử lý với hệ số lượng tử thấp hơn (độ nén nhỏ hơn,
dung lượng lớn hơn). H.264/AVC cho phép sử dụng tới 52 mức lượng tử
trong khi MPEG-2 chỉ có 31 mức.


Sử dụng bộ lọc tách khối: Trái ngược với bộ tiền xử lý hay bộ hậu xử lý, bộ
lọc tách khối được áp dụng trong suốt quá trình mã hóa trên mọi khung hình
đơn lẻ, nhưng trước đó nó sẽ được sử dụng để tham khảo cho những khung
hình đến sau. Cải tiến mới này sẽ giúp tránh được hiện tượng kết khối làm
ảnh hưởng đến chất lượng hình ảnh, đặc biệt là với tốc độ bit thấp. Nhưng tốc
độ mã hóa, giải mã sẽ bị giảm sút.



Kiểu dự đốn trọng số: H.264/AVC có thể hỗ trợ quá trình mờ dần hay tối
dần khung hình trong những đoạn film có hiệu ứng mờ dần (những khung
hình đến sau rất giống so với những khung hình ngay trước nó, chỉ có sắc độ
là khác một chút),.




Mã hóa Entropy thích nghi: trong H.264/AVC sử dụng 2 phương pháp mã
hóa phức tạp hơn đó là CAVLC và CABAC thay vì biến đổi VCL tĩnh trong
MPEG-2, nên hiệu quả mã hóa cũng cao hơn rõ rệt.


23

Ngồi ra, H.264/ AVC cịn có một số đặc tính làm tăng cường khả năng
chống sai số và mất dữ liệu như:


Thơng số cài đặt cấu trúc: tập hợp các thông số nhằm tăng cường cho thông
tin đầu mục của quá trình truyền được hiệu quả hơn. Ở những tiêu chuẩn
trước, nếu mất một số thông tin quan trọng như thông tin đầu mục của chuỗi
ảnh sẽ ảnh hưởng rất lớn đến q trình giải mã. Cịn trong H.264/AVC thì các
thơng tin này được tách riêng tạo tính linh hoạt và chuyên dụng hơn.



Cấu trúc cú pháp của NAL: Mỗi cấu trúc cú pháp trong H.264/AVC được đặt
trong gói dữ liệu vật lý gọi là NAL.



Hỗ trợ kỹ thuật sắp xếp thứ tự mềm dẻo FMO và sắp xếp thứ tự slice bất kỳ
ASO



Hỗ trợ 2 ảnh chuyển mạch đồng bộ SI/SP và kỹ thuật phân vùng dữ liệu (Data

Partitioning).
Chức năng của H.264/AVC có thể tổng hợp trong những chức năng
chính như sau:



Hiệu suất nén: hiệu suất nén là mục tiêu chính trong MPEG-1, MPEG-2. Do
đó ở H.264/AVC, việc cải tiến hiệu suất mã hóa các luồng dữ liệu sẽ mở rộng
khả năng ứng dụng của nó trong thực tiễn. Tiêu chuẩn H.264/AVC tiết kiệm
lên đến 50% tốc độ bit so với MPEG-1, MPEG-2, MPEG-4 part 2 khi mã hóa
cùng một cấp độ.



Khả năng tương tác: cho phép người sử dụng có thể tương tác trực tiếp các
nội dung chương trình đang xem.



Kiểu truy nhập phổ biến: tăng cường khả năng chống lỗi trong một môi
trường khắc nghiệt, cung cấp các công cụ cần thiết để giải quyết việc mất mát
gói dữ liệu trong khi truyền trong mạng gói và lỗi bit trong môi trường không
dây.


24

Kể từ đó đến nay H.264/AVC liên tục được cải tiến và sự thành công
của H.264/AVC thể hiện rõ trong việc giảm tốc độ bit cho các ứng dụng khác
nhau như sau:



Đối với dịch vụ hội thoại hoạt động tốt ở tốc độ < 1Mbps với độ trễ thấp.



Đối với dịch vụ giải trí hoạt động tốt ở tốc độ 1- 8Mbps với độ trễ trong
khoảng 0.5-2s.



Truyền hình quảng bá qua cáp, vệ tinh, mặt đất...



DVD cho truyền hình phân giải cao.



Truyền hình theo yêu cầu qua các kênh khác nhau.



Đối với dịch vụ luồng dữ liệu hoạt động tốt ở tốc độ 50 -1500kbps với độ trễ
2s.
1.1.2. Giới thiệu về các định dạng file đóng gói media
Các định dạng file đóng gói media cịn được gọi là bộ chứa dữ liệu
(container) sẽ kết hợp hoặc lưu giữ các phần tử nội dung (file) video và audio
vào một file để thuận tiện trong lưu trữ dữ liệu, truyền tải và chia sẻ nội dung
giữa các hệ thống máy tính, server lưu trữ chương trình trong hệ thống thiết bị

truyền hình (hình 1.2). Các bộ chứa dữ liệu file cho phép đóng gói và lưu giữ
nhiều kiểu phần tử nội dung video và audio có các chuẩn nén khác nhau. Do
đó, khi một nội dung video và audio được đóng gói vào trong bộ chứa dữ liệu
và truyền đến thiết bị thu, một trong những chức năng quan trọng của bộ chứa
dữ liệu là thông báo cho thiết bị phát lại (play back) kiểu chuẩn nén cần thiết
để thiết bị có thể giải mã được các phần tử nội dung chứa trong bộ chứa dữ
liệu đó.


25

Hình 1.2: Truyền tải và chia sẻ nội dung qua mạng IP
bằng file đóng gói media (container file).
Bên cạnh các định dạng file đóng gói nội dung video và audio được
các tổ chức phát thanh truyền hình quốc tế phát triển riêng cho cơng nghệ
truyền hình như MPEG-2 hay MPEG-4, sự hội tụ của cơng nghệ thơng tin vào
truyền hình cũng dẫn tới việc sử dụng một số định dạng file đóng gói nội
dung video và audio như AVI (Audio Video Interleaved) của Microsoft hay
QuickTime của Apple được phát triển trong lĩnh vực công nghệ thông tin vào
sử dụng trong cơng truyền hình. Trong đó:


AVI (Audio Video Interleaved): Định dạng file AVI được Microsoft phát
triển vào năm 1992 để phát hay xử lý các nội dung nghe nhìn (AV) trên hệ
thống máy tính chạy hệ điều hành Windows. Định dạng file AVI cho phép
đóng gói các dữ liệu nội dung video, audio vào trong một file đóng gói
(container) và cho phép phát đồng bộ nội dung audio với video. Định dạng
AVI, hỗ trợ nhiều tiêu chuẩn nén (bộ codec) dữ liệu video và audio, đã và
đang được sử dụng trong nhiều hệ thống hậu kỳ và hệ thống phát sóng
chương trình truyền hình. Tuy nhiên, do được phát triển từ năm 1992, AVI có

một số hạn chế. Đó là:


×