Tải bản đầy đủ (.docx) (38 trang)

Chuẩn nén trong truyền hình UHDTV

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (733.77 KB, 38 trang )

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
KHOA KỸ THUẬT ĐIỆN TỬ I
----------

PHÁT THANH TRUYỀN HÌNH
Đề tài :Chuẩn nén trong truyền hình
UHDTV

Giảng viên:Nguyễn Quốc Dinh
Nhóm thực hiện: Nhóm 04
Lớp:D11XLTH


MỤC LỤC
I, GIỚI THIỆU CHUNG VỀ UDHTV

II, KHÁI QUÁT VỀ NÉN VIDEO VÀ CHUẨN NÉN MPEG

III, CHUẨN NÉN MPEG-4 AVC/H.264

IV,CHUẨN NÉN MỚI H.265/HEVC


CHƯƠNG I
GIỚI THIỆU VỀ CÔNG NGHỆ UHDTV
1.1.

Giới thiệu về UHDTV

Ultra High Definition Television (Ultra HD Television hay UHDTV) là
công nghệ truyền hình được thiết kế để cung cấp cho người xem


nhưng trải nghiệm hình ảnh chất lượng siêu nét. UHDTV bao gồm 4K
UHD (2160p) và 8K UHD (4320p), đó là hai định dạng video kĩ thuật
số được các nhà nghiên cứu của Viện Công nghệ và Khoa học NHK
(Nhật Bản) đề xuất và được phê duyệt bởi Liên minh viễn thông quốc
tế (ITU). Công nghệ xử lý tín hiệu truyền hình UHDTV được sử dụng
cho màn hình có tỉ lệ là 16:9 và có ít nhất một đầu vào kĩ thuật số có
khả năng lưu trữ và phát video có độ phân giải tối thiểu 3840 x 2160
pixel.
Các tiêu chuẩn chất lượng của UHDTV được thực hiện theo 2 giai
đoạn trong đó tiến bộ công nghệ ở mỗi giai đoạn có thể tương đương
với bước nhảy vọt công nghệ từ truyền hình có độ nét tiêu chuẩn cũ
tới tiêu chuẩn công nghệ truyền hình độ nét cao hiện nay (HDTV).
Trong khi hình ảnh truyền hình HDTV hiện tương đương với 1-2
megapixel, hình ảnh truyền hình UHDTV giai đoạn 1 đã lên tới 8
megapixel và ở giai đoạn 2 lên tới 32 megapixel.
Chất lượng hình ảnh UHDTV song hành với độ trung thực của màu
tăng vọt và các lựa chọn về số hình ảnh trên 1 giây của UHDTV cũng
cao hơn nhiều so với HDTV. UHDTV là phát triển làm chấn động thế
giới truyền hình toàn hành tinh.


Độ phân giải 4K và 8K của UHDTV
Truyền hình UHDTV sẽ lôi cuốn toàn cầu trong tương lai gần. UHDTV
là bình minh của kỷ nguyên mới về truyền hình với mức độ thực của
hình ảnh chưa từng thấy mà người xem có thể thưởng thức.
+ Màu sắc thực hơn nhờ đường truyền băng
+ Sự rõ nét và chi tiết hơn của hình ảnh được nâng cao cho các màn
hình cỡ lớn dễ nhìn và sắc nét hơn.
+ Hệ thống âm thanh Multichanel 22.2 được phát sóng đồng thời với
UHDTV hỗ trợ chức năng âm thanh vòm.

1.2.

Khác biệt giữa UHDTV và các tivi tiêu chuẩn trước đó

Khác biệt lớn đầu tiên giữa UHDTV và một chiếc TV thường chính
là độ phân giải. Trong khi một chiếc TV truyền thống chỉ có thể hiển
thị tối đa khoảng 500 dòng và 500 cột điểm ảnh, tương ứng với độ
phân giải chỉ khoảng 500 x 500 pixel (250.000 điểm ảnh), còn TV
HDTV hiện hành có thể chia ra 1.920 cột và 1.080 dòng quét, tương
ứng với độ phân giải 1.920 x 1.080 pixel (hơn 2 triệu điểm ảnh) thì
một màn hình UHDTV có thể chia ra 3.840 cột và 2.160 dòng quét (với


UHD 4K) và 7.680 cột và 4.320 dòng quét (với UHD 8K) tương ứng với
độ phân giải 3.840 x 2.160 pixels (với UHD 4K khoảng 8 triệu điểm
ảnh) và 7.680 x 4320 pixels (với UHD 8K khoảng 33 triệu điểm ảnh)
trong Rec ITU-R BT.1769.
Như vậy, lượng điểm ảnh hiển thị được trên màn hình UHDTV nhiều
hơn gấp 40(80) lần so với TV thường và gấp 4(8) lần so với TV HDTV.
Điều đó đồng nghĩa UHDTV có thể hiển thị rất nhiều chi tiết hơn. Khác
biệt lớn thứ hai giữa UHDTV và TV thường nằm ở số cổng vào tín hiệu
ở mặt sau TV. Do phải hiển thị nhiều điểm ảnh hơn, nên một chiếc
UHDTV cần tới 3 dây cáp hình : một dây để truyền tải các hình ảnh
màu đỏ (R), một dây cho màu xanh lá (G) và một dây cho màu xanh
lam (B).
Khác biệt lớn cuối cùng là một số loại UHDTV cần có một đầu thu và
giải mã tín hiệu độ phân giải siêu nét (UHDTV receiver) thì mới có thể
bắt sóng truyền hình HD trực tiếp từ đài phát.
1.3.


Lợi ích của độ phân giải UHDTV

Trước hết, hình ảnh sẽ sắc nét và rõ ràng hơn, các pixel trên màn hình
sẽ nhỏ lại và chúng ta sẽ được hiệu ứng tương tự như trên các điện
thoại Full - HD hoặc “Retina” hiện nay. Chữ và chi tiết ảnh sẽ được
hiển thị tốt hơn, trải nghiệm xem thích thú hơn. Điều này quan trọng
bởi vì hiện nay các TV càng ngày càng lớn hơn, chúng ta thậm chí đã
có những chiếc TV gia đình với đường chéo màn hình lên đến 84 – 85
inch.
Tuy nhiên, cũng cần phải nói thêm rằng khả năng nhận biết các điểm
ảnh của mắt người còn phụ thuộc nhiều vào khoảng cách đến màn
hình. UHD chỉ thật sự có lợi ở vùng màu xanh lá cây, tức là chúng ta sẽ
cần những chiếc TV lớn 50 – 140 inch và khoảng cách xem từ 1,5m


đến xấp xỉ 5m. Mảng màu xanh càng lớn thì lơi ích càng nhiều. Chỉ khi
nào đạt được yêu cầu này thì trải nghiệm 4K(8K) của chúng ta mới
thật sự tốt.

Tỷ lệ kích thước màn hình và khoảng cách xem
Ngoài ra, nội dung 3D cũng được hưởng lợi rất nhiều khi sử dụng độ
phân giải 4K. Hiện tại, những TV 3D hay máy chiếu sử dụng kính phân
cực thụ động sẽ cắt hình ảnh Full - HD ra làm hai tương ứng với hai
mắt của chúng ta để có thể tạo hiệu ứng nổi. Chính vì thế, chúng ta chỉ
nhận được hình ảnh với độ phân giải 960 x 540 (một nửa mỗi chiều
của 1920 x 1080) mà thôi, và tất nhiên là ảnh sẽ không thể đẹp như
lúc xem 2D rồi. Còn khi áp dụng 4K, hình ảnh 3D xem qua kính thụ
động sẽ được chia thành hai ảnh Full - HD 1080p cho mỗi mắt (tức
một nửa 4K), tuyệt vời hơn là điều đương nhiên rồi.



Đối với các nhà sản xuất thiết bị, những màn hình 4K thì sẽ dễ sản
xuất hơn là áp dụng một công nghệ mới hoàn toàn như OLED, trong
khi họ vẫn có thể tiếp thị được nó ra thị trường như một chuẩn nội
dung mới hơn, xịn hơn. Như các bạn đã thấy, con số 4K cao hơn những
con số khác, và do đó nó dễ dàng được người tiêu dùng cho là “tốt
hơn”.
Chắc chắn rằng khi hỏi độ phân giải 3840 x 2160 với 1920 x 1080 cái
nào tốt hơn, nhiều người sẽ trả lời ngay rằng 4K tốt vì nó có nhiều
điểm ảnh hơn. Nhân viên bán hàng chắc chắn cũng sẽ tận dụng điểm
này để giới thiệu sản phẩm đến bạn. Tuy nhiên, lại một lần nữa 4K tốt
hơn hay không còn phụ thuộc vào nhiều yếu tố, như vấn đề khoảng
cách mà chúng ta đã thảo luận ở trên. Hiện nay cũng có những người
tiêu dùng phổ thông nói rằng “Tôi chẳng biết Full–HD là gì, nhưng mà
tôi muốn có nó”. Điều tương tự nhiều khả năng cũng sẽ diễn ra với 4K
Ultra HD.


CHƯƠNG II
KHÁI QUÁT VỀ NÉN VIDEO VÀ CHUẨN NÉN MPEG
2.1. Mục đích nén tín hiệu video
Tín hiệu video sau khi được số hoá 8 bit có tốc độ 216 Mb/s. Để có
thể truyền trong một kênh truyền hình thông thường, tín hiệu video số
cần phải được nén trong khi vẫn phải đảm bảo chất lượng hình ảnh .
Nén video trong những năm 1950 được thực hiện bằng công nghệ
tương tự với tỷ số nén thấp. Ngày nay công nghệ nén đã đạt được
những thành tựu cao hơn bằng việc chuyển đổi tín hiệu video từ
tương tự sang số. Công nghệ nén số (Digital Compressed) đòi hỏi năng
lực tính toán nhanh. Song ngày nay với sự phát triển của côngnghệ
thông tin, điều này không còn trở ngại. Như chúng ta biết tín hiệu

video có dải phổ từ 0 - 6 MHz, tuy nhiên trong nhiều trườnghợp năng
lượng phổ chủ yếu tập trung ở miền tần số thấp và chỉ có rất ít thông
tin chứa đựngở miền tần số cao.Đối với tín hiệu video số, số lượng bit
được sử dụng để truyền tải thông tin đối vớimỗi miền tần số khác
nhau, có nghĩa là: miền tần số thấp, nơi chứa đựng nhiều thông
tin,được sử dụng số lượng bít lớn hơn và miền tần số cao, nơi chứa
đựng ít thông tin, được sử dụng số lượng bít ít hơn. Tổng số bít cần
thiết để truyền tải thông tin về hình ảnh sẽ giảm một cách đáng kể và
dòng dữ liệu được “nén” mà chất lượng hình ảnh vẫn đảm bảo.Thực
chất của kỹ thuật “nén video số” là loại bỏ đi các thông tin dư thừa.
Các thông tin dư thừa trong nén video số thường là:


+ Độ dư thừa không gian giữa các pixel;
+ Độ dư thừa thời gian do các ảnh liên tiếp nhau;
+ Độ dư thừa do các thành phần màu biểu diễn từng pixel có độ
tương quancao;
+ Độ dư thừa thống kê do các kí hiệu xuất hiện trong dòng bít với xác
suất xuất hiệnkhông đều nhau;
+ Độ dư thừa tâm lý thị giác (các thông tin nằm ngoài khả năng cảm
nhận của mắt).vv…
Như vậy, mục đích của nén tín hiệu video là :
- Giảm tốc độ dòng bít của tín hiệu gốc xuống một giá trị nhất định
đủ để cóthể tái tạo ảnh khi giải nén;
- Giảm dung lượng dữ liệu trong lưu trữ cũng như giảm băng
thông cần thiết;
- Tiết kiệm chi phí trong lưu trữ và truyền dẫn dữ liệu trong khi vẫn
duy trìchất lượng ảnh ở mức chấp nhận đựơc.Với nguyên nhân và
mục đích của việc nén tín hiệu được trình bày như ở trên, ngàynay có
nhiều các chuẩn nén đã ra đời như: JPEG, M-JPEG, MPEG, DV… Trong

đó chuẩn nén MPEG được sử dụng nhiều trong nén video trong truyền
hình với thành công của chuẩnnén video MPEG-2 trong truyền hình số
và chuẩn nén MPEG-4 trong truyền hình trên mạng Internet.
2.2. Chuẩn nén MPEG
2.2.1. Khái quát về nén MPEG
- MPEG (Moving Picture Expert Group) là nhóm chuyên gia về
hình ảnh, được thành lập từ tháng 2 năm 1988 với nhiệm vụ xây dựng
tiêu chuẩn cho tín hiệuAudio và Video số. Ngày nay, MPEG đã trở
thành một kỹ thuật nén Audio và Video phổ biến nhất vì nó không chỉ
là một tiêu chuẩn riêng biệt mà tuỳ thuộc vào yêu cầu cụ thể của từng


thiết bị sẽ có một tiêu chuẩn thích hợp nhưng vẫn trên cùng một
nguyên lý thống nhất.
- Tiêu chuẩn đầu tiên được nhóm MPEG đưa ra là MPEG-1, mục tiêu
của MPEG-1là mã hoá tín hiệu Audio-Video với tốc độ khoảng 1.5Mb/s
và lưu trữ trong đĩa CD với chất lượng tương đương VHS.
- Tiêu chuẩn thứ 2 : MPEG-2 được ra đời vào năm 1990, không như
MPEG-1 chỉnhằm lưu trữ hình ảnh động vào đĩa với dung lượng bit
thấp. MPEG-2 với “công cụ ” mã hoá khác nhau đã được phát triển.
Các công cụ đó gọi là “Profiles” đượctiêu chuẩn hoá và có thể sử dụng
để phục vụ nhiều mục đích khác nhau.
- Tiêu chuẩn tiếp theo mà MPEG đưa ra là MPEG-4, được đưa ra vào
tháng 10 năm 1998, đã tạo ra một phương thức thiết lập và tương tác
mới với truyền thông nghe nhìn trên mạng Internet, tạo ra một
phương thức sản xuất, cung cấp và tiêu thụ mới các nội
dung video trên cơ sơ nội dung và hướng đối tượng (content/objectbased).
- MPEG-7: là một chuẩn dùng để mô tả các nội dung Multimedia, chứ
không phải là một chuẩn cho nén và mã hoá audio/ảnh động như
MPEG- 1, MPEG-2 hay MPEG-4. MPEG-7 sử dụng ngôn ngữ đánh dấu

mở rộng XML(Extansible Markup Language) để lưu trữ các siêu dữ
liệu Metadata, đính kèm timecode để gắn thẻ cho các sự kiện, hay
đồng bộ các dữ liệu. MPEG-7 bao gồm 3 bộ chuẩn sau:
+ Bộ các sơ đồ đặc tả (Description Schemes) và các đặc tả
(Description).
+ Ngôn ngữ xác định DDL (Description Definition Language) để định
nghĩa các sơ đồ đặc tả.
+ Sơ đồ mã hoá quá trình đặc tả.
Việc kết hợp MPEG-4 và MPEG-7 sẽ tạo ra các giải pháp lý tưởng cho
các dịch vụ Streaming Media, các hệ thống lưu trữ và sản xuất
Streaming Media trong thời gian tới
2.3. Các chuẩn nén MPEG.


2.3.1 Chuẩn nén MPEG-1
MPEG -1 được hình thành và năm 1988, là tiêu chuẩn của nhóm
chuyên gia về hình ảnh MPEG ở trong giai đoạn đầu tiên (tương ứng
với tiêu chuẩn ISO/IEC 11172 của ITU).Mục đích của MPEG -1 là
nghiên cứu một tiêu chuẩn mã hoá video và âm thanh kèm theo trong
các môi trường lưu trữ như: CD-ROM, đĩa quang … Tốc độ mã hoá
trong khoảng 1.5Mb/s.
Chuẩn nén MPEG -1 bao gồm 4 phần :
- Các hệ thống: ISO/IEC 11172 -1
- Video: ISO/IEC 11172 -2
- Audio: ISO/IEC 11172 -3
- Hệ thống kiểm tra: ISO/IEC 11172 -4
Trong các phần trên ta nghiên cứu một vài thông số trong phần Video
(ISO/IEC 11172-2).
2.3.2 Chuẩn nén MPEG-2
Chuẩn nén MPEG -2 là chuẩn nén phát triển tiếp sau MPEG -1, có kế

thừa tất cả các tiêu chuẩn của MPEG -1 và mục đích là nhằm hỗ trợ
việc truyền video số, tốc độ bít lớn hơn 4 Mb/s, bao gồm các ứng dụng
DSM (phương tiện lưu trữ số), Các hệ thống truyền hình hiện tại
(NTSC, PAL, SECAM), cáp, thu lượm tin tức điện tử, truyền hình trực
tiếp từ vệ tinh, truyền hình mở rộng (EDTV), truyền hình độ phân
giảicao (HDTV)…
Chuẩn MPEG -2 bao gồm 4 phần chính:
-Các hệ thống: ISO/IEC 13818 -1.
-Video: ISO/IEC 13818 -2


-Audio: ISO/IEC 13818 -3
-Các hệ thống kiểm tra: ISO/IEC 13818 -4.
2.3.3 Chuẩn nén MPEG-4
Ngày nay, khi nhu cầu truyền phát các ứng dụng video và đa
phương tiện mới trên hạ tầng kỹ thuật Internet đã làm nảy sinh các
yêu cầu chức năng mới không có trong các chuẩn nén MPEG -1 và
MPEG -2 hay các chuẩn nén trước đó. Tháng 10 năm 1998 với sự xuất
hiện của chuẩn nén MPEG -4 đã tạo ra một phương thức thiếtlập và
tương tác mới với truyền thông nghe nhìn trên mạng Internet, tạo ra
một phương thức sản xuất, cung cấp và tiêu thụ mới các nội dung
video trên cơ sở nội dung và
hướng đối tượng (content/object-based). Đây chính là một công nghệ
trình diễn truyền thông đa phương tiện phức hợp, có khả năng truyền
thông tại các môi trường truyền thông đa phương tiện phức hợp, có
khả năng truyền thông tại các môi trường : truyền hình số, đồ hoạ
tương tác, World Wide Web. Vì vậy, nhiệm vụ của MPEG -4 là nhằm
phát triển các chuẩn xử lý, mã hoá và hiển thị ảnh động, audio và các
tổ hợp của
chúng.MPEG -4 đang được triển khai bởi nhiều nhà vận hành mạng và

dịch vụ trên thếgiới với các dịch vụ mới đang được bổ xung để chiếm
các lợi thế cấu trúc hạ tầng băng rộng đang phát triển.
2.3.4 Tiêu chuẩn MPEG-7
MPEG (ISO/IEC SC29/WG11) cho ra đời một tiêu chuẩn mới là
MPEG-7 với mục đích để mô tả các nội dung Multimedia, chứ nó không
phải là chuẩn nén và mã hoá audio,video, ảnh động như các chuẩn
nén đã ra đời trước đó.


CHƯƠNG III
CÔNG NGHỆ NÉN ẢNH H.264/MPEG - 4 AVC
3.1. GIỚI THIỆU CHUNG
Kể từ khi mới xuất hiện vào đầu những năm 90, chuẩn nén video
MPEG-2 đã hoàn toàn thống lĩnh thế giới truyền thông. Cũng trong
thập kỷ này, chuẩn nén MPEG-2 đã được cải tiến về nhiều mặt. Giờ đây
nó có tốc độ bit thấp hơn và việc ứng dụng nó được mở rộng hơn nhờ
có các kỹ thuật như đoán chuyển động, tiền xử lý, xử lý đối ngẫu và
phân bổ tốc độ bit tùy theo tình huống thông qua ghép kênh thống kê.
Tuy nhiên, chuẩn nén MPEG-2 cũng không thể được phát triển một
cách vô hạn định. Thực tế hiện nay cho thấy chuẩn nén này đã đạt đến
hết giới hạn ứng dụng của mình trong lĩnh vực truyền truyền hình từ
sản xuất tiền kỳ đến hậu kỳ và lưu trữ Video số. Bên cạnh đó, nhu cầu


nén Video lại đang ngày một tăng cao kèm theo sự phát triển mạnh
mẽ của mạng IP mà tiêu biểu là mạng Internet. Chuẩn video MPEG-2
bị hạn chế bởi hai yếu tố trong định nghĩa ban đầu (original
definition) của nó:
• Tốc độ bit nhắm tới của video được nén là khoảng 2–15 Mb/s (đối
với main profile ở mail level). Tiêu chuẩn này không chứa giới hạn tốc

độ bit thấp hơn bất kỳ vì điều này không được yêu cầu trong định
nghĩa của bộ mã hóa tương thích. Hiển nhiên MPEG-2 cũng không
hiệu quả với tốc độ bit thấp hơn.
• Silicon cho thực hiện MPEG-2 đã bị giới hạn đến trình độ công nghệ
của những ngày đó. Điều này có nghĩa là trong năm 1994 ASIC
(application Specific Integrated Circuit) được sử dụng trong thiết kế
bộ giải mã với mật độ 120.000 gate/chip với kích thước gate 0.5 - 1 m.
Trong khi đó công nghệ tiên tiến ngày nay đã đạt 25.000.000
gate/ASIC với kích thước gate nhỏ hơn 0.1 m.
Như vậy các kỹ thuật dựa trên MPEG-2 đã bị hạn chế trong việc thực
hiện thực tế trong công nghệ ngày hôm nay. Nhiều tiêu chuẩn mã hóa
mới đã và đang nghiên cứu để khắc phục các nhược điểm của MPEG-2.
Trong đó H.264/AVC, dự án tiêu chuẩn mã hóa video của nhóm chuyên
gia mã hóa video của tổ chức ITU (ITU – T Video Coding Experts Group
– VCEG) và nhóm chuyên gia ảnh động ISO/IEC (ISO/IEC Moving
Picture Experts Group) là nổi bật hơn cả. Cái tên H.264/AVC chính là
sự kết hợp tiêu chuẩn nghiên cứu riêng của từng nhóm: nhóm ITU là
H.264, nhóm MPEG là AVC (Advanced Video Compression) tức MPEG-4
part 10. Các mục đích chính của việc nỗ lực tiêu chuẩn hóa này là phát
triển một tiêu chuẩn mã hóa video đơn giản, với chỉ tiêu kỹ thuật nén
tăng cường, và để có thể trình diễn video “thân thiện mạng” (network
– friendly), nhắm tới các ứng dụng “hội thoại” (video telephone) và
“không hội thoại” (lưu trữ, quảng bá hoặc streaming). H.264/AVC đã
thực hiện sự cải thiện đáng kể trong hiệu quả giảm tỷ lệ bit và méo ở
tốc độ bit đó, cung cấp (một cách gần đúng) hệ số tiết kiệm tốc độ bit
khoảng hai lần so với các tiêu chuẩn đang tồn tại như MPEG-2 video


3.2. CÁC PHIÊN BẢN H.26X
Theo ITU-T, các tiêu chuẩn mã hoá Video được coi là các khuyến

nghị gọi tắt là chuẩn H.26x (H.261, H.262, H.263 và H.264). Với tiêu
chuẩn ISO/IEC, chúng được gọi là MPEG-x (như MPEG-1, MPEG-2 và
MPEG-4).
3.2.1. H.261
Mục đích:
- H.261 được phát triển cho dịch vụ truyền hình hội nghị video phone
qua ISDN ở tốc độ thấp 64kbps (p= 1..30)
- Truyền hình hội nghị theo yêu cầu với chất lượng ảnh cao hơn, p ≥ 6,
tốc độ ≥ 384 kbps. - Là cơ sở của chuẩn sau này như MPEG 1,2
- Các đặc tính:
+ Trễ mã hóa < Truyền hình hội nghị song công, gây ấn
tượng◊150ms, tốt cho khán giả. Mở rộng thị trường
+ Thực hiện trên linh kiện VLSI (giá thành thấp) các dịch vụ video
phone, truyền hình hội nghị.
Các dạng ảnh đầu vào:
- Khả năng phối hợp giữa các chuẩn 625 và 525 dòng của TV, H.261 sử
dụng dạng thức trung gian chung CIF ( Common Intermediate
Format) với các tốc độ bit thấp hơn. H.261 sử dụng dạng có tốc độ nhỏ
hơn ¼ là QCIF (Quadrature).
- Với tốc độ 30 khung hình/s thì tốc độ dữ liệu của CIF là 37,3Mbps,
QCIF là 9,35 Mbps. Tốc độ càng thấp thì càng giảm số khung hình/s.
3.2.2 . H.263


Mục đích:
- Tiêu chuẩn cải tiến H.261 cho video tốc độ thấp, có thể truyền trên
mạng điện thoại công cộng PSTN, được công nhận năm 1996.
- Giống như H.261, mã hóa DCT cho các MB trong I Frame và DCT sai
biệt dự đoán trong P Frame.
- Tốc độ tối thiểu.

Ưu điểm:
- Chính xác sai biệt dự đoán tới ½ pixels
- Không hạn chế vector chuyển động.
- Mã hóa số học theo cú pháp.
- Dự đoán thuận lợi với các khung P
- Ngoài CIF, QCIF, H.263 còn hỗ trợ SQCIF, 4 CIF và 16 CIF với độ phân
giải tín hiệu chói tuần tự là 128x96, 704x576, 704x576, 1408x1152.
Độ phân giải tín hiệu sắc bằng ¼ tín hiệu chói.
3.2.3. MÃ HÓA H.264
3.2.3.1.Sơ đồ khối mã hóa H.264:


Mã hóa H.264

Trong đó:
- Fn (current): Ảnh hiện tại
- F’n-1(reference): Ảnh tham chiếu của 1 hoặc 2 khung hình được mã
hóa trước đó.
- F’n(reconstoncted): Ảnh khôi phục
- Intra prediction: Dự đoán trong ảnh
- Choose Intra Prediction: Chọn dự đoán trong ảnh
- Deblocking filter: Bộ lọc tách khối
- T, Q và T-1 , Q-1 : mã hóa separable integer transform-biến đổi
nguyên tách biệt , lượng tử hóa và giải mã T , giải lượng tử hóa tương
ứng.
- Dn, D’n: Phần ảnh sai khác vào mã hóa và ra từ giải mã


- Reorder: Sắp xếp lại - Entropy encode: Mã hóa entropy - MC(Motion
Compensation): Bù chuyển động.

- ME(Motion estimation): Đánh giá chuyển động
Định dạng mã hóa dữ liệu:
Thiết kế H. 264/ AVC hỗ trợ mã hóa video (trong định dạng 4:2:0) có
chứa các frame liên tục hoặc xen kẽ, hoặc có thể được trộn với nhau
trong cùng một dãy. Nhìn chung một frame video chứa hai field đan
xen, được cách ly về mặt thời gian bởi một chu kỳ field (nửa thời gian
của chu kỳ frame), có thể được mã hóa riêng biệt như hai ảnh field,
hoặc cùng với nhau như một ảnh frame. Một frame liên tục phải luôn
luôn được mã hóa như một ảnh frame đơn; tuy nhiên nó vẫn được
xem như gồm hai field ở cùng một thời điểm
3.2.3.2.Lớp trừu tượng mạng (NAL – Network Abstaction Layer)
Lớp trừu tượng mạng (NAL) được xác định để định dạng dữ liệu
này và cung cấp thông tin header trong cách thích hợp cho việc
chuyên chở bởi các lớp truyền tải hoặc môi trường lưu trữ. Tất cả dữ
liệu được chứa trong các khối NAL, mỗi khối chứa một số nguyên byte.
Một khối NAL xác định định dạng chung cho việc sử dụng trong cả hệ
thống định hướng gói (packet – oriented) và hệ thống định hướng
dòng bit (bitstream). Định dạng của các khối NAL là đồng nhất cho cả
việc phân phối dòng truyền tải định hướng gói và định hướng dòng
bit, ngoại trừ rằng mỗi khối NAL trong lớp truyền tải định hướng
dòng bit có thể có một tiền tố mã hóa khởi hành ở trước.
3.2.3.3. Lớp mã hóa video (Video Coding Layer)
Lớp mã hóa video (VCL-Video Coding Layer), được định rõ để biểu
diễn hiệu quả nội dung của dữ liệu video.Lớp mã hóa video của


H.264/AVC thì tương tự với các tiêu chuẩn khác như MPEG-2 video.
Nó là sự kết hợp dự đoán theo thời gian và theo không gian, và với mã
chuyển vị. Ảnh được tách thành các khối. Anh đầu tiên của dãy hoặc
điểm truy nhập ngẫu nhiên thì được mã hóa (trong khối) “Intra”, có

nghĩa là không dùng thông tin nào ngoài thông tin chứa trong bản
thân ảnh. Mỗi mẫu của một khối trong một frame Intra được dự đoán
nhờ dùng các mẫu không gian bên cạnh của các khối đã mã hóa trước
đó. Đối với tất cả các ảnh còn lại của dãy hoặc giữa các điểm truy cập
ngẫu nhiên, mã hóa “Inter” được sử dụng, dùng dự đoán bù chuyển
động từ các ảnh được mã hóa trước.


3.3. Kỹ thuật nén trong ảnh

3.3.1. Sơ đồ mã hóa trong ảnh

Intra Frame
Ảnh I thực hiện quá trình mã hóa trong ảnh cũng
tương tự mã hóa MPEG-2, nhưng cũng có những điểm khác như trình
bày ở các phần sau.

Mã hóa trong ảnh H.264


Trong đó:

F’n(reconstoncted): Ảnh khôi phục sẽ được lưu trong Memory để tìm
vector chuyển động cho Frame P tiếp theo.
3.3.2 Chọn macroblock và thứ tự trong công đoạn nén:
Chuẩn nén MPEG-4 AVC có hai cải tiến mới trong lĩnh vực nén
không
gian.
Trước hết, bộ lập mã này có thể tiến hành nén không gian tại các
macroblock 16x16 điểm ảnh thay vì các block 8x8 như trước đây. Điều

này giúp tăng cường đáng kể khả năng nén không gian đối với các hình
ảnh có chứa nhiều khoảng lớn các điểm ảnh giống nhau.
Thứ hai là thao tác nén được tiến hành trong miền không gian trước khi
công đoạn DCT diễn ra. Chuẩn nén MPEG-4 AVC so sánh macroblock
hiện thời với các macroblock kế bên trong cùng một khung, tính toán độ
chênh lệch, và sau đó sẽ chỉ gửi đoạn chênh lệch tới DCT. Hoặc là nó có
thể chia nhỏ macroblock 16x16 điểm ảnh thành các khối 4x4 nhỏ hơn và
so sánh từng khối này với các khối kế bên trong cùng một macroblock.
Điều này giúp cải thiện khả năng nén ảnh chi tiết.


3.3.3. Chuyển vị, co dãn và lượng tử hóa:
Tương tự với các tiêu chuẩn mã hóa video trước đó, H.264/AVC
cũng dùng mã chuyển vị cho dự đoán tiếp theo. Tuy nhiên trong
H.264/AVC việc chuyển vị được áp dụng cho các khối 4 x 4, và thay cho
biến đổi cosin rời rạc
(DCT) 4 x4
a/ Biến đổi nguyên tách biệt (separable integer transform)
được sử dụng, với các tính chất giống như 4 x 4 DCT về cơ bản. Vì
biến đổi ngược được xác định bởi các thuật toán nguyên chính xác nên
tránh được sự không thích nghi của biến đổi ngược. Một biến đổi 2 x 2
bổ sung được áp dụng cho bốn hệ số DC của mỗi thành phần chroma.
Nếu một macroblock được mã hóa trong mode Intra - 16 x 16, thì một
biến đổi 4 x 4 tương tự được thực hiện cho các hệ số DC 4 x 4 của tín
hiệu luma.

Ví dụ: Đầu vào là khối luma 4x4. Thực hiện biến đổi T


Đầu vào X Ra chuyển đổi W


b/ Lượng tử hóa các hệ số biến đổi
Để lượng tử hóa các hệ số biến đổi, H.264/AVC dùng lượng tử hóa
vô hướng. Một trong số 52 bộ lượng tử hóa được chọn cho mỗi
macroblock bởi tham số lượng tử hóa QP (Quantization Parameter).
Lượng tử hóa thay đổi theo khoảng cách để đạt được hiệu quả
nén cao theobiểu thức sau
Z = W round [ PF/ Qstep ]


Sau lượng tử là Z

Quét zic-zăc

Các bộ lượng tử hóa được sắp xếp sao cho có sự tăng khoảng 12.5%
trong kích thước bước lượng tử hóa khi QP tăng một đơn vị.


c/ Quét zic-zăc
Quét zic-zac bắt đầu từ hệ số DC nhằm ánh xạ ma trận 4x4 thành
vector 1x 16, đáy vector là giá trị EOB (End of Block). Nhóm các thành
phần tần số thấp vào đỉnh vector.

3.3.4. Sắp xếp lại:
Sắp xếp lại khối 1x 16 sau quét zic- zac ở trên. Thành phần DC ở đỉnh
vector 1x16, tiếp đến theo thứ tự lần lượt là 15 thành phần còn lại AC.

3.3.5.Mã hóa Entropy:
Trong H.264/AVC, hai phương pháp mã hóa entropy được hỗ trợ :
- Phương pháp mã hóa entropy mặc định (default) sử dụng một tập từ

mã mở rộng vô hạn đơn cho tất cả phần tử cấu trúc, ngoại trừ các hệ
số biến đổi được lượng tử hóa. Như vậy, thay cho việc một thiết kế
bảng VCL khác nhau cho mỗi phần tử cấu trúc, chỉ có một ánh xạ cho
một bảng từ mã đơn được thực
hiện theo thống kê dữ liệu. Bảng từ mã đơn được chọn là mã expGolomb với các tính chất giải mã rất đơn giản và hài hòa.


×