Tải bản đầy đủ (.pptx) (65 trang)

Phương pháp tiên tiến nén video AVC và ứng dụng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.08 MB, 65 trang )

IT4621

XỬ LÝ DỮ LIỆU ĐA PHƯƠNG TIỆN
Đề tài 13

“Phương pháp tiên tiến nén Video AVC
và ứng dụng”
Giảng viên hướng dẫn: PSG. TS Nguyễn Thị Hoàng Lan
Nhóm:


NỘI DUNG

-

Tìm hiểu chung phương pháp nén Video tiên tiến (AVC: Advanced Video Coding)
Tìm hiểu chuẩn MPEG - 4/ H264 AVC.
So sánh phương pháp nén Video chuẩn MPEG - 4 với phương pháp nén Video theo chuẩn MPEG - 1.
Tìm hiểu một thuật toán trong nén theo chuẩn MPEG - 4, thử nghiệm ứng dụng.


Tìm hiểu chung phương pháp nén Video tiên tiến AVC và chuẩn MPEG 4/ H264 AVC

-

H.264/ MPEG - 4 Part 10 hay AVC (Advanced Video Coding), thường được gọi tắt là H.264.
Là một chuẩn mã hóa/ giải mã Video và định dạng video đang được sử dụng rộng rãi hiện nay để ghi, nén và chia sẻ
Video phân giải cao, dựa trên việc bù chuyển động (Motion - Compensation) trên từng Block (Block Oriented).


Tìm hiểu chung phương pháp nén Video tiên tiến AVC



-

Kỹ thuật SVC (Scalable Video Coding) được sử dụng trong phương pháp này để thể hiện sự tiên tiến.


Ứng dụng

-

MPEG4 Part 10 /H264 hay AVC là một trong những định dạng đang được dùng phổ biến nhất hiện nay trong công
nghệ mã hóa, phân phối và xử lý Video.
Ví dụ: Digital Television, DVD and Blu - Ray Disks, Mobile TV, Video Conferencing and Internet Video Streaming,
iTunes Store Movies/ Videos…


Đặc tính nổi bật của chuẩn nén Video MPEG - 4/ H.264/ AVC

-

Dự đoán không gian định hướng trong kiểu mã hóa Intra: hỗ trợ tới 17 kiểu dự đoán, làm cho việc dự đoán mẫu được
chính xác hơn, đạt hiệu quả nén cao hơn.
Bù chuyển động với kích thước nhỏ có thể thay đổi. Kích thước bù chuyển động nhỏ nhất là 4x4, điều này mang lại
hiệu suất 15% so với MPEG - 2.
Bù chuyển động với nhiều hình tham khảo.
Tách riêng hình tham khảo và hình hiển thị


Đặc tính nổi bật của chuẩn nén Video MPEG - 4/ H.264 AVC


-

Giảm dư thừa về không gian tốt hơn.
Lượng tử hóa thích nghi.
Sử dụng bộ lọc tách khối.
Kiểu dự đoán trọng số H.264/ AVC có thể hỗ trợ quá trình mờ dần hay tối dần khung hình trong những đoạn Film có
hiệu ứng mờ dần (những frame đến sau rất giống so với những frame ngay trước nó, chỉ có sắc độ là khác một chút).


Các Profile và các Level
H.264/AVC có 4 Profile như sau:


Các Profile và các Level

Các phần mã hóa của các Profile trong H.264


Các phần chung cho tất cả các Profile

-

Slice I (Slice mã hoá trong ảnh): Slice đã mã hoá bằng việc sử dụng dự đoán chỉ từ các mẫu đã mã hoá bên trong cùng
một Slice .
Slice P (Predictive - Coded Slice ): các Slice được mã hoá bằng việc sử dụng dự đoán liên ảnh từ các ảnh tham chiếu
đã được mã hoá trước đó sử dụng hầu hết cho Vector chuyển động và hệ số tham chiếu để dự đoán các giá trị mẫu cho
mỗi Block.
CAVLC (Context - Based Adaptive Variable Lengh Coding): mã hoá độ dài biến đổi tương thích với tình huống, cho
mã hoá Entropy.



Kiến trúc phân lớp của H.264/ AVC
H.264/ AVC Codec bao gồm 2 khối : Video Coding Layer ( VCL)
và Network Abstraction Layer ( NAL).


Cấu trúc dòng bit

-

Bit đầu tiên là bit 0.
2 bits tiếp theo được sử dụng để chỉ ra rằng có hay không NALU chứa chuỗi (tập hợp) các tham số Picture hoặc một
mảnh của một Picture tham chiếu.
5 bits tiếp theo được sử dụng để chỉ ra loại của NALU Units, cái tương ứng với loại dữ liệu được mang trong NALU
Unit.


Quá trình nén H264/ MPEG – 4:

Sơ đồ khối mã hóa H.264/ AVC


Bù chuyển động trong các Slice P (dự đoán liên ảnh):

Sơ đồ nguyên lý nén Slice P


-

Các dạng mã hóa bù chuyển động được xác định cho các Macroblock Slice P. Dự đoán liên ảnh làm giảm sự tương

quan theo thời gian với sự trợ giúp của việc ước tính Vector chuyển động và bù chuyển động.
Chia các Macroblock thành các Block.
Các giá trị dự đoán cho thành phần chói và thành phần màu.
Bù chuyển động MPEG – 4 Part 10/ H.264 cho phép các Vector chuyển động không hạn chế, tức là chúng có thể
hướng ra ngoài miền ảnh.
MPEG – 4 Part 10/ H.264 hỗ trợ dự đoán bù chuyển động đa ảnh.
Ngoài các Mode bù chuyển động được mô tả ở trên, Macroblock Slice P cũng có thể được mã hóa trong Mode gọi là
SKIP.


-

So với các tiêu chuẩn trước đó, MPEG – 4 Part 10/ H.264 đã tổng quát khái niệm Slice B và không chỉ hỗ trợ một cặp
dự đoán theo hướng tiến/ lùi mà còn cả hai cặp theo hướng tiến/ tiến và lùi/ lùi.
Các Mode dự đoán trong Slice B: Trong Slice B có 4 Mode dự đoán liên ảnh khác nhau được hỗ trợ: dự đoán list 0, list
1, hai hướng và trực tiếp.


Bộ giải mã

Sơ đồ khối giải mã H.264/ AVC


-

Bù chuyển động: Bù chuyển động thực hiện việc thiết lập lại các khung trên cơ sở các Vector đã nhận được, dữ liệu
Delta (dữ liệu khác nhau giữa hai khung liên tiếp) và hình ảnh đã được mã hóa trước đó.
Khôi phục lỗi: Một trong những nhiệm vụ quan trọng nhất của bộ giải mã là làm phù hợp và khôi phục lại các lỗi chắc
chắn xảy ra, đặc biệt là khi kết nối qua các liên kết dễ xảy ra lỗi như mạng không dây.



Các kỹ thuật trong H.264/ AVC

-

Instantaneous Decoding Refresh Picture.
Switching I – Slices and Switching P – Slices.
Transform and QuantizationIntraframe Coding with Directional Spatial Prediction.
Adaptive Block Size Motion Compensation


So sánh phương pháp nén Video chuẩn MPEG – 4 với MPEG – 1

Sơ đồ nén MPEG – 1:


Nén Frame I:


Nén Frame B, P:


Sơ đồ nén MPEG – 4:


- MPEG – 1 (1992) – mã ISO/ IEC 11172: sử dụng chủ
yếu để ghi CD – ROM, VCD.

- Độ phân giải 352x240, 25-30 ảnh/s, tốc độ từ 1.2 - 1.5
Mbit/s, cấu trúc lấy mẫu 4:2:0


- Không cho phép mã hóa dữ liệu có độ phân giải lớn.
- MPEG – 1 xử lý khối điểm ảnh kích thước 8x8.
-

MPEG – 4 dựa trên MPEG – 1 và tiêu chuẩn MPEG – 2.
MPEG – 4/ H264 AVC xử lý khối điểm ảnh kích thước 4x4.
MPEG – 4 tập tin kích thước nhỏ hơn và Streaming trực tuyến, giải quyết vấn đề truyền thông đa phương tiện hay lưu trữ với không
gian ổ đĩa giới hạn.
do đó thích hợp cho MPEG – 4 cần thuật toán tốt hơn để quét và xác định những Pixel có thể được loại bỏ, để giảm kích thước dữ
liệu hơn nữa.


Mã hóa frame I
Nếu một khối hoặc macroblock được mã hóa trong chế độ intra, một khối dự đoán được
tạo dựa trên các khối được mã hóa tạo ra trước đó. Khối dự đoán P này được trừ đi khối
hiện tại trước khi mã hóa. Đối với thành phần độ chói (luma), P có thể được tạo cho mỗi
khối phụ 4x4 hoặc cho một macroblock 16x16. Có tổng cộng 9 chế độ dự đoán cho mỗi
khối luma 4x4; 4 chế độ cho khối luma 16x16; và một chế độ luôn được áp dụng cho
mỗi khối chroma 4x4.


×