Tải bản đầy đủ (.pdf) (4 trang)

Nghiên cứu hệ nén h 264 AVC và đánh giá hiệu năng của h 264 AVC đối với video tăng cường độ sâu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (264.51 KB, 4 trang )

Nghiên cứu hệ nén H.264/AVC và đánh giá
hiệu năng của H.264/AVC đối với video tăng
cường độ sâu


Trần Thị Thịnh


Trường Đại học Công nghệ. Đại học Quốc gia Hà Nội
Luận văn ThS. Công nghệ thông tin: 60 48 10
Người hướng dẫn : TS. Lê Thanh Hà
Năm bảo vệ: 2013
75 tr .

Abstract. Trình bày các khái niệm cơ bản về video và video CODEC (COde/DECode)
(hệ nén và giải nén video); cung cấp các thông tin chi tiết các thành phần trong video
CODEC gồm: mô hình không gian, mô hình thời gian và mã hóa entropy. Trình bày về
hệ nén H.264/AVC, bao gồm quy trình nén và giải nén của H.264/AVC và các hồ sơ
nén. Các kỹ thuật được sử dụng cho các bước trong quy trình nén sẽ được trình bày chi
tiết: dự đoán hình ảnh tham chiếu, chuyển đổi, lượng tử, mã hóa entropy. Trình bày
việc áp dụng chuẩn nén H.264/AVC cho các video tăng cường độ sâu do tác giả thực
hiện
Keywords. Hệ nén; Video; Quy trình nén; Phần mềm; Công nghệ thông tin
Content.
Trong những năm gần đây, truyền thông đa phương tiện phát triển mạnh mẽ,
các kỹ thuật mới ra đời nhằm mục đích đáp ứng nhu cầu giải trí cho con người ngày
một tốt hơn. Các ứng dụng đa phương tiện thời gian thực trên mạng di động, mạng
Internet, mạng truyền hình ngày càng phát triển. Các thiết bị phần cứng phát triển vượt
bậc cho phép người sử dụng dễ dàng thu phát video không chỉ các video thông thường
mà còn các video 3D. Các video thu thập có chất lượng cao và dung lượng lớn. Các
ứng dụng video 3D ngày càng phát triển như gọi điện thoại, chơi game 3D, truyền hình


3D… Đồng nghĩa với việc này là các vấn đề về khả năng lưu trữ và truyền dữ liệu. Với
các video lớn vấn đề truyền thông hiện nay đang gặp một số khó khăn: băng thông
đường truyền, nhiễu kênh… Thay vì việc cải thiện băng thông đường truyền cần đầu tư
lớn và khó khăn, thì phương pháp giảm kích thước dữ liệu bằng các kỹ thuật nén là
một cách giải quyết hiệu quả các khó khăn trên.
Hiện tại có nhiều phương pháp biểu diễn dữ liệu video 3D, một trong số đó là bổ sung
thêm thông tin về độ sâu vào các chuỗi video màu thông thường. Mặc dù đây không
phải là một giải pháp toàn diện dữ liệu video ba chiều, nhưng nó cho phép các hệ
thống hiển thị tổng hợp khung hình 3D dựa trên ảnh độ sâu [1] (Depth Image Based
Rendering – DIBR). Việc bổ sung thêm thông tin độ sâu vào video màu truyền thống
làm gia tăng kích thước dữ liệu cần lưu trữ và truyền tải video, do đó việc khảo sát ảnh
hưởng của dữ liệu độ sâu khi nén cùng với video màu là điều cần thiết.
Hiện nay đã có rất nhiều kỹ thuật nén dữ liệu đa phương tiện như: chuẩn JPEG,
chuẩn JPEG2000, chuẩn MPEG tuy nhiên hiệu quả nén của các tiêu chuẩn này cũng
chưa được cao và dung lượng còn rất lớn, thành công của chuẩn nén MPEG-4 Part 2
trong ứng dụng truyền hình số, các ứng dụng đồ họa nhưng với yêu cầu bộ mã hóa có
thể tương thích với các ứng dụng tốc độ bit thấp thì nó không đáp ứng hiệu quả. Từ
việc nghiên cứu khắc phục nhược điểm của MPEG-2, phát triển bổ sung cho MPEG-4
Part 2 để cho ra đời những chuẩn nén tiên tiến hơn, đặc biệt là H.264/AVC (MPEG-4
part 10). H.264/AVC là sự kết hợp giữa 2 tổ chức nổi tiếng: nhóm chuyên gia mã hóa
video của tổ chức ITU và nhóm chuyên gia xử lý ảnh động ISO/IEC. Sử dụng chuẩn
nén H.264 giúp giảm băng thông mạng và dung lượng sử dụng ổ cứng khi ghi hình,
thực tế là giảm hơn 50% so với chuẩn trước đó và giảm được 80% băng thông và kích
thước dữ liệu lưu trữ nhưng chất lượng video vẫn giữ được chất lượng hình ảnh. Chính
vì những ưu điểm đó mà MPEG-4 H.264/AVC đã trở thành chuẩn nén được sử dụng
phổ biến.
Tuy nhiên, đánh giá trên dành cho việc nén video thông thường, chưa có nhiều
nghiên cứu và thực nghiệm cho việc dùng H.264/AVC để nén video tăng cường độ
sâu. Vì vậy, tôi đã chọn đề tài “Nghiên cứu hệ nén H.264/AVC và đánh giá hiệu năng
của H.264/AVC đối với video tăng cường độ sâu” nhằm tìm hiểu nguyên lý hoạt động

cơ bản của một hệ nén video hiện đại và việc áp dụng hệ nén này đối với dạng video
tăng cường độ sâu. Luận văn gồm 4 chương:
Chương 1 trình bày các khái niệm cơ bản về video và video CODEC
(COde/DECode) (hệ nén và giải nén video). Phần này cung cấp các thông tin chi tiết
các thành phần trong video CODEC gồm: mô hình không gian, mô hình thời gian và
mã hóa entropy
Chương 2 trình bày về hệ nén H.264/AVC. Nội dung phần này bao gồm quy
trình nén và giải nén của H.264/AVC và các hồ sơ nén. Các kỹ thuật được sử dụng cho
các bước trong quy trình nén sẽ được trình bày chi tiết: dự đoán hình ảnh tham chiếu,
chuyển đổi, lượng tử, mã hóa entropy.
Chương 3 trình bày việc áp dụng chuẩn nén H.264/AVC cho các video tăng
cường độ sâu do tác giả thực hiện.
Và cuối cùng Chương 4 đưa ra các kết luận và hướng phát triển của luận văn.

TÀI LIỆU THAM KHẢO
Tài liệu tiếng Anh
[1] Dong Tian, Po-Lin Lai, Patrick Lopez, Cristina Gomila, "View Synthesis
Techniques for 3D Video", Proc. of SPIE Vol. 7443 74430T-1
[2] Clifford De Raffaele, Kenneth P. Camilleri ; “ Performance Improvement of
Segmentation-Based Depth Representation in 3D Imagery by Region Merging ”
[3] G. Bjøntegaard, Calculation of Average PSNR Differences, between RD-Curves,
ITU-T SG16 Q.6 Document, VCEG-M33, Austin, Apr. 2001.
[4] G. Sullivan and T. Wiegand, “ Rate-distortion optimization for video
compression,” IEEE Signal Processing Magazine, vol. 15, no. 6, pp. 74- 90, Nov.1998.
[5]
[6] Iain E. G. Richardson, The Robert Gordon University, Aberdeen, UK; “H.264 and
MPEG-4 Video Compression”
[7] ISO/IEC 14496-10 and ITU-T Rec. H.264, Advanced Video Coding, 2003
[8] ITU-T (formerly CCITT), “Codecs for videoconferencing using primary digital
group transmission ” ITU-T Recommendation H.120; version 1, 1984; version 2, 1988.

[9] ITU-T (formerly CCITT), “Video codec for audiovisual services at p x 64 kbit/s”
ITU-T Recommendation H.261; version 1, nov.1990; version 2, mar 1993.
[10] ITU-T (formerly CCITT) and ISO/IEC JTCI , “Generic coding of moving pictures
and associated audio information” ITU-T Recommendation H.262, Nov. 1994
[11] Joint Video Team (JVT), KTA Reference Software,

[12] K. R. Rao and P. Yip, Discrete Cosine Transform, Academic Press, 1990.
[13] Philipp Merkle, Aljoscha Smolic, Karsten Müller, and Thomas Wiegand;
“MULTI-VIEW VIDEO PLUS DEPTH REPRESENTATION AND CODING” Image
Communication Group, Image Processing Department, Fraunhofer Institute for
Telecommunications - Heinrich-Hertz-Institut, Einsteinufer 37, 10587 Berlin,
Germany
[14] Rafael C. Gonzalez and Richard E. Woods. Digital Image Processing. Addison-
Wesley, New York, 1992.
[15] Recommendation ITU-R BT.601-5, Studio encoding parameters of digital
television for standard 4:3 and wide-screen 16:9 aspect ratios, ITU-T, 1995
[16] Wiegand, T.; Sullivan, G. J.; Bjntegaard, G.; Luthra, A, “ Overview of the
H.264/AVC video coding standard”, IEEE TRANSACTIONS ON CIRCUITS AND
SYSTEMS FOR VIDEO TECHNOLOGY, VOL. 13, NO. 7, July 2003


×