Tải bản đầy đủ (.pdf) (26 trang)

Đánh giá hiệu năng của kỹ thuật mã hóa video hevch.265 truyền hình qua mạng IP (tt)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.01 MB, 26 trang )

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
---------------------------------------

NGUYỄN HỮU BẰNG

ĐÁNH GIÁ HIỆU NĂNG CỦA KỸ THUẬT MÃ HÓA
VIDEO HEVC/H.265 TRUYỀN HÌNH QUA MẠNG IP
CHUYÊN NGÀNH :

KỸ THUẬT VIỄN THÔNG

MÃ SỐ:

60.52.02.08

TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT

HÀ NỘI - 2017


i

Luận văn được hoàn thành tại:
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG

Người hướng dẫn khoa học: TS. VŨ VĂN SAN

Phản biện 1: …………………………………………………………………

Phản biện 2: …………………………………………………….……………..


Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học viện Công
nghệ Bưu chính Viễn thông
Vào lúc:

....... giờ ....... ngày ....... tháng ....... .. năm ...............

Có thể tìm hiểu luận văn tại:
- Thư viện của Học viện Công nghệ Bưu chính Viễn thông


ii

LỜI NÓI ĐẦU
Với sự bùng nổ của Internet, đặc biệt là Internet băng thông rộng đã làm thay
đổi cả nội dung và kỹ thuật truyền hình. Hiện tại, phần lớn các nội dung truyền hình
chỉ dừng lại ở mức độ nét cao, nhưng trong tương lai độ nét siêu cao sẽ là một xu thế
tất yếu. Hệ quả của sự phát triển này là sức ép ngày càng lớn lên hạ tầng truyền dẫn.
Để giải quyết vấn đề này, chuẩn mã hóa video thế hệ tiếp theo đã được phát triển với
tên gọi mã hóa video hiệu suất cao (HEVC/H.265).
Với mục đích đưa những đánh giá khách quan về hiệu năng của kỹ thuật mã
hóa video HEVC/H.265 khi truyền hình qua mạng IP, em xin chọn đề tài nghiên cứu
“Đánh giá hiệu năng của kỹ thuật mã hóa video HEVC/H.265 truyền hình qua mạng
IP.”.
Tổng quan, luận văn gồm 3 chương:
Chương 1 trình bày về mã hóa video hiệu suất cao HEVC.
Chương 2 giới thiệu về truyền hình qua mạng IP.
Chương 3 đánh giá hiệu năng của chuẩn mã hóa HEVC trong kịch bản truyền
hình qua mạng IP.
Sau hơn một thời gian nỗ lực tìm hiểu cùng với sự chỉ bảo tận tình của các
thầy cô trong khoa, đặc biệt là giảng viên TS. Vũ Văn San, em đã hoàn thành bài luận

văn này. Do đây là đề tài còn khá mới và vốn kiến thức bản thân còn hạn chế nên
không tránh được các sai sót, kính mong quý thầy cô và các bạn đóng góp ý kiến để
bài luận văn này hoàn thiện hơn.
Em xin chân thành cảm ơn thầy Vũ Văn San và các thầy cô trong Khoa Quốc tế
và Đào tạo đã tận tình giúp đỡ em trong suốt thời gian qua.
Hà Nội, tháng 5 năm 2017

Nguyễn Hữu Bằng


1

CHƯƠNG 1:

1.1.
1.1.1.

KỸ THUẬT MÃ HÓA VIDEO HEVC/H.265

Giới thiệu chung mã hóa video
Tổng quan mã hóa video
Một tín hiệu video số thường chứa một lượng lớn dữ liệu, do đó sẽ gặp rất

nhiều khó khăn trong việc lưu trữ và truyền đi trên băng thông kênh truyền hạn chế.
Vì vậy để có thể tiết kiệm không gian lưu trữ và băng thông kênh truyền thì ta cần
nén (mã hóa) tín hiệu.
Để đánh giá chất lượng của bức ảnh (hay khung ảnh video) ở đầu ra của bộ
mã hóa, ta thường sử dụng các tham số sau để đánh giá:

- Sai số bình phương trung bình – MSE (Mean Square Error) định nghĩa cho

cường độ sai khác giữa ảnh gốc và ảnh dự đoán [1]:
Mean Squared Error

: MSE 

1
N2

N 1

N 1

  (C
i 0

j 0

ij

 Ri j ) 2

(1.1)

- Tỉ số tín hiệu trên nhiễu đỉnh – PSNR (Peak to Signal to Noise Ratio) [1].
(2b  1)2
Peak signal to noise ratio : PSNR  10log10
(db)
MSE

(1.2)


Trong đó: + N×N kích thước bù chuyển động
+ hệ số Ci, j và Ri, j tương ứng với mẫu hiện tại và vùng mẫu tham khảo.
+ b số lượng bit/ mẫu.
Thông thường, nếu PSNR ≥ 40dB thì hệ thống mắt người gần như không
phân biệt được giữa ảnh gốc và ảnh khôi phục, tức là ảnh nén có chất lượng xuất
sắc.
• Nếu 30 dB  PSNR < 33 dB thì chất lượng ảnh nén bình thường, mắt người
có sự phân biệt được.
• Nếu PSNR < 30 dB thì chất lượng ảnh nén kém.


2

1.1.2.

GOP
Một GOP (nhóm các hình ảnh) xác định thứ tự mà khung hình intra và inter

được sắp xếp. Một chuỗi video thường gồm các GOP liên tiếp. Cấu trúc GOP thường
được xác định bằng một số cho biết khoảng cách giữa hai ảnh (I hoặc P). Việc lựa
chọn kích thước GOP phụ thuộc vào nhiều yếu tố khác như kích cỡ DPB và độ trễ
[2].
1.1.3.

Lớp mạng trừu tượng (NAL)
Lớp mạng trừu tượng là một tính năng thiết yếu, có sẵn trên cả H.264/AVC và

HEVC. Về cơ bản, đó là một phương pháp chia luồng bit video thành các đơn vị
NAL. Nhìn chung, HEVC và H.264/AVC có chung một cấu trúc trừ một số bit tại

mào đầu [3].

1.2.
1.2.1.

Chuẩn mã hóa video H.264/AVC
Bối cảnh ra đời và sự phát triển
H.264 được chấp thuận bởi tổ chức truyền thông quốc tế ITU-T với tên gọi

Recommendation H.264 và bởi tổ chức chuẩn hóa quốc tế (ISO/IEC) với tên gọi
International Standard 14496-10 (MPEG-4 part 10) Advanced Video Coding.
1.2.2.

Nguyên lý hoạt động cơ bản
Ngoại trừ tính năng lọc tách khối, H.264 vẫn bao gồm các khối chức năng cơ

bản như các chuẩn mã hóa trước đó như dự đoán, biến đổi, lượng tử hóa và mã hóa
entropy. Sự thay đổi quan trọng trong H.264 đến từ sự cải tiến chi tiết bên trong cách
khối chức năng đó.
1.2.3.

Các đặc điểm nổi bật
So với các chuẩn mã hóa video trước đó, H.264/AVC có một số những đặc

điểm nổi bật sau:
• Bù chuyển động với kích cỡ khối thay đổi
• Bủ chuyển động chính xác đến một phần tư mẫu


3


• Tách riêng hình ảnh tham khảo và hình ảnh hiển thị
• Dự đoán trọng số
• Sử dụng bộ lọc tách khối
• Dự đoán trong ảnh sử dụng không gian định hướng
Ngoài ra, H.264/AVC còn có một số đặc tính làm tăng cường khả năng chống
sai số và mất dữ liệu như:
• Tham số cấu trúc
• Cấu trúc cú pháp của NAL
• Kích cỡ mảnh linh hoạt
• Dữ liệu dư của ảnh

1.3.

Chuẩn mã hóa video HEVC/H.265
Bối cảnh ra đời và sự phát triển

1.3.1.

Tiêu chuẩn Mã hóa video hiệu suất cao (High Efficiency Video Coding) phản
ánh kinh nghiệm được tích lũy trong khoảng bốn thập kỷ nghiên cứu và ba thập kỉ
chuẩn hóa cho công nghệ mã hóa video kỹ thuật số. Kết quả, nó đã chính thức được
chuẩn hóa trong ITU-T Recommendation H.265 và ISO/IEC International Standard
23008-2 (MPEG-H part 2).
Nguyên lý hoạt động cơ bản

1.3.2.

Tiêu chuẩn HEVC được thiết kế cho nhiều mục đích, bao gồm hiệu năng mã
hóa, dễ dàng tích hợp hệ thống truyền dẫn và phục hồi dữ liệu bị mất cũng như tính

khả thi khi sử dụng kiến trúc xử lý song song.
1.3.3.

Các đặc điểm nổi bật
Về cơ bản HEVC/H.265 có cấu trúc tương tự như các chuẩn trước đó, tuy

nhiên HEVC có nhiều cải tiến mới để đem lại khả năng mã hóa với hiệu suất cao.
1.3.3.1.

Cấu trúc khối linh hoạt

Thay vì sử dụng khối macroblock như H.264/AVC và các tiêu chuẩn mã hóa
trước đó, trong HEVC/H.265, một hình ảnh được chia thành nhiều khối vuông, gọi là


4

khối cây mã hóa (CTB – Coding Tree Blocks). Mỗi thành phần CTB sáng kết hợp
với hai thành phần CTB màu và các cú pháp được gộp chung gọi là đơn vị cây mã
hóa (CTU – Coding Tree Units). CTU đại diện cho đơn vị xử lý cơ bản trong HEVC
và nó tương tự như khái niệm macroblock trong các tiêu chuẩn mã hóa video trước
đây. Kích thước CTU lớn hơn thường cho hiệu suất mã hóa tốt hơn nhưng làm tăng
thời gian mã hóa và giải mã cũng như yêu cầu bộ nhớ và khả năng tính toán phức tạp
hơn.

Hình 1.10: Chia CTU thành CU theo cấu trúc cây tứ phân [4]

Các CTB có thể được chia nhỏ hơn nữa theo cấu trúc cây mã hóa thành các
khối mã hóa (CB). Đó là đối tượng mà bộ mã hóa quyết định giữa dự đoán trong ảnh
hay dự đoán bù chuyển động.

Một CTU có thể chia thành các CU với kích cỡ khác nhau. Tương tự như CTU,
mỗi thành phần CB sáng kết hợp với hai thành phần CB màu cùng với các cú pháp
liên quan tạo thành một đơn vị mã hóa (CU). Một CTB chứa một hoặc thành nhiều
CU. Và mỗi CU được phân chia thành đơn vị dự đoán (PU) và đơn vị biến đổi (TU).


5

Hình 1.11 : Chia CU thành các PU [4]

Hình 1.12: Chia CTB thành TB và CB theo cấu trúc cây tứ phân [4]

Quyết định mã hóa bằng dự đoán liên ảnh hay trong ảnh được thực hiện ở cấp
CU.
1.3.3.2.

Phân vùng hình ảnh

Giống như H.264/AVC, trong HEVC/H.265, một hình ảnh được phân chia
thành một hoặc nhiều mảnh (slice). Một mảnh chứa một hoặc nhiều CTU hoặc
macroblock. Sự khác biệt trong HEVC/H.265 là một mảnh có thể giải mã độc lập mà
không phụ thuộc vào những mảnh khác trong cùng một ảnh.


6

1.3.3.3.

Xử lý song song


Phần cứng ngày nay cho phép tận dụng khả năng đa luồng ngay cả trên những
kiến trúc tiết kiệm điện. Nhờ khả năng đa luồng, hiệu năng xử lý được cải thiện đáng
kể. Trong HEVC/H.265 giới thiệu hai công cụ hỗ trợ xử lý đa luồng:
• Xử lý song song đầu sóng (WPP)
• Tile
1.3.3.4.

Dự đoán trong ảnh

Với tiêu chuẩn HEVC, quá trình dự đoán trong ảnh bao gồm ba bước: xây
dựng mảng mẫu tham khảo, dự đoán mẫu và hậu xử lý. Ba bước trên đều được thiết
kế tối ưu để đạt hiệu quả mã hóa cao trong khi giảm thiểu các yêu cầu tính toán trong
cả bộ mã hóa và giải mã. Các thiết lập chế độ dự đoán bao gồm phương pháp mô hình
hóa các loại nội dung thường xuất hiện trong video và hình ảnh tĩnh. Phương pháp
dự đoán trong ảnh có thể chia thành hai loại. Loại đầu tiên là dự đoán hướng. Dự
đoán hướng cung cấp khả năng mô hình hóa với độ chính xác cao cho các đối tượng
có cấu trúc định hướng. Phương pháp thứ hai, dự đoán phẳng và dự đoán DC hiệu
quả với các khu vực hình ảnh mịn. Tổng cộng có 35 chế độ được hỗ trợ.
1.3.3.5.

Dự đoán liên ảnh

Trong khi dự đoán trong ảnh chủ yếu khai thác mối tương quan giữa các mẫu
không gian lân cận thì dự đoán liên ảnh lại tận dụng sự tương quan thời gian giữa các
hình ảnh để xây dựng dự đoán bù chuyển động (MCP) cho một khối mẫu ảnh. Một
khối tương ứng trong một hình ảnh được giải mã trước có thể sử dụng làm yếu tố dự
báo cho các hình ảnh sau.
HEVC sử dụng hai chế độ: dự đoán vector chuyển động nâng cao (AMVP) và
chế độ kết hợp. Bộ mã hóa quyết định giữa hai chế độ này cho mỗi PU. Mỗi chế độ
xây dựng một danh sách ứng viên MV. Sau đó, nó chọn một trong số đó làm chỉ số

mã hóa và truyền đi trong luồng dữ liệu.
Đối với chế độ AMVP, vector chuyển động được dự đoán từ năm không gian
lân cận và một ứng viên thời gian.


7

Tương tự như H.264, HEVC hỗ trợ vector chuyển động với độ chính xác một
phần tư điểm ảnh cho thành phần chói và một phần tám điểm ảnh cho thành phần
màu. Hoạt động này được thực hiện chủ yếu bằng cách sử dụng bộ lọc nội suy. Quá
trình nội suy là một thủ tục chuyển hóa các mẫu phân số bằng cách sử dụng các mẫu
nguyên.
Nội suy mẫu phân số cho các mẫu chói trong HEVC ứng dụng một bộ lọc 8tap cho vị trí nửa mẫu và 7-tap cho vị trí một phần tư mẫu. Số lượng tap là một thông
số quan trọng cho các bộ lọc nội suy vì nó ảnh hưởng trực tiếp đến hiệu quả mã hóa
và độ phức tạp khi thực hiện.
Dự đoán trọng số là một phương pháp điều chỉnh mẫu cho dữ liệu bù chuyển
động. Nó rất hữu ích cho việc mã hóa các hiệu ứng mờ dần ứng dụng trong mã hóa
mặt người hay chuyển động. Trong HEVC, nó được đơn giản hóa bằng cách áp dụng
trọng số cho mỗi dự đoán bù chuyển động hoặc trung bình hai dự đoán bù chuyển
động.

1.4.

Tổng kết chương 1
Phần đầu tiên của chương 1 giới thiệu tổng quan về chuẩn mã hóa video. Cùng

với đó là cách thức đánh giá chất lượng video khi bị nén có tổn hao. Nhóm hình ảnh
cũng là một yếu tố quan trọng, cần phải được lưu ý trong quá trình nén video. Lớp
trừu tượng mạng (NAL) là một tính năng mới trong H.264/AVC và được phát triển
trong HEVC cũng được giới thiệu tại phần tổng quan. Sau đó, luận văn giới thiệu

những nét nổi bật của hai chuẩn nén H.264/AVC và HEVC. Trong đó, tập trung chủ
yếu vào HEVC với nhiều tính năng cải tiến.


8

CHƯƠNG 2:

2.1.
2.1.1.

TRUYỀN HÌNH QUA MẠNG IP

Mô hình hệ thống truyền hình qua mạng IP
Internet video
Hình 2.1 cho thấy một cái nhìn đơn giản về một mạng Internet video. Sơ đồ

này được chia thành hai phần, khâu sản xuất và phân phối. Trong khâu sản xuất, nội
dung video được chụp từ một nguồn, được số hóa, chỉnh sửa, gắn nhãn và được nhóm
vào một tệp được đặt trên máy chủ nơi nó có thể được truy cập. Trong khâu phân
phối, một người sử dụng một máy tính kết nối Internet để tìm kiếm nội dung, kết nối
với máy chủ, có quyền xem nội dung và sau đó tải tệp tin video hoặc yêu cầu luồng
video để xem trên máy tính cá nhân của họ bằng cách sử dụng phần mềm đa phương
tiện chuyên biệt.

Hình 2.1 Mạng cung cấp Internet Video [9]

2.1.2.

IPTV

IPTV chủ yếu được sử dụng để cung cấp các nội dung và dịch vụ mà CATV

hoặc hệ thống vệ tinh không thể cung cấp. Các nhà cung cấp dịch vụ muốn cung cấp
nhiều dịch vụ tiêu dùng qua một mạng đơn lẻ thường chọn công nghệ IP vì nó có thể
cung cấp nhiều dịch vụ và tốc độ cao trên một nền tảng duy nhất. Trong một hệ thống


9

điển hình, một mạng IP tốc độ cao tư nhân được sử dụng để liên tục cung cấp chương
trình video cho hàng trăm hoặc hàng ngàn người xem đồng thời.
Trên thực tế, các mạng IPTV là những hệ thống khá phức tạp được cấu thành
từ rất nhiều phần tử, đó là một trong những lý do mà chúng khó thiết kế và phát triển.
2.1.3.

Tình hình phát triển IPTV tại Việt Nam
Mặc dù, IPTV chỉ mới chiếm hơn 10% thị phần truyền hình trả tiền tại Việt

Nam [9]. Tuy nhiên, đây dần được xem là xu hướng phát triển tất yếu khi lộ trình số
hóa hoàn tất và người xem truyền hình đòi hỏi nhu cầu ngày càng cao về loại hình
truyền hình thông minh, kết nối và có tính tương tác cao.
Hiện tại, các dịch vụ truyền hình trong nước mới chỉ dừng lại ở mức HDTV.
Không thể phủ nhận HDTV là một trong những thành tựu to lớn của truyền hình,
nhưng với nhu cầu ngày càng cao của người sử dụng, truyền hình độ nét siêu cao sẽ
là xu thế tất yếu trong tương lại.
Nếu chỉ sử dụng các kỹ thuật mã hóa hiện nay như MPEG-4, tốc độ luồng dữ
liệu cần thiết để truyền một kênh UHDTV sẽ gấp 3-4 lần yêu cầu của một kênh HD
và các hệ thống truyền dẫn sẽ không đáp ứng được.

2.2.


Mã hóa và giải mã
Video nếu không được nén sẽ có chất lượng cao nhưng không thể chuyển tín

hiệu qua mạng truyền thông vì dung lượng quá lớn, trong khi nhu cầu xem và sử dụng
video ngày càng cao. Đã từ lâu, nén video được xem như một giải pháp quan trọng
nhằm giải quyết vấn đề dung lượng và truyền tải video trên mạng.

2.3.

Ghép kênh
Ở đầu ra bộ mã hóa hình ảnh là các luồng cơ sở (ES). Các luồng cơ sở này cần

được ghép kênh với các luồng cơ sở mang tín hiệu âm thanh và các thông tin khác.
Luồng cơ sở đóng gói (PES) là phiên bản “dễ xử lý” hơn của các luồng cơ sở
và chứa thông tin thời gian cho phép đồng bộ hóa các luồng âm thanh và hình ảnh.


10

Các luồng chương trình kết hợp nhiều loại luồng cơ sở đóng gói (âm thanh,
hình ảnh) để hỗ trợ các tác vụ sản xuất (như là ứng dụng ghi lên đĩa DVD, Bluray).
Các luồng truyền tải là một cách khác để kết hợp một luồng cơ sở đóng gói
thành một thực thể duy nhất và có thể được vận chuyển qua mạng. Các gói luồng
truyền tải có độ dài cố định và các luồng sẽ mang theo thông tin đồng hồ cần thiết
cho tín hiệu thời gian thực.

2.4.
2.4.1.


Truyền dẫn qua mạng IP
Giao thức giao vận
Giao thức giao vận được sử dụng để kiểm soát việc truyền tải các gói dữ liệu

kết hợp với IP. Chúng ta sẽ thảo luận về ba giao thức chính thường được sử dụng
trong việc truyền video theo thời gian thực:
UDP (User Datagram Protocol): Đây là một trong những giao thức IP đơn giản
và xuất hiện sớm nhất. UDP thường được sử dụng cho dữ liệu video và các dữ liệu
nhạy cảm về độ trễ khác.
TCP (Transmission Control Protocol): Đây là một giao thức Internet được sử
dụng rộng rãi để truyền dữ liệu. Phần lớn các thiết bị kết nối Internet có khả năng hỗ
trợ TCP trên IP (hoặc đơn giản là TCP/IP).
RTP: Giao thức truyền tải thời gian thực: Giao thức này được phát triển cụ thể
để hỗ trợ truyền dữ liệu thời gian thực, chẳng hạn như video.
2.4.2.

Đóng gói
Đóng gói là quá trình lấy một dòng dữ liệu, định dạng nó thành các gói tin IP,

và thêm các tiêu đề và dữ liệu khác cần thiết để phù hợp với một giao thức cụ thể.
Quá trình này không phải là một công thức dùng chung cho tất cả. Thay vào đó, quá
trình đóng gói có thể được thay đổi để đáp ứng yêu cầu hoạt động của các ứng dụng
và mạng khác nhau.


11

2.4.3.

Truyền thông điểm-điểm (unicast) và điểm-đa điểm (multicast)

Multicast là quá trình gửi một tín hiệu video cùng lúc tới nhiều người dùng.

Tất cả người xem đều có cùng một tín hiệu và được phát cùng một lúc, giống như
truyền hình truyền thống. Hầu như tất cả các chương trình phát sóng video thương
mại đều hoạt động bằng cách sử dụng multicasting, bao gồm truyền hình cáp, truyền
hình vệ tinh, truyền hình qua vô tuyến và IPTV. Tuy nhiên, đối với video trực tuyến
và video trên Internet, multicast là một ngoại lệ.
Để hiểu về multicast, chúng ta so sánh nó với quá trình unicast. Trong unicast,
mỗi luồng video sẽ được gửi đến chính xác một người nhận. Nếu nhiều người nhận
muốn có cùng một video, thì phía phát phải tạo một luồng unicast riêng cho mỗi
người nhận. Các luồng này sẽ truyền từ nguồn đến đích thông qua mạng IP.

Server
Video

Bộ định tuyến
multicast

Bộ định tuyến

PIM

Video
Client

Switch L2 với
IGMP

IGMP


IGMP

Luồng multicast UDP

Hình 2.10: Kiến trúc mạng cơ bản thiết kế cung cấp dịch vụ multicast bằng PIM và
IGMP

2.5.
2.5.1.

Một số đặc điểm truyền dẫn qua mạng IP
Mất gói
Một trong những vấn đề của mạng IP là sự mất mát gói tin gây ra bởi nhiều lý

do gặp phải tại các lớp mạng. Việc mất gói dữ liệu là một trong những lỗi phổ biến
nhất có thể xảy ra trên hệ thống phân phối video IP. Nó có thể gây ra bởi nhiều nguồn,


12

bao gồm lỗi bit, liên kết bị quá tải buộc các bộ định tuyến loại bỏ các gói dữ liệu, thiết
bị mạng bị hỏng và các nguyên nhân khác.
2.5.2.

Jitter
Jitter gói dữ liệu là hiện tượng các luồng gói tin không đến đích sau một khoảng

thời gian như nhau. Ví dụ, một ứng dụng đang cố gửi 100 gói dữ liệu trong vòng một
giây. Nó sẽ cố gắng gửi một gói tin trong vòng 10mili giây. Nếu các gói tin này được
gửi qua mạng không có jitter, các gói tin sẽ đến đích vào đúng thời điểm, mỗi gói

cách nhau 10mili giây. Khi các gói tin đến sớm hoặc muộn hơn 10mili giây, khi đó
jitter xảy ra. Điều này làm cho khoảng trống giữa các gói tin khác nhau, quá ngắn
hoặc quá dài.
2.5.3.

Trễ
Sự chậm trễ sẽ xảy ra trong bất kỳ mạng nào, dù là từ máy tính để bàn đến máy

chủ hoặc trên toàn cầu. Có hai nguồn trễ chính trên mạng IP: sự chậm trễ lan truyền
và sự chậm trễ chuyển đổi.

2.6.

Tổng kết chương 2
Chương 2 của luận văn đã giới thiệu một cách sơ lược về truyền hình qua mạng

IP. Trong đó, chúng ta cần phân biệt giữa Internet Video và IPTV. Mô hình của
Internet Video và IPTV cũng đã được trình bày. Phần tiếp theo, luận văn trình bày về
tình hình phát triển IPTV tại Việt Nam và xu hướng của loại hình dịch vụ này trong
tương lai là cung cấp truyền hình độ nét siêu cao UHDTV. Tiếp đó, luận văn trình
bày về cách thức thực hiện việc truyền hình qua mạng IP theo hướng tiếp cận là dịch
vụ IPTV. Phần cuối cùng, luận văn điểm qua một số đặc điểm đáng lưu ý của mạng
IP có thể ảnh hưởng tới việc truyền hình.


13

CHƯƠNG 3:

ĐÁNH GIÁ HIỆU NĂNG CỦA HEVC/H.265


TRONG KỊCH BẢN TRUYỀN HÌNH QUA MẠNG IP

3.1.

Giới thiệu chung
Trong chương 3, một số mô hình mô phỏng sẽ được xây dựng để đánh giá hiệu

năng của HEVC/H.265. Kết quả nhận được sẽ được so sánh với chuẩn nén video tiền
nhiệm H.264/AVC. Các video được sử dụng để truyền dẫn trong kịch bản này là các
video yuv chưa qua xử lý với nhiều độ phân giải và độ chi tiết khác nhau. Tất cả video
đều sử dụng dải động chuẩn với độ sâu màu bằng 8.
Bảng 3.1

Thông số kĩ

Các video mẫu được sử dụng trong bài đánh giá

Traffic and

Mobcal

Sun flower

Blue Sky

Độ phân

720p


1080p

1080p

4K

giải

(1280×720)

(1920×1080)

(1920×1080)

(3840×2160)

Độ sâu màu

8

8

8

8

4:2:0

4:2:0


4:2:0

4:2:0

50

25

25

30

504

500

217

300

thuật

Lấy mẫu
màu
Tốc độ
khung hình
Số khung
hình

Video mô tả Video




Building

tả Video mô tả Video



tả

một quyển lịch một bông hoa quang cảnh một đường phố
Mô tả bức
tranh

với hình ảnh hướng

dương. bầu trời với với nhiều làn xe.

chi tiết của con Một con ong tại tán cây. Góc Xe
tàu Vasa. Góc tâm của bông quay
quay di chuyển hoa. Góc quay chuyển

ô

di chuyển



di


chậm

với trong các làn.


14

chậm từ trên cố định. Mức độ tốc độ trung Dọc
xuống

dưới. chi tiết ở mức bình
cuối trung bình.

Phần

chiều

hai

thuận đường là nhiều
kim tòa

nhà

video là một

đồng

đoàn


Mức độ chi cố định.

tàu

đồ

bên
cao

hồ. tầng. Góc quay

chơi di chuyển

tiết ở mức

nhanh từ phải

thấp

sang trái. Mức
độ chi tiết cao.

3.2.

Mô hình và kịch bản mô phỏng

3.2.1.

Kịch bản mô phỏng thứ nhất

Hiệu năng của HEVC sẽ được kiểm nghiệm qua hai bài đánh giá. Bài đánh giá

đầu tiên dựa trên tham số lượng tử QP được giữ cố định đối với từng đoạn video. Một
vài giá trị QP sẽ được chọn để làm tăng số mẫu phục vụ cho việc đánh giá kết quả.
Các giá trị QP được cân nhắc giữa mỗi mô phỏng để cân bằng về mặt chất lượng
(tham số PSNR) giữa hai chuẩn mã hóa HEVC và H.264/AVC. Đầu tiên, giá trị PSNR
sẽ được xác định dựa trên chuẩn mã hóa HEVC, các mẫu mã hóa bằng H.264/AVC
sẽ được tinh chỉnh để phù hợp với tham số chất lượng trên chuẩn mã hóa HEVC.

Hình 3.1 Mô hình mô phỏng trong bài đánh giá thứ hai


15

3.2.2.

Kịch bản mô phỏng thứ hai.
Bài đánh giá thứ hai là một kịch bản truyền dẫn qua môi trường IP/UDP được

xây dựng như Hình 3.1. Tốc độ bit được tinh chỉnh để trong điều kiện thường, đoạn
video được phát không bị mất gói. Trong bài đánh giá này sử dụng phần mềm
FFMPEG [16] để mã hóa, giải mã, đóng gói, và thực hiện phát trực tuyến. Tương tự
như bài đánh giá trước, giá trị PSNR sẽ được tinh chỉnh trước để đạt được sự cân
bằng giữa 2 bộ mã hóa HEVC và H.264/AVC. Sau khi được mã hóa, luồng dữ liệu
sẽ được đóng gói bằng mpegts, trước khi được đóng vào gói tin udp và truyền đi theo
phương thức multicast.
Để đánh giá khả năng che giấu lỗi của các bộ mã hóa, chúng ta cần một kênh
truyền bị mất gói. Trong bài mô phòng này, quá trình rớt gói được mô phỏng với sự
trợ giúp của phần mềm iptables [17]


3.3.

Kết quả phân tích, đánh giá và khuyến nghị

3.3.1.

Kết quả phân tích, đánh giá và khuyến nghị của bài mô phỏng thứ nhất
Trong phần này, kết quả của các hai bài mô phỏng sẽ được trình bày. Trong

bài đánh giá đầu tiên, hai tiêu chí được đánh giá là hiệu năng nén và độ phức tạp.

Hình 3.2 Đường cong tỉ lệ giữa HEVC và H.264 trong video 720p


16

Hình 3.3 Đường cong tỉ lệ giữa HEVC và H.264 trong video 1080p

Hình 3.4 Đường cong tỉ lệ giữa HEVC và H.264 trong video 4K


17

Hình 3.5 Thời gian nén giữa HEVC và H.264/AVC

Hình 3.6 Thời gian giải nén giữa HEVC và H.264/AVC

Hiệu quả nén là một yêu cầu cơ bản nhất đối với mọi chuẩn mã hóa. Trong
Hình 3.2, Hình 3.3, Hình 3.4 thể hiện một đường cong biến dạng tỷ lệ cho cả hai tiêu
chuẩn HEVC và H.264/AVC.Từ những hình vẽ này, ta có thể nhận thấy một khoảng

cách hiệu quả nén đáng chú ý giữa hai tiêu chuẩn. Điểm đáng chú ý là HEVC thể hiện
được sự hiệu quả đối với độ phân giải 4K.


18

Hình 3.5 và Hình 3.6 thể hiện tổng thời gian để thực hiện quá trình nén và giải
nén giữa hai tiêu chuẩn. Có thể nhận thấy, thời gian cần để HEVC thực hiện quá trình
nén cao gấp nhiều lần so với H.264/AVC.
3.3.2.

Kết quả phân tích, đánh giá và khuyến nghị của bài mô phỏng thứ hai

Hình 3.7 Kịch bản mất gói ngẫu nhiên

Hình 3.8 Khả năng che giấu lỗi của HEVC và H.264/AVC trong video Sunflower


19

Hình 3.9 Khả năng che giấu lỗi của HEVC và H.264/AVC trong video BlueSky

Kết quả kịch bản mất gói ngẫu nhiên được thể hiện trong Hình 3.7.
Hình 3.8, Hình 3.9 mô tả kết quả khi phát lần lượt video sunflower, bluesky
qua một môi trường mất gói. Trong quá trình truyền, không có bất cứ một cơ chế nào
để phục hồi lỗi do mất gói tin. Tuy nhiên, bản thân các bộ giải mã đã được trang bị
sẵn khả năng che giấu lỗi. Mục tiêu của nó là giữ lại trải nghiệm xem tốt nhất cho
người xem.

3.4.


Tổng kết chương 3
Chương 3 đã tập trung đánh giá hiệu năng của HEVC dựa trên nhưng so sánh

trực tiếp với chuẩn tiền nhiệm H.264/AVC. Các tham số chính để bài đánh giá dựa
vào bao gồm PSNR, tốc độ bit, tỷ lệ mất gói. Hiệu năng được đánh giá qua bốn video
với các đặc điểm khác nhau để thể hiện đặc tính của bộ mã hóa.


20

KẾT LUẬN VÀ KIẾN NGHỊ
Luận văn đã giới thiệu những đặc điểm nổi bật của chuẩn mã hóa video hiệu
suất cao HEVC và chuẩn mã hóa trước nó H.264/AVC. Nói chung, nhiều kĩ thuật
được thực hiện trong HEVC dựa trên sự cải tiến từ H.264/AVC. Hầu như tất cả các
cú pháp và cấu trúc của H.265/HEVC đều hỗ trợ bộ mã hóa và giải mã một cách độc
lập. Hiệu năng đạt được phù hợp với mục tiêu ban đầu khi giảm tốc độ bit đi một nửa
so với H.264/AVC. Điều đáng nói là hiệu năng HEVC đối với video độ phân giải 4K
là khá ấn tượng. Trong tương lai, khi truyền hình độ nét siêu cao trở nên phổ biến,
HEVC sẽ đóng một vai trò quan trọng, tiết kiệm đáng kể lưu lượng video truyền trong
hạ tầng mạng.
Truyền hình qua mạng IP nói chung và IPTV nói riêng là một xu thế công nghệ
trong tương lai. Nhu cầu truyền hình của con người đang tăng nhanh hơn cao giờ hết.
Trong một bối cảnh truyền hình thời gian thực, giải pháp truyền thông multicast đang
được sử dụng một cách rộng rãi. Tuy nhiên, việc tăng hiệu suất nén cho các tiêu
chuẩn mã hóa thường làm giảm khả năng chống lỗi của các chuẩn mã hóa này. Như
kết quả đã trình bày ở trên, đối với các video có nhiều thành phần dịch chuyển,
H.264/AVC cho thấy hiệu năng cao hơn chuẩn HEVC. Điều này đặt ra những nghiên
cứu trong tương lai nhằm cải thiện khả năng chống lỗi của các bộ mã hóa mà vẫn giữ
được tỉ lệ nén cao.



21

DANH MỤC TÀI LIỆU THAM KHẢO

[1]

David Salomon, Giovanni Motta, David Bryant (2010), Handbook of Data
Compression, Nhà xuất bản Springer.

[2]

Alfredo Scaccialepre (2014), "Design and Implementation of a Fast HEVC
Random Access Video Encoder," Luận văn Thạc sĩ, Stockholm, Sweden.

[3]

Basak Oztas , Mahsa T. Pourazad , Panos Nasiopoulos , Victor C. M. Leung
(2012), "A Study on the HEVC Performance Over Lossy," TELUS
Communications Inc., Canada.

[4]

Gary J. Sullivan; Madhukar Budagavi; Vivienne Sze (2013), High Efficiency
Video Coding (HEVC), Nhà xuất bản Springer.

[5]

Thomas Wiegand, Gary J. Sullivan, Gisle Bjøntegaard, Ajay Luthra (2003),

"Overview of the H.264/AVC Video Coding Standard," Tạp chí IEEE
Transactions on Circuits and Systems for Video Technology.

[6]

Iain E. G. Richardson (2003), H.264 and MPEG-4 Video Compression: Video
Coding for Next-generation Multimedia, Nhà xuất bản John Wiley & Sons.

[7]

Sharabayko, Maxim P. (2013), "Intra Compression Efficiency in VP9 and
HEVC," Tạp chí Applied Mathematical Sciences, vol. 7, pp. 6803-6824.

[8]

Gary J. Sullivan; Jens-Rainer Ohm; Woo-Jin Han; Thomas Wiegand (2012),
"Overview of the High Efficiency Video Coding," Tạp chí IEEE Transactions
on Circuits and Systems for Video Technology, vol. 22, pp. 1649-1668.

[9]

Simpson, Wes; Greenfield, Howard (2007), IPTV and Internet Video: New
Markets in Television Broadcasting, Công ty Elsevier.

[10]

Đình Anh, , 15 4 2017. [Online]. Available:
[Accessed 20 5
2017].



22

[11]

Doãn
Phong,
","
[Online].
Available:
[Accessed 23 3 2017].

[12]

Trọng Hiền, 28 12 2016. [Online]. Available:
[Accessed 20 5 2017].

[13]

VASC (2009), "Giới thiệu về dịch vụ IPTV," [Online]. Available:
/>n_thong/IPTV/IPTV%20technical%20slide.pdf. [Accessed 20 5 2017].

[14]

FPT (2013), "Nguyên tắc thiết kế triển khai mạng FTTH mới," [Online].
Available:
[Accessed 20 5 2015].

[15]


Simpson, Wes (2008), Video Over IP IPTV, Internet Video, H.264, P2P, Web
TV, and Streaming: A Complete Guide to Understanding the Technology,
Công ty Elsevier.

[16]

" [Online]. Available: />
[17]

Andreasson, Oskar (2001-2006), Iptables Tutorial.

[18]

Lin, Ting-Lan; Yueh-Lun; Cosman, Chang and Pamela C. (2010), "Subjective
experiment and modeling of whole frame packet loss visibility for H.264,"
Hội nghị Packet Video Workshop (PV) 18th International 2010.

[19]

Xavier Corbillon, Florian Boyrivent, Gr´ egoire Asselin de Williencourt,
Gwendal Simon, G´ eraldine Texier, Jacob Chakareski (2016), "Efficient
Lightweight Video Packet Filtering for Large-Scale Video Data Delivery,"
Hội nghị IEEE International Conference on Multimedia & Expo Workshops
2016.

[20]

" />VNPT,
[Online].
Available:

/>=20213. [Accessed 2 4 2017].


×