Tải bản đầy đủ (.pdf) (26 trang)

Nghiên cứu và đánh giá chất lượng mã hóa video dùng chuẩn h 265 HEVC

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.28 MB, 26 trang )

ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC BÁCH KHOA


HOÀNG LAM SƠN

NGHIÊN CỨU VÀ ĐÁNH GIÁ CHẤT LƯỢNG MÃ HÓA
VIDEO DÙNG CHUẨN H.265/HEVC

Chuyên ngành
Mã số

: Kỹ thuật điện tử
: 60 52 02 03

TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT

Đà Nẵng - Năm 2017


Công trình được hoàn thành tại
TRƯỜNG ĐẠI HỌC BÁCH KHOA

Người hướng dẫn khoa học: TS Hồ Phước Tiến

Phản biện 1: TS. Ngô Minh Trí
Phản biện 2: TS. Ngô Văn Sỹ

Luận văn được bảo vệ trước Hội đồng chấm Luận văn tốt nghiệp
thạc sĩ Kỹ thuật điện tử họp tại Trường Đại học Bách khoa vào ngày
15 tháng 07 năm 2017.



Có thể tìm hiểu luận văn tại:
 Trung tâm Học liệu, Đại học Đà Nẵng tại Trường Đại học Bách
khoa
 Thư viện Khoa Điện tử-Viễn thông, Trường Đại học Bách khoa –
ĐHĐN.


1
MỞ ĐẦU
1. Lý do chọn đề tài
H.265/HEVC là một chuẩn nén video hoàn toàn mới với tên gọi
đầy đủ là High Efficiency Video Coding (HEVC) được Ủy ban Viễn
thông Quốc tế ITU-T thông qua và bắt đầu được các nhà phát triển
đưa vào sản phẩm thương mại. H.265/HEVC mang lại khả năng nén
cao gấp đôi so với kỹ thuật nén video H.264/AVC (Advance Video
Coding) hiện đang được dùng phổ biến. H.265/HEVC có tỷ lệ nén dữ
liệu gấp đôi so với H.264/MPEG-4 AVC ở cùng một mức độ chất
lượng video. Nói cách khác nó có thể được sử dụng để cung cấp chất
lượng hình ảnh được cải thiện đáng kể khi xét cùng một bitrate. Nó
có khả năng hỗ trợ 8K UHD (Ultra high definition television) và độ
phân giải lên đến 8192x4320 (4320P).
Hiện nay, việc nắm vững phương pháp mã hóa của chuẩn H265
và đánh giá chất lượng của nó cùng với hệ thống truyền dẫn DVB-T2
có ý nghĩa quan trọng việc lựa chọn và triển khai kỹ thuật nén H.265
trong lĩnh vực truyền dẫn tín hiệu truyền hình và công tác lưu trữ
video của Đài truyền hình Việt Nam hiện nay. Đây là lý do luận văn
tập trung nghiên cứu và đánh giá chất lượng mã hóa dùng chuẩn
H.265/ HEVC.
2. Mục đích nghiên cứu

 Phân tích đánh giá kỹ thuật nén video và chuẩn nén H.265/
HEVC.
 So sánh với chuẩn nén video H.264/AVC, đưa ra những ưu điểm
của chuẩn nén H.265/HEVC.
 Ứng dụng H.265/HEVC xây dựng mô hình truyền dẫn tín hiệu
video HDTV trong truyền hình số mặt đất DVB-T2 và đánh giá
chất lượng video thu được qua hệ thống.
3. Đối tượng và phạm vi nghiên cứu
Chuẩn nén H.265/HEVC, so sánh chuẩn nén H.265/HEVC với
chuẩn nén H.264/AVC .


2
Chuẩn nén video H.265/HEVC trong hệ thống truyền hình số mặt
đất DVB-T2.
Đánh giá chất lượng hình ảnh thu được.
4. Phương pháp nghiên cứu
Kết hợp phương pháp nghiên cứu lý thuyết và phương pháp
nghiên cứu thực nghiệm để thực hiện đề tài theo các bước sau:
 Nghiên cứu lý thuyết các kỹ thuật mã hóa và giải mã các loại tín
hiệu video.
 Phân tích và so sánh với chuẩn nén H.264/AVC và đưa ra những
ưu điểm của chuẩn nén H.265/HEVC.
 Mô phỏng việc nén và giải nén tín hiệu video bằng chương trình
mã nguồn mở C++ từ đó đánh giá chất lượng và hiệu quả của
chuẩn nén.
 Ứng dụng kỹ thuật nén H.265/HEVC xây dựng mô hình truyền
dẫn tín hiệu video độ phân giải cao qua hệ thống truyền hình số
mặt đất DVB-T2, đánh giá kết quả thu được.
5. Ý nghĩa khoa học và thực tiễn của đề tài nghiên cứu

Việc phân tích đánh giá chuẩn nén H.265/HEVC, và so sánh với
chuẩn nén trước đó có ý nghĩa quan trọng trong việc lựa chọn và triển
khai trong công tác truyền dẫn tín hiệu truyền hình tại Đài truyền
hình Việt Nam hiện nay. Ngoài ra, H.265/HEVC là một chuẩn nén
mới và còn rất nhiều kỹ thuật có thể cải tiến tốt hơn, nên thông qua
tìm hiểu so sánh có thể là một tiền đề nghiên cứu các giải pháp để cải
thiện hiệu suất và giảm độ phức tạp, như là trong kỹ thuật dự đoán
ảnh intra, inter hoặc một số thuật toán rate control..


3
Chương 1-TỔNG QUAN VỀ TRUYỀN HÌNH SỐ VÀ CƠ SỞ
NÉN VIDEO
1.1 Tổng quan về hệ thống truyền hình số.
1.1.1 Sơ đồ tổng quát hệ thống truyền hình số
Tín hiệu
truyền hình
tương tự

Thiết bị phát
Biến đổi
A/D

Mã hóa
nguồn

Mã hóa
kênh

Điều chế

số
Kênh
thông tin

Tín hiệu
truyền hình
tương tự

Biến đổi
D/A

Giải mã
hóa nguồn

Giải mã
hóa kênh

Giải điều
chế số

Thiết bị thu

Hình 1.1. Sơ đồ tổng quát hệ thống truyền hình số[1].
1.1.2 Đặc điểm truyền hình số
1.1.3 Quá trình số hóa tín hiệu
1.1.4 Tốc độ bit và độ rộng băng thông
1.1.5 Quá trình biến đổi và tiêu chuẩn lấy mẫu tín hiệu màu.
1.2 Nén tín hiệu video.
1.2.1 Các kỹ thuật nén tín hiệu video
Tín hiệu video thường chứa đựng một lượng lớn các thông tin dư

thừa, chúng thường được chia thành 5 loại như sau: Có sự dư thừa
thông tin về không gian; Có sự dư thừa thông tin về thời gian; Có sự
dư thừa thông tin về phổ; Có sự dư thừa do thống kê; Có sự dư thừa
tâm thị giác
Có nhiều phương pháp nén tín hiệu, phương pháp nén bằng cách
số hóa tín hiệu vẫn tỏ ra hữu hiệu trong mọi thời đại, một mặt nó có
thể làm giảm lượng thông tin không quan trọng một cách đáng kể,
mặt khác nó còn giúp cho tín hiệu được bảo mật hơn.


4
1.2.2 Tỷ số nén tín hiệu video
1.2.3 Phân loại kỹ thuật nén tín hiệu video
1.2.4 Biến đổi cosin rời rạc
1.2.5 Quá trình lượng tử hóa
1.2.6 Tiêu chuẩn đánh giá tín hiệu video
Đánh giá chất lượng video thông qua các giá trị cung cấp bởi
hệ thống xử lý, và việc suy giảm chất lượng tín hiệu có thể nhìn thấy
được (thông thường chúng được so sánh với tín hiệu gốc). Qua hệ
thống ta có thể thấy được những thay đổi về hình dạng, việc định
chuẩn chất lượng video là rất quan trọng. Để đánh giá chất lượng của
bức ảnh (hay khung ảnh video) ở đầu ra của bộ mã hoá, người ta
thường sử dụng tham số truyền thống sau để đánh giá:
Sai số bình phương trung bình (mean square error– MSE) định
nghĩa cho cường độ sai khác giữa ảnh gốc và ảnh dự đoán.

MSE 

1
N2


N 1 N 1

  (C
i 0

j 0

ij

 Ri j ) 2

(1.9)

Tỉ số tín hiệu trên nhiễu đỉnh (peak to signal to noise ratio– PSNR).
PSNR  10 log 10

(2 b  1) 2 (dB)
MSE

(1.10)

Trong đó NxN kích thước bù chuyển động; hệ số Ci, j và Ri, j tương
ứng với mẫu hiện tại và vùng mẫu tham khảo; b số lượng bit/
mẫu.Thông thường, nếu:
 PSNR ≥ 40dB thì hệ thống mắt người gần như không phân biệt
được giữa ảnh gốc và ảnh khôi phục, tức là ảnh nén có chất lượng
xuất sắc.
 30 dB  PSNR < 33 dB thì chất lượng ảnh nén bình thường, mắt
người có sự phân biệt được.

 PSNR < 30 dB thì chất lượng ảnh nén kém.
1.3 Mô hình cấu trúc DVB-T2
DVB-T2 là tiêu chuẩn truyền hình số mặt đất cho thế hệ thứ 2, là
thành quả nghiên cứu của nhiều nhà khoa học thuộc tổ chức DVB


5
(Digital Video Broadcasting ) trong suốt 3 năm (2006-2009). DVBT2 cho phép tăng dung lượng dữ liệu trên kênh truyền (30%) và độ
tin cậy trong môi trường truyền sóng trên mặt đất. DVB-T2 chủ yếu
dành cho truyền hình số có độ phân giải cao HDTV.
Kết luận chương 1
Chương này trình bày một cách tổng quát về hệ thống truyền hình
số, một số đặc trưng của truyền hình số so với truyền hình tương tự,
quá trình biến đổi và các tiêu chuẩn lấy mẫu, các kỹ thuật được sử
dùng để xử lý tín hiệu video, các cơ sở để đánh giá chất lượng video
sau quá trình mã hóa và giải mã. Đồng thời chương 1 giới thiệu sơ đồ
và cấu trúc cơ bản hệ thống truyền hình số mặt đất DVB-T2, là cơ sở
trong việc ứng dụng nén tín hiệu video vào hệ thống truyền hình số
cho chương 3.
Chương 2 - KỸ THUẬT MÃ HÓA VIDEO H.265/HEVC VÀ
SO SÁNH VỚI H.264/AVC
2.1 Lịch sử phát triển các chuẩn nén và sự phát triển các sản
phẩm liên quan đến mã hóa H.265/HEVC
2.1.1 Lịch sử phát triển

Hình 2.1. Lịch sử phát triển các chuẩn nén [3].
MPEG-2/H.262, H.264/AVC và H.265/HEVC là chuẩn nén
video được phát triển bởi ISO/IEC Moving Picture Experts Group
(MPEG) và ITU-T Video Coding Experts Group (VCEG). MPEG và



6
VCEG đã thành lập một nhóm cộng tác viên về mã hóa video để phát
triển chuẩn H.26x.
2.1.2 Quá trình sự phát triển các sản phẩm liên quan đến mã
hóa H.265/HEVC
2.2 Kỹ thuật mã hóa video H.264/AVC
2.2.1 Sơ đồ mã hóa và giải mã chuẩn H.264/AVC
2.2.2 Cấu trúc H.264/AVC
2.2.2.1 Các profiles và level
2.2.2.2 Slices
2.3 Kỹ thuật mã hóa video H.265/HEVC
2.3.1 Sơ đồ mã hóa và giải mã chuẩn H.265/HEVC

Hình 2.3. Sơ đồ khối của bộ mã hóa và giải mã HEVC [7].
Trong phần này, giải thích nguyên lý hoạt động cơ bản của quá
trình mã hóa và giải mã từ hình 2.3. Từ sơ đồ khối tổng quát của bộ
mã hóa, ta tiến hành phân tích những kỹ thuật cơ bản mã hóa
H.265/HEVC và so sánh với kỹ thuật mã hóa H.264/AVC.
2.3.2 Các profiles và level
2.3.3 Phân vùng ảnh
2.3.4 Biến đổi và lượng tử hóa
2.3.5 Các chế độ dự đoán


7
2.3.5.1 Chế độ dự đoán trong ảnh
2.3.5.2 Chế dự đoán liên ảnh
2.3.6 In-loop Filtering
2.3.7 Mã hóa Entropy

2.4 So sánh những đặc điểm cơ bản H.264/AVC và H.265/HEVC
Trên cơ sở phân tích các kỹ thuật mã hóa H.265/HEVC và
H.264/AVC, ta rút ra so sánh những đặc điểm cơ bản của hai chuẩn
mã hóa video và điểm khác biệt.
2.4.1 So sánh phân vùng hình ảnh - cấu trúc mã hóa ảnh
2.4.2 So sánh dự đoán trong ảnh
2.4.3 So sánh dự đoán liên ảnh
2.4.4 So sánh biến đổi và lượng tử hóa
2.4.5 So sánh mã hóa Entropy
2.4.6 So sánh In-loop Filtering
2.4.7 Cấu trúc xử lí song song
2.4.8 Tóm tắt so sánh kỹ thuật mã hóa H.265/HEVC và
H.264/AVC
Bảng 2.7. Bảng tóm tắt so sánh một số kỹ thuật mã hóa H.265/HEVC
và H.264/AVC.
Đặc điểm kĩ thuật

H.264/AVC

H.265/HEVC

Đơn vị mã hóa(CU)

16x16 only

8x8 tới 64x64, cấu trúc cây

Đơn vị dự
đoán(PU)


4 x 4 tới 16x16 (7
loại bao gồm cả
hình chữ nhật)
No

4 x 4 tới 64x64 (28 loại bao
gồm cả hình chữ nhật)

DCT

DCT, DST(4x4 only intra),
transform skipping
4-tap, 7-tap hoặc 8-tap

Đơn vị chuyển đổi
cấu trúc cây
Loại biến đổi
Bộ lọc nội suy phân
số pixel chính xác
Bộ lọc loại bỏ nhiễu
khối

2 hoặc 6-tap
Yes

Yes

Yes (trong phiên bản song
song)



8
Bộ lọc loại bỏ nhiễu
mã hóa
Sự phân chia Block

No

Yes (SAO)

Hình vuông, đối
xứng
9

Hình vuông, đối xứng,
không đối xứng.
35, adaptive reference pixel
smoothing

Dự đoán chuyển
động
Biến đổi

Dựa trên 1 vector
4x4, 8x8 Int DCT

Hợp nhất chuyển động.
AMVP. Hỗ trợ chế độ skip.
4×4,8×8, 16×16, và 32×32


Mã hóa Entropy

CAVLC, CABAC

CABAC

Bộ lọc lặp

Bộ lọc giải khối

Bộ lọc giải khối
Bù mẫu thích nghi.

Cấu trúc xử lí song
song
Profiles

Slice

Slice, Tile, WPP.

4

3

Độ phức tạp mã hóa
Hiệu quả nén

Phức tạp
Cao


Rất phức tạp
Rất cao (gấp 2 lần H.264)

Chế độ dự đoán
trong ảnh

Kết luận chương 2
Trong chương 2, đã tìm hiểu lịch sử phát triển các chuẩn nén, sự
ra đời của chuẩn nén video tiên tiến H.265/HEVC và phát triển chuẩn
nén và các sản phẩm liên quan đến H.265/HEVC để nói lên tính khả
thi của sự ra đời các thiết bị giải mã và xử lý video thời gian thực,
làm lý thuyết cơ bản nghiên cứu cho chương 3 tiếp theo.
Phân tích sơ đồ tổng quát mã hóa lai ghép H.264/AVC và
H.265/HEVC để thấy được cơ bản sự giống nhau và khác nhau trong
cấu trúc mã hóa giữa hai chuẩn.
Việc phân tích kỹ thuật mã hóa video H.265/HEVC theo hướng
những đặc tính khác biệt so với chuẩn mã hóa trước đó H.264/AVC,
để có được những đặc điểm khác biệt chung nhất và những cải tiến


9
của chuẩn nén mới so với chuẩn nén cũ để đem lại chất lượng mã hóa
tốt hơn. Từ đó lựa chọn thông số mã hóa chung cho phần mềm mã
hóa H.265 và H.264 trong so sánh phân tích mã hóa chương 4 khách
quan và chính xác hơn. Tiếp theo, để thấy được hiệu quả ứng của
chuẩn nén mới H.265 trong ứng dụng thực tế và chất lượng mã hóa
vượt trội, thì trong chương 3 và chương 4 sẽ thực hiện cụ thể hơn.
Chương 3 - XÂY DỰNG HỆ THỐNG TRUYỀN DẪN SỐ
MẶT ĐẤT TRÊN KỸ THUẬT MÃ HÓA H.265/HEVC VÀ

CÔNG NGHỆ DVB-T2
Qua phân tích so sánh những kỹ thuật nổi bật của chuẩn nén video
H.265/HEVC so với chuẩn nén đang được ứng dụng phổ biến hiện
nay là H.264/AVC được giới thiệu trong chương 2. Trong chương
này đề xuất ứng dụng kỹ thuật mã hóa video H.265/HEVC để xây
dựng và nâng cấp hệ thống phát số mặt đất DVB-T2 đang sử dụng tại
Đài THVN theo định hướng tối thiểu chí phí đầu tư cơ sở hạ tầng. Để
thực hiện được điều này, luận văn đề xuất đó là cần giảm tốc độ bit
cho mỗi chương trình bằng cách tăng hiệu quả mã hóa nguồn và tăng
dung lượng của kênh RF, tăng cường năng lực sử dụng dung lượng
kênh và đồng thời kiểm nghiệm bằng mô hình thực tế để chứng minh
tính khả thi của giải pháp.
Hình 3.1. Mô hình truyền dẫn số mặt đất DVB-T2.


10
3.1 Hệ thống truyền dẫn số mặt đất DVB-T2 hiện nay
Mô hình truyền dẫn số mặt đất tại Đài truyền hình Việt Nam hiện
nay được thể hiện ở hình 3.1. Các trạm phát sóng số mặt đất DVB-T2
được đặt hầu như trên các tỉnh thành trong cả nước, nguồn tín hiệu
gốc thu từ hệ thống vệ tinh Vinasat-Band C, được phát lên từ trạm
phát vệ tinh giảng võ.
Tốc độ bitrate tối hiện nay tối đa cho phép là 33.8Mbp/s, hiện nay
các chương trình của VTV nén theo chuẩn H.264/AVC. Đối với
chương trình HDTV nén với tốc độ bitrate 4.5Mbit/s, đối với các
chương trình SDTV với tốc độ bitrate 1.5Mbit/s. Như vậy một máy
phát số DVB-T2 chỉ phát được tối đa 07 chương trình HDTV bitrate
4.5Mbit/s, hoặc chỉ phát được tối đa 22 chương trình SDTV bitrate
1.5Mbit/s.
3.2 Giải pháp đề xuất và hiệu quả của áp dụng mã hóa

H.265/HEVC
3.2.1 Giải pháp đề xuất
Trên cơ sở hạ tầng sẵn có, quy hoạch phủ sóng tại các trạm phát
số đã được thực hiện, đảm bảo tính tiết kiệm kinh tế, luận văn đưa ra
giải pháp sau đây:
 Giảm tốc độ bit cho mỗi chương trình bằng cách tăng hiệu quả mã
hóa nguồn.
 Tăng dung lượng của kênh RF, tăng cường năng lực sử dụng dung
lượng kênh.
3.2.2 Hiệu quả đạt được
Hiệu quả đạt được thể hiện qua ví dụ trạm phát số tại Đà Nẵng.
Đối với máy phát số tại Đà Nẵng, khi các chương trình VTV9SD,
QRTSD, DRTSD chuyển sang HDTV thì tổng tốc độ bit lên đến
40.5Mbp/s vượt quá dung lượng cho phép. Việc áp dụng mã hóa
nguồn H.265/HEVC để giảm khoảng 50% tốc độ bit cho mỗi chương
trình thì tổng bitrate khoảng 22.5Mbp/s, thể hiện ở bảng 3.3.


11
Bảng 3.3. So sánh Bitrate chương trình HD máy phát số DVB-T2 Đà Nẵng.
STT Chương trình Bitrate HEVC(Mbp/s) Bitrate AVC (Mbp/s)
1
2
3
4
5
6
7
8
9


VTV1 HD
VTV2 HD
VTV3 HD
VTV6 HD
VTV7 HD
VTV8 HD
VTV9 HD
QRT HD
DRT1 HD
Tổng Bitrate

2.5
2.5
2.5
2.5
2.5
2.5
2.5
2.5
2.5

4.5
4.5
4.5
4.5
4.5
4.5
4.5
4.5

4.5

22.5Mbp/s

40.5 Mbp/s

Với việc chuyển đổi H.265/HEVC trong truyền dẫn DVB-T2 có
thể nén một chương trình lên đến 2.5Mbp/s vẫn đảm bảo được chất
lượng hình ảnh, và với dung lượng 33.8Mbp/s của máy phát số thì có
thể phát đến 13 chương trình HDTV chiếm dung lượng khoảng
32.5Mbp/s.
3.3 Xây dựng hệ thống DVB-T2 trên kỹ thuật mã hóa
H.265/HEVC
Dựa trên giải pháp được đề xuất, hiệu quả đạt được. Luận văn sẽ
giới thiệu mô hình một trạm phát sóng DVB-T2 sử dụng mã hóa
H.265 mới so với mô hình cũ giới thiệu ở hình 3.1 và các thành phần
trong mô hình cần được xử lý, nâng cấp và thay thế. Trong phần này
cũng giới thiệu thông số thu phát vệ tinh Band C với dung lượng
bitrate hiện có, giới thiệu một số thiết bị hiện có phục vụ việc nâng
cấp và tính toán cơ bản để có thể tăng dung lượng bitrate của máy
phát DVB-T2 mã ít bị ảnh hưởng đến quy hoạch phủ sóng đã đặt ra.
3.3.1 Một số thiết bị mã hóa nguồn sử dụng mã HEVC
3.3.2 Hệ thống vệ tinh Vinasat Band C
3.3.3 Tăng dung lượng cho máy phát sóng số mặt đất DVB-T2
Tăng dung lượng của kênh RF, tăng cường năng lực sử dụng


12
dung lượng kênh, liên quan đến vệc lựa chọn thông số cấu hình cho
hệ thống máy phát số. Việc lựa chọn các thông số cấu hình cho hệ

thống máy phát ảnh hưởng đến quy hoạch bán kính phủ sóng, mạng
DVB-T2 đơn tần hay đa tần số, mục đích thu cố định, hay di động,
ăng ten trong nhà hay ngoài nhà, và điều quan trong làm sao tốc độ
bit dòng truyền tải hệ thống máy phát DVB-T2 để đáp ứng các dòng
chương trình HDTV. Trong phần này sẽ tính toán lựa chọn thông số
phù hợp để tăng dung lượng kênh phát sóng mã không ảnh hưởng
nhiều đến đến hệ thống.
3.4 . Kiểm nghiệm mô hình DVB-T2 với H.265 trong thực tế
3.4.1 Thiết bị và mô hình thử nghiệm
Trong luận văn xây dựng mô hình hóa dựa trên cấu hình hệ
thống máy phát sóng số mặt đất hiện nay để thử nghiệm khả năng
phát sóng tín hiệu mã hóa nguồn H.265/HEVC trên hệ thống truyền
hình số mặt đất DVB-T2. Đo kiểm tra các thông số tại phòng thử
nghiệm, mức tín hiệu, tỷ số C/N, tỷ số lỗi điều chế MER tối thiểu khi
thay đổi các thông số, khảo sát về dung lượng truyền dẫn 1 kênh
truyền hình HDTV trên hệ thống truyền hình số mặt đất.
3.4.2 Thiết lập cấu hình
3.4.3 Kết quả thử nghiệm và nhận xét.
 Nhận thấy kết quả thu được ở bộ giải mã kênh DVB-T2 R&S
EFL340 có giá trị không thay đổi khi thay đổi các cấu hình, các giá
trị mức thu và giá trị MER ít thay đổi ở các kênh tần số khác nhau.
 Kết quả thu được hiển thị trên Tivi có tích hợp giải mã kênh
DVB-T2 và giải mã nguồn HEVC quan sát được không có hiện
tượng vỡ và dừng hình.
Kết luận chương 3
Với mô hình này, đảm bảo được tiết kiệm chi phí đầu tư, đáp ứng
với nhu cầu hiện tại với các chương trình HDTV và hướng tới tương
lai đối với các chương trình UHDTV 4K.
Ngoài ra việc nâng cấp thay thế này đảm bảo được khoảng cách



13
vùng phủ sóng, điều kiện thu trong nhà hay ngoài nhà, thu cố định
hay di động đã được quy hoạch trước đối với hệ thống cũ, và từ đó
lựa chọn tốc độ bit tối đa để có thể truyền tải nhiều chương trình
HDTV đã mã hóa H.265/HEVC tăng dung lượng kênh RF và hiệu
quả sử dụng.
Tuy nhiên, trong mô hình kiểm nghiệm mô hình thực tế, việc
đánh giá chất lượng mã hóa nguồn H.265/HEVC chỉ được thực hiện
qua quan sát trên Tivi bằng cảm nhận của con người với hiện tượng
có vỡ hình hay không. Việc đánh giá này không có số liệu cụ thể,
không thuyết phục rằng chất lượng mã hóa nguồn H.265/HEVC có
thể tốt hơn mã hóa nguồn H.264/AVC. Chính vì vậy trong phần
chương 4 tiếp theo sẽ đưa ra phương pháp và kết quả đánh giá trong
phần mã hóa nguồn chi tiết hơn, cụ thể hơn.
Chương 4- PHÂN TÍCH VÀ ĐÁNH GIÁ CHẤT LƯỢNG MÃ
HÓA VIDEO H.265/HEVC
Trong luận văn này sẽ trình bày phương pháp đánh giá chất lượng
H.265/HEVC so với H.264/AVC cả về đánh giá chất lượng khách
quan và chủ quan. Trong cả 2 trường hợp mã hóa H.265 và H.264
đều đo lường chất lượng bằng giá trị cụ thể và dựa vào đánh giá chất
lượng khách quan. Mặt khác khi đánh giá chủ quan về chất lượng nó
liên quan đến cảm nhận của người xem, độ chính xác là tùy thuộc
vào trình độ, kinh nghiệm người đánh giá và kết quả cuối cùng là sự
thống nhất giữa kết quả chủ quan và khách quan, để đưa ra kết luận
chất lượng lượng mã hóa H.265/HEVC tốt hơn H.264/AVC.
4.1 Thiết lập các điều kiện để thực hiện đánh giá
4.1.1 Mô hình mã hóa
Để đưa ra kết quả phân tích đánh giá khách quan trong so sánh
chất lượng mã hóa H.265/HEVC và H.264/AVC, luận văn dựa vào

phần mềm mã nguồn mở tham chiếu đã được các tổ chức chuẩn hóa
chạy trên nền C++. Đối với H.265/HEVC phần mềm mã nguồn mở


14
tham chiếu được gọi là HM (HEVC Test Model). Đối H.264/AVC
phần mềm mã nguồn mở tham chiếu được gọi là JM (Joint Test
Model). Trong chương này, sử dụng các phiên bản phần mềm mã
nguồn mở mới nhất so sánh mã hóa của H.265/HEVC với
H.264/AVC là HM 16.7 và JM 19 được sử dụng.
4.1.2 Cấu trúc dự đoán
Để đánh giá và so sánh chất lượng mã hóa ta dựa vào các cấu
trúc dự đoán sau.
(1) All Intra (AI).
(2). Low Delay P picture (LDP).
(3). Low Delay B picture (LDB).
(4). Random Access (RA).
Trong các cấu hình này, giá trị QP (Thông số lượng tử hóa) có thể
được điều chỉnh bởi thêm giá trị “QP Offset”. QP = QPI +QPoffset.
với QP offset được xác định qua kiểu ảnh P, hay ảnh.
Hình ảnh I đề cập đến hình ảnh có thể được giải mã độc lập mà
không yêu cầu dữ liệu dự đoán từ các ảnh đã giải mã khác. Thông
thường, hình ảnh P (predicted) yêu cầu dữ liệu mẫu hình ảnh từ một
ảnh I, P hoặc B khác để tạo ra từng khối mẫu dự đoán. Một ảnh B
(bi-predicted), yêu cầu dữ liệu mẫu hình ảnh từ hai hình I, P hoặc B
khác để tạo ra từng khối mẫu dự đoán.
4.2 Chuỗi video và quy trình đánh giá
4.2.1 Chuỗi video đánh giá
Các chuỗi video kiểm tra được định nghĩa theo kích thước ảnh,
mức độ chuyển động và ứng dụng. Chúng được phân thành 4 loại

video như bảng sau.


15
Bảng 4.2. Chuỗi video tham chiếu kiểm tra [25].
Phân
loại

Tên Video

Tỷ lệ khung
hình

Số
khung

Tốc độ Tỷ lệ lấy Số bit
khung
mẫu
mẫu

A

crowd run_yuv

1920x1080

200

50


4:2:0

8

B

ducks_take_off

1280x720

200

50

4:2:0

8

C

akiyo_yuv

352x288

300

50

4:2:0


8

D

news_yuv

352x288

300

50

4:2:0

8

4.2.2 Quy trình đánh giá
Trình tự thực hiện chạy mã hóa trên phần mềm HM 16.7 và
JM 19.0 đối với từng loại video, bằng cách thay đổi các giá trị thông
số lưỡng tử hóa QP để thu được các giá trị PSNR_YUV và Bitrate
từng loại video được mã hóa và mỗi video được được thực hiện trên
4 cấu trúc dự đoán theo các kiểm tra như sau:
TEST 1: All Intra (AI).
TEST 2: Low-Delay P (LDP).
TEST 3: Low-Delay B (LDB).
TEST 4: Random Access (RA).
Việc phân tích kết quả dựa trên giá trị PSNR_YUV cho mỗi video
và bitrate được tính trung bình cho tất cả các khung.
Đánh giá trị tiết kiệm bitrate của mã hóa H.265/HEVC so với

H.264/AVC.
4.3 Phân tích kết quả đánh giá khách quan
4.3.1 Mã hóa All Intra (AI-TEST 1)
Trong trường hợp của All Intra Main các video được mã hóa theo
các ảnh I độc lập với nhau nên sự cải thiện về bitrate mã hóa
H.265/HEVC đã cải thiện được 21,45% lượng bit tiết kiệm so với
H.265/AVC. Đồng thời, H.265/HEVC sẽ cho chất lượng ảnh tốt hơn
rất nhiều so với H264/AVC ở cùng một tốc độ bít.
4.3.2 Mã hóa Low delay P (LDP- TEST 2)
Trong trường hợp mã hóa các ảnh P, có sự dự đoán liên ảnh từ các


16
ảnh trước đó, hiệu quả trong trường hợp này cao hơn trường hợp dự
đoán AI. Trung bình lượng tiết kiệm bit trong mã hóa H.265/HEVC
đạt 73,94% so với mã hóa H.264/AVC. Đồng thời, H.265/HEVC sẽ
cho chất lượng ảnh tốt hơn so với H264/AVC ở cùng một tốc độ
bitrate.
4.3.3 Mã hóa Low delay B (LDB- TEST 3)
Trong kiểu mã hóa này, được dự đoán hai chiều của ảnh B, hiệu
suất bitrate đạt được trong trường hợp này cao hơn với trường hợp
mã hóa LDP, lượng tiết kiệm bit trung bình của H.265 so với H.264
đạt -93,78 %.
4.3.4 Mã hóa Random Access (RA- TEST 4)
Trong kiểu mã hóa RA, xu hướng tiết kiệm bit đối với loại video
có độ phân giải cao, lượng chuyển động lớn. Điều này nói lên khả
năng nén video của H.265 vượt trội đối với loại video có độ phân giải
lớn. video độ phân giải càng cao thì hiệu suất nén của mã hóa video
H.265 tốt hơn so với H.264.
4.3.5 Kết luận đánh giá khách quan

Bảng 4.7. Tổng hợp kết quả lượng tiết kiệm bít trong hai loại mã hóa.
Lượng bit tiết kiệm của
Video
H.265/HEVC so với H.264/AVC
Độ phân giải
Được mã
(pixel)
AI
LDP
LDB
RA
hóa
( %)
(%)
(%)
(%)
352x288
Loại C
-22,19 -65,42 -170,69 -31,82
Loại D

352x288

-20,58

-55,10

-120,77

-21,84


Loại B

1280x720

-21,69 -108,03

-52,18

-118.87

Loại A

1.920x1080

-67,24

-31,50

-77,63

-73,94

-93,78

-32,82

Trung bình

-21,49


Cùng chất lượng mã hóa, cùng giá trị QP thì khả năng nén của
H.265 tốt hơn chuẩn nén H.264.
Cùng giá trị bitrate, nhưng chất lượng nén của H.265 tốt hơn


17
chuẩn H.265. .
Lượng bit tiết kiệm của H.265 so với H.264 trung bình là 21,49%
mã hóa AI, 73,94% đối với mã hóa LDP, 93,78% đối với mã hóa
LDP và 32,82% đối với mã hóa RA.
Kết quả khách quan mang tính định lượng, kết quả mã hóa video
cuối cùng cũng mang đến sự cảm nhận của con người, giải quyết nhu
cầu giải trí của con người. Vì vậy, bên cạnh đánh giá khách quan, ta
cũng cần đánh giá chủ đối với các video được mã hóa trên. Trong
phần đánh giá chủ quan sử dụng kết quả mã hóa LDP, LDB và RA
của video loại A 1080p để đánh giá.
4.4 Phân tích đánh giá kết qủa chủ quan
4.4.1 Phương pháp đánh giá chủ quan
Phương pháp đánh giá chủ quan của con người rất quan trọng
trong việc đánh giá và so sánh chất lượng mã hóa H.265/HEVC và
H.264/AVC. Dựa trên phương pháp DSCQS (double Stimulus
continous Quality scale) theo khuyến cáo của ITU-R BT500 [12]
được sử dụng rộng rãi để đánh giá chất lượng video sử dụng truyền
dẫn trong truyền hình, để xây dựng phương pháp đánh giá chủ quan
chất lượng mã hóa video và được tiến hành như sau:

Đối với thang điểm đánh giá được chia thành 5 đoạn: Rất tốt, tốt,
bình thường, xấu, rất xấu, được quy đổi thành các điểm từ 0 đến 100
điểm. Có 5 đoạn, tương ứng một đoạn 20 điểm. Để phân tích kết quả

đánh giá, ta sử dụng điểm số ý kiến đánh giá trung bình MOS (Mean
Opinion Score) và vẽ đồ thị MOS/Bitrate. Trong bài luận văn sử
dụng 3 người được đánh giá, điều kiện và trình tự đánh giá đều như
nhau.


18
4.4.2 Kết quả đánh giá
4.4.2.1 Đánh giá chủ quan mã hóa LDP
Video dùng để biểu diễn cho người đánh giá có được từ kết quả
mã hóa LDP trong phần đánh giá khách quan với video loại A độ
phân giải 1080p, có tốc độ bitrate, QP khác nhau cho ở bảng 4.8. Và
kết quả trung bình biểu diễn trên đồ thị MOS, và sự khác nhau của
giá trị MOS.

Hình 4.12. Đồ thị MOS trong đánh giá chủ quan video LDP loại A.
4.4.2.2 Đánh giá chủ quan mã hóa LDB
Video dùng để biểu diễn cho người đánh giá có được từ kết quả
mã hóa LDB với video loại A độ phân giải 1080p, có tốc độ bitrate,
QP khác nhau cho ở bảng 4.10, và kết quả khảo sát 5 người thể hiện
trên bảng 4.11 và đặc trưng bằng đồ thị MOS.

Hình 4.13. Đồ thị MOS trong đánh giá chủ quan video LDB loại A.


19
4.4.2.3 Đánh giá chủ quan mã hóa RA
Video dùng để biểu diễn cho người đánh giá có được từ kết quả
mã hóa RA với video loại A độ phân giải 1080p, có tốc độ bitrate,
QP khác nhau cho ở bảng 4.12. Kết quả khảo sát 5 người thể hiện

trên bảng 4.13 và đặc trưng bằng đồ thị MOS.

Hình 4.14. Đồ thị MOS trong đánh giá chủ quan video RA loại A.
4.4.3 Kết luận đánh giá chủ quan
Các bảng 4.9, bảng 4.11, bảng 4.13 thể hiện thông số các video
được dùng để khảo sát.
Kết quả cho thấy chất lượng mã hóa H.265/HEVC tốt hơn so với
H.264/AVC tại cùng một giá trị bitrate. Thể hiện ở các hình 4.12,
hình 4.13 và hình 4.14 thể hiện giá trị (MOS) cảm nhận của con
người. Và giá trị sai khác cảm nhận trung bình của video mã hóa
H.265/HEVC và H.264/AVC các kiểu mã hóa LDP, LDB và RA lần
lượt là 16,58 %, 12,83 % và 45,16 %.
4.5 Tổng hợp so sánh đánh giá chủ quan và khách quan
Trong điều kiện và thời gian cho phép, trong luận văn lựa chọn
đối với loại A, độ phân giải cao nhất trong chuỗi video được đánh giá
ở phần khách quan. Kết quả khách quan và chủ quan đối với H.265
và H.264 ta có được hình 4.15.
Đối với kết quả đánh giá khách quan thể hiện ở hình 4.15 (a), (c)
(e) lần lượt có giá trị tiết kiệm bit trong các mã hóa LDP, LDB và RA
là 73,94%, 93,78%, 63,54%. Mặt khác trong các bảng 4.9, bảng 4.11,
bảng 4.13 cùng một giá trị bitrate thì giá trị QP của mã hóa H.264 lớn


20
hơn nhiều so với H.265.
Đối với kết quả đánh giá chủ quan thể hiện ở hình 4.15 (b), (d), (f)
lần lượt có giá trị MOS trung bình là 16,58 %, 12,83 % và 45,16 %.

Hình 4.15. Tổng hợp so sánh đánh giá khách quan và chủ quan.
Qua đây ta nhận thấy giá trị PSNR_YUV chỉ là tương đối, sự

chênh lệch nhỏ PSNR_YUV của hai loại mã hóa H.265 và H.264 khó
đánh giá là chất lượng mã hóa nào tốt hơn. Vì vậy, đánh giá chủ quan
rất quan trọng trong việc quyết định chất lượng mã hóa nào tốt hơn.
Trong mã hóa LDP hình 4.15 (a) và (b) có sự tương đồng trong
đánh giá khách quan và chủ quan. Trong hình 4.15 (a) giá trị
PSNR_YUV của mã hóa H.265 lớn hơn H.264 (sự chênh lệch nhỏ),
tương ứng với hình 4.15 (b) đánh giá chủ quan thì chất lượng mã hóa
H.265 tốt hơn và giá trị MOS trung bình đạt 16,58%.


21
Trong mã hóa LDB, hình 4.15 (c) giá trị PSNR_YUV của mã
hóa H.264 lớn hơn H.265 (sự chênh lệch nhỏ), tương ứng với hình
4.15 (d) đánh giá chủ quan thì chất lượng mã hóa H.265 tốt hơn và
giá trị MOS trung bình đạt 12,83% (thấp hơn so với trường hợp mã
hóa LDP).
Trong mã hóa RA, hình 4.15(e) giá trị PSNR_YUV giống nhau
trong hai mã hóa tại cùng giá trị bitrate, tương ứng với hình 4.15 (f)
đánh giá chủ quan thì chất lượng mã hóa H.265 tốt hơn và giá trị
MOS trung bình đạt 45,16%. Trong trường hợp này mã hóa H.264 có
hiện tượng vỡ các chi tiết hình ảnh khi quan sát tại các giá trị bitrate
khác nhau.
Qua phân tích trên ta nhận thấy có sự tương đồng trong kết quả
đánh giá khách quan và chủ quan, và tổng hợp kết quả khách quan và
chủ quan ta thấy rằng, chất lượng mã hóa H.265 trong trường hợp
này tốt hơn mã hóa H.264 tại cùng một giá trị bitrate
Kết luận chương 4
Đánh giá khách quan cho ra những kết quả có mang tính định
lượng, giá trị PSNR_YUV, giá trị bitrate và tiết kiệm bit của chuẩn
nén H.265/HEVC đạt được so với H.264/AVC. Điều quan trọng vẫn

là lượng tiết kiệm bit, giá trị PSNR_YUV chỉ là tương đối, có trường
hợp giá trị PSNR_YUV của mã hóa H.264 lớn hơn H.265 tại cùng
một giá trị QP nhưng các giá trị PSNR_YUV đều lớn hơn 30dB và sự
chênh lệch không lớn, vì vậy xem chất lượng là tương đương nhau.
Chính vì vậy cần có sự quan sát của mắt người để đánh giá so sánh
kết quả mã hóa tại các giá trị bitrate khác nhau.
Do điều kiện và thời gian nên trong luận văn sử dụng ba người
quan sát để khảo sát với kết quả sự sai lệch trung bình 16,58%,
12,83% và 45,16%, Sự khác biệt này cho ta thấy được sự khác nhau
về chất lượng của H.264 và H.265. Khi số lượng người đánh giá
nhiều hơn, ta sẽ có độ tin cậy cao hơn với kết quả thu được
Kết quả trong chương này là phân tích đánh giá chất lượng


22
chuẩn nén video H.265 so với chuẩn nén H.264 về các đánh giá
khách quan và chủ quan. Do tính linh hoạt của chuẩn nén mới, nên
các phương pháp cho ta khả năng lựa chọn thông số mã hóa tốt nhất
cho từng ứng dụng cụ thể. Đặc biệt cách tiếp cận thống nhất đánh giá
giữa phương pháp khách quan và phương pháp chủ quan giữa H.265
và H.264. Cụ thể hơn, về việc giảm tốc độ bitrate dựa trên đánh giá
khách quan cho thấy hiệu suất tăng khoảng 21,49% đối với kiểu dự
đoán AI, 73,94% đối với LDP, 93,78% đối với LDB và 62,54% đối
với RA và 62,59% so với H.264. Còn đối với phương pháp kiểm tra
thông qua thị giác con người cũng cho thấy rằng H.265 có chất lượng
vượt trội so với chuẩn nén H.264. Đồng thời cho thấy rằng chất
lượng mã hóa của H.265 so với H.264 thường tăng lên đối với các
video có độ phân giải cao như HD720p, 1080p và hướng tới video độ
phân giải 4K và 8K.



23
KẾT LUẬN VÀ KIẾN NGHỊ
Với các kết quả thu được đã cho thấy ưu việt mã hóa video mới
H.265/HEVC, và đưa ra một số kết luận sau.
 Cùng giá trị QP, chất lượng video mã hóa H.265/HEVC tương
đương với H.264/AVC nhưng khả năng nén của H.265/HEVC tốt
hơn chuẩn nén H.264/AVC.
 H.265/HEVC sẽ cho chất lượng ảnh tốt hơn so với HEVC ở cùng
một tốc độ bit.
 Theo lộ trình phát triển công nghệ cốt lõi truyền hình số mặt đất
DVB-T2, thì chuẩn nén H.265/HEVC sẽ thay thế H.264/AVC
trong tương lai gần.
 Với các đặc điểm nổi bật hơn hẳn của mình so với các chuẩn nén
trước đó H.265/HEVC sẽ đi tiên phong và chiếm lĩnh công nghệ
trong các dịch vụ trong tương lai như:
 Truyền phát video HD, Ultra-HD (4K, 8K) qua mạng
internet, qua vệ tinh và qua các dịch vụ truyền hình trả tiền.
 Người xem có cơ hội trải nghiệm xem video siêu nét và siêu
thực Ultra-HD (4K, 8K).
 Truyền phát video HD, Ultra-HD (4K, 8K) qua mạng
internet, qua vệ tinh và qua các dịch vụ truyền hình trả tiền.
 Người xem có cơ hội trải nghiệm xem video siêu nét và siêu
thực: Ultra-HD (4K, 8K).
Mặc dù đã cố gắng nghiên cứu, song do sự hiểu biết còn hạn chế
nên luận văn không tránh khỏi những thiếu sót. Rất mong sự bổ sung
và góp ý của quý thầy cô và đồng nghiệp để luận văn được hoàn
thiện hơn.
Cuối cùng tác giả xin chân thành cảm ơn sự quan tâm giúp đỡ và
chỉ bảo tận tình của Thầy giáo TS. Hồ Phước Tiến, cảm ơn các Thầy

cô trong khoa Điện Tử - Viễn Thông-Đại học Bách Khoa-Đại học Đà
Nẵng đã giúp đỡ tôi hoàn thành luận văn này.


×