Tải bản đầy đủ (.pdf) (105 trang)

Nghiên cứu và đánh giá chất lượng mã hóa video dùng chuẩn h 265 hevc

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (7.05 MB, 105 trang )

..

ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC BÁCH KHOA
---------------------------------------

HOÀNG LAM SƠN

NGHIÊN CỨU VÀ ĐÁNH GIÁ CHẤT LƯỢNG MÃ HÓA
VIDEO DÙNG CHUẨN H.265/HEVC

Chuyên ngành : Kỹ thuật điện tử
Mã số
: 60.52.02.03

LUẬN VĂN THẠC SĨ KỸ THUẬT

NGƯỜI HƯỚNG DẪN KHOA HỌC: TS. HỒ PHƯỚC TIẾN

Đà Nẵng – Năm 2017


LỜI CAM ĐOAN
Tôi xin cam đoan luận văn tốt nghiệp “Nghiên cứu và đánh giá chất lượng mã
hóa video dùng chuẩn H.265/HEVC.” là cơng trình nghiên cứu khoa học của riêng tôi
được thực hiện dưới sự hướng dẫn của TS. Hồ Phước Tiến. Luận văn tốt nghiệp là kết
quả của q trình nghiên cứu độc lập, khơng sao chép cơng trình nghiên cứu của bất
kỳ ai khác. Các số liệu trong luận văn được sử dụng trung thực, trích dẫn từ những
nguồn hợp pháp và đáng tin cậy.
Đà Nẵng, ngày tháng


năm 2017.

Người thực hiện

Hoàng Lam Sơn


MỤC LỤC
Lời cam đoan
Tóm tắt luận văn
Danh mục các ký hiệu, các chữ viết tắt
Danh mục các bảng
Danh mục các hình vẽ, đồ thị
MỞ ĐẦU ..................................................................................................................... 1
1. Lý do chọn đề tài ..................................................................................................... 1
2. Mục đích nghiên cứu ............................................................................................... 1
3. Đối tượng và phạm vi nghiên cứu ........................................................................... 1
4. Phương pháp nghiên cứu ......................................................................................... 2
5. Ý nghĩa khoa học và thực tiễn của đề tài nghiên cứu .............................................. 2
Chương 1 - TỔNG QUAN VỀ TRUYỀN HÌNH SỐ VÀ CƠ SỞ NÉN VIDEO .... 3
1.1. Tổng quan về hệ thống truyền hình số. ........................................................... 3
1.1.1 Sơ đồ tổng quát hệ thống truyền hình số ................................................... 3
1.1.2 Đặc điểm truyền hình số ............................................................................ 3
1.1.3 Q trình số hóa tín hiệu............................................................................ 4
1.1.4 Tốc độ bit và độ rộng băng thông .............................................................. 5
1.1.5 Quá trình biến đổi và tiêu chuẩn lấy mẫu tín hiệu màu. ............................ 6
1.2. Nén tín hiệu video .............................................................................................. 7
1.2.1 Các kỹ thuật nén tín hiệu video ................................................................. 7
1.2.2 Tỷ số nén tín hiệu video ............................................................................ 7
1.2.3 Phân loại kỹ thuật nén tín hiệu video ........................................................ 7

1.2.4 Biến đổi cosin rời rạc ................................................................................. 8
1.2.5 Q trình lượng tử hóa ............................................................................... 8
1.2.6 Tiêu chuẩn đánh giá tín hiệu video ............................................................ 9
1.3. Mơ hình cấu trúc DVB-T2 ............................................................................... 10
Kết luận chương 1.................................................................................................... 12
Chương 2-KỸ THUẬT MÃ HÓA VIDEO H.265/HEVC VÀ SO SÁNH VỚI
H.264/AVC ................................................................................................. 13
2.1. Lịch sử phát triển các chuẩn nén và sự phát triển các sản phẩm liên quan
đến mã hóa H.265/HEVC ............................................................................... 13
2.1.1 Lịch sử phát triển ..................................................................................... 13
2.1.2 Quá trình sự phát triển các sản phẩm liên quan đến mã hóa H.265 ........ 14
2.2. Kỹ thuật mã hóa video H.264/AVC ............................................................... 15
2.2.1 Sơ đồ mã hóa và giải mã chuẩn H.264/AVC .......................................... 15
2.2.2 Cấu trúc H.264/AVC ............................................................................... 16
2.2.2.1 Các profiles và level........................................................................ 16
2.2.2.2 Slices ............................................................................................... 17
2.3. Kỹ thuật mã hóa video H.265/HEVC ............................................................ 17
2.3.1 Sơ đồ mã hóa và giải mã chuẩn H.265/HEVC ........................................ 17
2.3.2 Các profiles và level ................................................................................ 18
2.3.3 Phân vùng ảnh.......................................................................................... 19
2.3.3.1 Phân vùng ảnh mức cao .................................................................. 20
2.3.3.2 Các tập tham số trong H.265/HEVC .............................................. 22


2.3.3.3 Cấu trúc khối và phân vùng các khối ảnh ...................................... 22
2.3.4 Biến đổi và lượng tử hóa ......................................................................... 25
2.3.5 Các chế độ dự đoán.................................................................................. 28
2.3.5.1 Chế độ dự đoán trong ảnh .............................................................. 29
2.3.5.2 Chế dự đoán liên ảnh ...................................................................... 29
2.3.6 In-Loop Filtering ..................................................................................... 32

2.3.7 Mã hóa entropy ........................................................................................ 33
2.4 So sánh những đặc điểm cơ bản H.264/AVC và H.265/HEVC ................... 34
2.4.1 So sánh phân vùng hình ảnh - cấu trúc mã hóa ảnh ................................ 34
2.4.2 So sánh dự đốn trong ảnh....................................................................... 34
2.4.3 So sánh dự đoán liên ảnh ......................................................................... 35
2.4.4 So sánh biến đổi và lượng tử hóa ............................................................ 36
2.4.5 So sánh mã hóa entropy ........................................................................... 36
2.4.6 So sánh in-loop filtering .......................................................................... 37
2.4.7 Cấu trúc xử lí song song .......................................................................... 37
2.4.8 Tóm tắt so sánh kỹ thuật mã hóa H.265/HEVC và H.264/AVC ............. 37
Kết luận chương 2.................................................................................................... 38
Chương 3 - XÂY DỰNG HỆ THỐNG TRUYỀN DẪN SỐ MẶT ĐẤT TRÊN KỸ
THUẬT MÃ HĨA H.265/HEVC VÀ CƠNG NGHỆ DVB-T2 ............ 39
3.1 Hệ thống truyền dẫn số mặt đất DVB-T2 hiện nay ...................................... 39
3.2 Giải pháp đề xuất và hiệu quả của áp dụng mã hóa H.265/HEVC ............ 41
3.2.1 Giải pháp đề xuất ..................................................................................... 41
3.2.2 Hiệu quả đạt được .................................................................................... 42
3.3. Xây dựng hệ thống DVB-T2 trên kỹ thuật mã hóa H.265/HEVC .............. 43
3.3.1 Mơ hình trạm phát sóng DVB-T2 sử dụng H.265/HEVC ....................... 43
3.3.2 Một số thiết bị mã hóa nguồn sử dụng mã hevc ...................................... 45
3.3.3 Hệ thống vệ tinh vinasat band c............................................................... 45
3.3.4 Tăng dung lượng cho máy phát sóng số mặt đất DVB-T2 ...................... 45
3.4. Kiểm nghiệm mơ hình DVB-T2 với H.265/HEVC trong thực tế ................ 47
3.4.1 Thiết bị và mơ hình thử nghiệm .............................................................. 47
3.4.2 Tín hiệu vào kiểm tra ............................................................................... 48
3.4.3 Thiết lập cấu hình .................................................................................... 48
3.4.4 Kết quả thử nghiệm và nhận xét .............................................................. 49
Kết luận chương 3................................................................................................... 50
Chương 4 - PHÂN TÍCH VÀ ĐÁNH GIÁ CHẤT LƯỢNG MÃ HÓA VIDEO
H.265/HEVC ............................................................................................ 51

4.1 Thiết lập các điều kiện để thực hiện đánh giá .............................................. 51
4.1.1 Mơ hình mã hóa ....................................................................................... 51
4.1.2 Cấu trúc dự đốn ...................................................................................... 52
4.2 Chuỗi video và quy trình đánh giá................................................................. 53
4.2.1 Chuỗi video đánh giá ............................................................................... 53
4.2.2 Quy trình đánh giá ................................................................................... 54
4.3 Phân tích kết quả đánh giá khách quan ........................................................ 54
4.3.1 Mã hóa all intra (AI-TEST 1) .................................................................. 54
4.3.2 Mã hóa low delay P (LDP- TEST 2) ....................................................... 56
4.3.3 Mã hóa low delay B (LDB- TEST 3) ..................................................... 58


4.3.4 Mã hóa random access (RA- TEST 4).................................................... 60
4.3.5 Kết luận đánh giá khách quan.................................................................. 61
4.4 Phân tích đánh giá kết qủa chủ quan ............................................................ 62
4.4.1 Phương pháp đánh giá chủ quan .............................................................. 62
4.4.2 Kết quả đánh giá ...................................................................................... 64
4.4.2.1 Đánh giá chủ quan mã hóa LDP ................................................... 64
4.4.2.2 Đánh giá chủ quan mã hóa LDB ................................................... 65
4.4.2.3 Đánh giá chủ quan mã hóa RA ...................................................... 65
4.4.3 Kết luận đánh giá chủ quan ..................................................................... 66
4.5 Tổng hợp so sánh đánh giá chủ quan và khách quan .................................. 67
Kết luận chương 4................................................................................................... 69
KẾT LUẬN VÀ KIẾN NGHỊ .................................................................................... 70
DANH MỤC TÀI LIỆU THAM KHẢO .................................................................. 72
QUYẾT ĐỊNH GIAO ĐỀ TÀI LUẬN VĂN
BẢN SAO KẾT LUẬN CỦA HỘI ĐỒNG
BẢN SAO NHẬN XÉT CỦA CÁC PHẢN BIỆN
PHỤ LỤC



TÓM TẮT LUẬN VĂN
NGHIÊN CỨU VÀ ĐÁNH GIÁ CHẤT LƯỢNG MÃ HĨA VIDEO DÙNG CHUẨN
H.265/HEVC
Học viên
: Hồng Lam Sơn. Chun ngành : Kỹ thuật điện tử
Mã số
: 60.52.02.03
Khóa
: K31, Trường Đại học Bách khoa-ĐHĐN
Tóm tắt- Các kỹ thuật mã hóa nén video đã được phát triển và cải thiện trong nhiều thập kỷ để giảm
thiểu dung lượng video, giúp cho việc truyền dẫn video qua mạng truyền thông đơn giản hơn. Hiện
nay, H.264/AVC là tiêu chuẩn nén mã hóa video được sử dụng phổ biến trên toàn thế giới. Tuy nhiên,
nhu cầu về video chất lượng cao hơn, tốc độ khung hình cao hơn, chẳng hạn như video HD, UltraH,
4K và 8K, thì H.264/AVC vẫn chưa có khả năng nén tốt nhất. Vì vậy, một chuẩn nén video mới
H.265/HEVC đã được phát triển, có khả năng mã hố tốt những video có độ phân giải cao và giảm
được dung lượng video mã hố một nửa so với chuẩn nén H.264/AVC.
Tìm hiểu lịch sử phát triển các chuẩn H.265/HEVC và các sản phẩm liên quan đến H.265/HEVC để
nói lên tính khả thi của sự ra đời các thiết bị giải mã xử lý video thời gian thực, khả năng thay thế
trong tương lai đối với chuẩn nén H.264/AVC. Việc phân tích cơ bản các khâu quan trọng trong kỹ
thuật mã hóa video H.265/HEVC theo hướng những đặc tính khác biệt so với chuẩn mã hóa
H.264/AVC trước đó, để thấy rõ các đặc điểm nổi trội và những cải tiến của chuẩn nén mới so với
chuẩn nén cũ để đem lại chất lượng mã hóa tốt hơn. Từ đó lựa chọn thơng số mã hóa chung cho phần
mềm mã hóa H.265 và H.264 trong so sánh phân tích mã hóa khách quan và chính xác hơn. Trong
phần ứng dụng thực tiễn, dựa trên cơ sở hạ tầng sẵn có của hệ thống DVB-T2 phát sóng số mặt đất
đang sử dụng chuẩn nén H.264/AVC, luận văn xây dựng mơ hình nâng cấp thay thế bằng chuẩn nén
mới H.265/HEVC vào trong hệ thống sẵn có theo hướng tiết kiệm chi phí thay thế và nâng cấp mà
không ảnh hưởng nhiều đến quy hoạch phủ sóng số đã đặt ra. Đồng thời thí nghiệm trên thiết bị thực
tế và đo các thông số và quan sát chất lượng hình ảnh thực tế qua các thiết bị thử nghiệm. Tác giả đã
tóm tắt kết quả đạt được và đưa ra hướng phát triển tiếp theo.

Từ khóa- mã hóa nén tiên tiến H.264/AVC; Mã hóa hiệu suất cao H.265/HEVC; số mặt đất thế hệ 2
DVB-T2(3 từ khóa).
STUDY AND PERFORMANCE EVALUATION OF H.265/HEVC-BASED VIDEO CODING
Abstract- Video coding techniques have been developed and improved over the years to reduce
video capacity, making video transmission over the network more effective. Today, H.264/AVC is the
video coding standard widely used in the world. However, with the demand for higher quality video
and higher frame rates, such as HD video, UltraHD, 4K and 8K, H.264/AVC still does not have the
best compression rate. Therefore, a new H.265/HEVC video compression standard has been
developed, it has the ability to effectively encode the high resolution video and reduce video encoding
capacity by half compared to H.264/AVC standard.
Studying the development history of the H.265/HEVC standard and products related to this
compression standard shows a possibility of introducing real-time video coding devices and a possible
replacement of the H.264/AVC compression standard. Basic analysis of the key aspects of the
H.265/HEVC video compression technology is carried out in comparison with H.264/AVC standard,
to show the prominent features and improvements of the new compression standard. On this basis, we
choose the general coding parameters for H.265 and H.264 to compare these two standards
objectively. In the practical application, based on the available infrastructure of DVB-T2 terrestrial
broadcasting system using the H.264/AVC standard, the thesis builds an upgraded model that replaces
the existing system by the new H.265/HEVC compression standard in order to save replacement and
upgrading costs without affecting the digital coverage planning. At the same time, experiments with
measurement of parameters and visual observation of actual images were carried out through the test
equipment. The author has summarized the results and proposed recommendations for further
development.
Key words- Advance Video Coding H264/AVC; High Efficiency Video Coding H.265/HEVC;
Terrestrial broadcasting system DVB-T2.


DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
AVC-Advance Video Coding (H.264/AVC)
CTU- Coding Tree Unit

CTB-Coding Tree Block
CU-Coding Unit
CB-Coding Block
TB-Transform Block
TU- Transform Unit
HEVC-High Efficiency Video Coding
NAL-Network Abstract Layer
PB-Prediction Block
PU-Prediction Unit
VCL-Video Coding Layer
WPP- Wave-front Parallel Processing
AMP-Asymmetric motion partition
AMVP-Advanced MV prediction
CABAC-Context-adaptive binary arithmetic
coding
CAVLC-Context-adaptive Variable Length
Coding
DCT-Discrete Cosine Transform
DF- Deblocking filter
DST-Discrete Sine Transform
EPZS-Enhanced predictive zonal search
GOP-Group Of Pictures
HEVC-High Efficiency Video Coding
LF-Loop filtering
MB-Macroblock
MC-Motion Compensation
ME-Motion estimation
MOS-Mean Opinion Score
MPEG-Moving Picture Experts Group
MV-Motion vectors

QP-Quantization Parameter
SAO-sample-adaptive offset
TCOEFF-Transform domain coefficients
UHDTV-Ultra high-definition television
HDTV-high-definition television
VTV
DVB-T2

Nén video tiên tiến
Đơn vị mã hóa cây
Khối mã hóa cây
Đơn vị mã hóa
Khối mã hố
Khối biến đổi
Đơn vị biến đổi
Mã hóa video hiệu suất cao
Lớp trừu tượng mã hóa mạng
Khối dự đốn
Đơn vị dự đốn
Lớp mã hóa video
Kỹ thuật xử lý song song sóng trước
Đa xử lý khơng đối xứng
Dự đốn vecto chuyển động nâng cao
Mã hóa số học nhị phân thích nghi nội
dung
Mã hóa độ dài thay đổi thích ứng bối
cảnh
Biến đổi Cosin rời rạc
Bộ lọc tách khối
Biến đổi sin rời rạc

Tìm kiếm khu vực dự đốn nâng cao
Nhóm ảnh
Mã hóa video hiệu suất cao
Bộ lọc vịng
Đa khối
Bù chuyển động
Dự đoán chuyển động
Ý kiến đánh giá trung bình
Nhóm chun gia về ảnh động
Vecto chuyển động
Thơng số lượng tử
Bù thích ứng mẫu
Hệ số chuyển đổi
Truyền hình độ phân giải siêu cao
Truyền hình độ phân giải cao
Đài truyền hình Việt Nam
Chuẩn truyền hình số thế hệ 2


DANH MỤC CÁC BẢNG
Số
hiệu
2.1
2.2
2.3
2.4
2.5
2.6
2.7
3.1

3.2
3.3
3.4
3.5
3.6
3.7
3.8
3.9
3.10
3.11
4.1
4.2
4.3
4.4
4.5
4.6
4.7
4.8
4.9
4.10
4.11
4.12
4.13

Tên bảng
Các loại slice mã hóa trong H264/AVC
Giới hạn mức trong H.265/HEVC
Kích thước nhóm lưỡng tử hóa cho kích thước CTU khác nhau
Giá trị EdgeIdx được liệt kê trong bộ lọc SAO edge
Sự khác nhau kỹ thuật dự đốn trong ảnh H.264/AVC và

H.265/HEVC
Kích thước khối bù chuyển động trong H.265/HEVC và H.264/AVC
Bảng tóm tắt so sánh một số kỹ thuật mã hóa H.265/HEVC và
H.264/AVC
Bộ thơng số cho máy phát DVB T2
Thơng số tốc độ bit chương trình máy phát số DVB-T2 Đà Nẵng
So sánh tốc độ bit chương trình HD máy phát số DVB-T2 Đà Nẵng
Quan hệ các thông sô điều chế hệ thống máy phát DVB-T2
Số sóng mang cung cấp cho mỗi băng tần BW=8Mhz
Khoảng bảo vệ được tính bằng micro giây
Khoảng cách phát tối đa của trạm phát sóng số DVB-T2
Thơng số dịng video 1080p HDTV
Mơ hình thiết lập thử nghiệm đối với máy phát số mặt đất
Kết quả cấu hình 1 thu được từ thiết bị đo R&S EFL340
Kết quả cấu hình 2 thu được từ thiết bị đo R&S EFL340
Thiết lâp cấu hình hai bộ mã hóa tham chiếu HM 16.7 và JM 19
Chuỗi video tham chiếu kiểm tra
Bảng kết quả mã hóa AI video loại B
Bảng kết quả mã hóa LDP video loại A
Bảng kết quả mã hóa LDB video loại A
Bảng kết quả mã hóa RA video loại A
Tổng hợp kết quả lượng tiết kiệm bít trong hai loại mã hóa.
Thơng số cặp video được mã hóa LDP dùng để đánh giá
Kết quả khảo sát đánh giá của 3 người, video loại A mã hóa LDP
Thơng số cặp video được mã hóa LDB dùng để đánh giá
Kết quả khảo sát đánh giá của 3 người, video loại A mã hóa LDB
Thơng số cặp video được mã hóa RA dùng để đánh giá
Kết quả khảo sát đánh giá của 3 người, video loại A mã hóa RA

Trang

17
19
26
33
35
36
37
41
41
43
46
46
47
47
48
49
49
49
51
54
56
57
59
61
61
64
64
65
65
66

66


DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
Số
hiệu
1.1
1.2
1.3
1.4
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
2.10
2.11
2.12
2.13
2.14
2.15
2.16
2.17
2.18
2.19
2.20

2.21
2.22
2.23
3.1
3.2
3.3
3.4
4.1
4.2

Tên hình vẽ

Trang

Sơ đồ tổng quát hệ thống truyền hình số
Quá trình biến đổi tín hiệu màu
Mơ hình cấu trúc DVB-T2
Khối giao thức T2-MI hệ thống DVB-T2
Lịch sử phát triển các chuẩn nén.
Sơ đồ khối của bộ mã hóa và giải mã MPEG-4 H.264/AVC
Sơ đồ khối của bộ mã hóa và giải mã H.265/HEVC
Cấu trúc slice của một ảnh
Các kiểu mã hóa slice khác nhau
Cấu trúc tile của một ảnh
Cấu trúc WPP trong một slice
Các tập tham số trong H.265/HEVC
Phân vùng hình ảnh thành nhiều macro 16x16 và CTU 64x64
Ví dụ về phân vùng CTU theo thứ tự chiều sâu
Ví dụ về chia một CTB thành nhiều TBs
Mối quan hệ giữa CU, PU và TU trong H.265/HEVC

Sơ đồ tổng quát biến đổi và lưỡng tử hóa block video
(a) Mã hóa, (b) Giải mã
Bộ dự đốn tính tốn QP trong H.265/HEVC
Các chế độ I_PCM, lossless and transform skip trong bộ mã hóa
Cấu trúc khối PU và các pixel lân cận sử dụng để dự đoán.
35 chế độ trong dự đoán trong ảnh
Sơ đồ tổng quát dự đốn liên ảnh trong H.265/HEVC.
CU được mã hóa Inter có thể sử dụng phân chia chuyển động đối xứng
(4 kiểu ) hoặc bất đối xứng (4 kiểu)
Ví dụ minh họa về hình ảnh trước và sau khi qua bộ lọc SAO.
Mơ hình định hướng phân loại mẫu EO: (a) Ngang, (b) dọc,(c) đường
chéo 1350, và (d) đường chéo 450
So sánh kích thước các block của H.264/AVC và H.265/HEVC
Sự hiệu quả của H.265 trong mã hóa đi đơi với sự phức tạp
Mơ hình truyền dẫn số mặt đất DVB-T2
Lộ trình phát triển cơng nghệ cốt lõi của truyền hình số mặt đất
Sơ đồ tổng quát nâng cấp trạm phát sóng DVB-T2 sử dụng mã hóa
H.265/HEVC
Mơ hình thử nghiệm phát sóng số mặt đất DVB-T2 sử dụng mã hóa
nguồn H.265/HEVC
Cấu trúc dự đốn chỉ có ảnh I
Cấu trúc dự đốn RA

3
6
10
11
13
15
18

20
20
21
22
23
23
24
25
25
26
27
28
29
30
30
31
32
32
34
37
40
42
44
48
52
53


Số
hiệu

4.3
4.4
4.5
4.6
4.7
4.8
4.9
4.10
4.12
4.13
4.14
4.15

Tên hình vẽ
Cấu trúc dự đốn LDP và LDB
Kết quả mã hóa AI
Kết quả mã hóa LDP
Kết quả mã hóa LDB
Kết quả mã hóa RA
Cấu trúc đánh giá chủ quan chất lượng video
Phiếu đánh giá cho một cặp video A và B
Chất lượng khác nhau giữa video A và B
Đồ thị MOS trong đánh giá chủ quan video LDP loại A
Đồ thị MOS trong đánh giá chủ quan video LDB loại A
Đồ thị MOS trong đánh giá chủ quan video RA loại A
Tổng hợp so sánh đánh giá khách quan và chủ quan.

Trang
53
55

57
59
60
62
63
63
64
65
66
67


1

MỞ ĐẦU
1. Lý do chọn đề tài
Trong những năm gần đây khi mà lĩnh vực công nghệ và truyền thông ngày càng
phát triển, với sự phát triển mạnh của internet tồn cầu thì việc truyền tải và lưu trữ
video cũng ngày càng trở nên phổ biến hơn. Cùng với đó chất lượng của phần cứng
ngày càng được nâng cao và giá thành lại ngày càng hợp lí, giúp cho việc phát triển
của dịch vụ truyền hình cơng nghệ số với nhiều ưu điểm vượt trội về số lượng chương
trình, chất lượng tín hiệu, hiệu quả kỹ thuật và kinh tế đang nhanh chóng chiếm lĩnh
thị trường, thay thế dần kỹ thuật tương tự truyền thống.
Khi chất lượng cuộc sống ngày càng được cải thiện, kéo theo nhu cầu nghe nhìn
càng cao hơn. Nếu như vài năm trước việc thưởng thức một bộ phim ở độ phân giải
480p hay HD 720p đủ thỏa mãn người xem, thì ngày nay chúng ta đã quen thuộc với
cụm từ Full-HD hay 1920 x 1080 với khoảng 2 triệu điểm ảnh (2 megapixel) đã có mặt
trên nhiều TV, màn hình máy tính, laptop, smartphone và tablet. Tuy nhiên, đến nay đã
có một độ phân giải mở ra một kỉ nguyên kế tiếp của nội dung và hình ảnh độ nét cao,
đó là 4K (hay cịn gọi là Ultra-HD). Với số điểm ảnh lên đến 8 triệu, tức gấp bốn lần

Full-HD, 4K mang lại những trải nghiệm cao cấp hơn, sắc nét hơn. Để có được những
trải nghiệm tuyệt vời đó thì người dùng cũng sẽ phải đầu tư thêm chi phí cho việc nâng
cấp các thiết bị lưu trữ cũng như đường truyền. Vì thế nhu cầu một chuẩn nén video
mới hiệu quả hơn nhằm giảm tải áp lực cho hệ thống ngày càng bức thiết hơn.
H.265/HEVC là một chuẩn nén video hoàn toàn mới với tên gọi đầy đủ là High
Efficiency Video Coding (HEVC) được Ủy ban Viễn thông Quốc tế ITU-T thông qua
và bắt đầu được các nhà phát triển đưa vào sản phẩm thương mại. H.265/HEVC mang
lại khả năng nén cao gấp đôi so với kỹ thuật nén video H.264/AVC (Advance Video
Coding) hiện đang được dùng phổ biến. H.265/HEVC có tỷ lệ nén dữ liệu gấp đôi so
với H.264/MPEG-4 AVC ở cùng một mức độ chất lượng video. Nói cách khác nó có
thể được sử dụng để cung cấp chất lượng hình ảnh được cải thiện đáng kể khi xét cùng
một bitrate. Nó có khả năng hỗ trợ 8K UHD (Ultra high definition television) và độ
phân giải lên đến 8192x4320 (4320P).
Hiện nay, việc nắm vững phương pháp mã hóa của chuẩn H265 và đánh giá chất
lượng của nó cùng với hệ thống truyền dẫn DVB-T2 có ý nghĩa quan trọng việc lựa
chọn và triển khai kỹ thuật nén H265 trong lĩnh vực truyền dẫn tín hiệu truyền hình và
cơng tác lưu trữ video của Đài truyền hình Việt Nam hiện nay. Đây là lý do luận văn
tập trung nghiên cứu và đánh giá chất lượng mã hóa dùng chuẩn H.265/ HEVC.
2. Mục đích nghiên cứu
Đề tài tập trung nghiên cứu các vấn đề sau:
 Phân tích đánh giá kỹ thuật nén video và chuẩn nén H.265/ HEVC.
So sánh với chuẩn nén video H.264/AVC, đưa ra những ưu điểm của chuẩn nén
H.265/HEVC.
 Ứng dụng H.265/HEVC xây dựng mơ hình truyền dẫn tín hiệu video HDTV
trong truyền hình số mặt đất DVB-T2 và đánh giá chất lượng video thu được qua
mơ hình thử nghiệm thực tế.
3. Đối tượng và phạm vi nghiên cứu
 Các chuẩn nén video và chuẩn nén H.265/HEVC, so sánh chuẩn nén
H.265/HEVC với chuẩn nén H.264/AVC đang sử dụng hiện nay.



2
 Chuẩn nén video H.265/HEVC trong hệ thống truyền hình số mặt đất DVB-T2
tại Truyền Hình Việt Nam.
 Đánh giá chất lượng hình ảnh thu được.
4. Phương pháp nghiên cứu
Với các mục tiêu trên phương pháp nghiên cứu là kết hợp phương pháp nghiên
cứu lý thuyết và phương pháp nghiên cứu thực nghiệm để thực hiện đề tài theo các
bước sau:
 Nghiên cứu lý thuyết các kỹ thuật mã hóa và giải mã các loại tín hiệu video.
 Phân tích và so sánh với chuẩn nén H.264/AVC và đưa ra những ưu điểm của
chuẩn nén H.265/HEVC.
 Ứng dụng kỹ thuật nén H.265/HEVC xây dựng mơ hình truyền dẫn tín hiệu
video độ phân giải cao qua hệ thống truyền hình số mặt đất DVB-T2, đánh giá
kết quả thu được.
 Mô phỏng việc nén và giải nén tín hiệu video bằng chương trình mã nguồn mở
C++ từ đó đánh giá chất lượng và hiệu quả của chuẩn nén.
5. Ý nghĩa khoa học và thực tiễn của đề tài nghiên cứu
Ngày nay, nhu cầu xem và sử dụng video càng cao, với sự phát triển không
ngừng của các thiết bị đầu cuối như TV, màn hình máy tính, laptop, smartphone và
tablet thì u cầu về chất lượng hình ảnh đang là vấn đề quan trọng hiện nay. Video
nếu khơng được nén sẽ có độ phân giải và chất lượng cao nhưng không thể truyền tín
hiệu qua mạng truyền thơng vì dung lượng q lớn. Do đó, các kỷ thuật mã hóa nén
video đã được phát triển và cải thiện trong nhiều thập kỷ qua để khắc phục vấn đề này,
giảm thiểu dung lượng video, giúp cho việc truyền dẫn qua mạng đơn giản hơn.
H.264/AVC là chuẩn nén tiên tiến đang sử dụng phổ biến ở nước ta hiện nay. Tuy
nhiên, nhu cầu chất lượng video ngày càng cao hơn, tốc độ khung hình cao hơn, chẳng
hạn như video HD, UltraHD, 4K và 8K thì chuẩn nén H.264/AVC vẫn chưa hiệu quả.
Vì vậy, một chuẩn nén video mới đã được phát triển, nó khơng chỉ cung cấp mã hóa
tốt video độ phân giải cao mà còn giảm 50% dung lượng so với chuẩn nén

H.264/AVC.
Việc phân tích đánh giá chuẩn nén H.265/HEVC, và so sánh với chuẩn nén trước đó
có ý nghĩa quan trọng trong việc lựa chọn và triển khai trong công tác truyền dẫn tín
hiệu truyền hình tại Đài truyền hình Việt Nam hiện nay. Ngoài ra, là một tiền đề
nghiên cứu các giải pháp cải thiện hiệu suất nén và giảm độ phức tạp, một số thuật
toán rate control đối với chuẩn nén mới H.265/HEVC.


3
Chương 1 - TỔNG QUAN VỀ TRUYỀN HÌNH SỐ VÀ CƠ SỞ NÉN VIDEO
1.1 Tổng quan về hệ thống truyền hình số.
1.1.1 Sơ đồ tổng quát hệ thống truyền hình số
Tín hiệu
truyền hình
tương tự

Thiết bị phát
Biến đổi
A/D

Mã hóa
nguồn

Mã hóa
kênh

Điều chế
số
Kênh
thơng tin


Tín hiệu
truyền hình
tương tự

Biến đổi
D/A

Giải mã
hóa nguồn

Giải mã
hóa kênh

Giải điều
chế số

Thiết bị thu

Hình 1.1. Sơ đồ tổng quát hệ thống truyền hình số[1].
Bộ biến đổi tín hiệu tương tự thành tín hiệu số (A/D) sẽ biến đổi tín hiệu truyền
hình tương tự thành tín hiệu truyền hình số, các tham số và đặc trưng của tín hiệu này
được xác định từ hệ thống truyền hình được lựa chọn, tín hiệu truyền số tại đầu ra bộ
chuyển đổi A/D được đưa đến bộ mã hóa nguồn, tại đây tín hiệu truyền hình số có tốc
độ dịng bit cao sẽ được nén thành dịng bít có tốc độ thấp hơn phù hợp cho từng ứng
dụng. Dòng bit tại đầu ra bộ mã hóa nguồn được đưa dến thiết bị phát (mã hóa kênh
thơng tin và điều chế tín hiệu) truyền đến thu qua kênh thơng tin.
Khi truyền qua kênh thơng tin, tín hiệu truyền hình số được mã hóa kênh. Mã hóa
kênh đảm bảo chống các sai sót cho tín hiệu trong kênh thơng tin. Thiết bị mã hóa
kênh phối hợp các đặc tính của tín hiệu số với kênh thơng tin. Khi tín hiệu truyền hình

số được truyền đi theo kênh thông tin, các thiết bị biến đổi trên được gọi là bộ điều chế
và giải điều chế.
Tại bên thu, tín hiệu truyền hình số được biến đổi ngược lại với q trình xử lý tại
phía phát, giải mã tín hiệu truyền hình thực hiện biến đổi tín hiệu truyền hình số thành
tín hiệu truyền hình tương tự. Hệ thống truyền hình số sẽ trực tiếp xác định cấu trúc
mã hóa và giải mã tín hiệu truyền hình.
1.1.2 Đặc điểm truyền hình số
Đặc điểm của truyền hình số được xem xét thơng qua các ưu nhược điểm của nó,
vì nó giải thích lý do của việc cần thiết phải thay thế truyền hình tương tự sang truyền
hình số, những đặc điểm dưới đây chính là tính ưu việt của truyền hình số so với
truyền hình tương tự, bao gồm:
 Có thể tiến hành rất nhiều quá trình xử lý trong Studio (trung tâm truyền hình) mà
tỷ số S/N khơng giảm. Trong truyền hình tương tự thì việc này gây méo tích luỹ (mỗi
khâu xử lý đều gây méo).
 Thuận lợi cho q trình ghi, đọc: có thể ghi đọc nhiều lần mà chất lượng không bị
giảm.
 Dễ sử dụng thiết bị tự động kiểm tra và điều khiển nhờ máy tính.


4
 Có khả năng lưu tín hiệu số trong các bộ nhớ có cấu trúc đơn giản và sau đó đọc nó
với tốc độ tuỳ ý.
 Khả năng truyền trên cự ly lớn: tính chống nhiễu cao (do việc cài mã sửa lỗi, chống
lỗi, bảo vệ..).
 Dễ tạo dạng lấy mẫu tín hiệu, do đó dễ thực hiện việc chuyển đổi hệ truyền hình,
đồng bộ từ nhiều nguồn khác nhau. dễ thực hiện những kỹ xảo trong truyền hình.
 Các thiết bị số làm việc ổn định, vận hành dễ dàng và không cần điều chỉnh các
thiết bị trong khi khai thác.Có khả năng xử lý nhiều lần đồng thời một số tín hiệu (nhờ
ghép kênh phân chia theo thời gian).
 Có khả năng thu tốt trong truyền sóng đa đường. Hiện tượng bóng ma thường xảy ra

trong hệ thống truyền hình tương tự do tín hiệu truyền đến máy thu theo nhiều đường.
Việc tránh nhiễu đồng kênh trong hệ thống thông tin số cũng làm giảm đi hiện tượng
này trong truyền hình quảng bá.
 Tiết kiệm được phổ tần nhờ sử dụng các kỹ thuật nén băng tần, tỉ lệ nén cao mà hầu
như người xem không nhận biết được sự suy giảm chất lượng. Từ đó có thể thấy được
nhiều chương trình trên một kênh sóng, trong khi truyền hình tương tự mỗi chương
trình phải dùng một kênh sóng riêng.
 Có khả năng truyền hình đa phương tiện, tạo ra loại hình thơng tin hai chiều, dịch
vụ tương tác, thông tin giao dịch giữa điểm và điểm. Do sự phát triển của cơng nghệ
truyền hình số, các dịch vụ tương tác này ngày càng phong phú đa dạng và ngày càng
mở rộng. Trong đó có sự kết hợp giữa máy thu hình và hệ thống máy tính, truyền hình
từ phương tiện thơng tin đại chúng trở thành thơng tin cá nhân.
Tuy nhiên truyền hình số cũng có những nhược điểm đáng quan tâm là dải thơng
của tín hiệu chưa nén tăng do đó độ rộng băng tần của thiết bị và hệ thống truyền lớn
hơn nhiều so với tín hiệu tương tự.
1.1.3 Q trình số hóa tín hiệu
Q trình số hố tín hiệu tương tự, bao gồm q trình lọc trước lấy mẫu, lượng
tử và mã hố. Q trình lọc trước nhằm loại bỏ các tần số khơng cần thiết ở tín hiệu
cũng như nhiễu, bộ lọc này còn gọi là bộ lọc chống nhiễu xuyên kênh Aliasing.
 Lấy mẫu
Lấy mẫu tín hiệu tương tự là q trình rời rạc hóa theo thời gian bằng tần số lấy
mẫu fs. Nó tạo ra giá trị tín hiệu tương tự tại một số hữu hạn các giá trị có biến rời rạc
gọi là các mẫu. Các mẫu được lấy cách đều nhau gọi là chu kỳ lấy mẫu. Tần số lấy
mẫu phải thoả mãn định lý Nyquist-Shannon :
f s  2. f max
(1.1)
Trong đó: + fs là tần số lấy mẫu.
+ fmax là tần số cực đại của tín hiệu tương tự.
 Lượng tử hóa.
Trong q trình này biên độ tín hiệu được chia thành các mức gọi là mức lượng tử.

Khoảng cách giữa hai mức kề nhau gọi là bước lượng tử. Các mẫu có được từ q
trình lấy mẫu sẽ có biên độ bằng mức lượng tử.
Số mức lượng tử N được biểu diễn: N= 2n, Trong đó n là số bit biểu diễn mỗi mẫu.
Tín hiệu số nhận được là một giá trị xấp xỉ của tín hiệu ban đầu, ngun nhân do q
trình lượng tử hóa xác định các giá trị số rời rạc cho mỗi mẫu. Tất cả các giá trị biên
độ nằm trong phạm vi giới hạn của một mức lượng tử đều được thiết lập một giá trị
như nhau.


5
Lượng tử hóa có hai loại:
 Lượng tử tuyến tính: có các bước lượng tử bằng nhau.
 Lượng tử phi tuyến: có các bước lượng tử khác nhau.
Q trình lượng tử sẽ gây ra sai số gọi là sai số lượng tử, sai số lượng tử là nguồn
nhiễu không tránh khỏi trong hệ thống số. Các giá trị lượng tử có thể chứa sai số trong
phạm vi 1/2 Q, trong đó Q là bước lượng tử.
 Mã hóa
Là q trình biến đổi cấu trúc nguồn mà không làm thay đổi tin tức, mục đích là cải
thiện các chỉ tiêu kỹ thuật cho hệ thống truyền tin. Dữ liệu sau mã hóa có các ưu điểm
là làm tăng khả năng chống nhiễu cho tín hiệu. Q trình này này biến đổi các mức tín
hiệu đã được lượng tử hóa thành chuỗi các bit “0” và “1”. Độ dài của dãy tín hiệu nhị
phân này là một trong những chỉ tiêu chất lượng của kỹ thuật số hóa tín hiệu. Nếu số
bit tăng độ chính xác của bộ chuyển đổi tăng nhưng tốc độ bít tăng địi hỏi kênh truyền
rộng.
Các mã sử dụng trong truyền hình số có thể chia thành 4 nhóm:
Các mã để mã hóa tín hiệu truyền hình
 Các mã để truyền có hiệu quả theo kênh thơng tin
 Các mã thuận tiện cho việc giải mã và đồng bộ bên thu
 Các mã để xử lý số tín hiệu trong các bộ phận khác nhau của hệ thống truyền
hình số.

1.1.4 Tốc độ bit và độ rộng băng thơng
 Tốc độ bit: Tốc độ bit là số lượng bit được truyền đi hay lưu trữ trong một đơn vị
thời gian.
C  f s .n
(1.2)
Trong đó : + f s là tần số lấy mẫu (Hz).
+ n là số bit nhị phân trong một ký hiệu.
+ C là tốc độ bit (bps).
 Thơng lượng kênh truyền tín hiệu số: Là tốc độ số liệu cực đại có thể truyền được
trên kênh truyền có độ rộng băng tần B.
(1.3)
C  B. log 2 (1  S )
N
Trong đó:

+ C là tốc độ bit (bps)
+ S N là tỷ số tín hiệu trên nhiễu trắng.

+ B là băng thông kênh truyền (Hz).
Tốc độ bit càng lớn thì tín hiệu tương tự khơi phục lại càng trung thực tuy nhiên nó
sẽ là cho dung lượng lưu trữ và băng thông kênh truyền càng lớn. Trong thực tế để
3
4

truyền tín hiệu có tốc độ bit là C (bps) thì cần băng thơng kênh truyền là: B  C (Hz).
Ví dụ: với n = 4, fs = 44,1Khz thì:
Tốc độ truyền thơng tin là : C = n x fs = 4 x 44,1 = 176,3.103 bits/s
3
4


Và độ rộng băng tần là B  C =

3
x 176,4.10 3  132,3 Khz .
4


6
1.1.5 Quá trình biến đổi và tiêu chuẩn lấy mẫu tín hiệu màu.
Một bức ảnh được chuyển từ RGB sang YUV nhằm giảm dung lượng lưu trữ
cũng như truyền đi, trong quá trình giải mã, trước khi hiển thị ảnh thì nó được biến đổi
ngược lại thành RGB.
R, G, B

Hình 1.2. Q trình biến đổi tín hiệu màu [1].
Cơng thức minh họa quá trình biến đổi như sau:
Y  k r R  (1  kb  k r )G  kb B
Cb 

0.5
(B  Y )
1  kb

Cr 

0.5
(R  Y )
1  kr

(1.4)


Với k b  k r  k g  1 , kb = 0.114, kr = 0.299, khi thế vào cơng thức (1.4) thì ta được:
Y  0.299 R  0.587G  0.114 B
0.5
( B  Y )  0.169 R  0.331G  0.5B
1  0.114
0.5
Cr 
( R  Y )  0.5R  0.419G  0.081B
1  0.299
Cb 

Nên ta có ma trận biến đổi từ RGB sang YUV như sau:
Y  0.299
Cb   0.169
  
Cr  0.5

0.587
 0.331
 0.419

0.114   R 
0.5  G 
 0.081  B 

(1.5)

Thực hiện tương tự ta suy ra được ma trận biến đổi từ YUV sang RGB như sau:
0

 R  1
G   1  0.344
  
 B  1 1.772

1.402  Y 
 0.714 Cb
 Cr 
0

Có nhiều kiểu lấy mẫu tín hiệu video số thành phần, điểm khác nhau chủ yếu ở tỷ
lệ giữa tần số lấy mẫu và phương pháp lấy mẫu tín hiệu chói và các tín hiệu màu, trong
đó bao gồm : Tiêu chuẩn 4:4:4; 4:2:2; 4:2:0; 4:2:1. Các định dạng số video có nén chỉ
lấy mẫu tích cực của video.
 Tiêu chuẩn lấy mẫu 4:1:1 - tần số lấy mẫu tín hiệu chói là 13,5MHz, và mỗi tín
hiệu hiệu màu là 3,375MHz.
 Tiêu chuẩn lấy mẫu 4:2:2 - tần số lấy mẫu tín hiệu chói là 13,5MHz, và mỗi tín
hiệu hiệu màu là 6,75MHz.


7
 Tiêu chuẩn lấy mẫu 4:4:4 - cả 3 thành phần có cùng độ phân giải, nghĩa là tần số
lấy mẫu tín hiệu chói là 13,5MHz, và mỗi tín hiệu hiệu màu là 13,5MHz.
 Tiêu chuẩn lấy mẫu 4:2:0 - là kiểu phổ biến, tần số lấy mẫu tín hiệu chói là
13,5MHz, và mỗi tín hiệu hiệu màu là 6,75MHz theo cả 2 chiều [1].
1.2 Nén tín hiệu video
1.2.1 Các kỹ thuật nén tín hiệu video
Tín hiệu video thường chứa đựng một lượng lớn các thông tin dư thừa, chúng
thường được chia thành 5 loại như sau:
Có sự dư thừa thông tin về không gian: giữa các điểm ảnh lân cận trong phạm vi một

bức ảnh hay một khung video, cịn gọi là thừa tĩnh bên trong từng frame.
 Có sự dư thừa thông tin về thời gian: giữa các điểm ảnh của các khung video
trong chuỗi ảnh video, còn gọi là thừa động giữa các frame.
 Có sự dư thừa thông tin về phổ: giữa các mẫu của các dữ liệu thu được từ các bộ
cảm biến trong camera, máy quay…
 Có sự dư thừa do thống kê: do bản thân của các ký hiệu xuất hiện trong dòng bit
với các xác suất xuất hiện khơng đồng đều.
 Có sự dư thừa tâm thị giác: thông tin không phù hợp với hệ thống thị giác con
người, những tần số quá cao so với cảm nhận của mắt người.
Ưu điểm của việc nén tín hiệu:
 Tiết kiệm băng thơng kênh truyền (trong thời gian thực hoặc nhanh hơn).
 Kéo dài thời gian sử dụng của thiết bị lưu trữ, giảm chi phí đầu tư thiết bị lưu trữ.
 Giảm dung lượng thơng tin mà khơng làm mất tính trung thực của hình ảnh.
Có nhiều phương pháp nén tín hiệu, phương pháp nén bằng cách số hóa tín hiệu vẫn
tỏ ra hữu hiệu, một mặt nó có thể làm giảm lượng thông tin không quan trọng một
cách đáng kể, mặt khác nó cịn giúp cho tín hiệu được bảo mật hơn.
1.2.2 Tỷ số nén tín hiệu video
Trong các hệ thống nén, tỉ số nén chính là tham số quan trọng đánh giá khả năng
nén của hệ thống, ta gọi n1, n2 là số lượng bit của tín hiệu trước và sau khi nén nên ta
có cơng thức như sau:
Tỷ số nén sẽ là C 

n1
n2

Phần trăm nén hay còn gọi là độ dư thừa dữ liệu tương đối.
 n 
n  n2
R  1  2  .100%  1
x.100%

n1
 n1 

(1.6)

Nếu n1= n2 thì ta có C =1, và R = 0 nghĩa là khơng có sự dư thừa dữ liệu.
Nếu n2<1.2.3 Phân loại kỹ thuật nén tín hiệu video
Nén video được chia thành hai họ lớn: Nén không tổn hao và nén tổn hao.
 Nén không tổn hao là quy trình biểu diễn các ký hiệu trong dịng bit nguồn thành
dịng các từ mã sao cho ảnh được khơi phục hồn tồn giống ảnh gốc, các thuật tốn
chỉ phụ thuộc vào cách thống kê nội dung dữ liệu và thường dựa trên việc thay thế một
nhóm các ký tự trùng lặp bởi một nhóm các ký tự đặc biệt khác ngắn hơn mà khơng
quan tâm đến ý nghĩa của dịng bit dữ liệu, nên địi hỏi phải có thiết bị lưu trữ và
đường truyền lớn hơn.


8
 Nén có tổn hao, tức là ảnh được khơi phục khơng hồn tồn giống ảnh gốc, dạng
nén này thích hợp cho việc lưu trữ và truyền ảnh tĩnh, ảnh video qua một mạng có
băng thơng hạn chế. Các dạng nén này thường có hệ số nén cao hơn (từ 2:1 đến 100:1)
và gây nên tổn hao dữ liệu và sự suy giảm ảnh sau khi giải nén do việc xóa và làm trịn
dữ liệu trong một khung hay giữa các khung. Nó liên quan đến việc dùng các phép
biến đổi tín hiệu từ miền này sang miền khác.
Trong thực tế phương pháp nén tổn hao thường được sử dụng nhiều hơn và các kỹ
thuật nén tổn hao thường sử dụng như: mã hóa vi sai, biến đổi cosin rời rạc DCT,
lượng tử vơ hướng, qt zig-zag, mã hóa Entropy…
1.2.4 Biến đổi cosin rời rạc
Nhằm biến đổi các hệ số trong miền thời gian (video số), không gian 2D (bức
ảnh tĩnh) thành các hệ số trong miền tần số. Các hệ số này ít tương quan hơn có phổ

năng lượng tập trung hơn, thuận tiện cho việc loại bỏ thông tin dư thừa.
Phép biến đổi DCT hoạt động dựa trên cơ sở ma trận vuông của mẫu sai số dự đoán,
kết quả cho ta một ma trận Y là những hệ số DCT được minh họa như sau:
Y = A.X.AT
(1.7)
Trong đó A là ma trận hệ số biến đổi, các thành phần của A như sau:
Ai , j  Ci cos

(2 j  1)i
Với
2N


C i 


C 
i



N 1 N 1

Tương đương với Yx, y  C x C y  X i, j Cos
i 0 J 0

1
N

Nếu i = 0


2
N

Nếu i > 0

(2 j  1) y
(2i  1) x
Cos
2N
2N

Phép biến đổi DCT nguyên 4x4 của chuỗi ngõ vào X được cho bởi công thức:
1
 2 cos 0

 1
 
 2 cos 8 
 

A 
1
 2 

cos

 2
 8 


 1 cos 3 


 2
 8 


1
cos 0
2

1
cos 0
2

1
 3 
cos

2
 8 

1
 5 
cos

2
 8 

1

 6 
cos

2
 8 

1
 10 
cos

2
 8 

1
 9 
cos

2
 8 

1
 15 
cos

2
 8 





1
 7  
cos
 
2
 8  
1
 14  
cos

2
 8 

1
 21  
cos

2
 8  

1
cos 0
2

Phép biến đổi DCT ngược cho bởi công thức:
X=ATYA
Tương đương với:
N 1 N 1

X i , j   C x C y Yx , y Cos

x 0 y 0

(2 j  1) y
(2i  1) x
Cos
2N
2N

1.2.5 Quá trình lượng tử hóa
Sau khi thực hiện biến đối DCT, các hệ số sẽ được lượng tử hoá dựa trên một
bảng lượng tử Q(u,v) với 0≤u, v≤ n-1, n là kích thước khối. Bảng này được định nghĩa
bởi từng ứng dụng cụ thể, các phần tử trong bảng lượng tử có giá trị từ 1 đến 255 được
gọi là các bước nhảy cho các hệ số DCT. Quá trình lượng tử được coi như là việc chia
các hệ số DCT cho bước nhảy lượng tử tương ứng, kết quả này sau đó sẽ được làm


9
tròn xuống số nguyên gần nhất. Các hệ số năng lượng thấp này, tượng trưng cho các
sự thay đổi pixel - pixel cỡ nhỏ, có thể bị xóa mà khơng ảnh hưởng đến độ phân giải
của ảnh phục hồi. Tại bộ mã hố sẽ có một bảng mã và bảng các chỉ số nội bộ, từ đó
có thể ánh xạ các tín hiệu ngõ vào để chọn được các từ mã tương ứng một cách tốt
nhất cho tập hợp các hệ số được tạo ra và có 2 loại lượng tử hóa chủ yếu.
 Lượng tử vơ hướng
Lượng tử vơ hướng thực hiện biến đổi một giá trị của tín hiệu vào X thành một tập
các giá trị đã được lượng tử cho tín hiệu ra Y. Mơ tả của lượng tử vơ hướng là sự làm
trịn của một số thực tới số ngun gần nhất với nó. Q trình lượng tử vơ hướng sẽ
làm mất mát thơng tin vì giá trị sau khi được lượng tử không thể khôi phục về giá trị
ban đầu.
Cơng thức tính lượng tử vơ hướng:
Qcoeff = round (coeff / Qstep)

(1.8)
Với: coeff : ma trận các giá trị trước khi lượng tử
Qcoeff : tập các giá trị sau khi lượng tử
Qstep : bước lượng tử
Trong nén và giải nén video, q trình lượng tử vơ hướng được chia thành 2 bước:
+ Lượng tử xuôi FQ (Forward Quantiser) tại bộ nén còn gọi là ‘scaled’
+ Lượng tử ngược IQ (Inverse Quantiser) tại bộ giải nén còn gọi là ‘rescaled’.
Dữ liệu xuất của quá trình lượng tử xuôi FQ là một mảng các hệ số đã được lượng tử
hóa, trong đó phần lớn là các giá trị 0.
Nếu giá trị bước lượng tử Qstep lớn thì các giá trị hệ số sau khi lượng tử sẽ được thay
thế với ít bit hơn và do đó tỉ lệ nén sẽ cao hơn so với bước lượng tử nhỏ. Tuy nhiên,
với bước lượng tử lớn thì các hệ số sau khi được ‘rescaled’ sẽ có các giá trị sai lệch so
với các giá trị trước khi lượng tử lớn hơn so với bước lượng tử nhỏ.
 Lượng tử vector
Là một quá trình biểu diễn một tập vector (mỗi vector gồm nhiều giá trị) bằng một
tập các số hữu hạn các ký hiệu ở ngõ ra, bảng mã ánh xạ sẽ có các giá trị xấp xỉ với giá
trị gốc. Vector lượng tử sẽ được lưu ở cả bộ mã hóa và bộ giải mã, q trình nén một
bức ảnh sử dụng lượng tử vector bao gồm các bước sau.
Phân chia bức ảnh gốc thành các phân vùng MxN pixel.
 Chọn vector thích ứng nhất từ bảng mã.
 Truyền chỉ số của vector thích ứng đến bộ giải mã.
 Tại bộ giải mã, ảnh cấu trúc lại sẽ xấp xỉ với phân vùng đã lựa chọn vector lượng
tử.
1.2.6 Tiêu chuẩn đánh giá tín hiệu video
Đánh giá chất lượng video thơng qua các giá trị cung cấp bởi hệ thống xử lý, và
việc suy giảm chất lượng tín hiệu có thể nhìn thấy được ( thơng thường chúng được so
sánh với tín hiệu gốc). Qua hệ thống ta có thể thấy được những thay đổi về hình dạng,
việc định chuẩn chất lượng video là rất quan trọng. Để đánh giá chất lượng của bức
ảnh (hay khung ảnh video) ở đầu ra của bộ mã hoá, người ta thường sử dụng các tham
số truyền thống sau để đánh giá:

Sai số bình phương trung bình (mean square error– MSE) định nghĩa cho cường độ
sai khác giữa ảnh gốc và ảnh dự đoán
MSE 

1
N2

N 1

N 1

  (C
i 0

j 0

ij

 Ri j ) 2

(1.9)


10
Tỉ số đỉnh tín hiệu trên nhiễu (peak to signal to noise ratio– PSNR).
PSNR  10 log 10

(2 b  1) 2
(dB)
MSE


(1.10)

Trong đó NxN kích thước bù chuyển động; hệ số Ci, j và Ri, j tương ứng với mẫu
hiện tại và vùng mẫu tham khảo; b số lượng bit/ mẫu.
Thơng thường, nếu:
 PSNR ≥ 40dB thì hệ thống mắt người gần như không phân biệt được giữa ảnh
gốc và ảnh khơi phục, tức là ảnh nén có chất lượng xuất sắc.
 30 dB  PSNR < 33 dB thì chất lượng ảnh nén bình thường, mắt người có sự
phân biệt được.
 PSNR < 30 dB thì chất lượng ảnh nén kém.
1.3 Mơ hình cấu trúc DVB-T2

Hình 1.3. Mơ hình cấu trúc cơ bản DVB-T2 [21].
DVB-T2 là tiêu chuẩn truyền hình số mặt đất cho thế hệ thứ 2, là thành quả
nghiên cứu của nhiều nhà khoa học thuộc tổ chức DVB (Digital Video Broadcasting)
trong suốt 3 năm (2006-2009). DVB-T2 cho phép tăng dung lượng dữ liệu trên kênh
truyền (30%) và độ tin cậy trong mơi trường truyền sóng trên mặt đất. DVB-T2 chủ
yếu dành cho truyền hình số có độ phân giải cao HDTV
DVB-T2 phải kế thừa những giải pháp đã tồn tại trong các tiêu chuẩn DVB khác.
DVB-T2 kế thừa 2 giải pháp kỹ thuật có quan trọng của DVB-S2, cụ thể:
Cấu trúc phân cấp trong DVB-S2, đóng gói dữ liệu trong khung BB (Base Band
Frame) và Sử dụng mã sửa sai LDPC (Low Density Parity Check).
Mục tiêu chủ yếu của DVB-T2 là dành cho các đầu thu cố định và di chuyển, cho
phép sử dụng được các anten thu hiện đang tồn tại ở mỗi gia đình và sử dụng lại các cơ
sở anten phát hiện có.
Trong cùng một điều kiện truyền sóng, DVB-T2 phải đạt được dung lượng cao hơn
thế hệ đầu (DVB-T) ít nhất 30%.
DVB-T2 phải đạt được hiệu quả cao hơn DVB-T trong mạng đơn tần SFN (Single
Frequency Network)

Hiện nay trên thế giới nhiều nước như Nhật Bản, Hàn Quốc.. đã cho thấy hiệu quả
của phát sóng số DVB-T2 trong truyền hình HDTV.


11
Hệ thống DVB-T2 được chia thành 3 khối chính ở phía phát (SS1, SS2,
SS3) và 2 khối chính ở phía thu (SS4, SS5) như trình bày trong hình.
 SS1: Mã hóa và ghép kênh
Khối SS1 có chức năng mã hóa tín hiệu video/audio cùng các tín hiệu phụ trợ kèm
theo như PSI/SI hoặc tín hiệu báo hiệu lớp 2 (L2 Signalling) với công cụ điều khiển
chung nhằm đảm bảo tốc độ bit khơng đổi đối với tất cả các dịng bit. Khối này có
chức năng hồn tồn giống nhau đối với tất cả các tiêu chuẩn của DVB. Đầu ra của
khối là dòng truyển tải MPEG-2TS (MPEG - 2 Transport Stream).
 SS2: Basic T2 – Gateway
Đầu ra của khối SS2 là dịng T2 - MI. Mỗi gói T2-MI bao gồm Baseband Frame, IQ
Vector hoặc thông tin báo hiệu (LI hoặc SFN). Dịng T2-MI chứa mọi thơng tin liên
quan đến T2-FRAME. Mỗi dịng T2-MI có thể được cung cấp cho một hoặc một vài
bộ điều chế trong hệ thống DVB-T2.
 SS3: Bộ điều chế DVB-T2 (DVB-T2 Modulator)
Bộ điều chế DVB-T2 sử dụng Baseband Frame và T2- Frame mang trong dòng T2MI đầu vào để tạo ra DVB-T2 Frame.
 SS4: Giải điều chế DVB-T2 (DVB-T2 Demodulator)
Bộ giải điều chế SS4 nhận tín hiệu cao tần (RF Signal) từ một hoặc nhiều máy phát
(SFN Network) và cho một dòng truyền tải (MPEG-TS) duy nhất tại đầu ra.
 SS5: Giải mã dòng truyền tải (Stream Decoder)
Bộ giải mã SS5 nhận dòng truyền tải (MPEG-TS) tại đầu vào và cho tín hiệu
video/audio tại đầu ra.
Đối với các khối giao tiếp, các khung băng tầng cơ sở DVB-T2 ( Baseband Frame)
đóng gói các đầu vào hệ thống DVB-T2 (TS hoặc Generic Stream). Các khung băng
tầng cơ sở DVB-T2 này được vận chuyển trong giao tiếp điều chế DVB-T2 (T2-MI).
Ngồi các thơng tin này, T2-MI cũng thu thập dữ liệu T2 khác:

 Dữ liệu tín hiệu L1: Nó cho phép xây dựng các khung T2 theo modulator.
 Dữ liệu vector IQ: đối với bất kỳ luồng phụ trợ.
 Dấu thời gian DVB-T2: cho các sự cố đồng bộ.
 Dữ liệu Khung Khung Mở rộng trong tương lai (FEF).

Hình 1.4. Khối giao thức T2-MI hệ thống DVB-T2 [21].
Đầu tiên, dữ liệu T2 được gói gọn thành các gói tin T2-MI, và sau đó các gói tin T2MI được gói gọn trong các gói truyền tải DVB/MPEG bằng cách sử dụng Data Piping.
Các gói DVB TS được vận chuyển tự nhiên qua bất kỳ giao diện truyền tải tiêu chuẩn
DVB (ASI). Ngồi ra, nó có thể được đóng gói trong các gói tin qua mạng dựa trên IP.


12
Kết luận chương 1
Chương này trình bày một cách tổng quát về hệ thống truyền hình số, một số đặc
trưng của truyền hình số so với truyền hình tương tự, quá trình biến đổi và các tiêu
chuẩn lấy mẫu, các kỹ thuật được sử dùng để xử lý tín hiệu video, các cơ sở để đánh
giá chất lượng video sau q trình mã hóa và giải mã. Đồng thời chương 1 giới thiệu
sơ đồ và cấu trúc cơ bản hệ thống truyền hình số mặt đất DVB-T2, là cơ sở trong việc
ứng dụng nén tín hiệu video vào hệ thống truyền hình số cho chương 3.


13

Chương 2 - KỸ THUẬT MÃ HÓA VIDEO H.265/HEVC VÀ SO SÁNH
VỚI H.264/AVC
2.1 Lịch sử phát triển các chuẩn nén và sự phát triển các sản phẩm liên quan
đến mã hóa H.265/HEVC
2.1.1 Lịch sử phát triển

Hình 2.1. Lịch sử phát triển các chuẩn nén [3].

MPEG-2/H.262, H.264/AVC và H.265/HEVC là chuẩn nén video được phát
triển bởi ISO/IEC Moving Picture Experts Group (MPEG) và ITU-T Video Coding
Experts Group (VCEG). MPEG và VCEG đã thành lập một nhóm cộng tác viên về mã
hóa video để phát triển chuẩn H.26x.
 Tiêu chuẩn H.264/AVC
H.264/MPEG-4 AVC được phát triển bởi sự hợp tác của VCEG ITU-T và ISO/IEC
MPEG. Đội dự án này được biết đến với cái tên Joint Video Team (JVT). Các tiêu
chuẩn của phiên bản đầu tiên của H.264/ MPEG-4 AVC được hoàn thành tháng 5 năm
2003. Mục đích của đội dự án JVT là tạo ra một tiêu chuẩn nén có khả năng cung cấp
chất lượng hình ảnh tốt ở tốc độ bit thấp hơn đáng kể so với tiêu chuẩn trước đó. Và
cuối cùng sau đó H.264/MPEG-4 AVC cũng được tạo ra và đã cung cấp đầy đủ linh
hoạt các tính năng cần thiết để cho tiêu chuẩn này được áp dụng cho một loạt các ứng
dụng trên một loạt các mạng và hệ thống, bao gồm tốc độ bit cao, thấp và video độ
phân giải cao.
Các ứng dụng hiện đang sử dụng H.264/MPEG-4 AVC được sử dụng trong
Streaming internet sources như YouTube và iTunes Store.. Bên cạnh đó H.264/AVC
cịn được sử dụng trong truyền tải video chất lượng cao như trong các chương trình
phát sóng HDTV: DVB-T, DVB-T2, DVB-C, DVB-S và DVB-S2 [4].
 Tiêu chuẩn H.265/HEVC.
VCEG đã bắt đầu nghiên cứu về thế hệ tiếp theo của H.264 từ năm 2004, bằng cách
phát triển ra 1 chuẩn nén video mới hoàn toàn, hoặc là phát triển tiếp từ H.264. Các kĩ
thuật khác nhau để nâng cao tiềm năng của chuẩn H.264 được khảo sát trong tháng 10
năm 2004. Tại cuộc họp tiếp theo của VCEG trong tháng 1 năm 2005, VCEG bắt đầu
chỉ định một số tiêu chí kĩ thuật quan trọng (Key Technical Areas - KTA) thế hệ mã
hóa tiếp theo. Một cơ sở phần mềm là KTA Codebase cho NGVC (Next-gen Video
Coding) đã được phát triển dựa trên mô hình chung của MPEG và VCEG cho H.264.


14
Yêu cầu về chất lượng của NGVC được đề ra là giảm bitrate còn một nửa mà vẫn

giữ nguyên chất lượng so với H.264, ở tất cả các profile, hoặc giảm 25% bitrate cùng
độ phức tạp giảm, hoặc thậm chỉ giảm bitrate hơn nữa và tăng mức độ phức tạp mã
hóa lên. Cơng nghệ của năm 2009 chưa đủ mạnh nên HEVC được định nghĩa như là
phần mở rộng của H.264 chứ khơng phải là hướng phát triển mới hồn toàn. MPEG đã
bắt đầu nghiên cứu dự án tương tự vào năm 2007, lấy tên là HPVC ( High
Performance Video Coding), nhưng bitrate trung bình chỉ giảm 20% so với AVC High
Profile, điều này đã dẫn đến sự hợp tác với VCEG của MPEG. Cuộc họp vào tháng 4
năm 2010 đã tiến hành lập ra nhóm JCTVC và các kĩ thuật mã hóa được đem ra bàn
thảo, tổng cộng có hơn 27 đề xuất được gửi. Các đánh giá cho thấy rằng H.265 có thế
đạt tỉ suất nén cao gấp đôi so với H.264. Cũng tại cuộc họp, 2 dự án NGVC và HPVC
được hợp nhất lại, lấy tên là HEVC, chính thức được gọi tắt là H.265. Ngay sau đó,
JCT-VC đã kết hợp những tính năng tốt nhất của 2 dự án trên vào một mã duy nhất
cho HEVC [11].
Phiên bản chuẩn H.265/HEVC đầu tiên được phê chuẩn vào tháng 1/2013.
HEVC được nghiên cứu và phát triển nhằm mục đích làm tăng gấp đơi hiệu quả mã
hóa video so với H.264/AVC đang tồn tại. Mặc dù hiệu suất nén phụ thuộc vào nội
dung, thiết lập bộ mã hóa, tuy nhiên ở cùng một mức độ chất lượng video, HEVC có tỷ
lệ nén dữ liệu gấp 2 lần so với H.264/AVC. Hoặc có thể hiểu HEVC (H.265) được sử
dụng để cung cấp chất lượng hình ảnh được cải thiện đáng kể tại cùng một tốc độ bit.
Khi nén một file có kích thước hoặc tốc độ bit tương tự như H.264/AVC thì
H.265/HEVC cung cấp chất lượng hình ảnh tốt hơn đáng kể.
2.1.2 Quá trình sự phát triển các sản phẩm liên quan đến mã hóa H.265/HEVC
Sự phát triển và hình thành chuẩn H.265/HEVC có mối liên hệ đối với sự phát
triển công nghệ, nhu cầu thị trường, đặc biết là nhu cầu nghe nhìn trong những năm
gần đây, sự phát triển truyền hình HDTV, UHDTV. Tháng 10 năm 2005 UHDTV
được đưa vào sử dụng đầu tiên tại bảo tàng quốc gia Kyushu (Nhật Bản).
Trong năm 2012.
 29/2/2012, tại Đại hội di động thế giới 2012, Qualcomm trình diễn một bộ giải
mã HEVC chạy trên một máy tính bảng Android, với một Qualcomm Snapdragon xử
lý lõi kép S4 tốc độ 1,5 GHz.

 24/4/2012, Liên minh Viễn thông quốc tế (ITU) đã giới thiệu cơng nghệ truyền
hình độ nét siêu cao (UHDTV), một tiến bộ quan trọng trong công nghệ truyền. Các
nhà nghiên cứu và các hãng đã bắt đầu quan tâm đến các độ phân giải cao hơn 1080p
như là độ phân giải siêu nét UHDTV (còn được gọi với các tên khác như SHV-Super
Hi-Vision, Extreme Definition Video,..).
 22/8/2012, Ericsson thông báo rằng bộ mã hóa HEVC đầu tiên của thế giới,
Ericsson SVP 5500. Các Ericsson SVP 5500 HEVC mã hóa được thiết kế để mã hóa
thời gian thực của video cho các thiết bị di động .
 06/9/2012, Tổng công ty Rovi thông báo rằng một Main Concept SDK- Software
Development Kit cho HEVC sẽ được phát hành vào đầu năm 2013 ngay sau khi
HEVC được chính thức phê chuẩn. Các HEVC MainConcept SDK bao gồm một bộ
giải mã, mã hóa, và đa vận chuyển cho Microsoft Windows, Mac OS, Linux, iOS, và
Android.
 09/09/2012, ATEME chứng minh tại triển lãm thương mại một bộ mã hóa HEVC
với độ phân giải 3840x2160p ở 60 fps.


15
Trong năm 2013. Phiên bản chuẩn H.265/HEVC đầu tiên phê chuẩn vào1/2013.
 08/01/2013, Vanguard cơng bố sự sẵn có của V.265, một phần mềm mã hóa
chuyên nghiệp HEVC có khả năng hiệu suất thời gian thực.
 04/02/2013, NTT DoCoMo công bố bắt đầu từ tháng ba sẽ cấp giấy phép thực
hiện các phần mềm giải mã HEVC. Trong một tài liệu JCT-VC NTT DoCoMo cho
thấy bộ giải mã phần mềm HEVC của họ có thể giải mã 3840×2160 ở 60 fps.
 19/04/2013, SES công bố lần đầu tiên UltraHD sử dụng các tiêu chuẩn HEVC
với độ phân giải 3840×2160 và tốc độ bit 20 Mbp/s.
 09/05/2013, NHK và Mitsubishi Electric thông báo rằng họ đã cùng nhau phát
triển bộ mã hóa HEVC đầu tiên cho 8K Ultra HDTV, cịn được gọi là Super Hi-Vision
(SHV) cho phép nó để mã hóa 10-bit video với độ phân giải 7680×4320 ở 60 fps.
 21/08/2013, Microsoft phát hành một DirectX Video Acceleration (DXVA) cho

HEVC hỗ trợ hồ sơ cá nhân chính. DXVA 2.0 ứng dụng cho các hoạt động: phân tích
bitstream, deblocking, nghịch đảo lượng tử mở rộng quy mô, và bù chuyển động.
 11/09/2013, ViXS System công bố XCode 6400SoC hỗ trợ 4K 60 fps.
 29/10/2013, Elemental Technologies công bố hỗ trợ xử lý video thời gian thực
4K HEVC.
Trong năm 2014.
 15/01/2014, oViCs công bố VIC-1 HEVC bộ giải mã hỗ trợ main10 lên đến 4K
với 120 fps [4].
Trên thế giới có rất nhiều tổ chức khác nhau về điện tử, họ chịu trách nhiệm quy
chuẩn và quy định rõ từng chuẩn công nghệ khác nhau.
2.2 Kỹ thuật mã hóa video H.264/AVC
2.2.1 Sơ đồ mã hóa và giải mã chuẩn H.264/AVC

Hình 2.2 Sơ đồ khối của bộ mã hóa và giải mã MPEG-4 H.264/AVC [5].
 Bộ mã hóa
Một bức ảnh đầu vào gồm có 3 thành phần màu cơ bản R, G, B, sẽ được biến đổi
thành Y, U, V sau đó ảnh sẽ được tách thành các khối MB có kích thước N × N với N


×