Tải bản đầy đủ (.pdf) (87 trang)

nghiên cứu hoạt động và ứng dụng của chuẩn h 265

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.68 MB, 87 trang )

LUẬN VĂN TỐT NGHIỆP THẠC SĨ
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
---------------------------------------

Trần Quang Chiến

NGHIÊN CỨU HOẠT ĐỘNG VÀ ỨNG DỤNG
CỦA CHUẨN H.265

LUẬN VĂN THẠC SĨ KỸ THUẬT
( Kỹ thuật điện tử )

Hà Nội – Năm 2015
Nghiên cứu hoạt động và ứng dụng của chuẩn H.265


LUẬN VĂN TỐT NGHIỆP THẠC SĨ
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
---------------------------------------

Trần Quang Chiến

NGHIÊN CỨU HOẠT ĐỘNG VÀ ỨNG DỤNG
CỦA CHUẨN H.265

Chuyên ngành :

Kĩ thuật điện tử


LUẬN VĂN THẠC SĨ KỸ THUẬT

NGƯỜI HƯỚNG DẪN KHOA HỌC
1. TS. Ngô Vũ Đức

Hà Nội – Năm 2015

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265


LUẬN VĂN TỐT NGHIỆP THẠC SĨ

LỜI CAM ĐOAN
Tôi xin cam đoan: Luận văn này là công trình nghiên cứu thực sự của cá
nhân, được thực hiện dưới sự hướng dẫn khoa học của Tiến sĩ Ngô Vũ
Đức.
Các số liệu, những kết luận nghiên cứu được trình bày trong luận văn
này trung thực và chưa từng được công bố dưới bất cứ hình thức nào.
Tôi xin chịu trách nhiệm về nghiên cứu của mình.
Học viên
Trần Quang Chiến

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265


LUẬN VĂN TỐT NGHIỆP THẠC SĨ

LỜI CẢM ƠN
Lời đầu tiên, tôi xin chân thành cám ơn Tiến sĩ Ngô Vũ Đức, người đã trực
tiếp hướng dẫn tôi hoàn thành luận văn. Với những lời chỉ dẫn, những tài liệu, sự

tận tình hướng dẫn và những lời động viên của thầy đã giúp tôi vượt qua nhiều khó
khăn trong quá trình thực hiện luận văn này.
Tôi cũng xin cám ơn quý thầy cô giảng dạy chương trình cao học "Kĩ thuật điện
tử” đã truyền dạy những kiến thức quý báu, những kiến thức này rất hữu ích và
giúp tôi nhiều khi thực hiện nghiên cứu.
Xin cám ơn các Quý thầy, cô công tác tại Viện Điện tử Viễn thông – Đại học
Bách khoa Hà Nội và Viện sau đại học – Đại học Bách khoa Hà Nội đã tạo điều
kiện thuận lợi trong suốt quá trình tôi tham gia khóa học.
Cuối cùng, tôi xin cám ơn thầy Phạm Ngọc Nam – Phó viện trưởng Viện Điện
tử Viễn thông Trường Đại học Bách khoa Hà Nội và Ban Giám hiệu trường đã hỗ
trợ trong quá trình tôi thực hiện luận văn.
Tôi xin chân thành cám ơn.
Học viên
Trần Quang Chiến

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265


LUẬN VĂN TỐT NGHIỆP THẠC SĨ

MỤC LỤC
LỜI CAM ĐOAN ......................................................................................................1
LỜI CẢM ƠN ............................................................................................................4
CÁC THUẬT NGỮ VIẾT TẮT...............................................................................8
DANH MỤC HÌNH VẼ ......................................................................................... 14
LỜI NÓI ĐẦU ...........................................................................................................1
Chƣơng 1. Cơ sở về nén tín hiệu Video và Các kĩ thuật nén Video ......................2
1.1 Sự cần thiết của nén tín hiệu ............................................................................2
1.2 Quá trính số hóa tín hiệu .................................................................................3
1.2.1 Lấy mẫu ....................................................................................................3

1.2.2 Lượng tử hóa.............................................................................................4
1.2.3 Mã hóa ......................................................................................................5
1.3 Tốc độ bít và thông lượng kênh truyền tín hiệu số...........................................5
1.3.1 Tốc độ bit ..................................................................................................5
1.3.2 Thông lượng kênh truyền tín hiệu số ........................................................5
1.4 Quá trình biến đổi tín hiệu màu .......................................................................6
1.5 Các tiêu chuẩn lấy mẫu video tín hiệu số ........................................................7
1.6 Mô hình nén tín hiệu Video ..............................................................................9
1.6.1 Nén tín hiệu Video ....................................................................................9
1.6.2 Lượng tin trung bình .............................................................................. 10
1.7 Phân loại kĩ thuật nén ................................................................................... 13
1.8 Quá trình biến đổi ......................................................................................... 13
1.8.1 Điều xung mã vi sai DPCM .................................................................. 14
1.8.2 Mã hóa biến đổi ..................................................................................... 14

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265


LUẬN VĂN TỐT NGHIỆP THẠC SĨ
1.9 Quá trình lượng tử ........................................................................................ 16
1.9.1 Lượng tử vô hướng ................................................................................ 16
1.9.2 Lượng tử vector ..................................................................................... 17
1.10

Quá trình mã hóa ...................................................................................... 18

1.10.1

Mã hóa độ dài thay đổi....................................................................... 18


1.11

Tiêu chuẩn đánh giá chất lượng ảnh nén .................................................. 20

1.12

Kết luận chương 1 ..................................................................................... 21

Chƣơng 2. Các chuẩn nén thuộc họ MPEC trƣớc H.265/HEVC và chuẩn nén
H.265/HEVC ........................................................................................................... 22
2.1 Giới thiệu về lịch sử phát triển của chuẩn MPE........................................... 22
2.2 Các tiêu chuẩn nén trước H.265/HEVC ....................................................... 22
2.2.1 Tiêu chuẩn MPEC-1 .............................................................................. 22
2.2.2 Tiêu chuẩn MPEG-2 .............................................................................. 25
2.2.3 Tiêu chuẩn MPEC-4 .............................................................................. 28
2.2.4 Tiêu chuẩn H.264 .................................................................................. 29
2.3 Tổng quan về chuẩn nén H.265/HEVC ......................................................... 30
2.3.1 Lịch sử phát triển của chuẩn nén H.265/HEVC .................................... 30
2.3.2 Lịch trình triển khai và các sản phẩm liên quan .................................... 31
2.3.3 Các profiles và levels của chuẩn HEVC................................................ 39
2.4 Kĩ thuật nén video HEVC .............................................................................. 42
2.4.1 Giải thích hoạt động cơ bản ................................................................... 42
2.4.2 Cấu trúc mã hóa (Coding Structure) ...................................................... 46
2.5 Kết luận chương 2 ......................................................................................... 50
Chƣơng 3. Những điểm tối ƣu của HEVC so với H.264/AVC............................ 52
3.1 Sự tối ưu trên lý thuyết .................................................................................. 52
3.2 Sự khác biệt qua mô phỏng với hình ảnh cụ thể ........................................... 57
3.2.1 Bài toán và mục tiêu cần đạt được......................................................... 57

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265



LUẬN VĂN TỐT NGHIỆP THẠC SĨ
3.2.2 Phương pháp thực hiện .......................................................................... 57
3.2.3 Kết quả đạt được qua mô phỏng ............................................................ 58
3.2.4 Trong H.264/AVC ................................................................................. 59
3.2.5 Trong HEVC .......................................................................................... 61
3.2.6 So sánh HEVC và H.264/AVC.............................................................. 66
3.3 Kết luận chương 3 ......................................................................................... 69
TÀI LIỆU THAM KHẢO ..................................................................................... 70

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265


LUẬN VĂN TỐT NGHIỆP THẠC SĨ

CÁC THUẬT NGỮ VIẾT TẮT
Thuật ngữ tiếng Anh

STT
1

2

3

4
5

HEVC


Thuật ngữ tiếng Việt
Chuẩn nén Video hiệu suất cao
(High Efficiency Video Coding)

VCEG

Nhóm chuyên gia về mã hóa Video
(Video Coding Experts Groups)

BAC

Mã hóa số học nhị phân (Binary
Arithmetic Coding)

CA

Mã hóa thích nghi theo nội dung
(Context Adaptive)

CC

Mã xóa (Clear code)

CIF

Định dạng mã hóa hình ảnh có kích
thước

6


352

x

288

(Common

Intermediate Format)
7

8

9

10

11
12
13
14

DAB

Phát quảng bá âm thanh số (Digital
Audio Broadcasting)

DCT


Biến đổi Cosine rời rạc (Discrete
Cosine Transform)

DFT

Biến đổi Fourier rời rạc (Discrete
Fourier Transform)

DPCM

Điều xung mã vi sai (Differential
Pulse Code Modulation)

DS

Thuật toán tìm kiểu hình thoi
(Diamond Search)

DTH
DWT

Biến đổi Wavelet rời rạc (Discrete
Wavelet Transform)

EOI

Mã kết thúc (End Of Information)

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265



LUẬN VĂN TỐT NGHIỆP THẠC SĨ
15

ES

Dòng cơ bản (Elemenatary Stream)

16

Exp-Golomb

Mã Exponential Golomb

FLC

Mã hóa có chiều dài cố định

17

18
19
1

2

3

4


(Fixed-Length Code)
FMO

Thứ tự MB mềm dẻo (Flexible
Macroblock Order)

GOP

Nhóm ảnh (Group Of Pictures)

GMC

Bù chuyển động toàn phần (Global
Motion Compensation)

HDS

Thuật toán tìm hình thoi nằm ngang
(Horizontal Diamond search)

HDTV

Truyền hình phân giải cao (High
Definition Television)

HEXBS

Thuật toán tìm kiểu hình lục giác
(Hexagon-Based Search)


ICT
5

Biến đổi nguyên Cosine rời rạc
(Integer

Discrete

Cosine

Transform)
IDR

6

Ảnh làm tươi tức thời bộ giải mã
(Instantaneous Decoder Refresh
Picture)

IDCT
7

Biến đổi ngược Cosine rời rạc
(Inverse

Discrete

Cosine

Transform)

8

IP

Giao

thức

Internet

(

Internet

Protocol)
ISDN

9

Mạng

tích

(Integrated

hợp

dịch

Service


vụ

số

Digital

Network)
10

JPEG

Chuẩn nén ảnh của ủy ban JPEG

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265


LUẬN VĂN TỐT NGHIỆP THẠC SĨ
quốc

tế

(Joint

Photographic

Experts Group)
11
12


13
14

JPEG2000

Chuẩn nén ảnh JPEG2000

LOSSLESS

Kỹ thuật nén ảnh không tổn hao
(không mất dữ liệu)

LOSSY

Kỹ thuật nén ảnh có tổn hao (có
mất dữ liệu)

MB

Đa khối (Macroblock)

MBAFF

Mã hóa khung mành thích nghi

15

(Macroblock-Adaptive Frame-Field
coding)


16

17

18

19

20

21

22

23

MC



chuyển

động

(Motion

Compensation)
ME

Ước lượng chuyển động(Motion

Estimate)

MMS

Dịch vụ tin nhắn đa phương tiện
(Multimedia Messaging Services)

MSE

Sai số bình phương trung bình
(Mean Square Error)

MPEG

Nhóm chuyên gia nén ảnh động
(Moving Pictures Experts Group)

NAL

Lớp trừu tượng mạng (Network
Abstraction Layer)

NNS

Tìm ở khối gần nhất (Nearest
Neighbors Search)

PCM

Điều


xung



(Pulse

Code

Modulation)

24

PF

25

MF

Hệ số nhân(Multipy Factor)

26

PSNR

Tỷ số tín hiệu đỉnh trên nhiễu (Peak

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265



LUẬN VĂN TỐT NGHIỆP THẠC SĨ
Signal to Noise Ratio)
QCIF
27

Định dạng hình ảnh có kích thước
176

x

144(Quarter

Common

Intermediate Format)
28
29
30

31

QP

Thông số lượng tử (Quantization
Parameter)

RBSP

(Raw Byte Sequence Payload)


RGB

Ba màu cơ bản màu đỏ/Xanh/Lam
(Red/Green/Blue)

RLC

Mã hoá dọc chiều dài (Run Length
Coding)

RSVP

Giao thức dành riêng tài nguyên
mạng

32

(Resource

Reservation

Protocol)
33

34

RTP

Giao thức truyền tải thời gian thực
(Real Time Transport Protocol)


SDTV

Truyền hình tiêu chuẩn ( Standard
Televison)

SMIL

Ngôn ngữ tích hợp Multimedia
đồng bộ (Synchronized Multimedia

35

Integration Language)
36

37

38

39
40

SRC

Điều khiển tốc độ bit biến đổi được
( Scalable Rate Control)

TSS


Thuật toán tìm ba bước (Three-Step
search)

UMTS

(Universal

Mobile

Telecommications System)
VCL

Lớp mã hóa Video (Video Coding
Layer)

VLC

Mã có chiều dài thay đổi (Variable

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265


LUẬN VĂN TỐT NGHIỆP THẠC SĨ
Length Code)
41
42

VO

Đối tượng Video (Video Object)


VOP

Đối tượng mặt phẳng Video (Video
Object Plane)

YCbCr
43

Độ

chói,

màu

(Luminance,

lam,

Blue

màu

đỏ

chrominance,

Red chrominance)
ISO


Tổ chức quốc tế về tiêu chuẩn chất
lượng (International Organization

44

for Standardization)
IEC
45

Ủy ban kỹ thuật điện quốc tế
(International

Electro-technical

Commission)
46
47
48

JTC1

Ủy ban kỹ thuật 1 (Joint Technical
Committee 1)

SC29

Ủy ban phụ 29 (Sub-committee 29)

WG11


Nhóm làm việc 11( Work Group
11)

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265


LUẬN VĂN TỐT NGHIỆP THẠC SĨ

DANH MỤC BẢNG BIỂU

Bảng 1-1 Kích thước 4x8 pixels .............................................................................. 11
Bảng 1-2 Độ dư thừa của các pixel trong ảnh .......................................................... 11
Bảng 1-3 Mức xám thực tế ....................................................................................... 11
Bảng 1-4 Chênh lệch mức xám của 2 pixel liên tiếp[5] .......................................... 12
Bảng 1-5 Lượng tử vô hướng [5]............................................................................. 17
Bảng 2-1 MPEC2 Profile[5] .................................................................................... 26
Bảng 2-2 Sự khác nhau giữa MPEG1 và MPEG2[5] .............................................. 28
Bảng 2-3 Sự phát triển của HEVC trong năm 2012[7] ........................................... 31
Bảng 2-4 Sự phát triển của HEVC trong năm 2013[7] ........................................... 32
Bảng 2-5H.265/HEVC levels[7] .............................................................................. 40
Bảng 3-1 Những điểm khác nhau chính giữa H.265/HEVC và H.264/AVC[8] ..... 53
Bảng 3-2So sánh tỷ lệ giảm bit giữa các chuẩn nén[8] ........................................... 55
Bảng 3-3So sánh video encoders với cùng tỷ lệ PSNR[8] ...................................... 56

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265


LUẬN VĂN TỐT NGHIỆP THẠC SĨ

DANH MỤC HÌNH VẼ

Hình 1-1Sơ đồ quá trình tạo tín hiệu số[4] .................................................................4
Hình 1-2 Quá trình biến đổi tín hiệu màu[6] ..............................................................6
Hình 1-3 Các tiêu chuẩn lấy mẫu phổ biến[6] ............................................................8
Hình 1-4Sơ đồ khối nén tín hiệu video[6] ..................................................................9
Hình 1-5 Mô hình hệ thống nén tổn hao[6] ............................................................. 13
Hình 1-6 Bộ mã hóa và giải mã DPCM[6] .............................................................. 14
Hình 1-7 Quá trình lượng tử vector[7] .................................................................... 18
Hình 1-8 Cây mã Huffman[7].................................................................................. 19
Hình 1-9 Minh họa mã hóa RLC[7] ........................................................................ 20
Hình 2-1 Quá trình phát triển của kĩ thuật nén MPEG qua các giai đoạn[4] .......... 22
Hình 2-2 Cấu trúc dòng bít MPEC1[7] ................................................................... 24
Hình 2-3 Cấu trúc chuỗi video MPEG[7] ................................................................ 25
Hình 2-4 Ứng dụng của H.265/HEVC[7] ................................................................ 39
Hình 2-5 H.265/HEVC profiles[7] .......................................................................... 39
Hình 2-6Sơ đồ mã hóa HEVC[8] ............................................................................ 44
Hình 2-7 Sơ đồ giải mã HEVC với bộ lặp vòng[8] ................................................. 45
Hình 2-8Quad-tree[9] .............................................................................................. 46
Hình 2-9 Khối dự đoán Prediction[9] ...................................................................... 48
Hình 2-10 Dự đoán liên khung[9] ........................................................................... 48
Hình 3-1So sánh hình ảnh HEVC và H.264/AVC[10] ............................................ 53
Hình 3-2 Các hình ảnh làm mẫu so sánh H.264/AVC và HEVC[7] ....................... 58
Hình 3-3 Tỷ lệ tín hiệu trên nhiễu trong H264/AVC ............................................... 59
Hình 3-4 Tốc độ bit theo thời giantrong H264/AVC ............................................... 60
Hình 3-5 Giới hạn độ tăng ích theo PSNR trong H264/AVC .................................. 61
Hình 3-6 Tỷ lệ tín hiệu trên nhiễu trong HEVC ...................................................... 62
Hình 3-7 Tốc độ bit theo thời giantrong HEVC ...................................................... 62
Hình 3-8 Độ tăng ích sau dự doán liên khungtheo PSNR trong HEVC .................. 63
Hình 3-9 Giới hạn độ tăng ích theo PSNR trong HEVC ......................................... 64
Hình 3-10Giới hạn độ tăng ích theo thời gian trong HEVC .................................... 65


Nghiên cứu hoạt động và ứng dụng của chuẩn H.265


LUẬN VĂN TỐT NGHIỆP THẠC SĨ
Hình 3-11So sánh tốc độ bit theo PSNR và theo thời gian trong H.264/AVC và
HEVC trên ảnh Foreman .......................................................................................... 66
Hình 3-12So sánh tốc độ bit theo PSNR và theo thời gian trong H.264/AVC và
HEVC trên ảnh coastguard....................................................................................... 67
Hình 3-13So sánh tốc độ bit theo PSNR và theo thời gian trong H.264/AVC và
HEVC trên ảnh mobile ............................................................................................. 68
Hình 3-14So sánh tốc độ bit theo PSNR và theo thời gian trong H.264/AVC và
HEVC trên ảnh news ................................................................................................ 69

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265


LUẬN VĂN TỐT NGHIỆP THẠC SĨ

LỜI NÓI ĐẦU
Để có thể đi sâu vào nghiên cứu chuẩn nén H.265/HEVC, thì chúng ta cần
nắm được các thuật ngữ, các kỹ thuật cần thiết cho việc nén tín hiệu, cũng như là
các ưu nhược điểm của các chuẩn nén trước đó đã mang lại.Vì đây là một đề tài lý
thuyết, nên bước quan trọng nhất của quá trình làm luận văn tốt nghiệp là tìm kiếm
tài liệu và tổng hợp nó thành một chuỗi các kiến thức liên tục tránh lang man và yếu
tố thuyết phục người tham khảo cũng rất quan trọng, do đó bên cạnh trình bày chi
tiết về cách thức nén, em đã cố gắng mô phỏng một phần ưu điểm của chuẩn nén
này nhằm góp phần sinh động cho đề tài.
TỔ CHỨC LUẬN VĂN
Luận văn được trình bày thành 3 chương.
Chương I: Trình bày cơ sở về nén tín hiệu video, các thông số đặc trưng của tín

hiệu số và quá trình biến đổi tín hiệu màu, phân loại các nguyên lý nén.Trình bày
các kỹ thuật được sử dụng trong nén Video, các phép biến đổi và các kỹ thuật mã
hóa, các tiêu chuẩn đáng giá chất lượng ảnh nén MSE, PSNR, MAE,SAE …
Chương II: Trình bày các chuẩn nén thuộc họ MPEG, cấu trúc dòng bit, các ưu
điểm đã đạt được và chuẩn nén tiên tiến nhất hiện nay: H.265/HEVC, các đặc tính
nổi bật và các kỹ thuật mới trong chuẩn nén này.
Chương III:Nêu lên những điểm tối ưu của chuẩn H.265/HEVC so với chuẩn
H.264/AVC.Mô phỏng để thấy rõ sự khác biệt giữa HEVC và H.264/AVC
Tuy nhiên, do kinh nghiệm còn hạn chế, đồng thời H.265/HEVC là một kỹ thuật
còn trong giai đoạn nghiên cứu và phát triển, nên chắc chắn luận văn sẽ không tránh
khỏi sai sót, kính mong Quý Thầy Cô, và bạn bè đồng nghiệp đóng góp ý kiến
nhằm hoàn thiện tốt luận văn tốt nghiệp này.
Học viên
Trần Quang Chiến

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265

Trang 1


LUẬN VĂN TỐT NGHIỆP THẠC SĨ

Chƣơng 1. Cơ sở về nén tín hiệu Video và Các kĩ
thuật nén Video
1.1 Sự cần thiết của nén tín hiệu
Một tín hiệu video số thường chứa một lượng lớn dữ liệu, do đó sẽ gặp rất
nhiều khó khăn trong việc lưu trữ và truyền đi trong một băng thông kênh truyền
hạn chế. Với sự phát triển của khoa học kỹ thuật, ngày nay đã sản xuất được bộ cảm
biến màu có độ phân giải lên đến 16 triệu pixel tương đương với một bức ảnh có độ
phân giải 4096x4096 pixels, nhưng thực tế ứng dụng cần độ phân giải cao nhất hiện

nay cũng chỉ dùng lại ở 1920x1080 pixel, do đó để có thể tiết kiệm không gian lưu
trữ và băng thông kênh truyền thì cần nén tín hiệu[1].
Quá trình nén ảnh thực hiện được là do thông tin trong bức ảnh có tổ chức, có
trật tự, vì vậy nếu xem xét kỹ tính trật tự, cấu trúc ảnh sẽ phát hiện và loại bỏ được
các lượng thông tin dư thừa, chỉ giữa lại các thông tin quan trọng nhằm giảm số
lượng bit khi lưu trữ cũng như khi truyền mà vẫn đảm bảo tính thẩm mỹ của bức
ảnh. Tại đầu thu, bộ giải mã sẽ tổ chức, sắp xếp lại được bức ảnh xấp xỉ gần chính
xác so với ảnh gốc nhưng vẫn đảm bảo thông tin cần thiết[1]. Tín hiệu video
thường chứa đựng một lượng lớn các thông tin dư thừa, chúng thường được chia
thành 5 loại như sau:
 Có sự dư thừa thông tin về không gian: giữa các điểm ảnh lân cận trong
phạm vi một bức ảnh hay một khung video, còn gọi là thừa tĩnh bên trong
từng frame.
 Có sự dư thừa thông tin về thời gian: giữa các điểm ảnh của các khung video
trong chuỗi ảnh video, còn gọi là thừa động giữa các frame
 Có sự dư thừa thông tin về phổ: giữa các mẫu của các dữ liệu thu được từ các
bộ cảm biến trong camera, máy quay…
 Có sự dư thừa do thống kê: do bản thân của các ký hiệu xuất hiện trong dòng
bit với các xác suất xuất hiện không đồng đều.

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265

Trang 2


LUẬN VĂN TỐT NGHIỆP THẠC SĨ
 Có sự dư thừa thị giác: thông tin không phù hợp với hệ thống thị giác con
người, những tần số quá cao so với cảm nhận của mắt người.
Ưu điểm của việc nén tín hiệu:
 Tiết kiệm băng thông kênh truyền ( trong thời gian thực hoặc nhanh hơn).

 Kéo dài thời giản sử dụng của thiết bị lưu trữ, giảm chi phí đầu tư cho thiết
bị lưu trữ.
 Giảm dung lượng thông tin mà không làm mất tính trung thực của hình ảnh.
Có nhiều phương pháp nén tín hiệu, phương pháp nén bằng cách số hóa tín hiệu
vẫn tỏ ra hữu hiệu trong mọi thời đại, một mặt nó có thể làm giảm lượng thông tin
không quan trọng một cách đáng kể, mặt khác nó còn giúp cho tín hiệu được bảo
mật hơn[2].

1.2 Quá trính số hóa tín hiệu
Quá trình số hoá tín hiệu tương tự, bao gồm quá trình lọc trước (prefiltering),
lấy mẫu, lượng tử và mã hoá minh họa như hình I.1. Quá trình lọc trước nhằm loại
bỏ các tần số không cần thiết ở tín hiệu cũng như nhiễu, bộ lọc này còn gọi là bộ lọc
chống nhiễu xuyên kênh Aliasing[1].

1.2.1 Lấy mẫu
Thực chất đây là một phép toán rời rạc hay là một phép điều biên xung PAM
và được thực hiện bằng các mạch Op-amp có cực khiển strobe. Nó tạo ra giá trị tín
hiệu tương tự tại một số hữu hạn các giá trị có biến rời rạc gọi là các mẫu. Các mẫu
được lấy cách đều nhau gọi là chu kỳ lấy mẫu. Tần số lấy mẫu phải thoả mãn định
lý Nyquist-Shannon [3]:
f s  2 f maz

(1.1)

Trong đó:

+ fs là tần số lấy mẫu.
+ fmax là tần số cực đại của phổ tín hiệu tương tự.

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265


Trang 3


LUẬN VĂN TỐT NGHIỆP THẠC SĨ
1.2.2 Lƣợng tử hóa
Quá trình lượng tử là quá trình chuyển một xung lấy mẫu thành một xung có
biên độ bằng mức lượng tử gần nhất hay nói cách khác là lượng tử chuyển đổi các
mức biên độ của tín hiệu đã lấy mẫu sang một trong các giá trị hữu hạn các mức nhị
phân. Lượng tử hoá biến đổi tín hiệu liên tục theo thời gian thành tín hiệu có biên
độ rời rạc, nhằm làm giảm ảnh hưởng của tạp âm trong hệ thống, hạn chế các mức
cho phép của tín hiệu lấy mẫu và chuẩn bị truyền tín hiệu gốc từ tương tự sang số.
Giá trị thập phân của các mẫu sau khi lượng tử hoá sẽ được biểu diễn dưới dạng số
nhị phân n bit (N= 2n), với n là độ phân giải lượng tử hoá, n càng lớn thì độ chia
càng mịn, do đó độ chính xác càng cao[4].
Do làm tròn các mức nên tín hiệu bị méo dạng do sai số lượng tử gọi là méo lượng
tử, tỷ số tín hiệu trên méo lượng tử (S/N) được xác định bởi:
S
 6,02n  1,76(dB)
N

(1.2)

Hình 1-1Sơ đồ quá trình tạo tín hiệu số[4]
Lượng tử hóa có hai loại:

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265

Trang 4



LUẬN VĂN TỐT NGHIỆP THẠC SĨ
 Lượng tử tuyến tính: phép nén tín hiệu theo quy luật đường cong đồng đều,
bước lượng tử bằng nhau.
 Lượng tử phi tuyến: phép nén tín hiệu theo quy luật đường cong không đồng
đều, tập trung nhiều mức lượng tử ở những vùng tín hiệu nhỏ. Trong kỹ thuật
nén ảnh, nén video thì loại lượng tử phi tuyến được dùng nhiều hơn vì nó
giảm dung lượng đến mức tối đa với độ méo lượng tử có thể chấp nhận
được[4].

1.2.3 Mã hóa
Là quá trình thay thế mỗi mức điện áp cố định sau khi lượng tử bằng một dãy
nhị phân gọi là từ mã.Tất cả các từ mã đều chứa số xung nhị phân cố định và được
truyền trong khoảng thời gian giữa 2 thời điểm lấy mẫu cạnh nhau.Bộ mã được sử
dụng để tái tạo các xung nhị phân hoặc các từ mã từ các giá trị đã lượng tử xuất
hiện ở đầu ra của bộ lượng tử hoá[4].

1.3 Tốc độ bít và thông lƣợng kênh truyền tín hiệu số
1.3.1 Tốc độ bit
Tốc độ bit là số lượng bit được truyền đi hay lưu trữ trong một đơn vị thời
gian[5].
C  f s * n (bit/s)

(1.3)
Trong đó :
+ f s là tần số lấy mẫu (Hz).
+ n là số bit nhị phân trong một ký hiệu.
+ C là tốc độ bit (bps).

1.3.2 Thông lƣợng kênh truyền tín hiệu số

Là tốc độ số liệu cực đại có thể truyền được trên kênh truyền có độ rộng
băng tần B.

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265

Trang 5


LUẬN VĂN TỐT NGHIỆP THẠC SĨ
C  B. log 2 (1  S

N

) (bps)

(1.4)
Trong đó
+ C là tốc độ bit (bps)
+ S N là tỷ số tín hiệu trên nhiễu trắng.
+ B là băng thông kênh truyền (Hz).
Tốc độ bit càng lớn thì tín hiệu tương tự khôi phục lại càng trung thực tuy
nhiên nó sẽ là cho dung lượng lưu trữ và băng thông kênh truyền càng lớn[5].Trong
thực tế để truyền tín hiệu có tốc độ bit là C (bps) thì cần băng thông kênh truyền là:
B

3
C (Hz)
4

Ví dụ: với n = 4, fs = 44,1Khz thì:

Tốc độ truyền thông tin là : C = n x fs = 4 x 44,1 = 176,3.103 bits/s
3
4

Và độ rộng băng tần là B  C =

3
x 176,4.103  132,3 Khz
4

1.4 Quá trình biến đổi tín hiệu màu

Hình 1-2 Quá trình biến đổi tín hiệu màu[6]

Một bức ảnh được chuyển từ RGB sang YUV nhằm giảm dung lượng lưu trữ cũng
như truyền đi, trong quá trình giải mã, trước khi hiển thị ảnh thì nó được biến đổi
ngược lại thành RGB[6]. Công thức minh họa quá trình biến đổi như sau:

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265

Trang 6


LUẬN VĂN TỐT NGHIỆP THẠC SĨ
Y  k r R  (1  k b  k r )G  k b B
Cb 

0.5
(B  Y )
1  kb


Cr 

0.5
(R  Y )
1  kr

(1.5)
Với k b  k r  k g  1 , kb = 0.114, kr = 0.299, khi thế vào công thức (1.5) thì ta được:
Y  0.299R  0.587G  0.114B
0 .5
( B  Y )  0.169R  0.331G  0.5 B
1  0.114
0 .5
Cr 
( R  Y )  0.5 R  0.419G  0.081B
1  0.299
Cb 

Nên ta có ma trận biến đổi từ RGB sang YUV như sau:
Y  0.299
Cb    0.169
  
Cr  0.5

0.587
 0.331
 0.419

0.114   R 

0.5  G 
 0.081  B 

(1.6)
Thực hiện tương tự ta suy ra được ma trận biến đổi từ YUV sang RGB như sau:
0
 R  1
G   1  0.344
  
 B  1
1.772

1.402  Y 
 0.714 Cb 
 Cr 
0

(1.7)

1.5 Các tiêu chuẩn lấy mẫu video tín hiệu số
Kiểu lấy mẫu cho ảnh video cũng là một vấn đề khá quan trọng của kỹ thuật
nén ảnh[6]. Một số kiểu lấy mẫu phổ biến minh họa như hình I.3 và có đặc điểm
như sau:
 Tốc độ lấy mẫu 4:1:1 - tần số lấy mẫu tín hiệu chói là 13,5MHz, và mỗi
tín hiệu hiệu màu là 3,375MHz.
 Tốc độ lấy mẫu 4:2:2 - tần số lấy mẫu tín hiệu chói là 13,5MHz, và mỗi
tín hiệu hiệu màu là 6,75MHz.

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265


Trang 7


LUẬN VĂN TỐT NGHIỆP THẠC SĨ
 Tốc độ lấy mẫu 4:4:4 - cả 3 thành phần có cùng độ phân giải, nghĩa là
tần số lấy mẫu tín hiệu chói là 13,5MHz, và mỗi tín hiệu hiệu màu là
13,5MHz.
 Tốc độ lấy mẫu 4:2:0 - là kiểu phổ biến, tần số lấy mẫu tín hiệu chói là
13,5MHz, và mỗi tín hiệu hiệu màu là 6,75MHz theo cả 2 chiều
Ví dụ : Một bức ảnh có độ phân giải 720 × 576 pixels
Độ phân giải của thành phần Y là 720 × 576 pixels được mã hóa bằng từ mã 8 bits.
 Nếu sử dụng kiểu lấy mẫu 4:4:4 thì độ phân giải của thành phần Cb, Cr là 720 ×
576 mẫu cũng được mã hóa bằng từ mã 8 bits.
=> Vậy tổng số bits sử dụng để mã hóa bức ảnh là 720 × 576 × 8 × 3 = 9 953 280
bits
 Nếu sử dụng kiểu lấy mẫu 4:2:0 thì độ phân giải của thành phần Cb, Cr là 360 ×
288 mẫu, cũng được mã hóa bằng từ mã 8 bits.
=> Vậy tổng số bits sử dụng là (720 × 576 × 8) + (360 × 288 × 8) × 2 = 4 976 640
bits

Hình 1-3 Các tiêu chuẩn lấy mẫu phổ biến[6]
Trong kiểu 4:4:4, tổng số mẫu cần thiết là 12 mẫu, do đó tổng số bit là 12 × 8 = 96
bits, và trung bình là 96/4 = 24 bits/pixel

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265

Trang 8


LUẬN VĂN TỐT NGHIỆP THẠC SĨ

Trong kiểu 4:2:0, tín hiệu được quét xen kẽ, do đó chỉ cần thiết 6 mẫu, 4 mẫu cho
thành phần Y, 1 mẫu cho thành phần Cb, 1 mẫu cho thành phần Cr, do đó tổng số
bits cần thiết là 6 × 8 = 48 bits, và trung bình là 48/4 = 12 bits/pixel.
Ta thấy kiểu lấy mẫu 4:2:0 giảm một ½ số lượng bits so với 4:4:4, đó cũng chính là
lý do mà kiểu lấy mẫu này được sử dụng phổ biến.

1.6 Mô hình nén tín hiệu Video

Hình 1-4Sơ đồ khối nén tín hiệu video[6]
Các khối chính là:
- Khối nén dư thừa thời gian.
 Dự đoán chuyển động
 Bù chuyển động
- Khối nén dư thừa theo không gian.
 Biến đổi DCT, DWT
 Lượng tử hóa
 Xắp xếp lại trật tự và mã hóa Entropy

1.6.1 Nén tín hiệu Video
Tín hiệu video có dải phổ nằm trong khoảng 0 -> 6Mhz, do thành phần tần số cao
chỉ xuất hiện ở các đường viền của hình ảnh nên năng lượng phổ rất ít tập trung ở
miền tần số cao mà chủ yếu tập trung ở miền tần số thấp. Điều đó có nghĩa là số
lượng bit ở miền tần số thấp sẽ nhiều hơn ở miền tần số cao[1].
Trong các hệ thống nén, tỉ số nén chính là tham số quan trọng đánh giá khả năng
nén của hệ thống, ta gọi n1, n2 là số lượng bit của tín hiệu trước và sau khi nén nên
ta có công thức như sau:

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265

Trang 9



LUẬN VĂN TỐT NGHIỆP THẠC SĨ
Tỷ số nén sẽ là C 

n1
n2

Phần trăm nén hay còn gọi là độ dư thừa dữ liệu tương đối.
 n 
n  n2
R  1  2  x100%  1
x 100%
n1
 n1 

(1.8)
Nếu n1= n2 thì ta có C =1, và R = 0 nghĩa là không có sự dư thừa dữ liệu.
Nếu n2<Ví dụ : n1 = 100Mb/s, n2 = 20Mb/s thì C = 5:1, R = 80%. Tức là ảnh có sự dư thừa
lớn, hiệu quả nén đạt 80%.

1.6.2 Lƣợng tin trung bình
Trước khi nghiên cứu các phương pháp nén, ta cần đánh giá lượng thông tin
chủ yếu được chứa đựng trong hình ảnh, từ đó xác định dung lượng tối thiểu cần sử
dụng để miêu tả, truyền tải thông tin về hình ảnh[1].
Thông tin được ký hiệu là ai và có xác suất p(ai) thì lượng tin được xác định theo
công thức sau:
I (ai )  log 2 [


1
]   log 2 p (ai )
p(ai )

(1.9)
Theo công thức trên ta thấy lượng tin chứa đựng trong một hình ảnh sẽ tỉ lệ
nghịch với khả năng xuất hiện của ảnh đó, nghĩa là sự kiện ít xảy ra sẽ chứa đựng
nhiều thông tin hơn và bằng tổng số lượng thông tin của từng phần tử ảnh.
Gọi lượng tin trung bình của hình ảnh là H(X) và được tính bằng công thức sau:
N

H (X )   p (ai ) * log 2 [
1

N
1
]    p (ai ) * log 2 p (ai )
p (ai )
1

(1.10)
Xác suất phân bố càng nhiều thì lượng tin trung bình entropy càng
nhỏ.Entropy đạt giá trị cực đại đối với phân bố đều, do đó nếu một ký hiệu có xác
suất lớn sẽ có số Entropy nhỏ.

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265

Trang 10



×