Tải bản đầy đủ (.docx) (85 trang)

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.68 MB, 85 trang )

LUẬN VĂN TỐT NGHIỆP THẠC SĨ
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

CỘNG HÒA XÃ HÔI CHỦ NGHĨA VIỆT NAM

Độc lập - Tự do - Hạnh phúc

--------------------------------------------------

---------------------------------

NHIỆM VỤ ĐỒ ÁN TỐT NGHIỆP
Họ và tên sinh viên: Trần Quang Chiến.……………. MSHV: CB120613
Khoá: 2012B……...Viện: Điện tử - Viễn thông …
Ngành: Điện tử - Viễn thông
1. Đầu đề đồ án:
………………………………………………..
………………………………………………………………………………………………………
……………………………………………………..
2. Các số liệu và dữ liệu ban đầu:
……………………………………..……………………………………………..……..……………
………………………………………………………………………………………………………
……………………….…..………………………..……………………………
3. Nội dung các phần thuyết minh và tính toán:
………………………………………………………………………………………………………
………..….
………………………………………………………………………………………………………
……………………………..….…………………………
4. Các bản vẽ, đồ thị ( ghi rõ các loại và kích thước bản vẽ ):
………………………………………………………………………………………………………


…………..……..….
………………………………………………………………………………………………………
…………………..……….……………
5. Họ tên giảng viên hướng dẫn:
TS. NGÔ VŨ ĐỨC
6. Ngày giao nhiệm vụ đồ án: ………………………………………………….………
7. Ngày hoàn thành đồ án: …………………………………………………………….

Chủ nhiệm Bộ môn

Ngày
tháng
năm
Giảng viên hướng dẫn

Sinh viên đã hoàn thành và nộp đồ án tốt nghiệp ngày

tháng

năm

Cán bộ phản biện

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265

Trang 1


LUẬN VĂN TỐT NGHIỆP THẠC SĨ
BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

--------------------------------------------------BẢN NHẬN XÉT ĐỒ ÁN TỐT NGHIỆP

Họ và tên sinh viên: Trần Quang Chiến……………. MSHV: CB120613
Khoá: 2012B………..Viện: Điện tử - Viễn thông … Ngành: Điện tử viễn thông
Giảng viên hướng dẫn:

TS. NGÔ VŨ ĐỨC

Cán bộ phản biện: ........................................................................................................................................................
1. Nội dung thiết kế tốt nghiệp:
...................................................................................................................................................................................................
...................................................................................................................................................................................................
...................................................................................................................................................................................................
...................................................................................................................................................................................................
...................................................................................................................................................................................................
.............................................................................................................................

2. Nhận xét của cán bộ phản biện:
...................................................................................................................................................................................................
...................................................................................................................................................................................................
...................................................................................................................................................................................................
...................................................................................................................................................................................................
...................................................................................................................................................................................................
...................................................................................................................................................................................................
...................................................................................................................................................................................................
...................................................................................................................................................................................................
............................................................................................................................................


Ngày

tháng

năm

Cán bộ phản biện
( Ký, ghi rõ họ và tên )

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265

Trang 2


LUẬN VĂN TỐT NGHIỆP THẠC SĨ

LỜI NÓI ĐẦU
Để có thể đi sâu vào nghiên cứu chuẩn nén H.265/HEVC, thì chúng ta cần
nắm được các thuật ngữ, các kỹ thuật cần thiết cho việc nén tín hiệu, cũng như là
các ưu nhược điểm của các chuẩn nén trước đó đã mang lại.Vì đây là một đề tài lý
thuyết, nên bước quan trọng nhất của quá trình làm Đồ án tốt nghiệp là tìm kiếm tài
liệu và tổng hợp nó thành một chuỗi các kiến thức liên tục tránh lang man và yếu tố
thuyết phục người tham khảo cũng rất quan trọng, do đó bên cạnh trình bày chi tiết
về cách thức nén, em đã cố gắng mô phỏng một phần ưu điểm của chuẩn nén này
nhằm góp phần sinh động cho đề tài.
TỔ CHỨC ĐỒ ÁN
Đồ án được trình bày thành 6 chương và 1 phụ lục.
Chương I: Trình bày cơ sở về nén tín hiệu video, các thông số đặc trưng của tín
hiệu số và quá trình biến đổi tín hiệu màu, phân loại các nguyên lý nén.
Chương II: Trình bày các kỹ thuật được sử dụng trong nén Video, các phép biến

đổi và các kỹ thuật mã hóa, các tiêu chuẩn đáng giá chất lượng ảnh nén MSE,
PSNR, MAE,SAE …
Chương III: Trình bày các chuẩn nén thuộc họ MPEG, cấu trúc dòng bit, các ưu
điểm đã đạt được.
Chương IV: Trình bày chuẩn nén tiên tiến nhất hiện nay: H.265/HEVC, các đặc
tính nổi bật và các kỹ thuật mới trong chuẩn nén này.
Chương V: Nêu lên những điểm tối ưu của chuẩn H.265/HEVC so với chuẩn
MPEG-4 H.264/AVC.
Chương VI: Mô phỏng để thấy rõ sự khác biệt giữa HEVC và H.264/AVC
Tuy nhiên, do kinh nghiệm còn hạn chế, đồng thời H.265/HEVC là một kỹ thuật
còn trong giai đoạn nghiên cứu và phát triển, nên chắc chắn luận văn sẽ không tránh
khỏi sai sót, kính mong Quý Thầy Cô, và bạn bè đồng nghiệp đóng góp ý kiến nhằm
hoàn thiện tốt luận văn tốt nghiệp này.
Học viên thực hiện:

Trần Quang Chiến

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265

Trang 3


LUẬN VĂN TỐT NGHIỆP THẠC SĨ

TÓM TẮT ĐỒ ÁN
“ Nghiên cứu hoạt động và ứng dụng của chuẩn H.265”

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265

Trang 4



LUẬN VĂN TỐT NGHIỆP THẠC SĨ

ABSTRACT
“ Reseach operations and applications of H.265 ”

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265

Trang 5


LUẬN VĂN TỐT NGHIỆP THẠC SĨ
MỤC LỤC
NHIỆM VỤ ĐỒ ÁN TỐT NGHIỆP.....................................................................................................................1
BẢN NHẬN XÉT ĐỒ ÁN TỐT NGHIỆP...........................................................................................................2
LỜI NÓI ĐẦU..........................................................................................................................................................3
TỔ CHỨC ĐỒ ÁN....................................................................................................................................................3
TÓM TẮT ĐỒ ÁN...................................................................................................................................................4
ABSTRACT..............................................................................................................................................................5
DANH MỤC HÌNH VẼ..........................................................................................................................................8
DANH MỤC BẢNG BIỂU.....................................................................................................................................9
CÁC THUẬT NGỮ VIẾT TẮT..........................................................................................................................10
Chương 1.
1.1

Cơ sở về nén tín hiệu Video.........................................................................................................12

Sự cần thiết của nén tín hiệu...............................................................................................................12


1.2 Quá trính số hóa tín hiệu....................................................................................................................13
1.2.1
Lấy mẫu................................................................................................................................ 13
1.2.2
Lượng tử hóa........................................................................................................................ 13
1.2.3
Mã hóa.................................................................................................................................. 15
1.3 Tốc độ bít và thông lượng kênh truyền tín hiệu số.............................................................................15
1.3.1
Tốc độ bit.............................................................................................................................. 15
1.3.2
Thông lượng kênh truyền tín hiệu số..................................................................................... 15
1.4

Quá trình biến đổi tín hiệu màu..........................................................................................................16

1.5

Các tiêu chuẩn lấy mẫu video tín hiệu số...........................................................................................17

1.6 Mô hình nén tín hiệu Video.................................................................................................................18
1.6.1
Nén tín hiệu Video................................................................................................................ 19
1.6.2
Lượng tin trung bình............................................................................................................. 19
Chương 2.
2.1

Các kĩ thuật nén Video................................................................................................................22


Phân loại kĩ thuật nén.........................................................................................................................22

2.2 Quá trình biến đổi...............................................................................................................................22
2.2.1
Điều xung mã vi sai DPCM.................................................................................................. 23
2.2.2
Mã hóa biến đổi.................................................................................................................... 23
2.3 Quá trình lượng tử..............................................................................................................................25
2.3.1
Lượng tử vô hướng............................................................................................................... 25
2.3.2
Lượng tử vector.................................................................................................................... 26
2.4 Quá trình mã hóa................................................................................................................................27
2.4.1
Mã hóa độ dài thay đổi.......................................................................................................... 27
2.4.2
Mã hóa số học....................................................................................................................... 29
2.5

Tiêu chuẩn đánh giá chất lượng ảnh nén...........................................................................................31

Chương 3.
3.1

Các chuẩn nén thuộc họ MPEC trước H.265/HEVC.............................................................33

Giới thiệu về lịch sử phát triển của chuẩn MPEG.............................................................................33

3.2 Các tiêu chuẩn nén trước H.265/HEVC.............................................................................................33
3.2.1

Tiêu chuẩn MPEC-1.............................................................................................................. 33

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265

Trang 6


LUẬN VĂN TỐT NGHIỆP THẠC SĨ
3.2.2
3.2.3
3.2.4

Tiêu chuẩn MPEG-2............................................................................................................. 36
Tiêu chuẩn MPEC-4.............................................................................................................. 38
Tiêu chuẩn H.264.................................................................................................................. 39

Chương 4.

Chuẩn nén H.265/HEVC.............................................................................................................44

4.1 Tổng quan về chuẩn nén H.265/HEVC...............................................................................................44
4.1.1
Lịch sử phát triển của chuẩn nén H.265/HEVC.....................................................................44
4.1.2
Lịch trình triển khai và các sản phẩm liên quan.....................................................................44
4.1.3
Các profiles và levels của chuẩn HEVC................................................................................50
4.2 Kĩ thuật nén video HEVC...................................................................................................................52
4.2.1
Giải thích hoạt động cơ bản................................................................................................... 52

4.2.2
Cấu trúc Mã hóa (Coding Structure)...................................................................................... 55
Chương 5.
5.1

Những điểm tối ưu của HEVC so với H.264/AVC...................................................................60

Sự tối ưu trên lý thuyết........................................................................................................................60

5.2 Sự khác biệt qua mô phỏng với hình ảnh cụ thể.................................................................................62
5.2.1
Trong H.264/AVC................................................................................................................. 63
5.2.2
Trong HEVC......................................................................................................................... 65
5.2.3
So sánh HEVC và H.264/AVC.............................................................................................. 69
TÀI LIỆU THAM KHẢO....................................................................................................................................73
BẢNG ĐỐI CHIẾU THUẬT NGỮ VIỆT – ANH............................................................................................75
PHỤ LỤC................................................................................................................................................................79

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265

Trang 7


LUẬN VĂN TỐT NGHIỆP THẠC SĨ

DANH MỤC HÌNH VẼ
Hình 1-1 Sơ đồ quá trình tạo tín hiệu số..................................................................14
Hình 1-2 Quá trình biến đổi tín hiệu màu................................................................16

Hình 1-3 Các tiêu chuẩn lấy mẫu phổ biến..............................................................18
Hình 1-4 Sơ đồ khối nén tín hiệu video...................................................................18
Hình 2-1 Mô hình hệ thống nén tổn hao..................................................................23
Hình 2-2 Bộ mã hóa và giải mã DPCM...................................................................23
Hình 2-3 Quá trình lượng tử vector.........................................................................26
Hình 2-4 Cây mã Huffman......................................................................................27
Hình 2-5 Minh họa mã hóa RLC.............................................................................28
Hình 2-6 Minh họa sự sắp xếp trong khoảng [0-1] thành những vùng nhỏ hơn sau
mỗi ký hiệu được mã hóa........................................................................................30
Hình 3-1 Quá trình phát triển của kĩ thuật nén MPEG qua các giai đoạn................33

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265

Trang 8


LUẬN VĂN TỐT NGHIỆP THẠC SĨ

DANH MỤC BẢNG BIỂU

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265

Trang 9


LUẬN VĂN TỐT NGHIỆP THẠC SĨ

CÁC THUẬT NGỮ VIẾT TẮT
STT


Từ viết tắt

Thuật ngữ tiếng Anh

Thuật ngữ tiếng Việt

1

IP

2

TCP

Internet Protocol
Transmission Control

Giao thức Internet
Giao thức điều khiển truyền
vận

3

JPEG

Protocol
Joint Photographic Experts

4


MJPEG

Group
Motion JPEG

Ảnh JPEG động

5

SOF

Start Of Frame

Bắt đầu khung

6

EOF

End Of Frame

7

MAC

Medium Access Control

Kết thúc khung
Điều khiển truy nhập môi


8

ROM

Read Only Memory

trường
Bộ nhớ chỉ có thể đọc

9

RAM

Ramdom Access Memory

Bộ nhớ truy cập ngẫu nhiên

10

SDRAM

Synchronous Dynamic RAM

RAM động đồng bộ

11

MMU

Khối quản lý bộ nhớ


12

IPC

Memory Management Unit
Inter-Process

13

USB

Universal Serial Bus

14

MCU

Microcontroller Unit

15

ADC

Analog- Digital Converter

16

COM


Component Object Model

17

EDK

Embedded Development Kit

phần
Kit phát triển nhúng

18

IIC hay I2C

Inter-Intergrated Circuit

Mạch liên tích hợp

19

PC

Personal Computer

Máy tính cá nhân

20

RX


Receive Data

Nhận dữ liệu

22

TX

Transmit Data

Truyền dữ liệu

23
24

LAN
TFTP

Local Area Network
Trivial File Transfer

Mạng cục bộ
Giao thức truyền tệp tin đơn

Communication

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265

Giao tiếp tiến trình nội

Kênh truyền nối tiếp phổ
biến
Khối vi điều khiển
Bộ chuyển đổ tương tự- số
Mô hình đối tượng thành

Trang 10


LUẬN VĂN TỐT NGHIỆP THẠC SĨ
Protocol
Dynamic Host Configuration

giản
Giao thức cấu hình động
máy chủ
Lớp vỏ bảo mật
Hệ thống tệp tin trên mạng
Giấy phép phần mềm tự do

25

DHCP

26

SSH

Protocol
Secure Shell


27

NFS

Network File System

28

GNU

General Public License

29

IC

30

ASCII

Integrated Circuit
American Standard Code for

31

UART

phổ biến
Mạch tích hợp

Bảng mã chuẩn

Information Interchange
Universal Asynchronous

Bộ truyền nhận không đồng

Receiver Transmitter

bộ phổ biến

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265

Trang 11


LUẬN VĂN TỐT NGHIỆP THẠC SĨ

Chương 1. Cơ sở về nén tín hiệu Video
1.1 Sự cần thiết của nén tín hiệu
Một tín hiệu video số thường chứa một lượng lớn dữ liệu, do đó sẽ gặp rất
nhiều khó khăn trong việc lưu trữ và truyền đi trong một băng thông kênh truyền
hạn chế. Với sự phát triển của khoa học kỹ thuật, ngày nay đã sản xuất được bộ cảm
biến màu có độ phân giải lên đến 16 triệu pixel tương đương với một bức ảnh có độ
phân giải 4096x4096 pixels, nhưng thực tế ứng dụng cần độ phân giải cao nhất hiện
nay cũng chỉ dùng lại ở 1920x1080 pixel, do đó để có thể tiết kiệm không gian lưu
trữ và băng thông kênh truyền thì cần nén tín hiệu.
Quá trình nén ảnh thực hiện được là do thông tin trong bức ảnh có tổ chức, có
trật tự, vì vậy nếu xem xét kỹ tính trật tự, cấu trúc ảnh sẽ phát hiện và loại bỏ được
các lượng thông tin dư thừa, chỉ giữa lại các thông tin quan trọng nhằm giảm số

lượng bit khi lưu trữ cũng như khi truyền mà vẫn đảm bảo tính thẩm mỹ của bức
ảnh. Tại đầu thu, bộ giải mã sẽ tổ chức, sắp xếp lại được bức ảnh xấp xỉ gần chính
xác so với ảnh gốc nhưng vẫn đảm bảo thông tin cần thiết. Tín hiệu video thường
chứa đựng một lượng lớn các thông tin dư thừa, chúng thường được chia thành 5
loại như sau:
 Có sự dư thừa thông tin về không gian: giữa các điểm ảnh lân cận trong
phạm vi một bức ảnh hay một khung video, còn gọi là thừa tĩnh bên trong
từng frame.
 Có sự dư thừa thông tin về thời gian: giữa các điểm ảnh của các khung video
trong chuỗi ảnh video, còn gọi là thừa động giữa các frame
 Có sự dư thừa thông tin về phổ: giữa các mẫu của các dữ liệu thu được từ các
bộ cảm biến trong camera, máy quay…
 Có sự dư thừa do thống kê: do bản thân của các ký hiệu xuất hiện trong dòng
bit với các xác suất xuất hiện không đồng đều.
 Có sự dư thừa tâm thị giác: thông tin không phù hợp với hệ thống thị giác
con người, những tần số quá cao so với cảm nhận của mắt người.
Ưu điểm của việc nén tín hiệu:

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265

Trang 12


LUẬN VĂN TỐT NGHIỆP THẠC SĨ
 Tiết kiệm băng thông kênh truyền ( trong thời gian thực hoặc nhanh hơn).
 Kéo dài thời giản sử dụng của thiết bị lưu trữ, giảm chi phí đầu tư cho thiết
bị lưu trữ.
 Giảm dung lượng thông tin mà không làm mất tính trung thực của hình ảnh.
Có nhiều phương pháp nén tín hiệu, phương pháp nén bằng cách số hóa tín hiệu
vẫn tỏ ra hữu hiệu trong mọi thời đại, một mặt nó có thể làm giảm lượng thông tin

không quan trọng một cách đáng kể, mặt khác nó còn giúp cho tín hiệu được bảo
mật hơn.

1.2 Quá trính số hóa tín hiệu
Quá trình số hoá tín hiệu tương tự, bao gồm quá trình lọc trước (prefiltering),
lấy mẫu, lượng tử và mã hoá minh họa như hình I.1. Quá trình lọc trước nhằm loại
bỏ các tần số không cần thiết ở tín hiệu cũng như nhiễu, bộ lọc này còn gọi là bộ lọc
chống nhiễu xuyên kênh Aliasing.

1.2.1 Lấy mẫu
Thực chất đây là một phép toán rời rạc hay là một phép điều biên xung PAM
và được thực hiện bằng các mạch Op-amp có cực khiển strobe. Nó tạo ra giá trị tín
hiệu tương tự tại một số hữu hạn các giá trị có biến rời rạc gọi là các mẫu. Các mẫu
được lấy cách đều nhau gọi là chu kỳ lấy mẫu. Tần số lấy mẫu phải thoả mãn định
lý Nyquist-Shannon :
Trong đó:

+ fs là tần số lấy mẫu.
+ fmax là tần số cực đại của phổ tín hiệu tương tự.

1.2.2 Lượng tử hóa
Quá trình lượng tử là quá trình chuyển một xung lấy mẫu thành một xung có
biên độ bằng mức lượng tử gần nhất hay nói cách khác là lượng tử chuyển đổi các
mức biên độ của tín hiệu đã lấy mẫu sang một trong các giá trị hữu hạn các mức nhị
phân. Lượng tử hoá biến đổi tín hiệu liên tục theo thời gian thành tín hiệu có biên
độ rời rạc, nhằm làm giảm ảnh hưởng của tạp âm trong hệ thống, hạn chế các mức
cho phép của tín hiệu lấy mẫu và chuẩn bị truyền tín hiệu gốc từ tương tự sang số.

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265


Trang 13


LUẬN VĂN TỐT NGHIỆP THẠC SĨ
Giá trị thập phân của các mẫu sau khi lượng tử hoá sẽ được biểu diễn dưới dạng số
nhị phân n bit (N= 2n), với n là độ phân giải lượng tử hoá, n càng lớn thì độ chia
càng mịn, do đó độ chính xác càng cao.
Do làm tròn các mức nên tín hiệu bị méo dạng do sai số lượng tử gọi là méo lượng
tử, tỷ số tín hiệu trên méo lượng tử (S/N) được xác định bởi:

Hình 1-1 Sơ đồ quá trình tạo tín hiệu số
Lượng tử hóa có hai loại:
 Lượng tử tuyến tính: phép nén tín hiệu theo quy luật đường cong đồng đều,
bước lượng tử bằng nhau.
 Lượng tử phi tuyến: phép nén tín hiệu theo quy luật đường cong không đồng
đều, tập trung nhiều mức lượng tử ở những vùng tín hiệu nhỏ. Trong kỹ thuật
nén ảnh, nén video thì loại lượng tử phi tuyến được dùng nhiều hơn vì nó
giảm dung lượng đến mức tối đa với độ méo lượng tử có thể chấp nhận được.

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265

Trang 14


LUẬN VĂN TỐT NGHIỆP THẠC SĨ
1.2.3 Mã hóa
Là quá trình thay thế mỗi mức điện áp cố định sau khi lượng tử bằng một dãy
nhị phân gọi là từ mã. Tất cả các từ mã đều chứa số xung nhị phân cố định và được
truyền trong khoảng thời gian giữa 2 thời điểm lấy mẫu cạnh nhau. Bộ mã được sử
dụng để tái tạo các xung nhị phân hoặc các từ mã từ các giá trị đã lượng tử xuất hiện

ở đầu ra của bộ lượng tử hoá.

1.3 Tốc độ bít và thông lượng kênh truyền tín hiệu số
1.3.1 Tốc độ bit
Tốc độ bit là số lượng bit được truyền đi hay lưu trữ trong một đơn vị thời
gian.
(bit/s)
Trong đó :
+là tần số lấy mẫu (Hz).
+ n là số bit nhị phân trong một ký hiệu.
+ C là tốc độ bit (bps).

1.3.2 Thông lượng kênh truyền tín hiệu số
Là tốc độ số liệu cực đại có thể truyền được trên kênh truyền có độ rộng
băng tần B.
(bps)
Trong đó
+ C là tốc độ bit (bps)
+ là tỷ số tín hiệu trên nhiễu trắng.
+ B là băng thông kênh truyền (Hz).
Tốc độ bit càng lớn thì tín hiệu tương tự khôi phục lại càng trung thực tuy
nhiên nó sẽ là cho dung lượng lưu trữ và băng thông kênh truyền càng lớn. Trong
thực tế để truyền tín hiệu có tốc độ bit là C (bps) thì cần băng thông kênh truyền là:
(Hz)
Ví dụ: với n = 4, fs = 44,1Khz thì:
Tốc độ truyền thông tin là : C = n x fs = 4 x 44,1 = 176,3.103 bits/s
Và độ rộng băng tần là =

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265


Trang 15


LUẬN VĂN TỐT NGHIỆP THẠC SĨ
1.4 Quá trình biến đổi tín hiệu màu

Hình 1-2 Quá trình biến đổi tín hiệu màu

Một bức ảnh được chuyển từ RGB sang YUV nhằm giảm dung lượng lưu trữ cũng
như truyền đi, trong quá trình giải mã, trước khi hiển thị ảnh thì nó được biến đổi
ngược lại thành RGB. Công thức minh họa quá trình biến đổi như sau:
(1)
Với , kb = 0.114, kr = 0.299, khi thế vào công thức (1) thì ta được:
Nên ta có ma trận biến đổi từ RGB sang YUV như sau:
Thực hiện tương tự ta suy ra được ma trận biến đổi từ YUV sang RGB như sau:

1.5 Các tiêu chuẩn lấy mẫu video tín hiệu số
Kiểu lấy mẫu cho ảnh video cũng là một vấn đề khá quan trọng của kỹ thuật
nén ảnh. Một số kiểu lấy mẫu phổ biến minh họa như hình I.3 và có đặc điểm như
sau:
 Tốc độ lấy mẫu 4:1:1 - tần số lấy mẫu tín hiệu chói là 13,5MHz, và mỗi
tín hiệu hiệu màu là 3,375MHz.
Nghiên cứu hoạt động và ứng dụng của chuẩn H.265

Trang 16


LUẬN VĂN TỐT NGHIỆP THẠC SĨ
 Tốc độ lấy mẫu 4:2:2 - tần số lấy mẫu tín hiệu chói là 13,5MHz, và mỗi
tín hiệu hiệu màu là 6,75MHz.

 Tốc độ lấy mẫu 4:4:4 - cả 3 thành phần có cùng độ phân giải, nghĩa là
tần số lấy mẫu tín hiệu chói là 13,5MHz, và mỗi tín hiệu hiệu màu là
13,5MHz.
 Tốc độ lấy mẫu 4:2:0 - là kiểu phổ biến, tần số lấy mẫu tín hiệu chói là
13,5MHz, và mỗi tín hiệu hiệu màu là 6,75MHz theo cả 2 chiều
Ví dụ : Một bức ảnh có độ phân giải 720 × 576 pixels
Độ phân giải của thành phần Y là 720 × 576 pixels được mã hóa bằng từ mã 8 bits.
 Nếu sử dụng kiểu lấy mẫu 4:4:4 thì độ phân giải của thành phần Cb, Cr là 720 ×
576 mẫu cũng được mã hóa bằng từ mã 8 bits.
=> Vậy tổng số bits sử dụng để mã hóa bức ảnh là 720 × 576 × 8 × 3 = 9 953 280
bits
 Nếu sử dụng kiểu lấy mẫu 4:2:0 thì độ phân giải của thành phần Cb, Cr là 360 ×
288 mẫu, cũng được mã hóa bằng từ mã 8 bits.
=> Vậy tổng số bits sử dụng là (720 × 576 × 8) + (360 × 288 × 8) × 2 = 4 976 640
bits

Hình 1-3 Các tiêu chuẩn lấy mẫu phổ biến
Trong kiểu 4:4:4, tổng số mẫu cần thiết là 12 mẫu, do đó tổng số bit là 12 × 8 = 96
bits, và trung bình là 96/4 = 24 bits/pixel
Trong kiểu 4:2:0, tín hiệu được quét xen kẽ, do đó chỉ cần thiết 6 mẫu, 4 mẫu cho
thành phần Y, 1 mẫu cho thành phần Cb, 1 mẫu cho thành phần Cr, do đó tổng số
bits cần thiết là 6 × 8 = 48 bits, và trung bình là 48/4 = 12 bits/pixel.
Nghiên cứu hoạt động và ứng dụng của chuẩn H.265

Trang 17


LUẬN VĂN TỐT NGHIỆP THẠC SĨ
Ta thấy kiểu lấy mẫu 4:2:0 giảm một ½ số lượng bits so với 4:4:4, đó cũng chính là
lý do mà kiểu lấy mẫu này được sử dụng phổ biến.


1.6 Mô hình nén tín hiệu Video

Hình 1-4 Sơ đồ khối nén tín hiệu video
Các khối chính là:
- Khối nén dư thừa thời gian.
 Dự đoán chuyển động
 Bù chuyển động
- Khối nén dư thừa theo không gian.
 Biến đổi DCT, DWT
 Lượng tử hóa
 Xắp xếp lại trật tự và mã hóa Entropy

1.6.1 Nén tín hiệu Video
Tín hiệu video có dải phổ nằm trong khoảng 0 -> 6Mhz, do thành phần tần số cao
chỉ xuất hiện ở các đường viền của hình ảnh nên năng lượng phổ rất ít tập trung ở
miền tần số cao mà chủ yếu tập trung ở miền tần số thấp. Điều đó có nghĩa là số
lượng bit ở miền tần số thấp sẽ nhiều hơn ở miền tần số cao.
Trong các hệ thống nén, tỉ số nén chính là tham số quan trọng đánh giá khả năng
nén của hệ thống, ta gọi n1, n2 là số lượng bit của tín hiệu trước và sau khi nén nên
ta có công thức như sau:
Tỷ số nén sẽ là
Phần trăm nén hay còn gọi là độ dư thừa dữ liệu tương đối.
Nếu n1= n2 thì ta có C =1, và R = 0 nghĩa là không có sự dư thừa dữ liệu.
Nếu n2<
Nghiên cứu hoạt động và ứng dụng của chuẩn H.265

Trang 18



LUẬN VĂN TỐT NGHIỆP THẠC SĨ
Ví dụ : n1 = 100Mb/s, n2 = 20Mb/s thì C = 5:1, R = 80%. Tức là ảnh có sự dư thừa
lớn, hiệu quả nén đạt 80%.

1.6.2 Lượng tin trung bình
Trước khi nghiên cứu các phương pháp nén, ta cần đánh giá lượng thông tin
chủ yếu được chứa đựng trong hình ảnh, từ đó xác định dung lượng tối thiểu cần sử
dụng để miêu tả, truyền tải thông tin về hình ảnh.
Thông tin được ký hiệu là ai và có xác suất p(ai) thì lượng tin được xác định theo
công thức sau:
Theo công thức trên ta thấy lượng tin chứa đựng trong một hình ảnh sẽ tỉ lệ
nghịch với khả năng xuất hiện của ảnh đó, nghĩa là sự kiện ít xảy ra sẽ chứa đựng
nhiều thông tin hơn và bằng tổng số lượng thông tin của từng phần tử ảnh.
Gọi lượng tin trung bình của hình ảnh là H(X) và được tính bằng công thức sau:
Xác suất phân bố càng nhiều thì lượng tin trung bình entropy càng nhỏ.
Entropy đạt giá trị cực đại đối với phân bố đều, do đó nếu một ký hiệu có xác suất
lớn sẽ có số Entropy nhỏ.
Ví dụ: Giả sử có một ảnh đen trắng với độ phân giải lượng tử 8 bit. Ký hiệu i
là mức xám của pixel và bộ ký hiệu A là tập hợp tất cả các mức xám từ 0->255, mức
xám 0 tương ứng với màu đen, mức xám 255 tương ứng với màu trắng. Do đó,
Entropy của ảnh là
Giả sử ta có kích thước 4x8 pixels như sau:
21

21

21

95


169

243

243

243

21

21

21

95

169

243

243

243

21

21

21


95

169

243

243

243

21

21

21

95

169

243

243

243

Ta sẽ xét các độ dư thừa của các pixel trong ảnh, hoặc giữa các ảnh liên tiếp như
sau.
 Giả sử các mức xám của tín hiệu hình đen trắng độc lập thống kê với nhau,

dựa vào số liệu thống kê cụ thể là.
Mức xám

Số lượng pixel

Xác suất.

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265

Trang 19


LUẬN VĂN TỐT NGHIỆP THẠC SĨ
21

12

3/8

95

4

1/8

169

4

1/8


243

12

3/8

Entropy của phần ảnh tĩnh này là:
H(x)

=

Tuy nhiên, trong thực tế các mức xám của các pixel không độc lập thống kê
với nhau, nên ta có thể biểu diễn theo từng cặp pixel liên tiếp như sau:
Giá trị cặp mức xám

Số lượng cặp

Xác suất

(21, 21)

8

1/4

(21, 95)

4


1/8

(95, 169)

4

1/8

(169, 243)

4

1/8

(243, 243)

8

1/4

(243, 21)

4

1/8

H(x)

=


Ngoài ra còn có thể biểu diễn theo phần chênh lệch mức xám của 2 pixel liên
tiếp như sau.
21

0

0

74

74

74

0

0

21

0

0

74

74

74


0

0

21

0

0

74

74

74

0

0

21

0

0

74

74


74

0

0

Giá trị mức xám

Số lượng

Xác suất.

21

4

1/8

0

16

1/2

74

12

3/8


H(x)

=

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265

Trang 20


LUẬN VĂN TỐT NGHIỆP THẠC SĨ

Như vậy, số lượng tin trung bình tối thiểu cần thiết để truyền một phần tử
ảnh sẽ khác nhau, nghĩa là độ dư thừa trong ảnh và giữa các bức ảnh sẽ phụ thuộc
vào cách mã hóa Entropy. Do đó cần phải xem xét kỹ để chọn ra loại mã hóa hiệu
quả nhất.

Chương 2. Các kĩ thuật nén Video
2.1 Phân loại kĩ thuật nén
Nén video được chia thành hai họ lớn: Nén không tổn hao và nén tổn hao.
 Nén không tổn hao là quy trình biểu diễn các ký hiệu trong dòng bit nguồn
thành dòng các từ mã sao cho ảnh được khôi phục hoàn toàn giống ảnh gốc,
các thuật toán chỉ phụ thuộc vào cách thống kê nội dung dữ liệu và thường
dựa trên việc thay thế một nhóm các ký tự trùng lặp bởi một nhóm các ký tự
đặc biệt khác ngắn hơn mà không quan tâm đến ý nghĩa của dòng bit dữ liệu,
nên đòi hỏi phải có thiết bị lưu trữ và đường truyền lớn hơn.
 Nén có tổn hao, tức là ảnh được khôi phục không hoàn toàn giống ảnh gốc,
dạng nén này thích hợp cho việc lưu trữ và truyền ảnh tĩnh, ảnh video qua
một mạng có băng thông hạn chế. Các dạng nén này thường có hệ số nén cao
hơn (từ 2:1 đến 100:1) và gây nên tổn hao dữ liệu và sự suy giảm ảnh sau khi
giải nén do việc xóa và làm tròn dữ liệu trong một khung hay giữa các

khung. Nó liên quan đến việc dùng các phép biến đổi tín hiệu từ miền này
sang miền khác.
Trong thực tế phương pháp nén tổn hao thường được sử dụng nhiều hơn và các kỹ
thuật nén tổn hao thường sử dụng như: mã hóa vi sai, biến đổi cosin rời rạc DCT,
lượng tử vô hướng, quét zig-zag, mã hóa Entropy…

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265

Trang 21


LUẬN VĂN TỐT NGHIỆP THẠC SĨ
2.2 Quá trình biến đổi

Hình 2-5 Mô hình hệ thống nén tổn hao
Tín hiệu ngõ vào được biến đổi nhằm mục đích biểu diễn một số liệu khác thích hợp
để nén hơn so với tín hiệu nguồn. Ở phía giải mã tín hiệu nén sẽ được biến đổi
ngược lại để thu tín hiệu gốc. Một số phép biến đổi được áp dụng phổ biến hiện nay
như:

2.2.1 Điều xung mã vi sai DPCM
Các phương pháp nén dùng DPCM dựa trên nguyên tắc phát hiện sự giống
nhau và khác nhau giữa các điểm ảnh gần nhau để loại bỏ các thông tin dư thừa.
Trong DPCM chỉ có phần khác nhau giữa mẫu - mẫu được truyền đi, sự khác nhau
này được cộng vào giá trị mẫu đã giải mã hiện hành ở phía giải mã để tạo ra giá trị
mẫu phục hồi. Hình II.2. mô tả sơ đồ khối của bộ mã hóa và giải mã DPCM.

Hình 2-6 Bộ mã hóa và giải mã DPCM
Ví dụ
Mẫu tín hiệu vào


115 117 116 117 118 117 115 116

Sự khác nhau
Dòng bit được nén như sau:

115

2

-1

1

1

-1

-2

1

2

-1

1

1


-1

-2

1

2.2.2 Mã hóa biến đổi

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265

Trang 22


LUẬN VĂN TỐT NGHIỆP THẠC SĨ
Nhằm biến đổi các hệ số trong miền thời gian (video số), không gian 2D (bức ảnh
tĩnh) thành các hệ số trong miền tần số. Các hệ số này ít tương quan hơn có phổ
năng lượng tập trung hơn, thuận tiện cho việc loại bỏ thông tin dư thừa.

2.2.2.1 Biến đổi cosin rời rạc DCT
Vì ảnh gốc có kích thước rất lớn cho nên trước khi đưa vào biến đổi DCT,
ảnh được phân chia thành các MB biểu diễn các mức xám của điểm ảnh. Việc phân
khối này sẽ làm giảm được một phần thời gian tính toán các hệ số chung, mặt khác
biến đổi cosin đối với các khối nhỏ sẽ làm tăng độ chính xác khi tính toán với dấu
phẩy tĩnh, giảm thiểu sai số do làm tròn sinh ra. Phép biến đổi DCT cơ bản hoạt
động dựa trên cơ sở ma trận vuông của mẫu sai số dự đoán, kết quả cho ta một ma
trận Y là những hệ số DCT được minh họa như sau:
Y = AXAT
Trong đó A là ma trận hệ số biến đổi, các thành phần của A như sau:
Với
Tương đương với


Nếu i = 0

Phép biến đổi DCT nguyên 4x4 của chuỗiNếu
ngõi vào
> 0 X được cho bởi công thức
Phép biến đổi ngược DCT cho bởi công thức:
X=ATYA
Tương đương với:

2.2.2.2 Biến đổi Hadamard
Là một ví dụ tổng quát hóa của biến đổi Fourier rời rạc, nó thực hiện các phép toán
cộng và trừ trên các ma trận 2m x 2m trực giao, đối xứng, tuyến tính…được định
nghĩa theo công thức sau:
trong đó Hn là ma trận NxN với N = 2m , m thường là các giá trị 1, 2 ,3 tương ứng
với các khối 2x2, 4x4, và 8x8, Hn được tạo ra từ phép toán Kronecker như sau: H n =
n lần.
Ví dụ H2 = H1 H1
Với H1=

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265

Trang 23


LUẬN VĂN TỐT NGHIỆP THẠC SĨ
2.3 Quá trình lượng tử
Sau khi thực hiện biến đối DCT, các hệ số sẽ được lượng tử hoá dựa trên một bảng
lượng tử Q(u,v) với 0≤u, v≤ n-1, n là kích thước khối. Bảng này được định nghĩa
bởi từng ứng dụng cụ thể, các phần tử trong bảng lượng tử có giá trị từ 1 đến 255

được gọi là các bước nhảy cho các hệ số DCT. Quá trình lượng tử được coi như là
việc chia các hệ số DCT cho bước nhảy lượng tử tương ứng, kết quả này sau đó sẽ
được làm tròn xuống số nguyên gần nhất. Các hệ số năng lượng thấp này, tượng
trưng cho các sự thay đổi pixel - pixel cỡ nhỏ, có thể bị xóa mà không ảnh hưởng
đến độ phân giải của ảnh phục hồi. Tại bộ mã hoá sẽ có một bảng mã và bảng các
chỉ số nội bộ, từ đó có thể ánh xạ các tín hiệu ngõ vào để chọn được các từ mã
tương ứng một cách tốt nhất cho tập hợp các hệ số được tạo ra. Có 2 loại lượng tử
hóa chủ yếu:

2.3.1 Lượng tử vô hướng
Lượng tử từng giá trị một cách độc lập hay nói cách khác là ánh xạ một mẫu của tín
hiệu ngõ vào tạo thành một hệ số lượng tử ở ngõ ra. Đây là một quá trình tổn hao vì
khi giải lượng tử, không thể xác định chính xác giá trị gốc từ số nguyên đã được
làm tròn. Lượng tử hóa thuận theo công thức FQ = round(X/QP)
Lượng tử hóa ngược theo công thức Y = FQ*QP. Với QP là bước nhảy lượng tử. Ví
dụ quá trình giải lượng tử cho một tín hiệu ngõ vào như sau:

Y
X

QP = 1

QP = 2

QP = 3

QP = 5

-4


-4

-4

-3

-5

-3

-3

-2

-3

-5

-2

-2

-2

-3

0

-1


-1

0

0

0

0

0

0

0

0

1

1

0

0

0

2


2

2

3

0

3

3

2

3

5

4

4

4

3

5

5


5

4

6

5

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265

Trang 24


LUẬN VĂN TỐT NGHIỆP THẠC SĨ






2.3.2 Lượng tử vector
Là một quá trình biểu diễn một tập vector (mỗi vector gồm nhiều giá trị) bằng
một tập các số hữu hạn các ký hiệu ở ngõ ra, bảng mã ánh xạ sẽ có các giá trị xấp xỉ
với giá trị gốc. Vector lượng tử sẽ được lưu ở cả bộ mã hóa và bộ giải mã, quá trình
nén một bức ảnh sử dụng lượng tử vector bao gồm các bước sau.
 Phân chia bức ảnh gốc thành các phân vùng MxN pixel
 Chọn vector thích ứng nhất từ bảng mã
 Truyền chỉ số của vector thích ứng đến bộ giải mã.
 Tại bộ giải mã, ảnh cấu trúc lại sẽ xấp xỉ với phân vùng đã lựa chọn vector
lượng tử.

Và sơ đồ khối của lượng tử vector như sau:

Hình 2-7 Quá trình lượng tử vector

2.4 Quá trình mã hóa
Bộ mã hóa có chức năng loại bỏ độ dư thừa trong các ký tự ở ngõ ra lượng tử
hóa và ánh xạ các ký tự này thành các từ mã tạo thành dòng bit ở ngõ ra bằng các
loại mã hóa như: mã hóa dự đoán, mã hóa VLC, mã hóa số học nhị phân, mã hóa
theo hình dạng…

2.4.1 Mã hóa độ dài thay đổi
Kỹ thuật mã hóa độ dài thay đổi VLC dựa trên xác suất các giá trị biên độ giống
nhau trong một ảnh để lựa chọn các từ mã để mã hoá. Bộ mã hóa có độ dài thay đổi
ánh xạ các ký hiệu ngõ vào thành một chuỗi từ mã có độ dài thay đổi ở ngõ ra

Nghiên cứu hoạt động và ứng dụng của chuẩn H.265

Trang 25


×