Tải bản đầy đủ (.pdf) (82 trang)

(Luận văn thạc sĩ) nén video phục vụ cho lưu trữ và truyền tải trong môi trường băng hẹp luận văn ths công nghệ thông tin 1 01 10

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (28.36 MB, 82 trang )

Đ Ạ I H Ọ C Q U Ố C G IA H À NỘI
TRƯ Ờ N G ĐẠI H Ọ C CÔNG N GH Ệ

Nguvễn T h ị T hanh Hưưng

NÉN VIDEO PHỤC vụ CHO Lưu TRỮ VÀ TRUYỀN TẢI
TRONG MỐI TRƯỜNG BÂNG HẸP

N gành : C ông nghệ thông tin
M ã s ố : 1.01.10

LUẬN VĂN THẠC s ĩ

NGƯỜI HƯỚNG DẪN KHOA HỌC:
PSG.TS NGÔ QUỐC TẠO
_
j

_____ _______ _____ ——~ ■■■-■
, " \!



I

丨卜. 丨

h C :..

j xr^-NG w
L —--------------------



ĩ HOM G TIN n




V z i o / ^ G

H à N ôi - 2006

"

i

V iiN j


Đ Ạ I H Ọ C Q U Ố C G IA H À NỘI
TRƯ Ờ N G ĐẠI H Ọ C CÔNG N GH Ệ

Nguvễn T h ị T hanh Hưưng

NÉN VIDEO PHỤC vụ CHO Lưu TRỮ VÀ TRUYỀN TẢI
TRONG MỐI TRƯỜNG BÂNG HẸP

N gành : C ông nghệ thông tin
M ã s ố : 1.01.10

LUẬN VĂN THẠC s ĩ


NGƯỜI HƯỚNG DẪN KHOA HỌC:
PSG.TS NGÔ QUỐC TẠO
_
j

_____ _______ _____ ——~ ■■■-■
, " \!



I

丨卜. 丨

h C :..

j xr^-NG w
L —--------------------

ĩ HOM G TIN n




V z i o / ^ G

H à N ôi - 2006

"


i

V iiN j


MỤC LỤC
MỤC LỤ C ....................................... ...................... ............................................................................. 1
DÀNH ỈVIỤC CÁC HÌNH VẼ VÀ BẢNC ĐƯỢC sù' DỤNG...............................................................3

MỞ ỒII
Mia hóa dữ liê u .......................................................................................
Tâm quan trọng cua nén video..............................................................
Phân loại nén dữ liệu.............................................................................
Vài nét về nén video...............................................................................
Mục đích nghiên cún của luận văn........................................................
Cấu trúc luận văn..................................................................................
............................................

...........................


............................................................................................................* ..........................................................................................................................................................

___ 、

CHUƠNC;丨
- k N C ; QUAN VÈ NÉN VID EO ..........................................................

1.1.
Giới thiệu về nén ảnh..................................................................

1.2.
Một sô phương pháp nén ảnh theo kiêu lossless.........................
1.2.1.
Entropy.................................................................................
■*>

r

1.2.2.
1.2.3.
1.2.4.

H uffm an ..............................................................................................
M ã hóa số học (A rithm e tic coding).............................................
M ã hoá lo ạ t dài (Run Length E ncoding)...................................

1.2.5.
Move to Front Coding.........................................................
1.3.
Ciói thiệu về nén video...............................................................
1.3.1.

Phân biệt giữ a nén video và nén ả nh ..........................................

1.3.2.
1.3.3.

Mơ hình nén video tống qt............................................... .
Mơ hình thời gian (Temporal model)................................... .


1.3.4.
1.3.5.

D ự đoản từ các ảnh phía trư ớc.......................................................
Những thay đỗi theo chuyển động .................................................

CHƯƠNG 2 -

2.1.
2.2.
2.3.
2.4.
2.5.

CÁC:
KỸ THUẬT CHÍNH ĐUỢC s ử DỤNG TRONG NÉN VIDEO

Nén không gian dữ liệ u ..............................................................
Giảm khơng gian mầu................................................................
Nén theo thịi gian.......................................................................
Nén dựa vào đối tượng cơ bản.....................................................
Kỹ thiiật nén MPEG:.. . . ........................................................

2.5.1.
2.5.2.
2.5.3.
2.5.4.
2.5.5.

Quá trìn h g iả i nén M peg .................................................................

Phăn cấp dữ liê u ( Data H ie ra rch y).............................................
In te r-P ictu re Coding ..........................................................................
Cấu tạo dòng Video ...........................................................................
Nén theo ch "yen động ......................................................................

2.6.
Nén dựa vào các block.................................................................
2.7.
Uớc Iưọng và bù chuyển động.....................................................
2.7. /.
Macrobiock...........................................................................
2.7 .2.
ƯVClượng ch uyển động theo macroblock.......................................
2.7.3.
Bù chuyển động theo từng macroblock.................................
2.8.
Chuyên đôi mien biêu diên và van e v
irng t.......................
ô%



2.8.1.
2.8.2.

A

A

ã


1

ô A

ôB

V

_

A _

-* A

1_

_

M _*>

Thuật toán D C T áp dụng cho nén ảnh ........................................
Biến đổi D C T .............:.......................................................................

6

8
9



5

Kết luận .................................................................................
M ỘT SÓ C H LÀ N NÉN VIDEO THƠNG DỤNG.....................

Chuẩn nén video và ứng dụng............................................
G iói thiệu về M P E G ......... ....................................................
Chuẩn MPEG-1...................................................................
Chuẩn MPEG-2...................................................................
Chuẩn nén video MPEG-4..................................................

5

í5
5
7

ơ

t x K T

ơ-

.ớ
*
9

G iớ i th iệ u M PEG -4 ................................................................
P ro file ,objects ,tools,và levels .............................................


3.5.3.
Một sô công cụ nén video được sử dụng trong MPEG4
3.5.4.
Điểu khiển tốc độ dòng mã hỏa ....................................
3.5.5.
ủng dụng của MPEG-4 : ...............................................
3.6.
So sánh các định chuẩn MPEG...........................................

5
6

THỤC N G H IỆ M .........................................................................
7

Chương trình thực nghiệm.................................................
Hiệu quả hoạt động..............................................................
Những mặt hạn chê..............................................................

;0
8

4.1.
4.2.
4.3.

r - T FS

C HƯƠNG 4 -


vi

J 3 5

3.5. /.
3.5.2.

í9

5 ;io
5;
5.

3

3.1.
3.2.
3.3.
3.4.
3.5.

i7
4!
4 (i8
5

c HUONG 3 -

22


2.9.

^.
J
4

L ư ợ nỊỊ tử h o á .......................................................................

4

2. H. 3.

,

KÉT LU Ậ N .................:.……:.....................................................................................
TÀ丨
UỆ;
Ù TH A M K H Ả O .......................................................................................

2


DANH MỤC CÁC HÌNH VẼ VÀ BẢNG Đ ư ợ c s ử DỤNG
I linh 1:

Kẻi qua nén anh theo hai phương pháp:lossy và lossless....................................................10

1lình 2:

Sơ đồ tổng quát bộ mã hóa video..........................................................................................19


1linh 3:

Hệ tọa độ IJ,
V............................................. :....................................................................... 23

íiinh 4:

Mơ tà quá trinh biến đồi keyframe....................................................................................... 26

Hinh 5:

Mô tả tách đối tượng..............................................................................................................27

Hình 6:

I ỉệ thống giải mâ M PEG ....................................................................................................... 28

Hình 7:

Phân cấp dữ liệu..................................................................................................................... 29

Hình 8:

Forward Prediction (dự báo một chiều)............................................................................... 31

1linh 9:

Bidirectional Prediction (dự báo hai chiêu).........................................................................31


Hình 10:

Thứ tự các khn h ìn h .......................................................................................................32

Hình 11 :

Thử tự hiển thị và thứ tự khn hinh trong dịngdữ liệu Video................................... 33

Hình 12:

Macroblock (4:2:0)............................................................................................................ 35

Hình 13:

Ước lượng chuyền động theo macroblock...................................................................... 36

ỉ ỉình 14:

Ánh thứ nhất........................................................................................................................38

ỉỉình 15:

Ảnh thứ 2 ............................................................................................................................ 38

Hình 16:

Phân sai sơ giữa ành

1 và ảnh 2 khi khơng sử dụng bù chun động......................... 39


Hình 17:

Phần sai số giữa ảnh

1 và ảnh 2 khi áp dụng bù chuyển dộng cho khối 16 X 16••…39

Minh 18:

Phần sai số giữa ảnh

1 và anh 2 khi áp dụng bù chuyền động cho khối 8 X 8 ........40

Hình ] 9:

Phần sai số giữa ảnh

1 và ánh 2 khi áp dụng bù chuyển động cho khối 4 X 4 ........40

Hình 20:

Quá trình mã hố biến đồi trong M PEG...................................................................... 41

Mình 21 :

Sơ đồ chung quá trình nén ảnh.......................................................................................42

Hình 22:

Sơ đồ chung quá trình giải nén ảnh............................................................................... 42


Hình 23:

Sơ đồ chuyển đối dừ liệu video dùng cho các ứng dụng.......................................... 48

Hình 24:

Bang so sánh kết quả thử nghiệm nén dữ liệu videocho các ứng dụng...................49

Hình 25:

Sơ dồ nguyên mẫu giải nén chuẩn MPEG1 (ISO/IEC 11172)..................................51

l iình 26:

Sơ đồ nén âm thanh.........................................................................................................51

Hình 27:

Mơ hinh hệ thống giải mã MPEG2.................................................................................. 54

l ỉình 28:

Mơ hinh nén và giái ncn theo từng lớp của MPEG-4.................................................... 56

s

r




3


Ilinh 29



Ví dụ về một cảnh trong Mí)t:c 4 ..................................................................................57


Hình 30:

VOP và v o dạng hinh chừ n h ật...................................................................................... 58

I lình 31:

VOP và v o dạng hình tùy ý ............................................................................................ 58

I lình 32:

Danh sách profile cua chuẩn MPHG4............................................................................. 59

Hinh 33:

Sư đồ kết hợp các đối tượng và công cụ nén hiệu quả...................................................61

I ỉ ình 34:

Bang giá trị cùa dc-scaler phụ thuộc vào tham số Q P ................................................62


Hinh 35:

Ọuá trình nén và giải nén các P-VOP............................................................................. 62

Hình 36:

Mơ hinh dự đốn chuyển động cho B-VOP................................................................. 63

Hình 37:

Bicu diễn vecto bù chuyến đơne cho mỗi macroblock...............................................65

Mình 38:

Sơ đồ cấu trủc gói video................................................................................................ 66

Hình 39:

Điều khiển lồi bàng Newpred....................................................................................... 68

Hình 40:

Biến đổi bitrate......................................................................................... .......................70

Hình 41 :

Bộ mã hố và giải mă sử dụng bộ đệm ........................................................................ 71

Hình 42:


Bảng so sánh các định chuẩn M PEG............................................................................74

Hinh 43:

Mơ hình nén phim mơ phịng......................................................................................... 75

4


M Ở ĐẦU
Mã hóa dữ liệu
Thuậl ngữ mã hóa dừ liệu có ihể hiểu theo nhiều nghĩa khác nhau, tuỳ thuộc
t



vào mục đích mã hóa: M ã hóa đê bảo vệ an toàn dừ liệu, giảm thiêu việc dữ

liệu bị xâm hại từ các tác nhân bên ngồi có ý nghĩa bảo mật. Mã hóa để làm
giâm bớt kích thước dữ liệu phục vụ trong lưu trữ và truyền thông, cịn gọi là
nén dừ liệu.


1

Khái niệm mã hóa được đê cập tới trong luận văn này được hiêu theo nghĩa
thứ hai: nén thu nhỏ dữ liệu.
*

Tâm quan trọng của nén video

%

f

r

f

Từ lâu vân đê nén dữ liệu đã được coi là thiêt yêu trong các lĩnh vực lưu trừ
và truyền tải dữ liệu. Với từng loại dữ liệu khác nhau như số liệu, chương trình,
âin thanh, hình ảnh thì sử dụng các phương pháp nén khác nhau. Chất lượng
s

r

\

nén cũng phụ thuộc vào yêu câu của các thiêt bị truyên và ứng dụng.
\

'

Ngày nay, nhu câu khai thác mạng internet phục vụ trun thơng, học tập,
giải Irí ngày một tăng. Đặc biệt là các nhu câu xem phim trực tuyên, trun
»

r

/


'

hình trực tun địi hỏi chát lượng phục vụ ngày một tôt hơn. Tuy nhiên, tôc độ
thông lượng Internet không đù đế giải nén video, audio tronu thời gian thực
(khó khăn thường gặp là tôc độ truyên dân các frame thâp, hoặc kích thước các
frame nhỏ). Một đĩa DVD (Digital Versatile Disk) chí cỏ thể lưu trữ được vài
giây raw video có độ phân giải và tơc độ trun frame đảm bảo chât lượng
truyền hình. Vì vậy, việc lưu trữ video trên DVD là khơng thực tế nếu khơng
tính đén các giải pháp nén audio và tín hiệu video.
Mặt khác, với kênh truyền có tần sổ nén cao, có thể truyền phát một hoặc
nhiều kênh video đã được nén với độ phân giải cao, thay vi việc gửi đi các đoạn
*

t

video dơn lẻ, độ phân giải thâp…Đặc biệt với chât lượng và dung lượng đường
\

f



*



truyên hạn chê, việc nén video ià vô cùng cân thiêt dôi với các ứng đụng
multimedia trong nhiều năm tới.



T ó m lại. nén video có hai lợi ích quan trọníỊ. T h ứ nhảt, nén v id e o tạo cơ hội

để khai thác video kỹ thuật số truvền phát trực lưvến và là môi trường lưu trữ
mà khôns cẩn hỗ trợ giải nén ('ra w ') video. Thứ hai, nén video đem lại hiộu
quả cao trong truyền dẫn và lưu trữ.

Phân loại nén dữ liệu
Nén dừ liệu được chia thành hai dạng cơ bản: Nén không mất thơng tin
t

/

r

(Lossless) và nén có mât thỏĩìR tin (Lossy). Đơi với dạng nén khơng mât thơng
tin. ảnh được

khơi phục hồn toàn giống ảnh gốc, thường được sử dụngtrong

các lĩnh vực địi hỏi độ chính xác cao như y hoc, qn sự. Tuy nhiên các
phưưns pháp nén không mât thônạ tin cho ti sơ nén thâp. điêu nảy địi hỏi phải
có thiết bị lưu trữ và đường truyền lớn. Các thuật tốn nén khơng mất thơng tin
thường dựa vào việc thay thế một nhóm các ký tự trùng lặp bởi một nhóm các
/

ký tự đặc biệt khác ngăn hơn mà khơng quan tâm tới ý nghĩa của dòng bit dữ
liệu và chỉ tạo ra một bản sao của đoạn dữ liệu lặp lại này. M ột số thuật toán
khác dùng những mã có độ dài khác nhau mã hóa cho các kí tự khác nhau giúp
cho các ký tự này chiếm chỗ ít hơn. Các phương pháp nén khơng mất thơng tin
như Run-Length Encoding (RLK), Huffman Coding, Arithmetic coding,

Shannon-Fano Coding, LZ78. LZH, LZW....
Đối với dạng nén có mất thơng tin ( lossy compresstion), dữ liệu được khơi
phục khơng giơng hồn tồn với dữ liệu gôc, nhưng vân dàm bảo sai sô châp
nhận dược. Ưu điểm của phương pháp này là cho tỉ số nén cao, phù hợp với các
ứng dụng lưu trữ và truyền âm thanh, ảnh tĩnh, video qua một mạng có băng
/

t

'

thơng hạn chê. Các phương pháp nén mât thơng tin thường dựa trên nên tảng là
loại bị bớt các màu mà mắt thường không hoặc khỏ cảm nhận được, chỉ giữ lại
một số màu chủ yếu có ảnh hưởng tích cực đến khả năng cảm nhận màu cùa
mắt. Ngoài ra. ta cũng cỏ thể áp dụng phương pháp giảm độ phân giải của ảnh,
tức là giám bớt số điểm ảnh trên một inch (dots per inch - dpi). Các dạng nén
mất dừ liệu thườn a cho hệ số nén cao hơn, nó liên quan lói việc dùng các phép
biến đổi tín hiệu từ miền này sane miền khác.


Các kỹ thuật biên đơi có mât dừ liệu có thê kc dên: Differential Encoding.
Discrete Cosine 'i'ransfonn(DCT), Vector Quantization...
Vài nét về nén video
Công nghệ video hiện dã trừ nên quen thuộc và dược sử dụng rộng rãi trong
\
•»
nhiêu lĩnh vực. Cơng nghệ này dựa trên sức mạnh của máy tính đê xử lý và
truyền tải video. Hạn chế của video là khối lượng dữ liệu rất lớn và khả năng
tương tác khó khăn.
Hiện nay để giải quvết những yếu điểm này có nhiều hướng nghiên cứu:

Tìm hiểu thuật tốn nén video hiệu quả dể giảm thiểu khối lượng dữ liệu video,
nghiên cứu các định chuẩn video để có thể tối ưu hoá video. Xây dựng tương
tác trong video. Xây dựng cơ sờ dừ liệu video.
Thuậl ngữ nén video Video compression (cịn gọi là video coding) là q
trình thu gọn. cơ đặc các chuồi video dạng số vào một không gian nhớ có số bit
nhỏ hơn kích thước ban đầu. “ RAW” hoặc q trinh giải nén thơng thường địi
r

r

t

hỏi bitrate khá lớn (xâp xỉ 216 Mbits trong một giây đôi với Video chât lượng
truyền hinh (TV-qualit>).
Nén video bao gồm hệ thống nén (encoder) và giải nén (decoder). Bộ
encoder chuyển dữ liệu nguồn vào trong một mơ hình nén trước khi truyền dẫn
y

r

»

hoặc lưu trữ, còn bộ decoder chuyên dữ liệu đã nén thành video sô ban đâu.
Cặp encoder/decodcr thường được biết đến với cái lên CODEC.
Mỗi tín hiệu thu nhận được có thể được nén bằng cách loại bỏ các thơng tin




thừa. Đơi với nén khơng mât thơng tin (lossless compression) dựa trên mơ hình

r

'

t

thơng kê. dữ liệu sau khi được khơi phục hồn tồn giơng với dữ liệu gơc ban
đầu, phương pháp nén không mất thông tin cho hệ số nén thấp. Do vậy chỉ có


t

một sơ ứng dụng địi hỏi độ chính xác tiệm cận tuyệt đơi như nén video phục vụ
trône y tế, quân sự... thường sir dụng phưcyng pháp này.
Phần lớn các kỹ thuật nén video dựa trên phương pháp nén mất thông tin.
Phương pháp này cho hệ số nén cao. tuv nhiên các tín hiệu thu lại sau q trình
giái mã khơng hồn tồn giống như dừ liệu ban đầu. Tuy nhiên mục dích cùa


thuật tốn nén video là lìm một phươníỉ pháp nén hiệu quã ngay cá khi phái

chấp nhận các biến dạnti trong q trình nén.
Mắt và não người khơng nhạy cảm với các tín hiệu tần số thấp, do vậy
y

\

\

f


khơng phát hiện dược sự thav đơi của ảnh khi các tín hiệu thuộc miên tân sơ
thấp bị loại bỏ. Thuật tốn nén video loại bỏ nhừns thông tin thừa trong miền
thời gian, không gian, và miền tần số. Ảnh sau khi đã được xử lý bằng cách loại
bo thông tin thừa như trên, được đưa vào nén hằng các kỹ thuật mã hóa entropy
như mã hỏa Huffman, mã hóa số học...
Nén video, ảnh đã có một bề dày nghiên cứu hơn 20 năm nay. Có rất nhiều
k ỹ th u ậ t n é n và g iã i nén đ ư ợ c g iớ i th iệ u và phát triể n . T ro n g đ iề u k iệ n h iệ n nay,
r

s

■»

khi mà có rât nhiêu các chuân nén đan xen, cạnh tranh, và cùng được lựa chọn,
■»

/

^

r

»

Sự ra đời của một chuân nén và giải nén thơng nhât cho phép nhiêu sản phâin
t

/


•»

của các nhà sản xuâl khác nhau cùng tim đưực tiêng nói chung đê hoạt động
hiệu q là vơ cùng cần thiết. Chính điều này đã dẫn đến sự ra địi cùa các
chuẩn nén ảnh quốc tế bao gồm JPEG để nén ảnh tĩnh, các chuẩn MPEG và
H.26x phục vụ nén video.

Mục đích nghiên cứu của luận văn
r

\

t

\

Xuât phát từ những nhu câu thực tê trên,tôi lựa chọn dê tài “ N á i video

phục vụ cho lưu trữ và truyền tài trong môi trường băng hẹp” . Luận văn tập
trung vào nghiên cứu một sổ vấn đề như sau:
- Trình bày một cách hệ thống một số phương pháp nén ảnh cơ bản

- Tập trung nghiên cứu các kỹ thuật nén video.
-

Nghiên cứu định chuẩn MPEG, đặc biệt là chuẩn nén video MPEG4.

Bao gồm việc giới thiệu một cách hệ thống q trình mã hóa và giải mã,
khai thác các công cụ nén video của chuẩn MPEG4 đảm bảo truyền dẫn
hiệu quả trên môi trường băng hẹp, tổng hợp so sánh các định chuẩn

MPHG.
- Vi ếl chương trình mơ phong nén video (lược thu nhận trực tiếp từ các
*

y

thiỏt bị thu phô thông như Web Cam. dựa trên chuân MPEG4

8


cấu trúc ln văn
\



Luận vãn bao gơm hơn chương như sau.
Chương 1: Giới thiệu tồng quan về nén video.
Chương 2: Trinh bày một cách hệ thống các kỹ thuật chính được sử dụng
trong nén video.
Chương 3: Mơ tả. phân tích các ưu. nhược điểm và so sánh một số chuẩn nén
phim thơng dụng.
Chương 4: Viết chương trình thực nahiệm mơ phỏng bộ nén phim theo chuẩn
MPHG4, va dánh g i á . :

9


CHƯƠNG 1 -


T Ó N G QUAN VÈ NÉN V ID E O

1.1. Giói thiệu về nén ảnh
r

\

r

Nén ánh là khoa học mã hóa một cách có hiệu quả các ảnh sơ nhăm giảm sơ
lượng các bít cần thiết để biểu diễn ánh. Mục đích nén ảnh là giảm chi phí trong
việc lưu trữ và truyền thơng nhưng vẫn giữ dược chất lượng ảnh. Chúng ta xét
ví dụ lưu trừ và truyền dữ liệu trên đườne truyền với tốc độ 9600 bps để thấy rõ
sự cần Ihiết cùa việc nén ảnh:

và mât 3.64 phút đê truyên.
- Ảnh màu RGB cùng độ phân giải như thế cần 6.000.000 bit để lưu trữ
và 11 phút để truyền.
- Anh âm bản 24

X

36 mm được quét



12 micromet, khoảng 3000

X


2000 điểm ảnh, nếu sử dụng 8bit/điổm ảnh thì cần 48.000.000 bit lưu
•>

%

trữ và 83 phút đê truỵên tải, ảnh âm bản màu đòi hỏi lượng lưu trữ và
thời gian truyền tái lớn gấp 3 lần.
\

t

r

Nén dừ liệu ảnh bao gôm nén mât thông tin và nén không mât thông tin, lựa
*

t

chọn phương pháp nén nào là tuỳ thuộc vào việc cân đôi giữa chât lượng ảnh
nén và tỳw> số nén.

ãnh đưưc nén bâng thdâi loàn khỏng
nìãt thong tin. sau khi phục h6i

Hình 1:

.inh được ncn bẳng (h u ii lo.in mấ(
íhồng lin, sau khi phục hói

Kết quả nén ảnh theo hai phuig pháp: lossy và lossless


10


Các phương pháp nén ảnh không mât thông tin bao gôm một sô phương
p h á p c ơ bản như : h u ffm a n , ru n le n g c o d in g , a rith m e tic , ...
ĩ

^

-7

%

Các phương pháp nén ảnh có mât dừ liệu sử (lụng kỹ thuật chuycn đơi miên
biêu diên và lượng tử hóa.

1.2. Một sổ phương pháp nén ảnh theo kiếu lossless
1.2.1. Entropy
1. Độ đo Entropy
p(a) log2—L
p(a)

H(A) = E
Trong dó :

- A là tập thơng báo
- H(A) là độ đo Entropv của A

- p(a) là xác suất cùa thông báo a

Lượng thông tin trong mồi thông báo a được định nghĩa như sau:
i(a) = log2 — —

p(a)

Định nghĩa đó cho thấy xác suất của thơng báo a càng lớn thì lượng thơng
tin trong a càng nhỏ
2. Mã tiền tố

Tập mã c được gọi là thồ mãn tính tiền tố nếu không tồn tại trong c một
cặp mã sao cho mã này là đoạn đầu của mã kia.
»

t

r

r

l ập mã c được gọi là m ã tiên tô tơ i tru nêu:
- c thoả mãn tính tiền tố

- Không tim được một tập mã C' sao cho độ dài trung bình cùa các từ
mã trong C' nhỏ hơn độ dài trung bình của các từ mã trong c.
3. Liên hệ giữa Entropy và độ dài từ mã
Giả sử ta có một tập thơng báo A = { ai a2, ...,an }
Phân phối xác suất tương ứng của A là P{pi P2 , ...,pn }
c = {C|.C2, ...,cn } là tập các từ mã của A.

Độ dài từ mã của các thông báo trong tập A tương ứng là 1C| 1C2, ...,lcn,

Khi đó, độ dài trung bình từ mã là:


1=

+ r :i, : + -• + r,J,n

/=1

Xét tập Ihơng báo A có Entropy là 11(A) và tập các từ mã c thoả mãn tính
liền tố. / (C) là độ dài trung bình của tập các từ mã

c, khi đó :

IỈ(A)< / (C) Công thức trên chỉ ra mối quan hệ giữa entropy của nguồn với độ dài trung
binh cùa từ mã.
Tập các từ mã c được gọi là tối ưu và thoả mân tính tiền tố: nếu pi > Pj thì
suy ra ltj < lCj. Điêu này có nghĩa là nêu xác xt của một thơng báo càng lớn thì
độ dài từ mã cùa thơng báo đó càng nhỏ

ỉ. 2.2. H uffm an


t

Phương pháp mã hóa Huffman dựa vào mơ hình thơng kè xác định xác st
f

t


t

xt hiện các kí tự trong dữ liệu gơc. Trong một dày kí tự, kí tự nào có xác st
'



r

*

xt hiện nhiêu hơn SC được thay b ãn e m ột m ã nhị phân với sơ bít nhở (từ m ã

ngắn), và ngược lại. Như vậy với phương pháp này độ dài trung bình của từ mã
r

\

r

>

sẽ giảm. Xác suât được tính băng cách duyệt tuân tự từng kí tự trong tệp gơc.

Ưu điềm của phương pháp mã hố Huffman là sinh ra tập các từ mã có độ
r

/


s

dài trung bình nhị nhât và thỏa mãn tính liên tơ. Hay nói một cách khác,
N

t

r

phương pháp Huffman sinh ra tập mã tiên tơ tơi ưu.
Thuật tốn xây dựng tập mã Huffman:


1.

r

»w

Xt phát từ rừng cây con, mơi kí tự i là một cây có gơc wi
/

,

r

được đánh trọng sơ pi (pi là phân phơi xác st của kí tự ị
trong chuỗi kí tự).
2.


Lặp lại các bước sau cho đến khi chỉ cịn lại mộl cây duy nhất

3.

Chọn hai cây có gốc trọng số nhỏ nhất (pi và pj min)

4.

Cìhép hai cây con đó thành câỵ mới và đánh trọng số gốc
bằng pi + pị Không quan trọng thứ tự trái phải của cây con

12


khi ghép vảo, nhưng để thuận tiện, nếu pi ■* pj thì đặt cây con
cỏ trọng số thấp hơn vào nhánh trái cua cây mới.
5.

Đảnh trọng số cho mỗi cung của cây kết quả. cung có hướng
sang trái trọng sơ băng 0, cung có hướng sang phải đánh
trọng số bằng 1, ta có kết quả là một cây nhị phân Huffman

6.

Duyệt câv Huffman sẽ sinh ra bảng mã tiền tố tối ưu

Số lượne hit được sử dụng để lưu trừ mã của mồi kí tự trong phương pháp
1

r


r

Huffman là log?— trong đó p là xác xt xt hiện của kí tự đó trong thơne

p

'

báo. Vidụ, một kí tự A có phân phối xác suất trong thông báo là 1/256 , thì cần
số bit dể lưu Irữ ỉà log2256, tức là cần 8 bit. Nếu phân phối xác suất của kí tự là
/

r

\

0,5 thì sơ bit m ã hố cho kí tự đạt tôi ưu băng 1.

Tuy nhiên, rất dễ nhận thấy một nhược điểm của phương pháp này, dó là số
bit thực tế cần sử dụng cho mồi kí tự thường lớn hơn so với lý thuyết. Chẳng
r



r

hạn, một ki tự có phân phơi xác st là 1/3,theo lý thut thì
1,6 bit. nhưng trên thực tế phài cần 2 bit để mã hố. Nếu phân


*

sơ bit mã hốlà
phối xác xuấtlà

0,999 cần 0,001443 bit, trên thực tế cần 1 bit tức là gấp gần 693 lần số lượng
r



r

»

bit trên lý thuyêt. Và như vậy, nêu phân phơi xác xt của kí tự càng lớn thì tỉ
lệ nén càng giảm. Điều này có nghĩa là nếu trong dừ liệu nguồn số đoạn lặp lại
càng nhiều thì phương pháp Huffman càng tỏ ra kém hiệu quả 18,1,4,3].

1.2.3. Mã hóa sơ học (Arithmetic coding)
Khác với mã hoá Huffman, mã hoá số học bỏ qua việc sinh mã cho từng kí
tự, thay vào đó là thay thế một chuồi kí tự đầu vào (message) bàng một khoảng
•)

X

(low, high) năm trong [0,1], các khoảng con này hồn tồn độc lập đê đảm bảo
'

*


f

s

f

s

tính tiên tơ của mã dược sinh ra. Sô bit cân thiêt cho mã hố nhỏ hơn chiêu dài
của thơng báo. Việc mã hố và giải mã băng phương pháp mã hố sơ học đêu
/

r

^

y

dựa vào phân phơi xác st cùa mơi kí tự trong thơng báo cân mã hố. Phươne
pháp mã hố số học hoàn toàn khả thi khi thực hiện trên máy tính vói những
thanh íihi cố định.

13


Quả trình mâ hố được mơ lá như sau:
Set low to 0.0
Set hìẹh to 1.0
While there are still input symbols do
Get an input symbol

code—range

=

high

-

low

high - low + ra n ^e *high range (sym bol)
low = low + range */(m’一rcw ge (sym bol)

End o f while
Output low
Trong đó, cặp (low ,
high) đươc khởi tạo giá trị ban đầu là (0,1) [5].
Ví dụ mã hố thơng báo “ BILL GATES” :
Kí tự

Phân phôi
xác suất

Khoảog con

Space
A
B
E
G

1
L
s
T

1/10
1/10
1/10
1/10
1/10
1/10
2/10
1/10
1/10

0.00-0.10
0.10-0.20
0.20-0.30
0.30-0.40
0.40 - 0.50
0.50 - 0.60
0.60-0.80
0.80 - 0.90
0.90-1.00

1'rcn thực tế, mỗi kí tự trong thơng báo được nhận một khoảng trong đoạn
f




\

[0,1 ] tuỳ thuộc vào phân phôi xác st của kí tự đó, nhưng khơng bao gơm cận
trên. Chẳng hạn kí tự “ T” trong thực tế nhận được khoảng 0.90 - 0.999...
Kết quả sau khi mã hóa thơng báo “ BILL GATES” theo phương pháp mã
hóa số học:
Kí tự

2
1
'6
.

0.2

l.
o
.
o
.

3

0.0
0.2

High
?
0


B
I

Low

14


0.256
0.258
0.2572
0.2576
Ü.25724
SPACE
0.25720
Ci
0.257216
0.257220
0.2572164
A
0.2572168
r
0.25721676
0.2572168
0.257216776
1-;
0.257216772
0.2572167752
0.2572167756
s

Kct quả mã hóa thơng báo "B IL L GATES” thu được giá trị low _ final bằng
0.2572167752
Quá trinh giải mã thông báo '"BILL GATES'' sẽ tien hành ngược lại, bắt

đầu từ giá trị low final = 0.2572167752 nhận được và đối chiếu với các khoảng
con của mỗi kí tự. Giá trị low_final rơi vào khoảng con [0.2;0.3], do vậy kí tự
đầu tiên là “ B” ,và low B = 0.2 . Biển đồi ngược lại ta được lo w jk i tự tiếp theo

=0.572167752, nằm trong khoảng [0.5;0.6], vậy kí tự tiếp theo là “ I” . lặp lại
cho đến khi gặp dấu hiệu EOF hoặc khi độ dài thơng báo đích bang với thơng
báo nguồn.
Thuật tốn giải mã dược mô tả như sau
Get encoded num ber
Do
find sym bol whose range straddles the encoded num ber
output the s y m b o l

range = symbol low value - symbol high value
subtract symbol low value from cncoded n u m b e r
divide encoded number by ranee
Until no more symbols
f

>

f

Trong thực tê, việc tính tốn các cận của các khoảng mã u câu các sơ có
độ chính xác cao, nhưng máy lính chỉ cho phép tính tốn trên các thanh ghi có


kích thước hữu hạn (16 bit, 32 bit, 64 bit, 128 bit), do đó thuật tốn mã hóa số
học không thể thực hiện được khi các khoảng cần cho việc mã hóa quá bé, vượt
qua khả năng của các thanh ghi. Để khắc phục vấn đề này, người ta sử dụng các
r

f



SƠ nguycn với độ dài cơ định. Khi đó, mặc dù các mã sơ học thu được khơng


,

chính xác, vì lơi làm trịn, nhưng nêu cả bộ mã hóa và giải mã cùng sử dụng

chung một cách làm trịn thì bộ giải mã sẽ sinh ra các thơng báo chính xác.

15




r

r

Dơi với kỹ thuật mã hóa sơ học thực hiện trcn các sơ ngun, q trinh mã
*


r

^

hóa \ à giai mã được áp dụnẹ trong thực tc vàn đảm bảo dộ chính xác như kêt
quả ihực hiện trên số thực.
1.2.4. M ã hố loạt dài (Run Length Encoding)
Mã hóa loạt dài sử dụng đặc điếm dư thừa về không gian, “ loạt” được dịnh
7

/

_

<

nghĩa ià dãy điêm liên tiêp có cùng giá trị. Ọ trình mã hóa loạt dài bao gơm
hai bước: Tiền xử lv dừ liêu và mà hóa Huffman.

Trước tiên, dừ liệu nguồn được chuyển sang dạng trung gian, các kí tự liên
t

t

\

r

tiêp nhau được thay thê băng một cặp (giá trị đêm, ký tự đại điện). Phân tích
r


\

thơng kê dừ liệu trung gian và mã hóa băng phương pháp Huffman. Dữ liệu mã
hóa ít bị lặp, và lúc này phương pháp Huffman tỏ ra hiệu quả hơn.
Áp dụng trong mã hóa ảnh:
Với ảnh đen trắng: kí hiệu điểm ảnh trắng là 1,điểm ảnh đen là 0, giả định
điêin ánh đâu tiên của ảnh là trăng. Ví dụ với

chuôi điêm ảnh

111110001111 ....kết quả tiền xử lý là 534. Bộ mã hóa sẽ phân tích thống kê kết
quả này và mã hóa chúng.
Với ảnh đa cấp xám: giả sử có chuồi điểm ảnh là 3,3,33,3,9,9,9,9,12,12,8,
56, __
Kết quà thu được sau bước tiền xử lý là 5,3,4,9,2,12.8,56....Khi đó bát đầu
'

y

'

xuât hiện sự nhập nhăng: Bộ giải mã không phân biệt được có 8 điêm ảnh 56,
t

^

■»

hay 8 và 56 là hai điêm ảnh. Có nhiêu phương pháp đê phân biệt sự nhập

nhàng này, chẳng hạn:


f

\

n

- Nêu ảnh chỉ có 128 câp xám, bit đâu tiên sẽ được sử đụng đê đánh dâu
hyte hiện thời là giá trị đếm hav giá trị cùa điểm ảnh.


r

r

- Nêu ảnh có 256 câp xám, giảm đi I câp xám, và dùng chính byte chứa
giá trị 255 đổ đánh dấu byte tiếp sau là byte đếm.
Xét với ví dụ trên, ta cỏ kết quả: 255,5,3,255.4,9,255,2,12,8,56....

Quá trình 2.iải mã: Quá trình giài mã RLE sẽ theo trình tự ngược lại [5.8].

r


/.2.5. Move to Front Coding
Phương pháp Move to Front Coding sử dụng một danh sách các thông báo.
Danh sách này có dặc điểm là các thơng báo có xác suất cao được xuất hiện ở
phần đầu danli sách, các thông báo có xác suất thấp được xuất hiện ở cuổi danh

sách. Dâv là dặc điêm quan trọng quyểt cỉịnh hiệu quả mã hóa của phương pháp
này.

Quá trinh mã hóa: Giả sử ta có chi ký tự cân mâ hóa s, Lập ra một danh
sách A bao gôm các ký tự trong

s và sãp xêp Iheo thứ tự Alphabet. Các kí tự

trong danh sách s được mã há dựa vào thứ tự cùa chúng trong danh sách A. Ta
có thể mơ tả thuật tốn mã hóa Move to front như sau:
Lặp lại quá trình sau, với i tâng từ 0 đến n-1 :

1.

Kiểm tra thứ tự của từng kí tự

S j

e s trong danh sách A, sinh

ra từ mã ĩị là thứ tự cùa Sj trong A.
2.

Chuyển kí tự Sj trong A lên đầu danh sách.

Kct quá sau bước tiền xử ]ý trên là một dãy số nguycn N. Tiếp tục mã hóa
N theo phương pháp Huffman, hoặc phương pháp mã hóa số học.
Ví dụ: mã hóa chuỗi kí tự '*ssat tt hiies






Danh sách ban đâu: “

Quá trinh tiên xử lý diên ra như sau:
ỈChuỗi kí tự mã hóa

Danh sách

----------------------------------r-rì , _
Từ mã

Issat tt hiies.

’ v.'/a'/e'/h'/i'/s'/t'

ịSat tt hiics .

,s’,
_’’..Va’



'#'’
'。


。6



at tt

6:0
,s_,
' ,’,.,:aVeVhVi,,_t, 「

hiies .

|t tt hiies .

•a'/s';V.Ve’,'hVi',
_t’ 6,0,3

!tt hiies .

’tVaVsV ,,|.'’,eVh\ĩ ịó.0,3,7

tt hiies .

• VtYaVsV.VeVhVi16,0 ,3 ,7,4

ịt lìiies.

_tv ,,
,a,'’s,,
_.,:e’,
’h,,
,i. 6,0,3,7,4,1
't\' YaW.VeVhVi’ 16,0.3 ,7 .4, 1.0


hi ies .
ịhiies .
iies .

6,0,3,7,4,1,0,1
■hv V d V /.V e V i, 6,0,3.7Ạ1.0.1,6


ics .

Ị'i?hV YtVa’,’s',
V/e’ ị6.0.3,7,4,1.0,1.6,7


es •

~ i'i VhVVtVaVs;
v/ẽ 7|6,0,3,7ÃŨ0, U 6,7^

'sVeViVhV ' . w , ? |6A3,7,4,1,0,1.6,7,0,7,6
f V s Y e '/i'W .X V Ị6,0,3,7,4,1,0,1,6,7,0,7,6,4
i6 . 0 J , 7 . 4 , L ( U

. 6 , 7 , 0 , 7 \ 6 A

7

%


Ta cũng lưu ý răng,trong phương pháp MTF, khi gặp một loạt các ký tự iặp
liên tiếp thì từ kí tự thử 2 trong loạt sẽ được thay thế bàng số 0 trong mã. Chẳng
hạn trong ví dụ trên, “ ss” được mã hóa là 6,0; “ tt” được mã hóa là 1,0; hav “ ii”
được mã hóa là 7,0. Đây cũng chính là một đặc điểm khá thú vị cùa phương
pháp MTF.
Quá trình giải mã: Sau khi dữ liệu được giải mã theo phương pháp Huffman
*

r

r



hoặc giải mã sơ học, kêt quả được một dãy sô nguyên N, các bước tiêp theo của
giải mã Move To Front như sau:
1.

Duvệt từng số nguyên íij trong dãy số nguyên N
,

2.

Lây ra ký tự thứ rij trong danh sách A

3.

Trong danh sách A, đưa kí tự thứ rii lên đâu

Ví dụ: giải


mã chuồi số nguyên 6,0,3,7,4,1,0,1,6,7,0,7,6,4,7

Chuỗi cần giải mã

Danh sách

Kết quả

16,0,3,7.4,1,0,1,6,7.0,7,6,4,7
10.3,7,4,1.0,1,6,7,0,7,6,4,7

,s’,
, ,,V,,a, ’eVhVi,;t, s

|3,7,4,1,0,K6,7,0,7,6.4,7

’sV .’V’.a’/eVhVr’V ss

7,4,1,0,1,6,7,0,7,6,4,7

'aVsV V.VeVhVi’’ĩ ssa

4,1,0,1,6,7,0,7,6,4,7

't'/a'/s ':':::Q\'h':i' ssat

ịl.(U ,
6,
7.0.7.6,

4,
7



ssat_

10.1,6,7,0,7,6,4,7

't';YaVsV.'/eVhYi' ssat t

1.6,7,0.7,6.4.7

r :Va’/sV.VeVhVi' ssat tt

|6,7.0.7,6.4,7

• VtVaVs',’.’,'e W ,
Y ssat tt_

p,
0,7,6’4,7

'h',' '’’t V C V e ', ? ssat tt h

18


7.0.7.6.4.7


•hV VtVa'/s.AVeYi. ssat tt h

•0,7,6,4.7

ị'i','h',' 'AVaVs’/.V e1ịssat tt hi

;7.6.4.7
1 77
|6,4,7

T.'h'J



Ịssat tt hii
V f.iaV s':, ssat tt hiie
ssat Ít hiies

p

’ V s V e W ’.tVaV.. ssat tt hiies

ĩ
!

ssat tt biies.

1.3. Giói thiệu về nén video
1.3.1. Phân biệt giữ a nén video và nén ảnh


về cơ bản, quá trình nén video và nén ảnh theo phương pháp nén lossy đều bao
'

r



gôm hai q trình chính: Thứ nhât, loại bị các thơng tin dư thừa trong miên không
gian và miên tân sô. Thứ hai, sử dụng mã hỏa entropy. Tuy nhiên, trong nén
video,việc phát hiện và xử lý các thông tin thừa động giữa các frame liên tục nhờ
vecto bù chuyên động làm giảm đáng kê kích Ihước video truyên tải và lưu trữ,đây
chính là mơ hình thời gian trong nén video.
1.3.2. M ơ hình nén video tống qt

Hình 2:

Sơ đồ tổng quát bộ mã hóa video


t





Một mơ hình nén hiệu quả là mơ hinh nhờ dỏ các chi video sơ được biêu diên


f


/

■»

băng sơ lưựníỉ bit ít nhàt có thê với một độ chính xác cao (sai lệch so với dữ liệu
nguồn ít nhất).
Bộ mã hóa video bao gồm 3 bộ phận chính: mơ hình thời gian (temporal
model), mô hinh không gian (spatial mode!) và bộ mã hóa entropy (entropy
encoder). Dừ liệu vào temporal model là chuỗi ảnh video (video sequence) chưa
được nén. Khi qua temporal model, chuỗi ảnh video này sẽ được giảm bớt thông
tin thừa bằng việc lợi dụng những điểm giốns nhau giữa các ảnh video liên tiếp,
trong MPEG-4 việc dự đoán cho một ảnh được hình thành từ một hoặc nhiều ảnh
phía trước hoặc phía sau, và bổ sung những điểm khác nhau giữa các ảnh, đây
?

/

chính là dự đốn bù chuyên động (motion compensated prediction). Kêt quả xử lý
X

t

tại temporal model cho ra ảnh sai sô (residual frame) là phân chênh lệch giữa ảnh
dự đoán so với ảnh hiện tại, và một tập các tham số của temporal model, chúng đặc
,

trưng cho tập các vector chuvên động (motion vector).
Ảnh sai sổ dược chuyển vào spatial model để loại bỏ phần dư thừa không gian
dựa vào việc phát hiện các điểm kế cận giống nhau. Trong MPEG-4, cơng việc này
chính là quá trình biến đổi DCT trên ảnh sai số, rồi lượng tử hóa chúng. Q trình

biển dổi sẽ chuyến các tín hiệu ảnh sai số này sang một miền khác thu được các hệ
r

t

•>



t

SƠ biên đơi (transform coefficient). Sau dó các hệ sơ lại được lượng tử hóa băng
^

r

>

t

»

_

\

cách loại bỏ các giá trị ờ tân sô cao và giữ lại các giá trị tân sô thâp. Đâu ra của
r

t


t

spatial model là một tập hợp các hệ sô biên đôi lượng tử (quantised transform
coefficients).
Các tham số của temporal model đặc trưng cho các véc tơ chuyển động và các
hệ sổ biến đổi lượng tử cuối cùng được nén bằng bộ mã hóa entropy để làm giảm
bớt các dư thừa thống kê. Dữ liệu được nén thành dòng bit hoặc llle phục vụ cho
truyền dẫn hoặc lưu trữ. Dòng bit nén này bao gồm các tham số của vector chuyển
động dã được mã hóa, mã của các hệ số lượng tử và các thông tin tiêu đề (header
information).

20


\

Bộ giải mã video sẽ khôi phục lại đoạn video ban đáu từ dịng bit dã được nén.
r
•>
»
Các hệ sị và các vector chuyên động được giải mã băng bộ giải mã entropy, sau dỏ
spalial model sẽ eiải mã thu tại các ảnh sai số. Bộ mâ hỏa sử dụng các tham số
vector chuvền động, cùng với một hoặc nhiều các ảnh đâ được giải mã trước đó để
tạo ra dự đoán cho ảnh hiện tại. cuối cùna cộng phần dự đốn này với ảnh sai số
,
%
» *
đê khơi phụclại video ban đâu với độ sai sô châp nhận được [2,9,11].


1.3.3. Mơ hình thời gỉan (Temporal model)
Mục tiêu của mơ hình thời gian là làm giảm dư thừa trong dịng dữ liệu video,
hàng việc trừ ảnh dự đoán (predicted frame) cho ảnh hiện tại (current frame) để
f

F

được ảnh sai sô, và tăng độ chính xác của tiên trình dự đốn. Dịng dữ liệu nén
f

t

*

,

chính là các ảnh sai sơ này. Anh sai sơ được mã hóa và được gửi đên bộ giải mã,
bộ giải mã sẽ khôi phục lại các ảnh dừ đoán, cộng ành dự đoán với ảnh sai sổ dã
được giải mã để khơi phục lại chính ảnh hiện tại để làm ảnh tham khảo (reference
frames) cho các ảnh sau. Các ảnh dự đoán thường được xây dựng từ một hoặc
nhiều ảnh tham khảo trước và sau nó. Độ chính xác của q trình dự đốn thường


•>

được cải thiện băng bù chuyên độnggiữa các ảnh tham khảo và ảnh hiện tại.

1.3.4. Dự đốn từ các ảnh phía trước.
t


Kỹ thuật dự đoán này là một trong các kỳ thuật đơn giản nhât trong temporal
model, đặc trưng của nó là sử dụng ảnh ngay phía trước làm dự đốn cho ảnh hiện
tại. Hai ảnh kê tiêp trong chuôi video sẽ được xử lý như sau: ảnh trước là dự đoán
của ảnh sau, và ảnh sai số thu được chính là kết quả cùa phép trừ ảnh trước cho
ảnh sau. Đổi với mơ hình này Ihì vấn dề bất cập chính là ở chỗ còn nhiều năng
lượng ảnh tập trung trong ảnh sai số (được xác định nhờ các vùng ảnh sáng và tối),
diêu này có nghĩa là vân cịn có một sô lượng krn thông tin ảnh được nén sau dự
f

y

•>

\

t

•*

r

đốn. Rât nhiêu các điêm tiêm năng sai sỏ thành đơi tượng di chun giữa hai ảnh,
t

/

•>

và như vậy mơ hình dự đốn tơt hơn nêu tính tốn bù chun động.


21


•*

,,

1.3.5. Những thay đôi theo chuyên động
•>

■»

,

Nguvèn nhân cùa những thay dơi giữa các ành video có thê do chun dộng của
các đối tượng (trong đó có chuyển động cứng cùa các đối tượng - như chuyền
y

\

*

1

động của ô tô. và chuyên động mêm dèo. biên dạng - như chuyên động cánh tay.
khói thuốc...), chuyến động của camera (trọng lượng, góc nghiêng, độ thu phóng,
2ĨC

quay), mờ rộng vùng quan sát (chẳng hạn cảnh quay được mở rộng theo sự di


chuyển cùa các dối tượng) và những thay đổi về độ sáng. Ngoại trừ nguyên nhân
mờ rộng vùng quan sát và những thay đỗi về độ sárm. các nguyên nhản còn lại phù
•>

t

■>

hợp với những di chuyên điêm ảnh giữa các ảnh. Có thê ước lượng đường đi của
mơi pixel giữa hai ảnh video kê cận, trường bao gôm ước lượng đường đi cùa pixel
được gọi là optical flow (optic flow)
Nêu trường optical flow được biêl chính xác, nó có khả năng tạo ra dự đốn
chính xác cho hầu hết các pixel của ảnh hiện tại bằng việc di chuyển mỗi pixel từ
ảnh tham khảo thông qua vector optical flow. Tuy nhiên đây khơng phải là phương
•t

e

\

pháp bù chun động phù hợp thực tê, vì nhiêu ngun nhân. Việc tính tốn chính
xác các vector này chi tiết cho từng pixel (các phương pháp chính xác thường dùng
các thủ tục tính tốn lặp đi lặp lại cho mỗi pixel), vector optical flow của mỗi pixel
phải được gửi đến bộ giải mã, bộ giải mã căn cứ vào các vector này để tạo lại ảnh
dự đốn. Kết quả lả vẫn phải có một số lượng lớn dữ liệu cần được truyền tải.
■>

,

Chính vì lẽ đó, việc sử dụng các kỹ thuật đê tơi ưu hóa q trình lính tốn

vector chuyển động là vấn đề rất đáng quan tâm trong nén video. Một số kỹ thuật
hiệu quả như: Phân chia ảnh thành các Block căn bản dể nén, kỹ thuật tính tốn bù
chuyển động, ước lượng chuyển động từ nội suy...Các vấn đề này sẽ được trình
bàv trong Chương II.

22


C Á C KỸ T H U Ậ T C H ÍN H Đ ư ợ c s ử DỤNG
T R O N G NEN V ID E O

CHƯƠNG 2 -

2.1. Nén không gian dữ lỉệu
Nén khôns gian được mô tả như việc thay thế các vùng nhìn thấy của một


«X

khn hình băng một mơ hình và một chi các bít. Ví dụ, trong một khn
hình có một vùng mầu xanh da trời. Nén không gian sẽ ghi nhận ràng có nhiều
đicm mâu xanh da trời tương tự mâu xanh (blue). Đê thay thê cho môi mô tả
của một chuỗi hàng ngàn điểm ảnh, nén khơng gian có thể ghi lại một cách
ngấn gọn các mô tả như “ tất cả các điểm trong vùng là mầu xanh” . Kỹ thuật
mã hoá loạt dài (Run Leng Ecoding) thường được dùng để ghi lại các mô tả
này. RLE sử dụng rât nhiêu mã có độ đài khác nhau. Băng cách này có thê tăng
cường nén khơng gian.
X

r


■»

r

>

Nhiêu loại mã nén video cho phép đặt các tham sô đê điêu chỉnh chật lượng
hình ảnh theo kích cỡ dữ liệu. Song song với việc kích cỡ dữ liệu và kích cỡ
1

r

của tệp sẽ giảm xng, thì hình dạng và độ nét của ảnh có thê bị suy giảm


t

*

/

nhưng vân châp nhận được. Như vậy chât lượng hình ảnh có liên quan đên kích
1

■»

cỡ dữ liệu, thay đơi một giá trị thì các giá trị khác của video cũng được thay đôi
theo Ị10J.


2.2. Giảm không gian mầu
Đây là kỹ thuật dựa trên nguyên lý làm
giảm thông tin màu (trong không gian
YUV) và sự kém nhạy cảm của mắt người
với màu sắc, đặc biệt với việc màu sắc liên
tục thay đối trong các chuyển động.

Hình 3:

Hệ tọa độ u,v

23


×