Tải bản đầy đủ (.pdf) (82 trang)

Nén video phục vụ cho lưu trữ và truyền tải trong môi trường băng hẹp

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (28.36 MB, 82 trang )

ĐẠI HỌ C Q U Ố C G IA HÀ NỘI
T R Ư Ờ N G Đ Ạ I H Ọ C C Ô N G N G H Ệ
Nguvễn Thị Thanh Hưưng
NÉN VIDEO PHỤC vụ CHO
Lưu
TRỮ VÀ TRUYỀN TẢI
TRONG MỐI TRƯỜNG BÂNG HẸP
Ngành : Công nghệ thông tin
Mã số : 1.01.10
LUẬN VĂN THẠC sĩ
NGƯỜI HƯỚNG DẪN KHOA HỌC:
PSG.TS NGÔ QUỐC TẠO
_

_
____
_
_
___
__
_
____
——~ ■ ■■-■
j , " \ ! h C : . .
丨 卜
.

i
j xr^-NG w ĩ HOM G TIN n V iiN j
— L —




"
I
V z i o / ^ G
H à Nôi - 2006
ĐẠI HỌ C Q U Ố C G IA HÀ NỘI
T R Ư Ờ N G Đ Ạ I H Ọ C C Ô N G N G H Ệ
Nguvễn Thị Thanh Hưưng
NÉN VIDEO PHỤC vụ CHO
Lưu
TRỮ VÀ TRUYỀN TẢI
TRONG MỐI TRƯỜNG BÂNG HẸP
Ngành : Công nghệ thông tin
Mã số : 1.01.10
LUẬN VĂN THẠC sĩ
NGƯỜI HƯỚNG DẪN KHOA HỌC:
PSG.TS NGÔ QUỐC TẠO
_

_
____
_
_
___
__
_
____
——~ ■ ■■-■
j , " \ ! h C : . .

丨 卜
.

i
j xr^-NG w ĩ HOM G TIN n V iiN j
— L —



"
I
V z i o / ^ G
H à Nôi - 2006
MỤC LỤC
Mia hóa dữ liêu
___

Tâm quan trọng cua nén video

Phân loại nén dữ liệu
Vài nét về nén video
Mục đích nghiên cún của luận văn
Cấu trúc luận văn
CHUƠNC;

- kNC; QUAN VÈ NÉN VIDEO
1.1. Giới thiệu về nén ảnh
r ■*>
1.2. Một sô phương pháp nén ảnh theo kiêu lossless
1.2.1. Entropy


1.2.2. H u ffm a n

.

1.2.3. M ã hóa số học (A rith m e tic c o d ing )

1.2.4. M ã hoá lo ạ t d à i (R un Length E n cod ing )

1.2.5. Move to Front Coding

1.3. Ciói thiệu về nén video
1.3.1. Phân b iệ t giữ a nén video và nén ả n h

1.3.2. Mô hình nén video tống quát

.
1.3.3. Mô hình thời gian (Temporal model)

.
1.3.4. D ự đoản từ các ảnh ph ía trư ớ c.

1.3.5. N hững thay đỗ i theo chuyển động

CHƯƠNG 2 - CÁC

KỸ THUẬT CHÍNH ĐUỢC sử DỤNG TRONG NÉN VIDEO
2.1. Nén không gian dữ liệu
2.2. Giảm không gian mầu
2.3. Nén theo thòi gian

2.4. Nén dựa vào đối tượng cơ bản
2.5. Kỹ thiiật nén MPEG: . .
.

2.5.1. Quá trìn h g iả i nén M peg

2.5.2. Phăn cấp dữ liê u ( D ata H ie ra rch y )

2.5.3. In te r-P ic tu re Coding

2.5.4. Cấu tạo dòng V ide o

2.5.
5.
Nén theo ch "y e n động

2.6. Nén dựa vào các block
2.7. Uớc Iưọng và bù chuyển động
2.7. /.
Macrobiock

2.7 . 2. ƯVC lượng ch uyển động theo macroblock. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.7.3. Bù chuyển động theo từng macroblock

«% ■ A A ■ • Ạ 1 « A « B Ã V _ A _ -* A 1 _ _ M _*>
2.8. Chuyên đôi mien biêu diên và van đe vẽ

irọng tử
2.8.1. Thuật toán D C T áp dụng cho nén ảnh


2.8.2. Biến đ ổi D C T
:
MỤC LỤC



1
DÀNH ỈVIỤC CÁC HÌNH VẼ VÀ BẢNC ĐƯỢC sù' DỤNG 3
MỞ OÀII


— *
6
8
9
2. H. 3. Lư ợ n ỊỊ tử ho á
2.9. Kết luận
.

c HUONG 3 - MỘT SÓ CHLÀN NÉN VIDEO THÔNG DỤNG

3.1. Chuẩn nén video và ứng dụng
3.2. Giói thiệu về M PEG


.

3.3. Chuẩn MPEG-1
3.4. Chuẩn MPEG-2
3.5. Chuẩn nén video MPEG-4


3.
5. / .
G iớ i th iệ u M P E G -4

3.5.2. P ro file ,objects,too ls,và levels

3.5.3. Một sô công cụ nén video được sử dụng trong MPEG4
3.5.4. Điểu khiển tốc độ dòng mã hỏa

3.
5.5.
ủng dụng của MPEG-4 :

3.6. So sánh các định chuẩn MPEG
C HƯƠNG 4 - THỤC NGHIỆM
4.1. Chương trình thực nghiệm
4.2. Hiệu quả hoạt động
,
4.3. Những mặt hạn chê
KÉT LUẬN :.……:


U Ệ ;Ù THAM KHẢO
i 7
i 8
í 9
io
í5
. ớ

*9
; 0
^ .
4J
4 !
4 (
5 ;
5 ;
5 .
ô-
v i
2
DANH MỤC CÁC HÌNH VẼ VÀ BẢNG Được sử DỤNG
I linh 1 : Kẻi qua nén anh theo hai phương pháp: lossy và lossless 10
1 lình 2: Sơ đồ tổng quát bộ mã hóa video 19
1 linh 3: Hệ tọa độ I J ,V

: 23
íiinh 4: Mô tà quá trinh biến đồi keyframe 26
Hinh 5: Mô tả tách đối tượng 27
Hình 6: I ỉệ thống giải mâ MPEG 28
Hình 7: Phân cấp dữ liệu 29
Hình 8: Forward Prediction (dự báo một chiều) 31
1 linh 9: Bidirectional Prediction (dự báo hai chiêu) 31
Hình 10: Thứ tự các khuôn hình 32
Hình 11 : Thử tự hiển thị và thứ tự khuôn hinh trong dòng dữ liệu Video

33
Hình 12: Macroblock (4:2:0) 35
Hình 13: Ước lượng chuyền động theo macroblock

36
ỉ ỉình 14: Ánh thứ nhất 38
ỉỉình 15: Ảnh thứ 2 38
s
r

Hình 16: Phân sai sô giữa ành 1 và ảnh 2 khi không sử dụng bù chuyên động

39
Hình 17: Phần sai số giữa ảnh 1 và ảnh 2 khi áp dụng bù chuyển dộng cho khối 16 X 16••…39
Minh 18: Phần sai số giữa ảnh 1 và anh 2 khi áp dụng bù chuyền động cho khối 8 X 8

40
Hình ] 9: Phần sai số giữa ảnh 1 và ánh 2 khi áp dụng bù chuyển động cho khối 4 X 4

40
Hình 20: Quá trình mã hoá biến đồi trong MPEG
41
Mình 21 : Sơ đồ chung quá trình nén ảnh 42
Hình 22: Sơ đồ chung quá trình giải nén ảnh 42
Hình 23: Sơ đồ chuyển đối dừ liệu video dùng cho các ứng dụng 48
Hình 24: Bang so sánh kết quả thử nghiệm nén dữ liệu video cho các ứng dụng 49
Hình 25: Sơ dồ nguyên mẫu giải nén chuẩn MPEG1 (ISO/IEC 11172) 51
l iình 26: Sơ đồ nén âm thanh 51
Hình 27: Mô hinh hệ thống giải mã MPEG2 54
l ỉình 28: Mô hinh nén và giái ncn theo từng lớp của MPEG-4 56
3
Ilinh 29

Ví dụ về một cảnh trong Mí)t:c


4 57
Hình 30: VOP và v o dạng hinh chừ nhật 58
I lình 31: VOP và v o dạng hình tùy ý
58
I lình 32: Danh sách profile cua chuẩn MPHG4 59
Hinh 33: Sư đồ kết hợp các đối tượng và công cụ nén hiệu quả 61
I ỉ ình 34: Bang giá trị cùa dc-scaler phụ thuộc vào tham số Q P 62
Hinh 35: Ọuá trình nén và giải nén các P-VOP 62
Hình 36: Mô hinh dự đoán chuyển động cho B-VOP 63
Hình 37: Bicu diễn vecto bù chuyến đône cho mỗi macroblock 65
Mình 38: Sơ đồ cấu trủc gói video 66
Hình 39: Điều khiển lồi bàng Newpred 68
Hình 40: Biến đổi bitrate 70
Hình 41 : Bộ mã hoá và giải mă sử dụng bộ đệm 71
Hình 42: Bảng so sánh các định chuẩn MPEG 74
Hinh 43: Mô hình nén phim mô phòng 75
4
MỞ ĐẦU
Mã hóa dữ liệu
Thuậl ngữ mã hóa dừ liệu có ihể hiểu theo nhiều nghĩa khác nhau, tuỳ thuộc
’ t
vào mục đích mã hóa: Mã hóa đê bảo vệ an toàn dừ liệu, giảm thiêu việc dữ
liệu bị xâm hại từ các tác nhân bên ngoài có ý nghĩa bảo mật. Mã hóa để làm
giâm bớt kích thước dữ liệu phục vụ trong lưu trữ và truyền thông, còn gọi là
nén dừ liệu.

1
Khái niệm mã hóa được đê cập tới trong luận văn này được hiêu theo nghĩa
thứ hai: nén thu nhỏ dữ liệu.

*
Tâm quan trọng của nén video
f % r f
Từ lâu vân đê nén dữ liệu đã được coi là thiêt yêu trong các lĩnh vực lưu trừ
và truyền tải dữ liệu. Với từng loại dữ liệu khác nhau như số liệu, chương trình,
âin thanh, hình ảnh thì sử dụng các phương pháp nén khác nhau. Chất lượng
s r \
nén cũng phụ thuộc vào yêu câu của các thiêt bị truyên và ứng dụng.
\ '
Ngày nay, nhu câu khai thác mạng internet phục vụ truyên thông, học tập,
giải Irí ngày một tăng. Đặc biệt là các nhu câu xem phim trực tuyên, truyèn
r » / '
hình trực tuyên đòi hỏi chát lượng phục vụ ngày một tôt hơn. Tuy nhiên, tôc độ
thông lượng Internet không đù đế giải nén video, audio tronu thời gian thực
(khó khăn thường gặp là tôc độ truyên dân các frame thâp, hoặc kích thước các
frame nhỏ). Một đĩa DVD (Digital Versatile Disk) chí cỏ thể lưu trữ được vài
giây raw video có độ phân giải và tôc độ truyên frame đảm bảo chât lượng
truyền hình. Vì vậy, việc lưu trữ video trên DVD là không thực tế nếu không
tính đén các giải pháp nén audio và tín hiệu video.
Mặt khác, với kênh truyền có tần sổ nén cao, có thể truyền phát một hoặc
nhiều kênh video đã được nén với độ phân giải cao, thay vi việc gửi đi các đoạn
* t
video dơn lẻ, độ phân giải thâp…Đặc biệt với chât lượng và dung lượng đường
\ f

* •
truyên hạn chê, việc nén video ià vô cùng cân thiêt dôi với các ứng đụng
multimedia trong nhiều năm tới.
Tóm lại. nén video có hai lợi ích quan trọníỊ. Thứ nhảt, nén video tạo cơ hội
để khai thác video kỹ thuật số truvền phát trực lưvến và là môi trường lưu trữ

mà khôns cẩn hỗ trợ giải nén ('raw') video. Thứ hai, nén video đem lại hiộu
quả cao trong truyền dẫn và lưu trữ.
Phân loại nén dữ liệu
Nén dừ liệu được chia thành hai dạng cơ bản: Nén không mất thông tin
/ t r
(Lossless) và nén có mât thỏĩìR tin (Lossy). Đôi với dạng nén không mât thông
tin. ảnh được khôi phục hoàn toàn giống ảnh gốc, thường được sử dụng trong
các lĩnh vực đòi hỏi độ chính xác cao như y hoc, quân sự. Tuy nhiên các
phưưns pháp nén không mât thônạ tin cho ti sô nén thâp. điêu nảy đòi hỏi phải
có thiết bị lưu trữ và đường truyền lớn. Các thuật toán nén không mất thông tin
thường dựa vào việc thay thế một nhóm các ký tự trùng lặp bởi một nhóm các
/
ký tự đặc biệt khác ngăn hơn mà không quan tâm tới ý nghĩa của dòng bit dữ
liệu và chỉ tạo ra một bản sao của đoạn dữ liệu lặp lại này. Một số thuật toán
khác dùng những mã có độ dài khác nhau mã hóa cho các kí tự khác nhau giúp
cho các ký tự này chiếm chỗ ít hơn. Các phương pháp nén không mất thông tin
như Run-Length Encoding (RLK), Huffman Coding, Arithmetic coding,
Shannon-Fano Coding, LZ78. LZH, LZW
Đối với dạng nén có mất thông tin (lossy compresstion), dữ liệu được khôi
phục không giông hoàn toàn với dữ liệu gôc, nhưng vân dàm bảo sai sô châp
nhận dược. Ưu điểm của phương pháp này là cho tỉ số nén cao, phù hợp với các
ứng dụng lưu trữ và truyền âm thanh, ảnh tĩnh, video qua một mạng có băng
/ t '
thông hạn chê. Các phương pháp nén mât thông tin thường dựa trên nên tảng là
loại bò bớt các màu mà mắt thường không hoặc khỏ cảm nhận được, chỉ giữ lại
một số màu chủ yếu có ảnh hưởng tích cực đến khả năng cảm nhận màu cùa
mắt. Ngoài ra. ta cũng cỏ thể áp dụng phương pháp giảm độ phân giải của ảnh,
tức là giám bớt số điểm ảnh trên một inch (dots per inch - dpi). Các dạng nén
mất dừ liệu thườn a cho hệ số nén cao hơn, nó liên quan lói việc dùng các phép
biến đổi tín hiệu từ miền này sane miền khác.

Các kỹ thuật biên đôi có mât dừ liệu có thê kc dên: Differential Encoding.
Discrete Cosine 'i'ransfonn(DCT), Vector Quantization
Vài nét về nén video
Công nghệ video hiện dã trừ nên quen thuộc và dược sử dụng rộng rãi trong
\ •»
nhiêu lĩnh vực. Công nghệ này dựa trên sức mạnh của máy tính đê xử lý và
truyền tải video. Hạn chế của video là khối lượng dữ liệu rất lớn và khả năng
tương tác khó khăn.
Hiện nay để giải quvết những yếu điểm này có nhiều hướng nghiên cứu:
Tìm hiểu thuật toán nén video hiệu quả dể giảm thiểu khối lượng dữ liệu video,
nghiên cứu các định chuẩn video để có thể tối ưu hoá video. Xây dựng tương
tác trong video. Xây dựng cơ sờ dừ liệu video.
Thuậl ngữ nén video Video compression (còn gọi là video coding) là quá
trình thu gọn. cô đặc các chuồi video dạng số vào một không gian nhớ có số bit
nhỏ hơn kích thước ban đầu. “ RAW” hoặc quá trinh giải nén thông thường đòi
r r t
hỏi bitrate khá lớn (xâp xỉ 216 Mbits trong một giây đôi với Video chât lượng
truyền hinh (TV-qualit>).
Nén video bao gồm hệ thống nén (encoder) và giải nén (decoder). Bộ
encoder chuyển dữ liệu nguồn vào trong một mô hình nén trước khi truyền dẫn
y r »
hoặc lưu trữ, còn bộ decoder chuyên dữ liệu đã nén thành video sô ban đâu.
Cặp encoder/decodcr thường được biết đến với cái lên CODEC.
Mỗi tín hiệu thu nhận được có thể được nén bằng cách loại bỏ các thông tin
• •
thừa. Đôi với nén không mât thông tin (lossless compression) dựa trên mô hình
' r t
thông kê. dữ liệu sau khi được khôi phục hoàn toàn giông với dữ liệu gôc ban
đầu, phương pháp nén không mất thông tin cho hệ số nén thấp. Do vậy chỉ có
ể t

một sô ứng dụng đòi hỏi độ chính xác tiệm cận tuyệt đôi như nén video phục vụ
trône y tế, quân sự thường sir dụng phưcyng pháp này.
Phần lớn các kỹ thuật nén video dựa trên phương pháp nén mất thông tin.
Phương pháp này cho hệ số nén cao. tuv nhiên các tín hiệu thu lại sau quá trình
giái mã không hoàn toàn giống như dừ liệu ban đầu. Tuy nhiên mục dích cùa
thuật toán nén video là lìm một phươníỉ pháp nén hiệu quã ngay cá khi phái
chấp nhận các biến dạnti trong quá trình nén.
Mắt và não người không nhạy cảm với các tín hiệu tần số thấp, do vậy
y \ \ f
không phát hiện dược sự thav đôi của ảnh khi các tín hiệu thuộc miên tân sô
thấp bị loại bỏ. Thuật toán nén video loại bỏ nhừns thông tin thừa trong miền
thời gian, không gian, và miền tần số. Ảnh sau khi đã được xử lý bằng cách loại
bo thông tin thừa như trên, được đưa vào nén hằng các kỹ thuật mã hóa entropy
như mã hỏa Huffman, mã hóa số học
Nén video, ảnh đã có một bề dày nghiên cứu hơn 20 năm nay. Có rất nhiều
kỹ thuật nén và giãi nén được g iớ i thiệu và phát triển. T ro n g điều kiện hiện nay,
r s ■»
khi mà có rât nhiêu các chuân nén đan xen, cạnh tranh, và cùng được lựa chọn,
■» / r ^ »
Sự ra đời của một chuân nén và giải nén thông nhât cho phép nhiêu sản phâin
t / •»
của các nhà sản xuâl khác nhau cùng tim đưực tiêng nói chung đê hoạt động
hiệu quá là vô cùng cần thiết. Chính điều này đã dẫn đến sự ra đòi cùa các
chuẩn nén ảnh quốc tế bao gồm JPEG để nén ảnh tĩnh, các chuẩn MPEG và
H.26x phục vụ nén video.
Mục đích nghiên cứu của luận văn
r \ t \
Xuât phát từ những nhu câu thực tê trên,tôi lựa chọn dê tài “ N ái video
phục vụ cho lưu trữ và truyền tài trong môi trường băng hẹp”. Luận văn tập
trung vào nghiên cứu một sổ vấn đề như sau:

- Trình bày một cách hệ thống một số phương pháp nén ảnh cơ bản
- Tập trung nghiên cứu các kỹ thuật nén video.
- Nghiên cứu định chuẩn MPEG, đặc biệt là chuẩn nén video MPEG4.
Bao gồm việc giới thiệu một cách hệ thống quá trình mã hóa và giải mã,
khai thác các công cụ nén video của chuẩn MPEG4 đảm bảo truyền dẫn
hiệu quả trên môi trường băng hẹp, tổng hợp so sánh các định chuẩn
MPHG.
- Viếl chương trình mô phong nén video (lược thu nhận trực tiếp từ các
* y
thiỏt bị thu phô thông như Web Cam. dựa trên chuân MPEG4
8
cấu trúc luân văn
\ •
Luận vãn bao gôm hôn chương như sau.
Chương 1 : Giới thiệu tồng quan về nén video.
Chương 2: Trinh bày một cách hệ thống các kỹ thuật chính được sử dụng
trong nén video.
Chương 3: Mô tả. phân tích các ưu. nhược điểm và so sánh một số chuẩn nén
phim thông dụng.
Chương 4: Viết chương trình thực nahiệm mô phỏng bộ nén phim theo chuẩn
MPHG4, va dánh g iá .:
9
CHƯƠNG 1 - TÓNG QUAN VÈ NÉN VIDEO
1.1. Giói thiệu về nén ảnh
r \ r
Nén ánh là khoa học mã hóa một cách có hiệu quả các ảnh sô nhăm giảm sô
lượng các bít cần thiết để biểu diễn ánh. Mục đích nén ảnh là giảm chi phí trong
việc lưu trữ và truyền thông nhưng vẫn giữ dược chất lượng ảnh. Chúng ta xét
ví dụ lưu trừ và truyền dữ liệu trên đườne truyền với tốc độ 9600 bps để thấy rõ
sự cần Ihiết cùa việc nén ảnh:

và mât 3.64 phút đê truyên.
- Ảnh màu RGB cùng độ phân giải như thế cần 6.000.000 bit để lưu trữ
và 11 phút để truyền.
- Anh âm bản 24 X 36 mm được quét ở 12 micromet, khoảng 3000 X
2000 điểm ảnh, nếu sử dụng 8bit/điổm ảnh thì cần 48.000.000 bit lưu
•> %
trữ và 83 phút đê truỵên tải, ảnh âm bản màu đòi hỏi lượng lưu trữ và
thời gian truyền tái lớn gấp 3 lần.
\ t r
Nén dừ liệu ảnh bao gôm nén mât thông tin và nén không mât thông tin, lựa
* t
chọn phương pháp nén nào là tuỳ thuộc vào việc cân đôi giữa chât lượng ảnh
nén và tỳ số nén.
w>
ãnh đưưc nén bâng thdâi loàn khỏng .inh được ncn bẳng (huii lo.in mấ(
nìãt thong tin. sau khi phục h6i íhồng lin, sau khi phục hói
Hình 1 : Kết quả nén ảnh theo hai phuoìig pháp: lossy và lossless
10
Các phương pháp nén ảnh không mât thông tin bao gôm một sô phương
pháp cơ bản như: huffm an, run leng coding, arithm etic,
ĩ ^ -7 %
Các phương pháp nén ảnh có mât dừ liệu sử (lụng kỹ thuật chuycn đôi miên
biêu diên và lượng tử hóa.
1.2. Một sổ phương pháp nén ảnh theo kiếu lossless
1.2.1. E ntropy
1. Độ đo Entropy
H(A) = E p(a) log2—L
p(a)
Trong dó : - A là tập thông báo
- H(A) là độ đo Entropv của A

- p(a) là xác suất cùa thông báo a
Lượng thông tin trong mồi thông báo a được định nghĩa như sau:
i(a) = log
2
— —
p(a)
Định nghĩa đó cho thấy xác suất của thông báo a càng lớn thì lượng thông
tin trong a càng nhỏ
2. Mã tiền tố
Tập mã c được gọi là
thoà mãn tính tiền tố
nếu không tồn tại trong c một
cặp mã sao cho mã này là đoạn đầu của mã kia.
» t r r
l ập mã c được gọi là m ã tiên tô tôi tru nêu:
- c thoả mãn tính tiền tố
- Không tim được một tập mã C' sao cho độ dài trung bình cùa các từ
mã trong C' nhỏ hơn độ dài trung bình của các từ mã trong c.
3. Liên hệ giữa Entropy và độ dài từ mã
Giả sử ta có một tập thông báo A = { ai a2, ,an }
Phân phối xác suất tương ứng của A là P{pi P
2
, ,pn }
c = {C|.C2, ,cn } là tập các từ mã của A.
Độ dài từ mã của các thông báo trong tập A tương ứng là 1C| 1C2, ,lcn,
Khi đó, độ dài trung bình từ mã là:
Xét tập Ihông báo A có Entropy là 11(A) và tập các từ mã c thoả mãn tính
liền tố. / (C) là độ dài trung bình của tập các từ mã c, khi đó :
IỈ(A)< / (C)<IỈ(A)+ 1
Công thức trên chỉ ra mối quan hệ giữa entropy của nguồn với độ dài trung

binh cùa từ mã.
Tập các từ mã c được gọi là tối ưu và thoả mân tính tiền tố: nếu pi > Pj thì
suy ra ltj < lCj. Điêu này có nghĩa là nêu xác xuât của một thông báo càng lớn thì
độ dài từ mã cùa thông báo đó càng nhỏ
ỉ. 2.2. H u ffm a n
• t
Phương pháp mã hóa Huffman dựa vào mô hình thông kè xác định xác suât
f t t
xuât hiện các kí tự trong dữ liệu gôc. Trong một dày kí tự, kí tự nào có xác suât
'

* r
xuât hiện nhiêu hơn SC được thay bãne một mã nhị phân với sô bít nhở (từ mã
ngắn), và ngược lại. Như vậy với phương pháp này độ dài trung bình của từ mã
r \ > r
sẽ giảm. Xác suât được tính băng cách duyệt tuân tự từng kí tự trong tệp gôc.
Ưu điềm của phương pháp mã hoá Huffman là sinh ra tập các từ mã có độ
r s /
dài trung bình nhò nhât và thỏa mãn tính liên tô. Hay nói một cách khác,
N t r
phương pháp Huffman sinh ra tập mã tiên tô tôi ưu.
Thuật toán xây dựng tập mã Huffman:
• »w r
1. Xuât phát từ rừng cây con, môi kí tự i là một cây có gôc wi
/ , r
được đánh trọng sô pi (pi là phân phôi xác suât của kí tự ị
trong chuỗi kí tự).
2. Lặp lại các bước sau cho đến khi chỉ còn lại mộl cây duy nhất
3. Chọn hai cây có gốc trọng số nhỏ nhất (pi và pj min)
4. Cìhép hai cây con đó thành câỵ mới và đánh trọng số gốc

bằng pi + pị Không quan trọng thứ tự trái phải của cây con
1 =
+
r :i, :
+ -• +
r,J,n
/=1
12
khi ghép vảo, nhưng để thuận tiện, nếu pi
■*
pj thì đặt cây con
cỏ trọng số thấp hơn vào nhánh trái cua cây mới.
5. Đảnh trọng số cho mỗi cung của cây kết quả. cung có hướng
sang trái trọng sô băng 0, cung có hướng sang phải đánh
trọng số bằng 1, ta có kết quả là một cây nhị phân Huffman
6. Duyệt câv Huffman sẽ sinh ra bảng mã tiền tố tối ưu
Số lượne hit được sử dụng để lưu trừ mã của mồi kí tự trong phương pháp
1 r r
Huffman là log?— trong đó p là xác xuât xuât hiện của kí tự đó trong thône
p '
báo. Vi dụ, một kí tự A có phân phối xác suất trong thông báo là 1/256 , thì cần
số bit dể lưu Irữ ỉà log2256, tức là cần 8 bit. Nếu phân phối xác suất của kí tự là
/ r \
0,5 thì sô bit mã hoá cho kí tự đạt tôi ưu băng 1.
Tuy nhiên, rất dễ nhận thấy một nhược điểm của phương pháp này, dó là số
bit thực tế cần sử dụng cho mồi kí tự thường lớn hơn so với lý thuyết. Chẳng
r • r *
hạn, một ki tự có phân phôi xác suât là 1/3,theo lý thuyêt thì sô bit mã hoá là
1,6 bit. nhưng trên thực tế phài cần 2 bit để mã hoá. Nếu phân phối xác xuất là
0,999 cần 0,001443 bit, trên thực tế cần 1 bit tức là gấp gần 693 lần số lượng

r ’ r »
bit trên lý thuyêt. Và như vậy, nêu phân phôi xác xuât của kí tự càng lớn thì tỉ
lệ nén càng giảm. Điều này có nghĩa là nếu trong dừ liệu nguồn số đoạn lặp lại
càng nhiều thì phương pháp Huffman càng tỏ ra kém hiệu quả 18,1,4,3].
1.2.3. Mã hóa sô học (Arithmetic coding)
Khác với mã hoá Huffman, mã hoá số học bỏ qua việc sinh mã cho từng kí
tự, thay vào đó là thay thế một chuồi kí tự đầu vào (message) bàng một khoảng
X •)
(low, high) năm trong [0,1], các khoảng con này hoàn toàn độc lập đê đảm bảo
' * f s f s
tính tiên tô của mã dược sinh ra. Sô bit cân thiêt cho mã hoá nhỏ hơn chiêu dài
của thông báo. Việc mã hoá và giải mã băng phương pháp mã hoá sô học đêu
/ r ^ y
dựa vào phân phôi xác suât cùa môi kí tự trong thông báo cân mã hoá. Phươne
pháp mã hoá số học hoàn toàn khả thi khi thực hiện trên máy tính vói những
thanh íihi cố định.
13
Quả trình mâ hoá được mô lá như sau:
Set low to 0.0
Set hìẹh to 1.0
While there are still input symbols do
Get an input symbol
code—range = high - low
h igh - low + ran^e *high ra nge (sym bol)
low = low + ra nge */(m’

rcw ge (sym bol)
End o f while
Output low
Trong đó, cặp (low


high) đươc khởi tạo giá trị ban đầu là (0 ,1 ) [5].
Ví dụ mã hoá thông báo “BILL GATES” :
Kí tự
Phân phôi
xác suất
Khoảog con
Space 1/10
0.00-0.10
A
1/10
0.10-0.20
B
1/10
0.20-0.30
E 1/10 0.30-0.40
G
1/10 0.40 - 0.50
1
1/10
0.50 - 0.60
L 2/10 0.60-0.80
s 1/10 0.80 - 0.90
T
1/10
0.90-1.00
1'rcn thực tế, mỗi kí tự trong thông báo được nhận một khoảng trong đoạn
f ệ \
[0,1 ] tuỳ thuộc vào phân phôi xác suât của kí tự đó, nhưng không bao gôm cận
trên. Chẳng hạn kí tự “T” trong thực tế nhận được khoảng 0.90 - 0.999

Kết quả sau khi mã hóa thông báo “BILL GATES” theo phương pháp mã
hóa số học:
Kí tự Low High
' 6
21
l .
o .
o .
0.0
0.2
0.2
B
I
14
SPACE
Ci
A
r
1-;
s
0.256
0.2572
0.25720
0.257216
0.2572164
0.25721676
0.257216772
0.2572167752
0.258
0.2576

Ü.25724
0.257220
0.2572168
0.2572168
0.257216776
0.2572167756
Kct quả mã hóa thông báo "BILL GATES” thu được giá trị low _ final bằng
0.2572167752
Quá trinh giải mã thông báo '"BILL GATES'' sẽ tien hành ngược lại, bắt
đầu từ giá trị low final = 0.2572167752 nhận được và đối chiếu với các khoảng
con của mỗi kí tự. Giá trị low_final rơi vào khoảng con [0.2;0.3], do vậy kí tự
đầu tiên là “ B”,và low B = 0.2 . Biển đồi ngược lại ta được low jki tự tiếp theo
=0.572167752, nằm trong khoảng [0.5;0.6], vậy kí tự tiếp theo là “I” . lặp lại
cho đến khi gặp dấu hiệu EOF hoặc khi độ dài thông báo đích bang với thông
báo nguồn.
Thuật toán giải mã dược mô tả như sau
Get encoded num ber
Do
find sym bol whose range straddles the encoded num ber
output the s y m b o l
range = symbol low value - symbol high value
subtract symbol low value from cncoded num ber
divide encoded number by ranee
Until no more symbols
f > f
Trong thực tê, việc tính toán các cận của các khoảng mã yêu câu các sô có
độ chính xác cao, nhưng máy lính chỉ cho phép tính toán trên các thanh ghi có
kích thước hữu hạn (16 bit, 32 bit, 64 bit, 128 bit), do đó thuật toán mã hóa số
học không thể thực hiện được khi các khoảng cần cho việc mã hóa quá bé, vượt
qua khả năng của các thanh ghi. Để khắc phục vấn đề này, người ta sử dụng các

r f •
SÔ nguycn với độ dài cô định. Khi đó, mặc dù các mã sô học thu được không

,
chính xác, vì lôi làm tròn, nhưng nêu cả bộ mã hóa và giải mã cùng sử dụng
chung một cách làm tròn thì bộ giải mã sẽ sinh ra các thông báo chính xác.
15
• r r
Dôi với kỹ thuật mã hóa sô học thực hiện trcn các sô nguyên, quá trinh mã
* ^ r
hóa \ à giai mã được áp dụnẹ trong thực tc vàn đảm bảo dộ chính xác như kêt
quả ihực hiện trên số thực.
1.2.4. M ã hoá lo ạ t d ài (Run L e n g th E nco ding)
Mã hóa loạt dài sử dụng đặc điếm dư thừa về không gian, “ loạt” được dịnh
7 /
_
<
nghĩa ià dãy điêm liên tiêp có cùng giá trị. Ọuá trình mã hóa loạt dài bao gôm
hai bước: Tiền xử lv dừ liêu và mà hóa Huffman.
Trước tiên, dừ liệu nguồn được chuyển sang dạng trung gian, các kí tự liên
t t \ r
tiêp nhau được thay thê băng một cặp (giá trị đêm, ký tự đại điện). Phân tích
r \
thông kê dừ liệu trung gian và mã hóa băng phương pháp Huffman. Dữ liệu mã
hóa ít bị lặp, và lúc này phương pháp Huffman tỏ ra hiệu quả hơn.
Áp dụng trong mã hóa ảnh:
Với ảnh đen trắng: kí hiệu điểm ảnh trắng là 1,đ iểm ảnh đen là 0, giả định
điêin ánh đâu tiên của ảnh là trăng. Ví dụ với chuôi điêm ảnh
111110001111 kết quả tiền xử lý là 534. Bộ mã hóa sẽ phân tích thống kê kết
quả này và mã hóa chúng.

Với ảnh đa cấp xám: giả sử có chuồi điểm ảnh là 3,3,33,3,9,9,9,9,12,12,8,
56,
__
Kết quà thu được sau bước tiền xử lý là 5,3,4,9,2,12.8,56 Khi đó bát đầu
' ' y
xuât hiện sự nhập nhăng: Bộ giải mã không phân biệt được có 8 điêm ảnh 56

t ^ ■»
hay 8 và 56 là hai điêm ảnh. Có nhiêu phương pháp đê phân biệt sự nhập
nhàng này, chẳng hạn:
• f \ n r
- Nêu ảnh chỉ có 128 câp xám, bit đâu tiên sẽ được sử đụng đê đánh dâu
hyte hiện thời là giá trị đếm hav giá trị cùa điểm ảnh.
• r r
- Nêu ảnh có 256 câp xám, giảm đi I câp xám, và dùng chính byte chứa
giá trị 255 đổ đánh dấu byte tiếp sau là byte đếm.
Xét với ví dụ trên, ta cỏ kết quả: 255,5,3,255.4,9,255,2,12,8,56
Quá trình 2.iải mã: Quá trình giài mã RLE sẽ theo trình tự ngược lại [5.8].
/.2.5.
Move to Front Coding
Phương pháp Move to Front Coding sử dụng một danh sách các thông báo.
Danh sách này có dặc điểm là các thông báo có xác suất cao được xuất hiện ở
phần đầu danli sách, các thông báo có xác suất thấp được xuất hiện ở cuổi danh
sách. Dâv là dặc điêm quan trọng quyểt cỉịnh hiệu quả mã hóa của phương pháp
này.
Quá trinh mã hóa: Giả sử ta có chuôi ký tự cân mâ hóa s, Lập ra một danh
sách A bao gôm các ký tự trong s và sãp xêp Iheo thứ tự Alphabet. Các kí tự
trong danh sách s được mã há dựa vào thứ tự cùa chúng trong danh sách A. Ta
có thể mô tả thuật toán mã hóa Move to front như sau:
Lặp lại quá trình sau, với i tâng từ 0 đến n-1 :

1. Kiểm tra thứ tự của từng kí tự S j e s trong danh sách A, sinh
ra từ mã ĩị là thứ tự cùa Sj trong A.
2. Chuyển kí tự Sj trong A lên đầu danh sách.
Kct quá sau bước tiền xử ]ý trên là một dãy số nguycn N. Tiếp tục mã hóa
N theo phương pháp Huffman, hoặc phương pháp mã hóa số học.
Ví dụ: mã hóa chuỗi kí tự '*ssat tt hiies
•,,
Danh sách ban đâu: “
Quá trinh tiên xử lý diên ra như sau:
ỈChuỗi kí tự mã hóa
Danh sách

r-rì


_
Từ mã
Issat tt hiies.
’ v.'/a'/e'/h'/i'/s'/t'
ịSat tt hiics . ,s ’ ,_ ’’ Va
’’’。' # ' ’'。’’。
6

at tt hiies .
,s_,' ,’,.,:aVeVhVi,,_t,

6:0
|t tt hiies .
•a'/s
';

V.Ve’,'hVi'

_t’
6,0,3
!tt hiies .
’tVaVsV ,,|.'’,eVh\ĩ ịó.0,3,7
tt hiies .
• VtYaVsV.VeVhVi16,0,3,7,4
ịt lìiies.
_tv ,

,a,'’s,

_.,:e’

’h,

,i.
6,0,3,7,4,1
hi ies .
't\'
YaW.VeVhVi’ 16,0.3,7.4,1.0
ịhiies .
6,0,3,7,4,1,0,1
iies .
■hv VdV /.V eV i,
6,0,3.7Ạ1.0.1,6
ics . Ị'i?hV YtVa’,’s',V/e’ ị6.0.3,7,4,1.0,1.6,7
;es • ~ i'i VhVVtVaVs; v/ẽ7 |6,0,3,7ÃŨ0, U6,7^
'sVeViVhV '.w ,? |6A3,7,4,1,0,1.6,7,0,7,6

f V sY e'/i'W .X V Ị6,0,3,7,4,1,0,1,6,7,0,7,6,4
i 6 . 0 J , 7 . 4 , L ( U . 6 , 7 , 0 , 7 \ 6 A 7
%
Ta cũng lưu ý răng,trong phương pháp MTF, khi gặp một loạt các ký tự iặp
liên tiếp thì từ kí tự thử 2 trong loạt sẽ được thay thế bàng số 0 trong mã. Chẳng
hạn trong ví dụ trên, “ ss” được mã hóa là 6,0; “tt” được mã hóa là 1,0; hav “ii”
được mã hóa là 7,0. Đây cũng chính là một đặc điểm khá thú vị cùa phương
pháp MTF.
Quá trình giải mã: Sau khi dữ liệu được giải mã theo phương pháp Huffman
* r r •
hoặc giải mã sô học, kêt quả được một dãy sô nguyên N, các bước tiêp theo của
giải mã Move To Front như sau:
1. Duvệt từng số nguyên íij trong dãy số nguyên N
,
2. Lây ra ký tự thứ rij trong danh sách A
3. Trong danh sách A, đưa kí tự thứ rii lên đâu
Ví dụ: giải mã chuồi số nguyên 6,0,3,7,4,1,0,1,6,7,0,7,6,4,7
Chuỗi cần giải mã
Danh sách Kết quả
16,0,3,7.4,1,0,1,6,7.0,7,6,4,7
10.3,7,4,1.0,1,6,7,0,7,6,4,7
,s’ ,, ,,V,,a,

’eVhVi,;t, s
|3,7,4,1,0,K6,7,0,7,6.4,7
’sV .’V’.a’/eVhVr’V ss
7,4,1,0,1,6,7,0,7,6,4,7
'aVsV V.VeVhVi’’ĩ
ssa
4,1,0,1,6,7,0,7,6,4,7

't'/a'/s
':

':::Q\'h':i'
ssat
ịl.(U

6

7.0.7.6

4,7
ssat_
10.1,6,7,0,7,6,4,7
't
';
YaVsV.'/eVhYi'
ssat t
1.6,7,0.7,6.4.7
r :
Va’/sV.VeVhVi' ssat tt
|6,7.0.7,6.4,7
• VtVaVs',’.’,'e W ,Y ssat tt_
p

0,7,6’4,7
'h',' '’’tV C V e ',? ssat tt h
18
7.0.7.6.4.7
•hV VtVa'/s.AVeYi.

ssat tt h
•0,7,6,4.7 ị'i','h',' 'AVaVs’/.Ve1 ịssat tt hi
;7.6.4.7
1

7 7
T.'h'J Ịssat tt hii
|6,4,7
Vf.iaVs':, ssat tt hiie
p
ssat Ít hiies
ĩ
’ V s V e W ’.tVaV
ssat tt hiies
!
ssat tt biies.
1.3. Giói thiệu về nén video
1.3.1. P hân b iệt giữ a nén video và nén ảnh
về cơ bản, quá trình nén video và nén ảnh theo phương pháp nén lossy đều bao
' r 、
gôm hai quá trình chính: Thứ nhât, loại bò các thông tin dư thừa trong miên không
gian và miên tân sô. Thứ hai, sử dụng mã hỏa entropy. Tuy nhiên, trong nén
video,việc phát hiện và xử lý các thông tin thừa động giữa các frame liên tục nhờ
vecto bù chuyên động làm giảm đáng kê kích Ihước video truyên tải và lưu trữ,đây
chính là mô hình thời gian trong nén video.
1.3.2. M ô hình nén video tốn g qu á t
Hình 2: Sơ đồ tổng quát bộ mã hóa video


t



Một mô hình nén hiệu quả là mô hinh nhờ dỏ các chuôi video sô được biêu diên

f / ■»
băng sô lưựníỉ bit ít nhàt có thê với một độ chính xác cao (sai lệch so với dữ liệu
nguồn ít nhất).
Bộ mã hóa video bao gồm 3 bộ phận chính: mô hình thời gian (temporal
model), mô hinh không gian (spatial mode!) và bộ mã hóa entropy (entropy
encoder). Dừ liệu vào temporal model là chuỗi ảnh video (video sequence) chưa
được nén. Khi qua temporal model, chuỗi ảnh video này sẽ được giảm bớt thông
tin thừa bằng việc lợi dụng những điểm giốns nhau giữa các ảnh video liên tiếp,
trong MPEG-4 việc dự đoán cho một ảnh được hình thành từ một hoặc nhiều ảnh
phía trước hoặc phía sau, và bổ sung những điểm khác nhau giữa các ảnh, đây
? /
chính là dự đoán bù chuyên động (motion compensated prediction). Kêt quả xử lý
t X
tại temporal model cho ra ảnh sai sô (residual frame) là phân chênh lệch giữa ảnh
dự đoán so với ảnh hiện tại, và một tập các tham số của temporal model, chúng đặc
,
trưng cho tập các vector chuvên động (motion vector).
Ảnh sai sổ dược chuyển vào spatial model để loại bỏ phần dư thừa không gian
dựa vào việc phát hiện các điểm kế cận giống nhau. Trong MPEG-4, công việc này
chính là quá trình biến đổi DCT trên ảnh sai số, rồi lượng tử hóa chúng. Quá trình
biển dổi sẽ chuyến các tín hiệu ảnh sai số này sang một miền khác thu được các hệ
r t •> t ,
SÔ biên đôi (transform coefficient). Sau dó các hệ sô lại được lượng tử hóa băng
^ r > t » _ \
cách loại bỏ các giá trị ờ tân sô cao và giữ lại các giá trị tân sô thâp. Đâu ra của
r t t

spatial model là một tập hợp các hệ sô biên đôi lượng tử (quantised transform
coefficients).
Các tham số của temporal model đặc trưng cho các véc tơ chuyển động và các
hệ sổ biến đổi lượng tử cuối cùng được nén bằng bộ mã hóa entropy để làm giảm
bớt các dư thừa thống kê. Dữ liệu được nén thành dòng bit hoặc llle phục vụ cho
truyền dẫn hoặc lưu trữ. Dòng bit nén này bao gồm các tham số của vector chuyển
động dã được mã hóa, mã của các hệ số lượng tử và các thông tin tiêu đề (header
information).
20
\
Bộ giải mã video sẽ khôi phục lại đoạn video ban đáu từ dòng bit dã được nén.
r
•>
»
Các hệ sò và các vector chuyên động được giải mã băng bộ giải mã entropy, sau dỏ
spalial model sẽ eiải mã thu tại các ảnh sai số. Bộ mâ hỏa sử dụng các tham số
vector chuvền động, cùng với một hoặc nhiều các ảnh đâ được giải mã trước đó để
tạo ra dự đoán cho ảnh hiện tại. cuối cùna cộng phần dự đoán này với ảnh sai số
, %
» *
đê khôi phục lại video ban đâu với độ sai sô châp nhận được [2,9,11].
1.3.3. Mô hình thời gỉan (Temporal model)
Mục tiêu của mô hình thời gian là làm giảm dư thừa trong dòng dữ liệu video,
hàng việc trừ ảnh dự đoán (predicted frame) cho ảnh hiện tại (current frame) để
f F
được ảnh sai sô, và tăng độ chính xác của tiên trình dự đoán. Dòng dữ liệu nén
f t * ,
chính là các ảnh sai sô này. Anh sai sô được mã hóa và được gửi đên bộ giải mã,
bộ giải mã sẽ khôi phục lại các ảnh dừ đoán, cộng ành dự đoán với ảnh sai sổ dã
được giải mã để khôi phục lại chính ảnh hiện tại để làm ảnh tham khảo (reference

frames) cho các ảnh sau. Các ảnh dự đoán thường được xây dựng từ một hoặc
nhiều ảnh tham khảo trước và sau nó. Độ chính xác của quá trình dự đoán thường

•>
được cải thiện băng bù chuyên động giữa các ảnh tham khảo và ảnh hiện tại.
1.3.4. Dự đoán từ các ảnh phía trước.
t
Kỹ thuật dự đoán này là một trong các kỳ thuật đơn giản nhât trong temporal
model, đặc trưng của nó là sử dụng ảnh ngay phía trước làm dự đoán cho ảnh hiện
tại. Hai ảnh kê tiêp trong chuôi video sẽ được xử lý như sau: ảnh trước là dự đoán
của ảnh sau, và ảnh sai số thu được chính là kết quả cùa phép trừ ảnh trước cho
ảnh sau. Đổi với mô hình này Ihì vấn dề bất cập chính là ở chỗ còn nhiều năng
lượng ảnh tập trung trong ảnh sai số (được xác định nhờ các vùng ảnh sáng và tối),
diêu này có nghĩa là vân còn có một sô lượng krn thông tin ảnh được nén sau dự
f y •> \ t r •*
đoán. Rât nhiêu các điêm tiêm năng sai sỏ thành đôi tượng di chuyên giữa hai ảnh,
t / •>
và như vậy mô hình dự đoán tôt hơn nêu tính toán bù chuyên động.
21
•* ,,
1.3.5. Những thay đôi theo chuyên động
■» •> ,
Nguvèn nhân cùa những thay dôi giữa các ành video có thê do chuyên dộng của
các đối tượng (trong đó có chuyển động cứng cùa các đối tượng - như chuyền
y \ * 1
động của ô tô. và chuyên động mêm dèo. biên dạng - như chuyên động cánh tay.
khói thuốc ), chuyến động của camera (trọng lượng, góc nghiêng, độ thu phóng,
2ÓC quay), mờ rộng vùng quan sát (chẳng hạn cảnh quay được mở rộng theo sự di
chuyển cùa các dối tượng) và những thay đổi về độ sáng. Ngoại trừ nguyên nhân
mờ rộng vùng quan sát và những thay đỗi về độ sárm. các nguyên nhản còn lại phù

•> t ■>
hợp với những di chuyên điêm ảnh giữa các ảnh. Có thê ước lượng đường đi của
môi pixel giữa hai ảnh video kê cận, trường bao gôm ước lượng đường đi cùa pixel
được gọi là optical flow (optic flow)
Nêu trường optical flow được biêl chính xác, nó có khả năng tạo ra dự đoán
chính xác cho hầu hết các pixel của ảnh hiện tại bằng việc di chuyển mỗi pixel từ
ảnh tham khảo thông qua vector optical flow. Tuy nhiên đây không phải là phương
•t e \
pháp bù chuyên động phù hợp thực tê, vì nhiêu nguyên nhân. Việc tính toán chính
xác các vector này chi tiết cho từng pixel (các phương pháp chính xác thường dùng
các thủ tục tính toán lặp đi lặp lại cho mỗi pixel), vector optical flow của mỗi pixel
phải được gửi đến bộ giải mã, bộ giải mã căn cứ vào các vector này để tạo lại ảnh
dự đoán. Kết quả lả vẫn phải có một số lượng lớn dữ liệu cần được truyền tải.
■> ,
Chính vì lẽ đó, việc sử dụng các kỹ thuật đê tôi ưu hóa quá trình lính toán
vector chuyển động là vấn đề rất đáng quan tâm trong nén video. Một số kỹ thuật
hiệu quả như: Phân chia ảnh thành các Block căn bản dể nén, kỹ thuật tính toán bù
chuyển động, ước lượng chuyển động từ nội suy Các vấn đề này sẽ được trình
bàv trong Chương II.
22
CHƯƠNG 2 - CÁC KỸ THUẬT CHÍNH Đ ư ợ c s ử DỤNG
TRONG NEN VIDEO
2.1. Nén không gian dữ lỉệu
Nén khôns gian được mô tả như việc thay thế các vùng nhìn thấy của một

«X
khuôn hình băng một mô hình và một chuôi các bít. Ví dụ, trong một khuôn
hình có một vùng mầu xanh da trời. Nén không gian sẽ ghi nhận ràng có nhiều
đicm mâu xanh da trời tương tự mâu xanh (blue). Đê thay thê cho môi mô tả
của một chuỗi hàng ngàn điểm ảnh, nén không gian có thể ghi lại một cách

ngấn gọn các mô tả như “tất cả các điểm trong vùng là mầu xanh”. Kỹ thuật
mã hoá loạt dài (Run Leng Ecoding) thường được dùng để ghi lại các mô tả
này. RLE sử dụng rât nhiêu mã có độ đài khác nhau. Băng cách này có thê tăng
cường nén không gian.
X r ■» > r
Nhiêu loại mã nén video cho phép đặt các tham sô đê điêu chỉnh chật lượng
hình ảnh theo kích cỡ dữ liệu. Song song với việc kích cỡ dữ liệu và kích cỡ
r 1
của tệp sẽ giảm xuông, thì hình dạng và độ nét của ảnh có thê bị suy giảm

t * /
nhưng vân châp nhận được. Như vậy chât lượng hình ảnh có liên quan đên kích
■» 1
cỡ dữ liệu, thay đôi một giá trị thì các giá trị khác của video cũng được thay đôi
theo Ị10J.
2.2. Giảm không gian mầu
Đây là kỹ thuật dựa trên nguyên lý làm
giảm thông tin màu (trong không gian
YUV) và sự kém nhạy cảm của mắt người
với màu sắc, đặc biệt với việc màu sắc liên
tục thay đối trong các chuyển động.
Hình 3: Hệ tọa độ u,v
23

×