Tải bản đầy đủ (.pdf) (48 trang)

Phương pháp mã hóa video theo đối tượng ứng dụng trong các hệ thống thông tin video

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (562 KB, 48 trang )

Phương pháp mã hóa video theo đối tượng ứng dụng trong các hệ thống
thơng tin video nén

MỤC LỤC

Chương 1 : Tổng quan về mã hóa video
1.1. Mục đích nghiên cứu video nén theo hướng đối tượng
1.2. Tổng quan về các chuẩn nén
1.3. Kĩ thuật mã hóa video nén theo hướng đối tượng MPEG-4 và ưu điểm
Chương 2: Cơng nghệ mã hóa video trong MPEG-4
2.1. Mã hố hình dạng ngồi (Shape Coder)
2.1.1. Biến đổi Cosin rời rạc ( DCT)
2.1.2. Lượng tử hố
2.1.3. Mã hóa
2.2. Dự đốn và tổng hợp động
2.2.1. Ước lượng chuyển động
2.2.2. Kỹ thuật đệm
2.2.3. Kỹ thuật chuyển động cơ bản
2.2.3.1. Kỹ thuật thay đổi từng khối thích ứng với cấu trúc đa cạnh của VOP
2.2.3.2. Ước lượng chuyển động của điểm ảnh
2.2.3.3. Chế độ INTRA / INTER
2.2.3.4. Tìm kiếm nửa điểm ảnh
2.2.3.5. Dự đốn MV
2.2.3.6. Chế độ vector chuyển động khơng giới hạn
2.2.3.7. Chế độ nâng cao chất lượng dự đốn
2.3. Mã hóa cấu trúc
2.4. Giải mã MPEG-4 VOP
2.5. Mã hóa theo lớp video
2.6. Đánh giá hiệu quả
2.7. Điều khiển tốc độ
Chương 3: Ứng dụng


THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN


3.1. IP TV
3.2. Video yêu cầu
3.3. Mobile TV
3.4. Truyền hình hội nghị
Kết luận
Danh mục tài liệu tham khảo
Danh mục chữ viết tắt



THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN


Li núi u

Vi s phỏt trin ca cụng ngh thụng tin, v cựng vi ú l s phỏt trin
ngy cng mnh m ca cỏc ng dng truyn thụng a phng tin , ũi hi con
ngi khụng ngng tỡm tũi sỏng to ỏp ng kp vi xu th phỏt trin y. Nh
vo s phỏt trin ca cỏc ng dng truyn thụng a phng tin m chỳng ta cú
th a õm thanh, hỡnh nh, hay cỏc on video i xa mt cỏch nhanh chúng v
thun tin. Song vi vic truyn ti mt on video cú dung lng ln i xa gp
khỏ nhiu khú khn bi kh nng cú hn ca kờnh dn.Vỡ vy cỏc nh sn xut
ó ỏp dng mt s k thut nộn giỳp ti u húa cỏc on video trờn, lm gim
dung lng phi truyn i m cht lng hỡnh nh tng ng vi hỡnh nh
gc. Mt trong cỏc k thut nộn c s dng rng rói ú l k thut nộn chuyn
ng m tiờu biu l chun nộn MPEG. Qua quỏ trỡnh nghiờn cu cỏc chuyờn
gia ó cho ra i chun nộn MPEG-4 vi nhiu tớnh nng u vit v nú ó nhanh

chúng c ng dng rng rói trong h thng thụng tin video nộn. MPEG-4 s
dng mt phng phỏp mó húa video theo tng i tng thay vỡ mó húa ton
b c mt on video, vỡ vy dung lng video c gim i ỏng k m cht
lng li khụng cú nhiu thay i .
Vỡ vy chỳng tụi ó chn ti nghiờn cu Phng phỏp mó húa
video theo i tng ng dng trong cỏc h thng thụng tin video nộn i
sõu tỡm hiu k thut mó húa trong chun nộn MPEG-4 ny.
ti nghiờn cu c chia lm 3 phn
Chng 1: tng quan v video
Chng 2: cụng ngh mó húa video trong MPEG-4
Chng 3: cỏc ng dng
Chỳng tụi xin gi li cm n ti thy giỏo ó hng dn v giỳp
chỳng tụi thc hin ti ny. V chỳng tụi cng xin gi li cm n ti thy cụ
giỏo trong b mụn K Thut Thụng Tin v cỏc bn cựng lp ó giỳp chỳng
THệ VIEN ẹIEN Tệ TRệẽC TUYEN


tơi trong việc tìm kiếm thơng tin, tài liệu và các giáo trình tham khảo trong suốt
q trình thực hiện đề tài này.
Chúng tơi rất mong nhận được ý kiến đóng góp của thầy cơ giáo và các
bạn sinh viên để cho đề tài nghiên cứu được hồn thiện hơn


Chương 1 : Tổng quan về mã hóa video

1.1 Mục đích nghiên cứu video nén theo hướng đối tượng
Tại sao chúng ta cần phải nén video ?
Để xem được 1 đoạn video có chất lượng cao mà dung lượng khơng q lớn
là 1 điều rất quan trọng và cần thiết. Đó chính là lí do cần phải sử dụng 1 cơng
cụ nén video nhằm giảm tối đa dung lượng của đoạn video mà chất lượng vẫn

đáp ứng được u cầu.
Nhu cầu truyền phát các dịch vụ Multimedia mới trên hạ tầng kỹ thuật mạng
Internet đã làm nảy sinh các u cầu chức năng khơng có trong các chuẩn
MPEG-1, MPEG-2,H.26X và các chuẩn nén video trước đó. Sự xuất hiện của
chuẩn MPEG-4 (10/1998) và H264 đã tạo ra một phương thức thiết lập và tương
tác mới với truyền thơng nghe nhìn trên mạng internet, tạo ra một phương thức
sản xuất, cung cấp và ứng dụng mới các nội dung video trên cơ sở nội dung và
hướng đối tượng (content/object-based). Đây chính là một cơng nghệ trình diễn
truyền thơng đa phương tiện phức hợp, có khả năng truyền thơng trong các mơi
trường băng thơng rất khác nhau nhờ kết hợp tốt 3 mơi trường: Truyền hình số,
đồ hoạ tương tác và World Wide Web
1.2 Tổng quan về các chuẩn nén
Hiệp hội viễn thơng quốc tế (ITU) và tổ chức tiêu chuẩn quốc tế/ Uỷ ban kỹ
thuật điện tử quốc tế (ISO/IEC) là hai tổ chức phát triển các tiêu chuẩn mã hố
Video. Theo ITU-T, các tiêu chuẩn mã hố Video được coi là các khuyến nghị
THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN


gi tt l chun H.26x (H.261, H.262, H.263 v H.264). Vi tiờu chun
ISO/IEC, chỳng c gi l MPEG-x (nh MPEG-1, MPEG-2 v MPEG-4).
MPEG hay gn hn l MPG cú xut x t Moving Picture Experts Group
(Nhúm cỏc chuyờn gia in nh). T chc ra i hi nm 1988 ny chuyn phỏt
trin cỏc tiờu chun v cỏi v nộn phim s (digital video) v õm thanh s (digital
audio). Nú hot ng di s u ca T chc Quc t v Tiờu chun húa
(ISO). Mpeg-4 l chun cho cỏc ng dng MultiMedia. Mpeg-4 tr thnh mt
tiờu chun cho nộn nh k thut truyn hỡnh s, cỏc ng dng v ho v
Video tng tỏc haichiu(Games,Videoconferencing) v cỏc ng dng
Multimedia tng tỏc hai chiu (World Wide Web hoc cỏc ng dng nhm
phõn phỏt d liu Video nh truyn hỡnh cỏp, Internet Video...). Mpeg-4 ó tr
thnh mt tiờu chun cụng ngh trong quỏ trỡnh sn xut, phõn phi v truy cp

vo cỏc h thng Video. Nú ó gúp phn gii quyt vn v dung lng cho
cỏc thit b lu tr, gii quyt vn v bng thụng ca ng truyn tớn hiu
Video hoc kt hp c hai vn trờn.
Vi MPEG-4, cỏc i tng khỏc nhau trong mt khung hỡnh cú th c
mụ t, mó hoỏ v truyn i mt cỏch riờng bit n b gii mó trong cỏc dũng c
bn ES (Elementary Stream) khỏc nhau. Cng nh xỏc nh, tỏch v x lý riờng
cỏc i tng (nh nhc nn, õm thanh xa gn, vt, i tng nh video nh
con ngi hay ng vt, nn khung hỡnh ), nờn ngi s dng cú th loi b
riờng tng i tng khi khuụn hỡnh. S t hp li thnh khung hỡnh ch c
thc hin sau khi gii mó cỏc i tng ny.
H.264 ( MPEG-4 AVC hay MPEG-4 part 10), hin ang l phng thc tiờn
tin nht trong lnh vc nộn video. H.264 cho cht lng hỡnh nh tt nht khi
cú cựng dung lng so vi cỏc chun nộn khỏc. H.264 cng c ng dng nh
thut nộn chớnh trong video phõn gii cao (HD)
Mc tiờu chớnh ca chun nộn H.264 ang phỏt trin nhm cung cp Video
cú cht lng tt hn nhiu so vi nhng chun nộn Video trc õy. iu ny
cú th t c nh s k tha cỏc li im ca cỏc chun nộn Video trc õy.
THệ VIEN ẹIEN Tệ TRệẽC TUYEN


Khơng chỉ thế, chuẩn nén H.264 còn kế thừa phần lớn lợi điểm của các tiêu
chuẩn trước đó là H.263 và MPEG-4.
Trong đề tài này chúng tơi xin phép được trình bày kĩ thuật mã hóa video
nén theo hướng đối tượng MPEG-4 mà hiện nay đang đuợc sử dụng rất nhiều
như 1 cơng cụ mã hóa với nhiều tính năng ưu việt.
1.3 Kĩ thuật mã hóa video nén theo hướng đối tượng MPEG-4 và ưu
điểm của nó.
MPEG-4 được coi là một cuộc cách mạng mới trong media số. Nó là chuẩn
multimedia tồn cầu thế hệ kế tiếp. Nó được thiết kế để truyền tải video với chất
lượng DVD (MPEG-2) qua mạng. MPEG-4 có khả năng nén cao và tối ưu hóa

được dung lượng băng thơng cũng như dung lượng file lưu trữ mà lại đưa ra chất
lượng video chập nhận được.
MPEG-4 có phương thức mã hóa và nén video hồn tồn tối ưu hơn các
chuẩn khác trước nó đó là việc chia nhỏ mỗi lớp video thành các đối tượng riêng
biệt,Thay vì thực hiện truyền tải tất cả các lớp video như ở MPEG-2 thì MPEG-
4 chỉ truyền đi sự thay đổi trong mỗi đối tượng đã được tách ra.MPEG-4 ra đời
với khá nhiều tính năng ưu việt:
1.3.1 Tính mềm dẻo và có khả năng nâng cấp.
Các nhà thiết kế bộ mã hố MPEG phải đối mặt với rất nhiều vấn đề, nhưng
vấn đề quan trọng nhất là làm sao thiết kế được một thuật tốn nén mềm dẻo và
có khả năng nâng cấp được trong tương lai. Họ thường mong muốn có được các
bộ mã hố MPEG thích hợp cho nhiều ứng dụng, từ TV màn ảnh rộng, chất
lượng cao tới các hệ thống nhỏ, tín hiệu video đen trắng cho các hệ thống
camera an ninh. Hiển nhiên là một hệ thống nén thiết kế dành cho các phim màn
ảnh rộng phải có phần cứng mạnh, bộ nhớ lớn hơn là một hệ thống được thiết kế
cho hệ thống camera dành cho mục đích an ninh.Các nhà thiết kế giải quyết vấn
đề này bằng cách định nghĩa "Level" và "Profile" cho hệ thống. Các "Level" xác
định giới hạn năng lực xử lý của phần cứng và bộ nhớ cần thiết để mã hố tín
THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN


hiệu. Các "Profile" xác định độ phức tạp của q trình mã hố và giải mã.Đối
với MPEG-4 thì có 19 profile (nhưng đối với H.264 chỉ có 3 profile).
Về khả năng nâng cấp của bộ mã hố MPEG, họ thiết kế theo hai bước.
Bước thứ nhất là thay cho xác định chỉ tiêu của bộ mã hố và giải mã, họ xác
định loại tín hiệu nằm giữa hai thiết bị này. Bước thứ hai là thực hiện các cải
tiến trong bộ mã hố và giải mã mới sao cho nó tương thích với các chuẩn cũ
(backward compatible).Chuẩn MPEG có các qui tắc và giao thức cho tín hiệu
truyền giữa bộ mã hố và giải mã. Các quy tắc này, thực chất giống như là một
loại ngơn ngữ dành riêng cho bộ mã hố và giải mã. Các bộ mã hố tương thích

phải có khả năng “nói” được ngơn ngữ này. Các bộ giải mã tương thích phải có
khả năng hiểu được tồn bộ các "từ vựng" mà bộ mã hố đã phát ra trong một
ngữ cảnh nhất định.MPEG-4 thực hiện điều này bằng cách tạo ra một bộ các
cơng cụ dùng để nén tín hiệu trong các trường hợp khác nhau. Một trong các
cơng cụ này, chuyển đổi cosine rời rạc (DCT - discrete cosine transform), có
nhiệm vụ chuyển đổi một khối 8x8 pixel thành một tập các hệ số
1.3.2 MPEG-4 đem lại cơng cụ nén mới.
Ta hãy xem xét các cộng cụ nén mới mà chuẩn MPEG-4 mang tới lĩnh vực
nén ảnh. Hình 1 so sánh các cơng cụ của chuẩn MPEG-2 và MPEG-4.

Hình 1.1: cơng cụ nén mới của MPEG-4 so với MPEG-2.
THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN


Chuẩn MPEG-4 đi xa hơn, theo hình 2, nó có thể dự đốn hệ số của tồn bộ
các khối trên một hàng hay hệ số của các khối ở cột bên trái từ một khối đầu
tiên.



Hình 1.2: MPEG4 có thể dự đốn các tham số trên 1 hàng, hay các thơng số của cột bên trái
từ một khối đầu tiên.
Việc dự đốn các hệ số của hàng hay của cột dựa trên nội dung của hình ảnh.
Ví dụ, một ảnh chứa một vật thể theo chiều đứng như cái cọc chẳng hạn. Khi đó
qt ảnh này theo chiều ngang sẽ tạo ra sự thay đổi lớn trong các hệ số sau DCT
khi gặp hình ảnh cái cọc này. Trái lại, khi qt theo chiều đứng thì các khối nằm
trong một cột có các hệ số DCT gần giống nhau, từ đó có thể nén với tỉ lệ nén
cao hơn.
MPEG-4 mở rộng cách dự đốn vector chuyển động. MPEG-4 có thể dự
đốn vector cho một macroblock từ các macroblock ở trên hay ở bên trái, và nó

chỉ gửi đi sự sai khác so với các vector cũ mà thơi. Do đó giảm đi dữ liệu cần
thiết dùng để mã hố một vector, cho phép có thể dùng một vector cho mỗi khối
DCT. Việc dự đốn chuyển động sẽ tốt hơn với 4 vector, giảm nhỏ lỗi khi dự
đốn.
Chất lượng hình ảnh có thể được cải thiện đáng kể bằng cách dùng tỉ lệ nén
dữ liệu lớn hơn mà khơng cần thay đổi độ phân giải. Mpeg khơng phải là một
cơng cụ nén đơn lẻ mà ưu điểm của nén Mpeg chính là ở chỗ nó có một tập hợp
THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN


các cơng cụ mã hố chuẩn, chúng có thể được kết hợp với nhau một cách linh
động để phục vụ cho một loạt các ứng dụng khác nhau, khả năng truyền dẫn tốt
trong mơi trường truyền dẫn khắc nhiệt.
1.3.3 Tiềm năng của chuẩn MPEG-4.
Trong khi các chuẩn MPEG-1 và MPEG-2 thao tác với một ảnh tồn vẹn, thì
chuẩn MPEG-4 có thể làm việc được với các hình ảnh được tạo ra, hay đã được
máy tính xử lý và đó là một thế mạnh của chuẩn MPEG-4.So với chuẩn MPEG-
2 thì MPEG-4 có những ưu thế hơn về xử lý đồ họa trực tiếp.


Hình 1.3.a : Đầu vào của bộ mã hóa MPEG-2 là một ảnh hồn chỉnh được
lặp lại theo tần số ảnh (frame rate)

Hình 1.3.b : Bộ mã hóa MPEG-4 có thể xử lý các lệnh đồ họa một
cách trực tiếp , do đó cơng cụ biểu diễn hình ảnh thực sự nằm trong bộ
giảimã MPEG-4
Hình 1.3 : so sánh giữa chuẩn MPEG-2 và MPEG-4 về xử lý đồ họa
Chuẩn MPEG-4 có thể làm việc được với 4 loại đối tượng, như trên hình 4.Hình
4 cho thấy chuẩn MPEG-4 đã chuẩn hố phương pháp truyền các đối tượng 3
chiều nhờ các đối tượng lưới (mesh object), cùng với các phương tiện ánh xạ bề

THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN


mặt vật thể lên các đối tượng này, chuẩn này có thể xử lý các đối tượng có hình
dạng bất kỳ

Hình 1.4: MPEG4 đã chuẩn hóa phương pháp truyền các đối tượng 3
chiều nhờ các đối tượng lưới.
1.3.4 Audio, video và tất cả các đối tượng khác có thể được đồng bộ
chặt chẽ với độ chính xác cao và có khả năng tương tác.
Truyền thông multimedia theo dòng (Multimedia stream), trong đó dòng
audio và video sẽ được biến đổi thích nghi với yêu cầu băng thông và chất lượng
hình nhờ loại bỏ những đối tượng (hình ảnh, âm thanh) không cần thiết khỏi
dòng dữ liệu và đồng bộ các thông tin được nhúng trong dòng dữ liệu đó. Thêm
vào đó, MPEG-4 sẽ cho phép người sử dụng khả năng tương tác trực tiếp với
dòng dữ liệu (dừng tiến hay lùi nhanh, kích chuột để kích hoạt các tuỳ chọn
video và audio…)
Lưu giữ và phục hồi dữ liệu audio và video: do MPEG-4 phân chia các
khung hình thành các đối tượng, việc trình duyệt Browser trên cơ sở nội dung
(đối tượng) mong muốn sẽ được thực hiện một cách dễ dàng và nhờ vậy, các
ứng dụng lưu giữ hay phục hồi thông tin trên cơ sở nội dung MPEG-4 sẽ được
thuận lợi hơn.
THÖ VIEÄN ÑIEÄN TÖÛ TRÖÏC TUYEÁN


Truyn thụng bỏo a phng tin: cỏc thụng bỏo di dng text, audio v
video MPEG-4 s c truyn i vi yờu cu bng thụng ớt hn, v cú kh nng
t iu chnh cht lng cho phự hp vi kh nng bng thụng ca thit b gii
mó.
Thụng tin gii trớ: nhng s trỡnh din nghe nhỡn tng tỏc (th gii o, trũ

chi tng tỏc ) cú th c trin khai trờn c s chun MPEG-4 s lm gim
yờu cu v bng thụng v lm cho th gii o tr nờn sinh ng v ging nh
thc t trờn cỏc trang web

Chng 2 : Cụng ngh mó húa video trong MPEG-4

MPEG-4 l sn phm ca nhúm MPEG (Moving Picture Expert Group)
c thnh lp thỏng 1/1988 vi nhim v phỏt trin cỏc chun x lý, mó hoỏ v
hin th cỏc nh ng, audio v cỏc t hp ca chỳng.
Sn phm u tiờn ca nhúm ny l MPEG-1 c s dng cho vic mó hoỏ
cỏc d liu nghe nhỡn vi tc 1,5 Mbps. Sn phm th hai ca nhúm l chun
MPEG-2 ni ting hin nay, mang tớnh tng quỏt hn v ang c ỏp dng cho
mt lot cỏc ng dng nghe nhỡn trong phm vi tc t 3-40 Mbps.
Khụng ging cỏc chun MPEG trc ú, vớ d nh trong MPEG-2, ni m
ni dung c to ra t nhiu ngun nh video nh ng, ha, vn bn v
c t hp thnh chui cỏc khung hỡnh phng, mi khung hỡnh (bao gm cỏc
i tng nh ngi, vt, õm thanh, nn khung hỡnh) c chia thnh cỏc
phn t nh pixels v x lý ng thi, ging nh cm nhn ca con ngi thụng
qua cỏc giỏc quan trong thc t. Cỏc pixels ny c mó hoỏ nh th tt c
chỳng u l cỏc phn t nh video nh ng. Ti phớa thu ca ngi s dng,
quỏ trỡnh gii mó din ra ngc vi quỏ trỡnh mó hoỏ khụng khú khn. Vỡ vy cú
th coi MPEG-2 l mt cụng c hin th tnh, v nu mt nh truyn thụng
truyn phỏt li chng trỡnh ca mt nh truyn thụng khỏc v mt s kin, thỡ
THệ VIEN ẹIEN Tệ TRệẽC TUYEN


logo của nhà sản xuất chương trình này khơng thể loại bỏ được. Với MPEG-2,
bạn có thể bổ xung thêm các phần tử đồ hoạ và văn bản vào chương trình hiển
thị cuối cùng (theo phương thức chồng lớp), nhưng khơng thể xố bớt các đồ
hoạ và văn bản có trong chương trình gốc.

Chuẩn MPEG-4 khắc phục được hạn chế này và là một chuẩn động dễ thay đổi.
Với MPEG-4, các đối tượng khác nhau trong một khung hình có thể được mơ tả,
mã hố và truyền đi một cách riêng biệt đến bộ giải mã trong các dòng cơ bản
ES (Elementary Stream) khác nhau. Cũng nhờ xác định, tách và xử lý riêng các
đối tượng (như nhạc nền, âm thanh xa gần, đồ vật, đối tượng ảnh video như con
người hay động vật, nền khung hình …), nên người sử dụng có thể loại bỏ riêng
từng đối tượng khỏi khn hình. Sự tổ hợp lại thành khung hình chỉ được thực
hiện sau khi giải mã các đối tượng này.

Hình 2.1. Cấu trúc của bộ mã hố và giải mã video MPEG-4
Các bộ phận chức năng chính trong các thiết bị MPEG-4 bao gồm:
- Bộ mã hố hình dạng ngồi Shape Coder dùng để nén đoạn thơng tin, giúp
xác định khu vực và đường viền bao quanh đối tượng trong khung hình scene.
- Bộ dự đốn và tổng hợp động để giảm thơng tin dư thừa theo thời gian.
- Bộ mã kết cấu mặt ngồi Texture coder dùng để xử lý dữ liệu bên trong và
các dữ liệu còn lại sau khi đã bù chuyển động.


THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN




Hình 2.2. Sơ đồ cấu trúc giải mã video MPEG-4
Hình 2 là một ví dụ về tổng hợp khung hình video sử dụng trong MPEG-4.
Nhiều đối tượng được tách ra khỏi video đầu vào. Mỗi đối tượng video sau đó
được mã hóa bởi bộ mã hố đối tượng video VO (Video Object) và sau đó được
truyền đi trên mạng. Tại vị trí thu, những đối tượng này được giải mã riêng rẽ
nhờ bộ giải mã riêng VO và gửi tới bộ compositor. Người sử dụng có thể tương
tác với thiết bị để cấu trúc lại khung hình gốc, hay để xử lý các đối tượng tạo ra

một khung hình khác. Ngồi ra, người sử dụng có thể download các đối tượng
khác từ các thư viện cơ sở dữ liệu (có sẵn trên thiết bị hay từ xa thơng qua mạng
LAN, WAN hay Internet) để chèn thêm vào hay thay thế các đối tượng có trong
khn hình gốc.
Để có thể thực hiện việc tổ hợp khung hình, MPEG-4 sử dụng một ngơn ngữ
mơ tả khung hình riêng, được gọi là định dạng nhị phân cho khung hình BiFS
(Binary Format for Scenes). BiFS khơng chỉ mơ tả ở đâu và khi nào các đối
tượng xuất hiện trong khung hình, nó cũng mơ tả cách thức hoạt động của đối
tượng (làm cho một đối tượng xoay tròn hay chồng mờ hai đối tượng lên nhau)
và cả điều kiện hoạt động đối tượng và tạo cho MPEG-4 có khả năng tương tác.
Trong MPEG-4 tất cả các đối tượng có thể được mã hố với sơ đồ mã hố riêng
của nó - video được mã hố theo kiểu video, text được mã hố theo kiểu text,
các đồ hoạ được mã hố theo kiểu đồ hoạ - thay vì việc xử lý tất cả các phần tử
THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN


ảnh pixels như là mã hố video ảnh động. Do các q trình mã hố đã được tối
ưu hố cho từng loại dữ liệu thích hợp, nên chuẩn MPEG-4 sẽ cho phép mã hố
với hiệu quả cao tín hiệu ảnh video, audio và cả các nội dung tổng hợp như các
bộ mặt và cơ thể hoạt hình.
2.1 Mã hố hình dạng ngồi (Shape Coder )
-Khung hình : là thành phần mã hố chính. Thường thường chúng ta có thể
phân biệt sự thay đổi về độ sáng của ảnh tốt hơn so với sự thay đổi về màu. Do
đó trước hết các sơ đồ nén Mpeg sẽ tiến hành chia khung hình thành các thành
phần độ sáng Y và thành phần độ màu Cb, Cr (một thành phần về độ sáng và hai
thành phần về độ màu). Một khung hình sẽ gồm có 3 ma trận ứng với các thành
phần về độ sáng (Y) và hai thành phần về độ màu Cb và Cr.
Ma trận Y có số hàng và cột bằng nhau (ma trận vng). Ma trận Cb và Cr
có số hàng và cột bằng nửa ma trận Y. Hình 3 cho thấy quan hệ và vị trí của Y
và các thành phần Cb và Cr. Lưu ý rằng cứ 4 giá trị Y lại có 2 giá trị kết hợp

một của Cb và một của Cr (Vị trí của giá trị Cb và Cr là tương đương).
Các bộ lọc tiền xử lý sẽ lọc ra những thơng tin khơng cần thiết từ tín hiệu Video
và những thơng tin khó mã hố nhưng khơng quan trọng cho sự cảm thụ của mắt
người. Kỹ thuật đốn chuyển động dựa trên ngun tắc là các khung hình trong
một cảnh Video dường như có liên quan mật thiết với nhau theo thời gian: Mỗi
khung hình tại một thời điểm nhất định sẽ có nhiều khả năng giống với các
khung hình đứng ngay phía trước và ngay phía sau nó. Do vậy ở phía bộ mã hố,
chỉ cần gửi những khung hình có thay đổi so với những khung hình trước, sau
đó dùng phương pháp nén về khơng gian để loại bỏ sự dư thừa về khơng gian
trong chính khung hình sai khác này. Trong MPEG-4 là yếu tố ít có sự thay đổi
nhất, các bước mã hóa khung hình cũng tương tư như mã hóa ảnh. Thuật tốn
mã hố biến đổi gồm các bước:
+Biến đổi Cosine rời rạc (DCT).
+Lượng tử hố.
+Mã hóa
2.1.1 Biến đổi Cosin rời rạc ( DCT )
THƯ VIỆN ĐIỆN TỬ TRỰC TUYẾN


S thut toỏn nộn v gii nộn c mụ t di õy:


Hỡnh 2.3 s thut toỏn nộn nh (a)


Quỏ trỡnh gii nộn s c lm ngc li, ngi ta gii mó tng phn nh
nộn tng ngvi phng phỏp nộn ó s dng trong phn nộn nh cỏc thụng
tin liờn quan ghi trong phn header ca file nộn. Kt qu thu c l h s ó
lng t. Cỏc h s ny c khụi phc v giỏ tr trc khi lng t húa bng
b tng t húa. Tip ú em bin i Cosin ngc ta c nh ban u vi

trung thc nht nh.
Bng mó v bng lng t trong s gii nộn c dng lờn nh nhng
thụng tin ghi trong phn cu trỳc u tp ( Header) ca tp nh nộn. Quỏ trỡnh
nộn chu trỏch nhim to ra v ghi li nhng thụng tin ny. Phn tip theo s
phõn tớch tỏc dng ca tng khi trong s 2.3
+ Phn khi
Vỡ nh gc cú kớch thc rt ln cho nờn trc khi a vo bin i DCT,
nh c phõn chia thnh cỏc khi vuụng, mi khi ny thng cú kớch thc 8
x 8 pixel v biu din cỏc mc xỏm ca 64 im nh, cỏc mc xỏm ny l cỏc s
nguyờn dng cú giỏ tr t 0 n 255. Vic phõn khi ny s lm gim c mt
phn thi gian tớnh toỏn cỏc h s chung, mt khỏc bin i cosin i vi cỏc
khi nh s lm tng chớnh xỏc khi tớnh toỏn vi du phy tnh, gim thiu sai
s do lm trũn sinh ra.

THệ VIEN ẹIEN Tệ TRệẽC TUYEN



Hỡnh 2.4 s thut toỏn nộn nh (b)
Bin i DCT l mt cụng on chớnh trong cỏc phng phỏp nộn s dng
bin i. 2 cụng thc õy minh ho cho 2 phộp bin i DCT thun nghch i
vi mi khi nh cú kớch thc 8 x 8. Giỏ tr x(n
1
, n
2
) biu din cỏc mc xỏm
ca nh trong min khụng gian, X(k
1
, k
2

) l cỏc h s sau bin i DCT trong
min tn s.
+ Bin i
Bin i l mt trong nhng cụng on ln trong cỏc phng phỏp nộn s
dng phộp bin i. Nhim v ca cụng on bin i l tp trung nng lng
vo mt s ớt cỏc h s bin i. Cụng thc bin i cho mi khi l:







v

Thut toỏn bin i DCT cho mi khi trong trng hp ny s bao gm 16
phộp bin i DCT. u tiờn, ngi ta bin i nhanh Cosin mt chiu cho cỏc
dóy im nh trờn mi hng. Ln lt thc hin cho 8 hng. Sau ú em bin
THệ VIEN ẹIEN Tệ TRệẽC TUYEN


i nhanh Cosin mt chiu theo tng ct ca ma trn va thu c sau 8 phộp
bin i trờn. Cng ln lt thc hin cho 8 ct. Ma trn cui cựng s l ma trn
h s bin i ca khi tng ng.Trong s gii nộn ta phi dựng phộp bin
i Cosin ngc. Cụng thc bin i ngccho khi 8x8:




v



2.1.2 Lng t hoỏ

Khi lng t húa trong s nộn úng vai trũ quan trong v quyt nh t
l nộn cachun nộn. u vo ca khi lng t húa l cỏc ma trn h s bin
i Cosin ca cỏc khi im nh.Sau khi thc hin bin i DCT, 64 h s s
c lng t hoỏ da trờn mt bng lng t gm 64 phn t Q(u,v) vi 0u,
v7. Bng ny c nh ngha bi tng ng dng c th. Cỏc phn t trong
bng lng t cú giỏ tr t 1 n 255 c gi l cỏc bc nhy cho cỏc h s
DCT. Quỏ trỡnh lng t c coi nh l vic chia cỏc h s DCT cho bc
nhy lng t tng ng, kt qu ny sau ú s c lm trũn xung s nguyờn
gn nht. Cụng thc (3) th hin vic lng t vi F(u,v) l cỏc h s DCT,
F
Q
(u,v) l cỏc h s sau lng t, cỏc h s ny s c a vo b mó hoỏ
Entropy.

(3)
THệ VIEN ẹIEN Tệ TRệẽC TUYEN


Mc ớch ca vic lng t hoỏ l gim s lng bit cn lu tr cỏc h s
bin i bng vic gim chớnh xỏc ca cỏc h s ny cho nờn lng t l quỏ
trỡnh x lý cú mt thụng tin.
Quỏ trỡnh gii lng t phớa b gii mó c thc hiờn ngc li. Cỏc h
s sau b gii mó entropy s nhõn vi cỏc bc nhy trong bng lng t (bng
lng t c t trong phn header ca nh JPEG). Kt qu ny sau ú s c
a vo bin i DCT ngc. nõng cao hiu qu nộn cho mi b h s trong
mt khi, ngi ta xp chỳng li theo th t ZigZag. Tỏc dng ca sp xp li

theo th t ZigZag l to ra nhiu loi h s ging nhau. Chỳng ta bit rng
nng lng ca khi h s gim dn t gúc trờn bờn trỏi xung gúc di bờn
phi nờn vic sp xp li cỏc h s theo th t ZigZag s to iu kin cho cỏc
h s xp x nhau (cựng mc lng t) nm trờn mt dũng

Hỡnh 2.5 : Quỏ trỡnh gii lng t v th t sp xp zigzag

Mi khi ZigZag ny c mó húa theo phng phỏp RLE. Cui mi khi
u ra ca RLE, ta t du kt thỳc khi EOB (End Of Block). Sau ú, cỏc khi
c dn li v mó húa mt ln bng phng phỏp mó Huffman. Nh cú du kt
thỳc khi nờn cú th phõn bit c hai khi cnh nhau khi gii mó Huffman.
Hai bng mó Huffman cho hai thnh phn h s tt nhiờn s khỏc nhau. cú
THệ VIEN ẹIEN Tệ TRệẽC TUYEN


th gii nộn c, chỳng ta phi ghi li thụng tin nh: kớch thc nh, kớch
thc khi, ma trn Y, lch tiờu chun, cỏc mc to li, hai bng mó
Huffman, kớch thc khi nộn mt chiu, kớch thc khi nộn xoay chiu v
ghi ni tip vo hai file nộn ca thnh phn h s.
Ci t gii thut cho nộn thc s phc tp. Chỳng ta phi nm c cỏc
kin thc v nộn
RLE, Huffman, bin i Cosin, xõy dng b lng t húa Lloyd-
MaxNộn v gii nộn hi chm nhng bự li, thi gian truyn trờn mng
nhanh hn do kớch thc tp nộn nh. Vi nhng u im ca mỡnh c ISO
chp nhn l chun nh quc t v c bit n di mó s ISO 10918-1.
2.1.3 Mó húa
Mó hoỏ l bc cui cựng trong h thng nộn nh da trờn bin i DCT.
Chun nộn nh JPEG hin nay dựng phng phỏp mó hoỏ Huffman, õy l phộp
mó hoỏ khụng lm mt thụng tin. Phng phỏp ny da trờn mụ hỡnh thng kờ.
Da vo d liu gc, ngi ta tớnh tn sut xut hin cỏc h s. Vic tớnh tn

sut c thc hin bng cỏch duyt tun t t u khi n cui khi, sau ú,
nhng h s cú tn sut cao c gn cho mt t mó ngn, cỏc h s cú tn sut
thp c gỏn mt t mó di. Vi cỏch thc ny chiu di trung bỡnh ca t mó
ó gim xung.

ng ZicZig
Cỏc h s thu c sau khi lng t hoỏ s c sp xp thnh mt chui
cỏc ký hiu theo kiu zig-zag (theo ng zig-zag) t cỏc h s cú tn s
THệ VIEN ẹIEN Tệ TRệẽC TUYEN

×