Tải bản đầy đủ (.pdf) (93 trang)

Nghiên cứu tìm hiểu chuẩn MPEG 4 và phương pháp tiên tiến nén video theo chuẩn MPEG26 và h 264

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (775.01 KB, 93 trang )

..

Bộ giáo dục và đào tạo
Trường đại học bách khoa hà nội
--------------------------------------------

Phan Tiến Dũng

nghiên cứu tìm hiểu chuẩn mpeg-4 và phương pháp
tiên tiến nén video theo chuẩn mpeg-4 và H.264.

Chuyên ngành : Công nghệ thông tin

Luận văn thạc sĩ ngành công nghệ thông tin

Người hướng dẫn khoa học:
PGS.Ts: Nguyễn thị hoµng lan

Hµ néi - 2004


2

Lời cam đoan

Tôi tên là : Phan Tiến Dũng
Học viên lớp Cao học Công nghệ thông tin 2002
Tôi đà làm đồ án tốt nghiệp cao học CNTT với tên đề tài: Nghiên cứu
tìm hiểu chuẩn MPEG-4 và phương pháp tiên tiÕn nÐn video theo chn
MPEG-4 vµ H.264, do PGS.TS. Ngun Thị Hoàng Lan hướng dẫn
Tôi xin cam đoan nội dung trong đồ án tốt nghiệp này là do tôi tìm


hiểu, nghiên cứu và thực hiện. Nếu sai tôi hoàn toàn chịu trách nhiệm trước
trường, pháp luật.
Hà Nội, ngày

tháng

năm 2004

Người cam ®oan

Phan TiÕn Dòng


3

Mục lục
Lời cam đoan .............................................................................................................2
Mục lục .......................................................................................................................3
Danh mục các ký hiệu, các chữ viết tắt ...................................................................6
Danh mục các bảng ...................................................................................................8
Danh mục các hình vẽ đồ thị. ...................................................................................9
Mở đầu ..................................................................................................................11
Chương I: Video số và chuẩn mpeg-4..................................................13
1.1 Giới thiệu ........................................................................................................13
1.2 Các thành phần của chuẩn MPEG-4...........................................................14
Chương II: tìm hiểu mpeg-4 visual và các đặc tả nội dung 18
2.1 Khái quát MPEG-4 Visual ...........................................................................18
2.1.1. Các tính năng .........................................................................................19
2.1.2. Các công cụ, đối tượng, mô tả và các mức. ...........................................20
2.1.3 Các đối tượng video .................................................................................22

2.2 MÃ hoá các khung hình chữ nhật. ...............................................................23
2.2.1 Định dạng video vào ra ...........................................................................23
2.2.2 Mô tả đơn giản.........................................................................................24
2.4 MÃ hoá các vùng có hình bất kỳ ..................................................................26
2.4.1 Mô tả lõi ...................................................................................................27
2.4.2 Mô tả chính..............................................................................................32
2.4.3 Mô tả hiệu quả mà hoá tiên tiến (ACE) .................................................35
2.4.4 Mô tả N-bit ...............................................................................................36
2.5 MÃ hoá video liên hoàn .................................................................................36
2.5.1 Liên hoàn không gian .............................................................................37
2.5.2 Liên hoàn thời gian .................................................................................37
2.6 MÃ hoá bề mặt ...............................................................................................37
Chương III: tìm hiểu chuẩn H.264/ MPEG-4 phần 10 ........................40
3.1 Khái quát về sơ đồ mà hoá theo chuẩn H.264 ............................................40
3.2 CÊu tróc H.264 ..............................................................................................41


4

3.2.1 Các mô tả và các mức ..............................................................................41
3.2.2 Định dạng video ......................................................................................42
3.2.3 Định dạng dữ liệu mà hoá ......................................................................43
3.2.3 Định dạng dữ liệu mà hoá ......................................................................43
3.2.4 Các hình ảnh tham khảo ........................................................................43
3.2.5 Các lát ......................................................................................................44
3.2.6. Macroblocks ...........................................................................................45
3.3 Mô tả dòng cơ bản .........................................................................................45
3.3.1 Khái quát .................................................................................................45
3.3.2. Quản lý ảnh tham khảo .........................................................................46
3.4 Mô tả chính ....................................................................................................46

3.5 Mô tả mở rộng ...............................................................................................47
3.5.1 Các lát SP và SI .......................................................................................47
3.5.2 Các lát dữ liệu phân đoạn .......................................................................48
3.6 Truyền tải H.264............................................................................................48
3.7 So sánh giữa MPEG-4 Visual và H.264 .......................................................49
Chương IV: nghiên cứu các kỹ thuật tiên tiến cải thiện
khả năng dự đoán dựa vào néi dung trong H.264/AVC ............50
4.1 Kh¸i qu¸t chung ............................................................................................50
4.2 Dù đoán chuyển động....................................................................................50
4.2.1 Dự đoán trong khung hình ....................................................................50
4.2.2 Dự đoán liên ảnh .....................................................................................52
4.2.3. Dự đoán các khối trong lát B .................................................................58
4.2.4 Dự đoán trọng số .....................................................................................61
4.3 Dự đoán nội dung trong mà hoá ..................................................................62
4.3.1 MÃ hoá độ dài thay ®ỉi thÝch nghi víi néi dung (Context-based
Adaptive Variable Length Coding CAVLC) ....................................................62
4.3.2 MÃ hoá số học nhị phân thích nghi víi néi dung (Context-based
Adaptive Binary Arithmetic Coding CABAC) .................................................67
4.3.3 C¶i thiện mà hoá các hệ số chuyển đổi trong CABAC..........................71
4.3.4 Thêm cây khung cảnh (Context-Tree Weighting CTW) .......................74
4.4 Kết luận ..........................................................................................................77


5

Chương V: Thiết kế và cài đặt một số giải thuật trong
công nghệ nén video theo chuẩn mpeg-4. .....................................78
5.1 Đặt vÊn ®Ị, mơc ®Ých thiÕt kÕ thư nghiƯm. .................................................78
5.2 ThiÕt kế các chức năng ..................................................................................78
5.2.1 Tiền xử lý .................................................................................................79

5.2.2 Phân tách các đối tượng..........................................................................80
5.2.3 Dự đoán chuyển động .............................................................................81
5.2.4 DCT/IDCT ...............................................................................................81
5.2.5 Biến đổi Wavelet (DWT) .........................................................................82
5.2.6 Lượng tử/ thay đổi tỷ lệ. ..........................................................................82
5.2.7 MÃ hoá entropy........................................................................................83
5.2.8 Hậu xử lý .................................................................................................84
Chương VI: Kết quả và đánh giá ..........................................................86
6.1. Đánh giá kết quả thực nghiệm. ...................................................................86
6.1.1 Thí nghiệm...............................................................................................86
6.1.2 Đánh giá ..................................................................................................87
Kết luận ..............................................................................................................89
Phụ lục .................................................................................................................91
A. Bảng so sánh mà hoá giữa MPEG-2 và MPEG-4 ........................................91
B. Tài liệu tham khảo. .........................................................................................92


6

Danh mục các ký hiệu, các chữ viết tắt
Từ viết t¾t TiÕng Anh
AVI
Audio Video Interleave
BDM
B-frame
BMA
CBP
CZS
DZS
DCT

DPCM
DVD
Fps
FS
FTSS
GDA
GOP
HDTV
I-frame
IDCT
IEC
ISO
ITU-T
MAD
MB
MBT
MCP
ME
MPEG
MSE
MV
MVD
NPDS
NTSC
NTSS
P-frame
PAL
PD
Pixel
PPDS

QP

Block Distortion Measure
Bi-directionally predicted frame
Block Matching Algorithm
Coded Block Pattern
Circular Zonal Search
Diamond Zonal Search
Discrete Cosine Transform
Diferential Pulse Code Modulation
Digital Video Disk
Frames/s
Full Search Agorithm
Fast Three Step Search
Greedy Search Algorithm (GBMAs)
Group Of Pictures
High Definition Television
Intra-frame
Inverse Discrete Cosine Transform
International Electrotechnical
Commission
International Standard Organization
International Telecommunication
Union
Mean Absolute Difference
Macroblock
Macroblock Type
Motion Compensated Prediction
Motion Estimation
Motion Picture Experts Group


Tiếng Việt
Định dạng file được hỗ trợ bởi thư
viện Video for Windows
Độ đo sai khác (méo) khối
Khung hình dự đoán 2 chiều
Giải thuật đối sánh khối
Kiểu khối mà hoá
Tìm kiếm trên miền dạng tròn
Tìm kiếm trên miền dạngdiamond
Phép biến đổi cosin rời rạc
Điều xung m sai phân
Đĩa video dùng kỹ thuật số
Số khung hình trên giây
Giải thuật tìm kiếm vét cạn
Tìm kiếm ba bước nhanh
Giải thuật tìm kiếm tham lam
Nhóm ảnh
Truyền hình có độ phân giải cao
frame kiểu intra
Biến đổi cosine rời rạc ngược
Hội đồng kỹ thuật điện tử quốc tế

Tổ chức tiêu chuẩn quốc tế
Hiệp hội truyền thông viễn thông
quốc tế
Trung bình sai khác tuyệt đối
Macroblock
Kiểu Macroblock
Dự đoán bù chuyển động

Đánh giá ước lượng chuyển động
Nhóm chuyên gia nghiên cứu ảnh
động
Mean Squared Error
Sai số trung bình bình phương
Motion vector
Vectơ dịch chuyển
Motion Vector Differential
Sai khác vectơ dịch chuyển
Normalized Partial Distortion Search Tìm kiếm méo cục bộ chuẩn hoá
National Television System
Héi ®ång hƯ thèng TV qc gia Mü
Committee
New Three Step Search
Tìm kiếm ba bước kiểu mới
Forward prediction frame
Frame dự đoán thuận
Phase Alternation Line
Hệ PAL
Partial Distortion
Giá trị méo cục bộ
Picture element
Điểm ảnh
Progressive Partial Distortion Search Tìm kiếm méo cục bộ liên tiến
Quantization Parameter
Thông số lượng tử hoá


7


RLC
SAD
SNR
SP-picture
TSS
TCL
VLC
VO
VOL
VOP
VS

Run - Length Coding
Sum Absolute Difference
Signal to Noise Ratio
Inter-stream transitional picture
Three Step Search Algorithm (3SS)
Transform Coefficient Level
Variable Length Coding
Video Object
Video Object Layer
Video Object Plane
Video Session

M hóa loạt dài
Tổng sai khác tuyệt đối
Tỉ số tín hiệu trên nhiễu
ảnh tịnh tiến liên dòng
Giải thuật tìm kiếm ba bước
Mức hệ số chuyển đổi

M độ dài thay đổi
Đối tượng video
Lớp đối tượng video
Mặt phẳng đối tượng video
Phiên video


8

Danh mục các bảng
Bảng 2.1: Các mô tả MPEG-4 Visual cho mà hoá video tự nhiên ...........................20
Bảng 2.2: Các mô tả MPEG-4 Visual cho mà hoá video nhân tạo và kết hợp .........21
Bảng 2.3: Các mức trong mô tả đơn giản .................................................................22
Bảng 3.1: Các chế độ lát trong H.264 ......................................................................44
Bảng 3.2: Tổng hợp sự khác nhau giữa MPEG-4 Visual và H.264 ..........................49
Bảng 4.1: Chọn lựa bảng tìm kiếm cho coeff_token ................................................63
Bảng 4.2: Ngưỡng để quyết định tăng suffixLength hay không ..............................64
Bảng 4.3 Mô hình khung cảnh cho bin 1 .................................................................69
Bảng 4.4 Mô hình khung cảnh .................................................................................69
Bảng 4.5: Các kiểu khối cơ bản với số các hệ số và kiểu khung cảnh liên quan......72
Bảng 6.1: Nhận xét các đặc tính hình ¶nh sau khi nÐn theo c¶m thơ chđ quan .......87


9

Danh mục các hình vẽ đồ thị.
Hình 1.1: Kiến trúc MPEG-4....................................................................................15
Hình 2.1: Mô hình chung của MPEG-4 ...................................................................18
Hình 2.2: Ba chế độ lớp các đối tượng video (I-VOP, P-VOP, B-VOP) [18] ..........23
Hình 2.3: Các bước mà hoá và giải mà I-VOP .........................................................24

Hình 2.4: Các bước mà hoá và giải mà P-VOP ........................................................25
Hình 2.5: Mẫu khung cảnh cho BAB nội khung ......................................................28
Hình 2.6: Mẫu khung cảnh cho BAB liên khung ....................................................29
Hình 2.7 Điền đầy chiều ngang và dọc trong MB biên ............................................30
Hình 2.8: Minh hoạ phần gốc tĩnh (nền) ..................................................................34
Hình 2.8: Cây thứ tự quét .........................................................................................39
Hình 3.1: Bộ mà hoá H.264 ......................................................................................40
Hình 3.2: Bộ giải mà H.264......................................................................................40
Hình 3.3: Mô tả dòng cơ bản, chính, mở rộng trong H.264 .....................................42
Hình 3.4: Chuỗi các khối NAL ................................................................................43
Hình 3.5: Cú pháp lát ................................................................................................45
Hình 3.6: Ví dụ chuỗi các thành phần RBSP............................................................48
Hình 4.1: Các chế độ dự đoán 4x4 chói ...................................................................51
Hình 4.2: Các chế độ dự đoán nội khung 16x16 ......................................................52
Hình 4.3: Phân vùng macroblock: 16x16, 8x16, 16x8, 8x8 .....................................53
Hình 4.4: Phân vùng macroblock: 8x8, 4x8, 8x4, 4x4 .............................................53
Hình 4.5: Ví dụ về dự đoán số mẫu nguyên và mẫu con ..........................................54
Hình 4.6: Nội suy vị trí nửa điểm chói .....................................................................55
Hình 4.7: Các vị trí nội suy phần tư điểm chói .........................................................56
Hình 4.8: Các vị trí nội suy của phần tám mẫu màu ................................................56
Hình 4.9: Các phân vùng hiện tại và lân cân (kích thước phân vùng giống nhau) ...57
Hình 4.10: Các phân vùng hiện tại và lân cận (các kích thước phân vùng khác nhau)
...................................................................................................................................58


10

Hình 4.11: Các ví dụ dự đoán phân vùng trong kiểu macroblock B .........................59
Hình 4.12: Các ví dụ của các chế độ dự đoán trong các macroblock lát B ..............60
Hình 4.12: Các mô hình khung cảnh được dùng trong mà hoá hình dạng ...............67

Hình 4.13: Hai ví dụ về sự quyết định khung cảnh cho mà hoá giá trị tuyệt đối các
hệ số có nghĩa ............................................................................................................74
Hình 5.1: Các khối chức năng chính trong bộ mà hoá .............................................79
Hình 5.2: Biểu đồ chuyển đổi cosine nhanh. ............................................................82
Hình 5.3: Sơ đồ mà hoá độ dài thay đổi ...................................................................83
Hình 5.4: Sơ đồ mà hoá khèi CABAC [17] ..............................................................83
H×nh 5.5: Thùc thi bé läc sau ...................................................................................84
Hình 5.6: Thực thi bộ lọc lặp ....................................................................................85


11

Mở đầu
Cùng với sự phát triển mạnh mẽ các kỹ thuật như truyền hình số, streaming video
trên Internet và DVD-Video, nén video đà trở thành thành phần nhất thiết trong lĩnh
vực truyền hình và giải trí media. Sự thành công của truyền hình số và DVD-Video
dựa trên chuẩn 10 năm tuổi MPEG-2, kỹ thuật này đà chứng minh hiệu quả của nó
nhưng hiện nay đà trở nên lạc hậu. Rõ ràng đà đến lúc cần phải thay thế nén video
MPEG-2 bằng kỹ thuật nén hiệu quả hơn và có thể sử dụng các lợi thế khả năng xử
lý. ĐÃ có nhiỊu cc tranh ln vỊ kü tht nµo sÏ phđ lên MPEG-2. Đối thủ chính
là chuẩn quốc tế là MPEG-4.
Hiện nay MPEG-4 đà được phát hành và đang phát triển gồm 16 phần bao quát
toàn bộ các vấn đề hệ thống, video, audio, truyền dẫn Trong đó MPEG-4 Visual
và H.264 (được biết như Mà hoá video tiên tiến) là chuẩn để mà hoá các thông tin
hình ảnh. Trong khi các hÃng sản xuất tự do cạnh tranh phát triển và sáng tạo các
sản phẩm, mỗi chuẩn đưa ra nhằm tương thích với các bộ mà hoá và bộ giải mà để
có thể thành công trong kết nối mạng. Các chuẩn không định nghĩa cụ thể bộ mÃ
hoá mà chỉ định nghĩa đầu ra của bộ mà hoá như thế nào. Phương thức giải mà được
định nghĩa trong mỗi chuẩn nhưng các hÃng sản xuất tự do phát triển theo cách
riêng miễn là đạt được kết quả như trong chuẩn.

MPEG-4 Visual (phần 2 trong chuẩn MPEG-4) được phát triển bởi Nhóm chuyên
gia về ảnh động (Motion Picture Experts Group MPEG) làm việc cho tổ chức tiêu
chuẩn quốc tế (ISO). H.264 được phát triển bởi Nhóm chuyên gia về mà hoá video
(Video Coding Experts Group VCEG) lµm viƯc cho hiƯp héi viễn thông quốc tế
(ITU-T) phụ trách về loạt các chuẩn truyền tín hiệu hình ảnh. Bước cuối cùng của
chuẩn H.264 được thực hiện bởi nhóm cộng tác giữa VCEG và MPEG đà phát hành
tiêu chuẩn cuối cùng bởi ISO/IEC (MPEG-4 phần 10) và ITU-T (H.264) vào năm
2003.
Nhằm không ngừng nâng cao hiệu năng mà hoá, rất nhiều kỹ thuật được áp dụng
vào trong MPEG-4 Visual, H.264 để cố gắng tận dụng tối đa sự tương quan giữa các
khung hình video cả về không gian và thời gian. Đồ án tập trung nghiên cứu các mô


12

tả cho phép tương tác theo nội dung video theo chuẩn MPEG-4 và phương pháp tiên
tiến nén video theo chuẩn H.264. Nổi bật trong các kỹ thuật đó là phương pháp mÃ
hoá dự đoán dựa vào nội dung. Không chỉ đơn thuần dự đoán chuyển động như các
chuẩn MPEG trước đây, trong chuẩn này cho phép xử lý linh hoạt các tham số theo
nội dung của cảnh video cần nén.
Đồ ¸n bao gåm s¸u ch­¬ng víi néi dung sau:
Ch­¬ng 1: Giới thiệu về lĩnh vực video số và các chuẩn liên quan
Chương 2 và 3 Tập trung nghiên cứu các kỹ thuật chính của MPEG-4 Visual và
H.264
Chương 4: Nghiên cứu các kỹ thuật dự đoán dựa vào nội dung được áp dụng trong
H.264
Chương 5: Các khối chức năng chính trong bộ mà hoá và cài đặt một số module áp
dụng các kỹ thuật tiên tiến.
Chương 6: Đánh giá và nhận xét những kết quả đạt được.
Để hoàn thành bản đồ án tốt nghiệp này, ngoài sự cố gắng của cá nhân em còn có

sự giúp đỡ tận tình của PGS.TS. Nguyễn Thị Hoàng Lan - giảng viên khoa Công nghệ
thông tin Trường đại học Bách khoa Hà nội. Cô đà định hướng, cung cấp tài liệu,
hướng dẫn chi tiết và sửa chữa các sai sót em mắc phải trong quá trình thực hiện.
Em cảm ơn các thầy cô giáo của khoa Công nghệ thông tin Trường đại học
Bách khoa Hà nội đà tận tình dạy dỗ trong thời gian em học tập tại trường.
Hà nội, ngày 5 tháng 11 năm 2004.
Sinh viªn
Phan TiÕn Dịng


13

Chương I: Video số và chuẩn mpeg-4
1.1 Giới thiệu
Khi chúng ta nghĩ về video, chúng ta thường nghĩ đó là những cái gì mà camera
nhìn thấy. Chúng ta nghĩ đó là chuỗi tuyến tính các cảnh được trình diễn đủ nhanh
để tạo ra ảo giác chuyển động. Mỗi ảnh là một đối tượng hình chữ nhật chứa phần
nền và cảnh. Tương tự cách nghĩ thông thường về audio như là các rÃnh CD, trong
đó âm thanh đà được hoà trộn và phát ra. Với cách nghĩ như thế này sự tương tác bị
giới hạn chỉ có chạy, dừng lại, tua nhanh, tua ngược, bỏ qua tới vị trí khác hoặc trình
diễn nhanh hoặc chậm hơn so với thời gian thực. Có thể gọi cách nghĩ về audio và
video theo khía cạnh thế giới phẳng
Tuy nhiên cái chúng ta thực sự nhìn thấy khi chúng ta quan sát thế giới thực là
gì? Chúng ta thực sự nghe gì khi chúng ta lắng nghe. Chúng ta nhìn thấy các thực
thể riêng biệt: con người, cây cối, đồ đạc, phòng, phong cảnh, các con côn trùng, các
bông hoa, các con chim ... Khi chúng ta lắng nghe chúng ta nghe tiếng nói riêng biệt
từng người, tiếng ồn, tiếng vọng trong phòng, tiếng các nhạc cụ ... Chúng là các đối
tượng nghe nhìn (Audio Visual Object AVO) có mối quan hệ trong không gian.
Những cái gì chúng ta nhìn và nghe chủ yếu phụ thuộc vào mối quan hệ này.
MPEG-4 cho phép mỗi loại đối tượng này được mà hoá theo cách tối ưu với tính

chất tự nhiên của đối tượng đó và cho phép những thành phần đối tượng nghe nhìn
này được truyền tới người dùng như các dòng căn bản thông qua các kênh phân
phối. Tại đầu thu sẽ thu nhận lại các đối tượng nghe nhìn riêng biệt này vào cảnh và
cho phép người dùng cuối thao tác vị trí không gian của mỗi đối tượng audio và
video. Những cái gì chúng ta nhìn và nghe cuối cùng phụ thuộc vào sự chọn lựa của
mình.
Chúng ta không có micro để có thể phân biệt giữa các nguồn âm thanh riêng rẽ
để ghi lại. Chúng ta không có camera có thể nhặt các đối tượng riêng rẽ để ghi lại
đối tượng đó mà bỏ qua tất cả các hình ảnh xung quanh. Để mà hoá các cảnh và âm
thanh tự nhiên diễn ra chúng ta hoặc chấp nhận truyền thế giới phẳng tới người dùng
hoặc là sử dụng các kỹ thuật xử lý tín hiệu, phân tích dữ liệu để nhặt ra các đối


14

tượng riêng biệt. MPEG-4 cho phép chúng ta tổng hợp các đối tượng và truyền đến
người dùng cuối với hàng loạt thông số cho phép người dùng tương tác với nội dung
các đối tượng trong ảnh video.
1.2 Các thành phần cđa chn MPEG-4
Chn ISO/IEC 14496 (‘MPEG-4’) do nhãm chuyªn gia về ảnh động (Moving
Picture Expert Group) tạo ra, duy trì và cập nhật, đây cũng là nhóm phát triển các
chuẩn cho Tỉ chøc chn qc tÕ (International Standards Organisation).
HiƯn nay 16 phần của MPEG-4 đà được phát hành và đang phát triển. Phần 1 đến
6, 8 và 10 được phát hành như chuẩn quốc tế và các phần còn lại như các Báo cáo kỹ
thuật vẫn chưa được phát hành thành phiên bản cuối.[10]
Phần 1, Hệ thống: Mô tả cảnh, trộn các thông tin audio, video và các thông tin liên
quan, đồng bộ, quản lý bộ đệm,.
Phần 2, Visual: MÃ hoá và mô tả các đối tượng nhìn tự nhiên và nhân tạo.
Phần 3, Audio: MÃ hoá và mô tả các đối tượng audio tự nhiên và nhân tạo.
Phần 4, Kiểm tra sự tuân thủ: các điều kiện tuân thủ, kiểm tra các thủ tục , kiểm tra

dòng bit.
Phần 5, Phần mềm tham khảo: Phần mềm phổ biến thực thi phần lớn các công cụ
trong chuẩn
Phần 6, Phân phối khuôn khổ tích hợp đa phương tiện: Phần giao thức cho truyền
phát đa phương tiện.
Phần 7, Phần mềm tham khảo tối ưu visual: Phần mềm tham khảo tối ưu thực thi
các công cụ mà hoá đối tượng. Phần này là báo cáo kỹ thuật
Phần 8, Truyền MPEG-4 qua IP: Cơ chế đặc biệt để truyền dữ liệu mà MPEG-4 qua
các mạng IP.
Phần 9, Mô tả phần cứng tham khảo:Mô tả VHDL của các công cụ mà hoá MPEG-4
(để thực thi trên các IC). Phần này là báo cáo kỹ thuật và vẫn đang được phát triển
Phần 10, MÃ hoá video tiên tiến: MÃ hoá hiệu quả các đối tượng video tự nhiên.
Phần 11, Mô tả cảnh và cơ chế ứng dụng


15

Phần 12, Định dạng file media
Phần 13, Quản lý và bảo vệ phần mở rộng
Phần 14, Định dạng file MPEG-4
Phần 15, Định dạng file AVC
Phần 16, Mở rộng khung sườn cho linh hoạt

Hiển thị và tương tác
người dùng
Tổng hợp và biểu diễn

Lớp nén
Mô tả
đối tượng


Mô tả
các cảnh

Các đối tượng
Audio Video

Thông tin
truyền ngược

Lớp đồng bộ (hoặc truy nhập)

Lớp phân phối

Truyền dẫn/ Lưu trữ

Hình 1.1: Kiến trúc MPEG-4
Đồ án tập trung nghiên cứu vào lớp nén được mô tả ở phần 2 và phần 10. Chuẩn
H.264 (cũng xem như là Phần 10 của MPEG-4 MÃ hoá video tiên tiến và được
biết chính thức là H.26L) là nổ lực kết hợp giữa nhóm MPEG và nhóm các chuyên


16

gia mà hoá video (Video Coding Experts Group), là nhóm nghiên cứu của Hiệp hội
viễn thông quốc tế (International Telecommunications Union).
MPEG đà phát triển thành công các chuẩn MPEG-1 và MPEG-2 cho mà hoá
video và audio được sử dụng rộng rÃi trong truyền thông và lưu trữ video số. Nhóm
này cũng chịu trách nhiệm đưa ra tiêu chuẩn hoá cho chuẩn MPEG-7 và MPEG-21.
VCEG đà phát triển H.261 được sử dụng rộng rÃi trong hệ thống điện thoại video.

Cả hai nhóm đà kết hợp với nhau để đưa ra đề nghị H.26L và chuyển thành chuẩn
quốc tế (H.264/MPEG-4 Phần 10) do cả ISO/IEC và ITU-T phát hành.
Cũng giống như các chuẩn video trước đây, chuẩn MPEG-4 và H.264 không quy
định bộ mà hoá video. Thay vào đó chuẩn quy định cú pháp của dòng mà bit, ngữ
nghĩa của những thành phần cú phát và tiến trình trong đó các thành phần cú pháp
được giải mà để đưa ra thông tin trực quan. Bằng cách quy định cú pháp và ngữ
nghĩa của dòng mà bit, chuẩn định nghĩa các dòng bít tương thích chấp nhận được.
Bộ mà hoá tương thích phải tạo ra dòng bit mà bộ giải mà có thể giải mà chính xác
dựa theo định nghĩa trong chuẩn. Cả hai chuẩn đều định nghĩa bộ giải mà tham khảo
giả thuyết, các mức thực hiện, hạn chế thực thi trong mỗi bộ nén. Các hạn chế này
bao gồm như dòng mà bit tối đa, kích thước ảnh tối đa mà bộ mà hoá có thực hiện,
những hạn chế này rất quan trọng bởi ví nó liên quan đến bộ nhớ và yêu cầu xử lý
của bộ giải mÃ.
Một số mô hình được ứng dụng vào trong MPEG-4 như tổng hợp tiếng nói để
phát âm từ văn bản dựa trên những mô hình mạng lưới biến dạng. Mạng lưới uốn
cong có thể được dùng để diễn đạt các vật thể video đơn giản. Ví dụ, kết cấu của lá
cờ có thể được ánh xạ vào mạng lưới mà mạng lưới này được bởi những làn sóng mô
hình trong gió. Cấu trúc tổng hợp nhạc cho phép tạo ra vô số cách thiết lập các kỹ
thuật hoà nhạc, do đó cả một dàn đồng ca có thể được mô phỏng. Chữ viết và đồ hoạ
có thể được liên kết để chạy một đoạn video và đồng bộ với các thành phần media.
Người dùng có thể đi vào ngôi nhà biểu diễn 3 chiều và đặc tính âm học của mỗi
phòng có thể được điều chỉnh dựa trên kích thước của mỗi phòng, vì thế âm thanh có
tiếng vang ít hay nhiều. Khi bạn đi vào mô hình ngôi nhà, một người nào đấy đi qua
bạn ở hành hàng thì tiếng nói nghe được ở tai gần to hơn tai kia. Các rÃnh ©m thanh


17

có thể được trộn lại để mang tiếng trống và bass nếu có yêu cầu. Nếu có cuộc hội
thoại khó nghe giữa nhiều tiếng động âm thanh, hội thoại có thể được điều chỉnh to

lên và dễ nghe hơn. Tất cả các thay đổi của người dùng cuối được hỗ trợ trong chuẩn
MPEG-4 thông qua việc thực thi tiêu chuẩn đầy đủ và vượt trội này.
Vấn đề phân tách video thành các đối tượng nghe nhìn riêng biệt để người dùng
có thể thao tác trên các đối tượng đó đến thời điểm này vẫn chưa có bộ mà hoá nào
thực hiện được. Mặc dù RealNetworks, Microsoft và Apple đà thông báo có bộ mÃ
hoá tương thích MPEG-4 nhưng chúng chỉ thực sự đưa vào các chuẩn nén MPEG-4
mà không phân tách thành các đối tượng nghe nhìn riêng biệt.
Trong MPEG-4 nén video được trình bày chủ yếu ở Phần 2, Visual và Phần 10,
MÃ hoá video tiên tiến. Cả hai chuẩn đều tập trung vào nén dữ liệu hình ảnh nh­ng
MPEG-4 Visual nhÊn m¹nh tÝnh linh ho¹t trong khi H.264 nhấn mạnh vào hiệu quả
và độ tin cậy. MPEG-4 cung cấp bộ công cụ các kỹ thuật mà hoá linh hoạt cao, có
khả năng đáp ứng với nhiều kiểu dữ liệu hình ảnh như các khung hình chữ nhật, các
đối tượng video, các ảnh tĩnh, ảnh tự nhiên và ảnh nhân tạo. MPEG-4 cung cấp các
chức năng thông qua các công cụ mà hoá được tổ chức thành các mô tả và phân
thành các nhóm phù hợp với từng loại ứng dụng.
Ngược lại với khả năng linh hoạt trong MPEG-4 Visual, H.264 tập trung đặc biệt
vào hiệu quả nén các khung hình video. Tính năng chính của chuẩn là hiệu quả nén
(nén tốt hơn so với các chuẩn trước đó), hiệu quả truyền (xây dựng nhiều tính năng
hỗ trợ độ tin cậy, khả năng chịu lỗi truyền qua nhiều mạng và kênh truyền) và tập
trung vào nhiều ứng dụng phổ biến của nén video. Hiện tại chỉ với 3 mô tả (trong
khi ở MPEG-4 Visual có 20 mô tả) chủ yếu tập trung vào các ứng dụng truyền tải
phổ biến video. Mô tả dòng cơ bản đặc biệt hữu dụng cho các ứng dụng giao tiếp
như video hội nghị. Mô tả mở rộng đưa thêm các công cụ cho streaming video trên
mạng và mô tả chính chứa các công cụ phù hợp với các ứng dụng thông dụng như
truyền phát video và lưu trữ.
H.264 vừa được phát hành chính thức vào năm 2003 với nhiều công cụ mà hoá
hiệu quả đang là đề tài chính được các nhà nghiên cứu quan tâm và phát triển.


18


Chương II: tìm hiểu mpeg-4 visual và các đặc tả néi dung
2.1 Kh¸i qu¸t MPEG-4 Visual
ChuÈn MPEG-4 cung cÊp mét tập công nghệ đáp ứng các yêu cầu của nhà cung
cấp dịch vụ, các tác giả và người dùng cuối. Mô hình chung của MPEG-4 được thể
hiện ở hình 2.1 liên quan rất nhiều lĩnh vực [15]. Trong phần này chØ tËp trung t×m
hiĨu vỊ lÜnh vùc video.
Chn ISO/IEC 14496 phần 2 (MPEG-4 Visual) cải thiện tiêu chuẩn nổi tiếng
MPEG-2 ở cả lĩnh vực hiệu quả nén (nén tốt hơn với cùng chất lượng hình) và tính
linh hoạt (có nhiều ứng dụng rộng rÃi hơn). Chuẩn này tạo được nhiều giải thuật nén
tiên tiến hơn và cung cấp bộ công cụ mà hoá bao quát hơn và thao tác media số.
MPEG-4 Visual chứa cốt lõi là mô hình mà hoá /giải mà cùng với một số công cụ
mà hoá thêm. Mô hình chính được dựa trên mô hình mà hoá nổi tiếng DPCM/DCT
liên hoàn và hỗ trợ các công cụ cải thiện nén, truyền dẫn tin cậy, mà hoá riêng biệt
các đối tượng ...
BIFS

Video

Nguồn
tín
hiệu

Phân
phối

Phân
kênh

Audio


Tổng hợp

Trình diễn

Đồ hoạ

Chữ

Tương tác

Hình 2.1: Mô h×nh chung cđa MPEG-4


19

Không giống như bất cứ ứng dụng nào yêu cầu tất cả các công cụ phải thực hiện
trong khung MPEG-4 Visual, chuẩn chỉ mô tả một loạt các mô tả. Các mô tả được
đề nghị thành các tập hoặc nhóm công cụ phục vụ cho các loại ứng dụng cụ thể. Các
mô tả bao gồm: Mô tả đơn giản (tập tối thiểu các công cụ cho các ứng dụng không
phức tạp), Mô tả lõi và chính (các công cụ cho mà hoá các đối tượng video có hình
bất kỳ), Mô tả đơn giản thời gian thực tiên tiến (các công cụ cho chịu lỗi truyền dẫn
với độ trễ thấp) và Mô tả đơn giản tiên tiến (cải thiện nén trả giá bằng cách tăng độ
phức tạp).
MPEG-4 Visual được nhúng trong ISO/IEC 14496-2, tài liệu này rất cụ thể và
lên tới hơn 500 trang. Phiên bản 1 được phát hành vào năm 1998 và bổ sung thêm
các công cụ, mô tả vào 2 phụ lục thành chuẩn trong phiên bản 2 vào cuối năm 2001.
Nhiều công cụ và mô tả được kế hoạch cho phụ lục hoặc phiên bản tương lai nh­ng
cÊu tróc cÊu tróc “bé c«ng cơ” cđa MPEG-4 ë phiên bản sau 14496-2 vẫn tương
thích ngược với phiên bản 1.

2.1.1. Các tính năng
MPEG-4 Visual cố gắng đạt các yêu cầu ứng dụng rộng rÃi trong lĩnh vực liên
lạc hình ảnh thông qua tiếp cận dựa vào bộ công cụ mà hoá các thông tin hình ảnh.
Các tính năng chính phân biệt giữa MPEG-4 Visual và các chuẩn mà hoá hình ảnh
trước đây là:
ã Hiệu quả nén các chuỗi video tự nhiên quét liên tục và xen mành (nén các chuỗi
khung hình video chữ nhật). Cốt lõi công cụ nén dựa vào chuẩn ITU-T H.263 và
có thể làm tốt hơn MPEG-1 và MPEG-2. Các cộng cụ lựa chọn thêm vào làm cải
thiện hiệu quả nén.
ã Các đối tượng mà hoá video (các vùng hình bất quy tắc của cảnh video). Đây là
khái niệm mới cho chuẩn nén video và cho phép mà hoá độc lập ảnh và nền trong
cảnh video.
ã Hỗ trợ truyền hiệu quả trên các mạng hiện tại. Công cụ phục hồi lỗi giúp bộ giải
mà phục hồi từ việc truyền lỗi và duy trì thành công kết nèi video trong m«i


20

trường mạng dễ xảy ra lỗi và các công cụ mà hoá dây chuyền giúp hỗ trợ truyền
linh hoạt trong khoảng tốc độ bit.
ã Mà hoá bề mặt tĩnh (dữ liệu ảnh). Các ảnh tĩnh có thể được mà hoá và truyền
trong cùng khung dữ liệu như là chuỗi ảnh động. Công cụ mà hoá bề mặt có thể
hữu ích khi kết hợp biểu diễn ảnh động
ã MÃ hoá các đối tượng hình ảnh sống động như mạng lưới đa giác 2 chiều và 3
chiều, khuôn mặt sống động, thân hình cử động.
ã MÃ hoá cho các ứng dụng đặc biƯt víi chÊt l­ỵng video nh­ “phim tr­êng”.
Trong øng dơng kiểu này, chất lượng hình ảnh quan trọng hơn nhiều tỷ lệ nén
cao.
2.1.2. Các công cụ, đối tượng, mô tả và các mức.
MPEG-4 Visual cung cấp chức năng mà hoá thông qua sự kết hợp giữa các công

cụ, các đối tượng và các mô tả. Công cụ là tập con của chức năng mà hoá để hỗ trợ
cá tính năng đặc biệt ( ví dụ như mà hoá video cơ bản, video xen mành, các hình đối
tượng ...). Đối tượng là thành phần video (ví dụ như chuỗi các khung hình chữ nhật,
chuỗi các vùng có hình tuỳ ý, ảnh tĩnh) được mà hoá dùng một hoặc nhiều công cụ.
Mô tả là tập các kiểu đối tượng mà bộ mà có khả năng thực hiện công việc.
Các mô tả của MPEG-4 Visual để mà hoá các cảnh video tự nhiên được liệt kê
trong bảng 2.1 và trong khoảng mô tả đơn giản rồi đến mô tả các hình bất kỳ và mÃ
hoá các đối tượng liên hoàn đến mô tả mà hoá với chất lượng phim trường.
Bảng 2.1: Các mô tả MPEG-4 Visual cho mà hoá video tự nhiên
Mô tả MPEG-4 Visual
Đơn giản
Đơn giản tiên tiến
Đơn giản tiên tiến thời
gian thực
Lõi
Chính
Hiệu quả mà hoá tiên
tiến
N-bit

Các tính năng chính
MÃ hoá với độ phức tạp của các khung hình chữ nhật thấp
Cải thiện hiệu quả mà hoá các khung hình chữ nhật và hỗ trợ
video xen mành
MÃ hoá các khung hình chữ nhật cho truyền phát video thời
gian thực
MÃ hoá cơ bản các đối tượng video có hình tuỳ ý
Nhiều tính năng mà hoá các đối tượng video
Hiệu quả cao mà hoá các đối tượng video
MÃ hoá các đối tượng video với độ lấy mẫu phân giải hơn 8 bit



21

Liên hoàn đơn giản
Liên hoàn hạt
Liên hoàn chính
Liên hoàn bề mặt
Liên hoàn bề mặt tiên
tiến
Lõi tiến tiên
Studio đơn giản
Studio chính

MÃ hoá liên hoàn các khung hình video chữ nhật
MÃ hoá liên hoàn tiên tiến các khung hình video chữ nhật
MÃ hoá liên hoàn các đối tượng video
MÃ hoá liên hoàn các bề mặt tĩnh
Các bề mặt tĩnh liên hoàn cải thiện và các tính năng dựa vào đối
tượng
Kết hợp các tính năng của các mô tả Đơn giản, Chính và liên
hoàn bề mặt tiên tiến
MÃ hoá các đối tượng với chuỗi video chất lượng cao
MÃ hoá các đối tượng với chuỗi video chất lượng cao có cải
thiện hiệu quả nén

Các mô tả trong bảng 2.2 cho mà hoá video nhân tạo (hoạt hình hoặc các mô
hình) và các mô tả kết hợp (kết hợp các tính năng từ mà hoá video nhân tạo và tự
nhiên). Các mô tả này không dùng cho nén video tự nhiên.
Bảng 2.2: Các mô tả MPEG-4 Visual cho mà hoá video nhân tạo và kết hợp

Mô tả MPEG-4 Visual
Bề mặt chuyển động cơ bản
Mặt chuyển động đơn giản
Mặt và thân chuyển động đơn giản
Kết hợp

Các tính năng chính
MÃ hoá khối 2 chiều với bề mặt tính
Các mô hình mặt người chuyển động
Các mô hình mặt và thân chuyển động
Kết hợp các tính năng của Đơn giản, Lõi, Bề mặt
chuyển động cơ bản, Mặt chuyển động đơn giản

Các mô tả là cơ chế quan trọng để khun khÝch c¸c bé m· ho¸ cđa c¸c h·ng
kh¸c nhau có thể tương thích lẫn nhau. Chuẩn MPEG-4 Visual mô tả nhiều công cụ
mà hoá và dường như không yêu cầu bất kỳ bộ giải mà thương mại nào phải thực thi
tất cả các công cụ đó. Thay vì đó, người thiết kế bộ giải mà chọn các mô tả chứa
thích hợp với ứng dụng cần thiết của họ. Ví dụ bộ mà hoá cơ bản thực thi trên bộ xử
lý thấp có thể dùng mô tả đơn giản, bộ mà hoá cho ứng dụng streaming video có thể
chọn mô tả đơn giản thời gian thực ... Các mô tả có ảnh hưởng lớn đến thị trường
hơn những cái khác. Các mô tả đơn giản và đơn giản tiên tiến được phổ biến với
nhiều hÃng sản xuất và người dùng trong khi các mô tả mà hoá cho các đối tượng
hình bất kỳ rất hạn chế.
Các mô tả định nghĩa tập con của các công cụ mà hoá và các mức định nghĩa các
thông số của dòng bit. Bảng sau liệt kê các mức của mô tả đơn giản, đơn giản tiên
tiến và đơn giản tiên tiến thời gian thực. Tại mỗi mức ép buộc khả năng thực hiện tối


22


đa để giải chuỗi mà MPEG-4. Ví dụ, thiết bị cuối với khả năng xử lý hạn chế và ít
bộ nhớ có thể chỉ hỗ trợ giải mà dòng bít mô tả đơn giản mức 0. Các mức định nghĩa
do hạn chế bộ nhớ đệm, kích thước khung hình giải mà và tốc độ xử lý (số
macroblock trên giây) và số các đối tượng video. Thiết bị cuối phải đối mặt với các
thông số này để đảm bảo khả năng giải mà thành công thích nghi với dòng bít mô tả
đơn giản mức 0. Các mức cao hơn của mô tả đơn giản yêu cầu bộ giải mà phải làm
việc với 4 đối tượng video.
Bảng 2.3: Các mức trong mô tả đơn giản
Mô tả

Mức

Độ phân giải

Đơn giản

L0
L1
L2
L3
L0

Đơn giản tiên tiến
(AS)

Đơn giản tiên tiến
thời gian thực

Số đối tượng tối đa


176x144
176x144
352x288
352x288
176x144

Tốc độ bÝt
tèi ®a
64 kbps
64 kbps
128 kbps
384 kbps
128 kbps

L1
L2
L3
L4
L5
L1

176x144
352x288
352x288
352x576
720x576
176x144

128 kbps
384 kbps

768 kbps
3 Mbps
8 Mbps
64 kbps

4 AS hoặc đơn giản
4 AS hoặc đơn giản
4 AS hoặc đơn giản
4 AS hoặc đơn giản
4 AS hoặc đơn giản
4 ARTS hoặc đơn giản

L2
L3
L4

352x288
352x288
352x288

128 kbps
384 kbps
2 Mbps

4 ARTS hoặc đơn giản
4 ARTS hoặc đơn giản
16 ARTS hoặc đơn giản

1 đơn giản
4 đơn giản

4 đơn giản
4 đơn giản
1 AS hoặc đơn giản

2.1.3 Các đối tượng video
Một trong những đóng góp quan trọng của MPEG-4 Visual là loại bỏ cách nhìn
truyền thống về chuỗi video như là một tập các khung hình video chữ nhật. Thay vì
đó, MPEG-4 Visual xem chuỗi video như là một tập hợp gồm một hoặc nhiều các
đối tượng video. MPEG-4 Visual định nghĩa các đối tượng video là một thực thể linh
hoạt và người dùng được phép truy nhập (tìm kiếm, hiển thị) và thao tác ( cắt và
dán). Một đối tượng video (Video Object VO) là một vùng video có hình dáng tuỳ ý
và chứa trong thời gian tuỳ ý. Một VO tại một thời điểm cụ thể gọi là lớp các đối
tượng video (Video Object Plane VOP)


23

Hình 2.2: Ba chế độ lớp các đối tượng video (I-VOP, P-VOP, B-VOP) [18]
2.2 MÃ hoá các khung hình chữ nhật.
Mặc dù có khả năng mà hoá linh hoạt các đối tượng nhưng các ứng dụng phổ
biến của MPEG-4 là mà hoá toàn bộ các khung hình video. Các công cụ để làm việc
với các VOP chữ nhật ( điển hình là toàn bộ các khung hình) được nhóm với nhau
gọi là các mô tả đơn giản. Các công cụ cơ bản được lấy từ các chuẩn mà hoá video
trước đây. MÃ hoá DCT các macroblock với dự đoán bù chuyển động. Mô tả đơn
giản được dựa vào mô hình nổi tiếng DPCM/DCT nhiều công cụ thêm vào để cải
thiện hiệu quả mà hoá và hiệu quả truyền. Do mô tả đơn giản được phổ biến rộng rÃi
nên các mô tả cải thiện cho các VOP chữ nhật đang được phát triển. Mô tả đơn giản
tiên tiến cải thiện hơn hiệu quả mà hoá và hỗ trợ cho video xen mành. Mô tả tiên
tiến thời gian thực đưa thêm các công cụ hữu dụng cho các ứng dụng streaming
video thời gian thực.

2.2.1 Định dạng video vào ra
Đầu vào của bộ mà hoá và đầu ra của bộ giải mà MPEG-4 Visual là chuỗi video
theo định dạng 4:2:0, 4:2:2 hoặc 4:4:4 liên tục hoặc xen mành.


24

2.2.2 Mô tả đơn giản
Bộ mà hoá tương thích với mô tả đơn giản phải có khả năng mà hoá và giải mÃ
các đối tượng video đơn giản sử dụng các công cụ sau:
ã I-VOP (mà trong khung chữ nhật VOP, định dạng video liên tục)
ã P-VOP (mà liên khung chữ nhật VOP, định dạng video liên tục)
ã Phần đầu ngắn (chế độ tương thích với H.263)
ã Các công cụ nén hiệu quả (4 vectơ chuyển động cho mỗi macroblock, vectơ
chuyển động không hạn chế, dự đoán trong khung)
ã Các công cụ truyền hiệu quả (các gói video, phân đoạn dữ liệu, mà hoá độ dài
thay đổi đảo ngược)
Mô tả đơn giản của MPEG-4 Visual có mô hình nổi tiếng về tốc độ bit rất thấp
(VLBV). Các công cụ trong mô tả bit rất thấp dựa vào chuẩn H.263 và chế độ phần
đầu ngắn cho phép tương thích trực tiếp (tại mức các khung hình) giữa bộ mà hoá
mô tả đơn giản MPEG-4 và H.263
Các công cụ mà hoá cơ bản
Khung
hình
nguồn
Khung
hình

giải mÃ


DCT

Q

Sắp lại

RLE

VLE
MÃ hoá
I-VOP

IDCT

Q-1

Sắp lại

RLD

Hình 2.3: Các bước mà hoá và giải mà I-VOP

VLD


25

ME

Khung

hình
nguồn
Khung
hình
giải mÃ

MCP

Xây dựng lại
khung hình

DCT

Q

Sắp lại

RLE

VLE
MÃ hoá
P-VOP

MCR

IDCT

Q-1

Sắp lại


RLD

VLD

Hình 2.4: Các bước mà hoá và giải mà P-VOP
Các công cụ mà hoá hiệu quả
Các công cụ sau, một phần của mô tả đơn giản có thể cải thiện hiệu quả nén. Các
cải thiện này chỉ có nếu không sử dụng chế độ phần đầu ngắn.
Bốn vectơ chuyển động cho mỗi macroblock
Dự đoán chuyển động hiệu quả hơn với kích thước khối nhỏ hơn. Mặc định kích
thước khối cho bù chuyển động là 16x16 mẫu (chói), 8x8 mẫu (màu) có kết quả là
một vectơ chuyển động cho mỗi macroblock. Công cụ này cho phép bộ giải mà chọn
lựa khối bù chuyển động kích thước nhỏ hơn 8x8 mẫu (chói) và 4x4 mẫu (màu). Chế
độ này có thể hiệu quả hơn nhiều trong dự đoán chuyển động đặc biệt là các vùng
chuyển động phức tạp hoặc vùng gần đường biên của đối tượng chuyển động. Lúc
đó cần phải gửi 4 vectơ chuyển động thay vì một vectơ và bộ mà hoá có thể chọn để
gửi một hoặc 4 vectơ chuyển động cho macroblock đó.
Các vectơ chuyển động không hạn chế.
Trong một vài trường hợp, macroblock phù hợp nhất có thể là khối 16x16 vượt ra
ngoài đường biên của VOP tham khảo. Khối macroblock phù hợp lấy được từ vectơ
chuyển động vào vùng ngoại suy. Công cụ vectơ chuyển động không hạn chế cho
phép các vectơ vượt ra ngoài đường biên của VOP tham khảo. Nếu một mẫu chỉ
định bởi vectơ chuyển động vượt ra ngoài VOP tham khảo thì mẫu gần biên nhất sẽ
được dùng thay thế. Chế độ vectơ chuyển động không hạn chế có thể cải thiện hiệu


×