Tải bản đầy đủ (.pdf) (66 trang)

Tổng quan về IPTV potx

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.27 MB, 66 trang )



Mở đầu

Sự phát triển của mạng Internet toàn cầu nói riêng và công nghệ thông
tin nói chung đã đem lại tiến bộ và phát triển vượt bậc của khoa học kĩ thuật.
Internet không những đã rút ngắn khoảng cách về không gian, thời gian mà
còn mạng lại cho mọi người, mọi quốc gia và cả thế giới những lợi ích to lớn.
Tốc độ phát triển nhanh chóng của công nghệ thông tin là một trong những lợi
ích to lớ
n, có vai trò quan trọng và tầm ảnh hưởng rộng khắp.
Với sự phát triển nhanh chóng của mạng Internet băng rộng còn làm
thay đổi cả về nội dung và kĩ thuật truyền hình. Hiện nay truyền hình có nhiều
dạng khác nhau: truyền hình số, truyền hình vệ tinh, truyền hình cáp, truyền
hình Internet và IPTV. IPTV đang là cấp độ cao nhất và là công nghệ truyền
hình của tương lai. Sự vượt trội trong kĩ thuật truyền hình của IPTV là tính
năng tương tác gi
ữa hệ thồng với người xem, cho phép người xem chủ động
về thời gian và khả năng triển khai nhiều dịch vụ giá trị gia tăng tiện ích khác
trên hệ thồng nhằm đáp ứng nhu cầu của người sử dụng.
Hiện nay trên thế giới đã có một số quốc gia triển khai thành công IPTV.
Theo các chuyên gia dự báo thì tốc độ phát triển thuê bao IPTV sẽ tăng theo
cấp số nhân theo từng năm. Ở Vi
ệt Nam hiện nay, một số nhà cung cấp đang
thử nghiệm dịch vụ IPTV trên mạng băng rộng ADSL.
















IPTV
2
CHƯƠNG 1 TỔNG QUAN VỀ IPTV

1.1 Giới thiệu về truyền hình số theo giao thức IP:
IPTV là tên viết tắt của cụm từ Internet Protocol Television _ truyền hình
qua giao thức Internet.
ITPV theo định nghĩa chính thức như sau: IPTV được định nghĩa là các
dịch vụ đa phương tiện như truyền hình ảnh, tiếng nói, văn bản, dữ liệu được
phân phối qua các mạng dựa trên IP mà được quan lý để cung cấp các cấp
chất lượng dị
ch vụ, bảo mật, tính tương tác, tính tin cậy theo yêu cầu. (theo
ITU – T FG IPTV)
Như vậy IPTV đóng vai trò phân phối các dữ liệu, kể cả hình ảnh, âm
thanh, văn bản qua mạng sử dụng giao thức Internet. Điều này nhấn mạnh
vào việc Internet không đóng vai trò chính trong việc truyền tải thông tin truyền
hình hay bất kì loại nội dung truyền hình nào khác. Thay vào đó, IPTV sử
dụng IP là cơ chế phân phối mà theo đó có thể sử dụng Internet, đại di
ện cho
mạng công cộng dựa trên IP, hay có thể sử dụng mạng riêng dựa trên IP.
Có thể thấy, IPTV là một dịch vụ số mà có khả năng cung cấp những

tính năng vượt trội hơn khả năng của bất kì cơ chế phân phối truyền hình nào
khác. Ví dụ, set – top box IPTV có thể thông qua phần mềm để cho phép xem
đồng thời 4 chương trình truyền hình trên màn hiển thị, hay có thể nhận tin
nhắn sms, e – mail….
Tiềm năng củ
a IPTV là rất lớn. Dự đoán rằng, năm 2008 sẽ có khoảng
20 triệu gia đình sử dụng dịch vụ IPTV. Nếu chúng ta trả phí 50$ mỗi tháng
cho dịch vụ IPTV, để cả một set – top box, thì ngân sách sẽ thu về khoảng 12
tỉ $ một năm trong vài năm.

1.2 Một số đặc tính IPTV:

- Hỗ trợ truyền hình tương tác: Khả năng hai chiều của hệ thống
IPTV cho phép nhà cung cấp dịch vụ phân phố
i toàn bộ các ứng dụng TV
tương tác. Các loại dịch vụ được truyền tải thông qua một dịch vụ IPTV có thể
bao gồm TV trực tiếp chuẩn, TV chất lượng cao (HDTV), trò chơi tương tác,
và khả năng duyệt Internet tốc độ cao.
IPTV
3
- Sự dịch thời gian: IPTV kết hợp với một máy ghi video kĩ thuật số
cho phép dịch thời gian nội dung chương trình – một cơ chế cho việc ghi và
lưu trữ nội dung IPTV để xem sau.
- Cá nhân hóa: Một hệ thống IPTV từ kết cuối đến kết cuối hỗ trợ
truyền thông tin hai chiều và cho phép người dùng ở kết cuối cá nhân hóa
những thói quen xem TV của họ bằng cách cho phép họ quyết định nhữ
ng gì
họ muốn xem và khi nào họ muốn xem.
- Yêu cầu về băng thông thấp: Thay vì phân phối trên mọi kênh để
tới mọi người dùng, công nghệ IPTV cho phép nhà cung cấp dịch vụ chỉ

truyền trên một kênh mà người dùng yêu cầu. Đặc điểm hấp dẫn này cho
phép nhà điều hành mạng có thể tiết kiệm băng thông của mạng.
- Có thể truy xuất qua nhiều thiết bị: Việc xem nội dung IPTV bây
giờ không chỉ
giới hạn ở việc sử dụng TV. Người dùng có thể sử dụng máy
PC hay thiết bị di động để truy xuất vào các dịch vụ IPTV.

1.3 Sự khác biệt giữa IPTV và truyền hình Internet:
Do đều được truyền trên mạng dựa trên giao thức IP, người ta đôi lúc hay
nhầm IPTV là truyền hình Internet. Tuy nhiên, 2 dịch vụ này có nhiều điểm khác
nhau:

• Các nền khác nhau:
Truyền hình Internet sử dụng mạng Internet công cộng để phân phát các nội
dung video tới người sử dụng cuối.
IPTV sử dụng mạng riêng bảo mật để truyền các nội dung video đến khách
hàng. Các mạng riêng này thường được tổ chức và vận hành bởi nhà cung cấp
dịch vụ IPTV.

Về mặt địa lí
Các mạng do nhà cung cấp dịch vụ viễn thông sở hữu và điều khiển không cho
phép người sử dụng Internet truy cập. Các mạng này chỉ giới hạn trong các khu vực địa
lí cố định.
Trong khi, mạng Internet không có giới hạn về mặt địa lí, người dùng Interet nào
cũng có thể xem truyền hình Internet ở bất kì đâu trên thế giới.
• Quyền sở hữu hạ tầng mạng
Khi nội dung video được gửi qua mạng Internet công cộng, các gói sử
dụng giao thức Internet mạng nội dung video có thể bị trễ hoặc mất khi nó di
IPTV
4

chuyển trong các mạng khác nhau tạo nên mạng Internet công cộng. Do đó, nhà
cung cấp các dịch vụ truyền hình ảnh qua mạng Internet không đảm bảo chất
lượng truyền hình như với truyền hình mặt đất, truyền hình cáp hay truyền hình
vệ tinh. Thực tế là các nội dung video truyền qua mạng Internet khi hiển thị trên
màn hình TV có thể bị giật và chất lượng hình ảnh thấp.
Trong khi, IPTV chỉ được phân phối qua một hạ tầng mạng của nhà cung
c
ấp dịch vụ. Do đó người vận hành mạng có thể điều chỉnh để có thể cung cấp
hình ảnh với chất lượng cao.
• Cơ chế truy cập
Một set-top box số thường được sử dụng để truy cập và giải mã nôi j dung
viedeo được phân phát qua hệ thống IPTV , trong khi PC thương được sử dụng để
truy cập các dịch vụ Internet. Các loại phần mềm được sử dụng trong PC thườ
ng
phụ thuộc vào loại nội dung truyền hình Internet. Ví dụ như, để download các
chương trình TV từ trên mạng Internet, đôi khi cần phải cài đặt các phần mềm
media cần thiết để xem được nội dung đó. Hay hệ thống quản lí bản quyền cũng
cần để hỗ trợ cơ chế truy cập.
• Giá thành
Phần trăm nội dung chương trình được phân phát qua mạng Internet công
cộng tự do thay đổi. Đi
ều này khiến các công ty truyền thông đưa ra các loại dịch
vụ dựa trên mức giá thành. Giá thành các loại dịch vụ IPTV cũng gần giống với
mức phí hàng tháng của truyền hình truyền thống. Các nhà phân tích mong rằng
truyền hình Internet và IPTV có thể hợp lại thành 1 loại hình dịch vụ giải trí.

1.4 Cơ sở hạ tầng một mạng IPTV

IPTV
5

Hình 1.1 Sơ đồ khối đơn giản của một hệ thống IPTV

• Trung tâm dữ liệu IPTV:
Cũng được biết đến là “đầu cuối_headend”. Trung tâm dữ liệu IPTV
nhận nội dung từ nhiều nguồn khác nhau, bao gồm truyền hình địa phương,
các nhà tập hợp nội dung, nhà sàn xuất, qua đường cáp, trạm số mặt đất hay
vệ tinh. Ngay khi nhận được nội dung, một số các thành phần phần cứng khác
nhau t
ừ thiết bị mã hóa và các máy chủ video tới bộ định tuyến IP và thiết bị
bảo mật dành riêng được sử dụng để chuẩn bị nội dung video cho việc phân
phối qua mạng dựa trên IP. Thêm vào đó, hệ thống quản lý thuê bao được
yêu cầu để quản lý và hồ sơ và phí thuê bao của những người sử dụng. Chú ý
rằng, địa điểm thực của trung tâm dữ liệu IPTV được yêu cầu bở
i hạ tầng cơ
sở mạng được sử dụng bởi nhà cung cấp dịch vụ.
• Mạng truyền dẫn băng thông rộng:
Việc truyền dẫn dịch vụ IPTV yêu cầu kết nối điểm – điểm. Trong trường
hợp triển khai IPTV trên diện rộng, số lượng các kết nối điểm – điểm tăng
đáng kể và yêu cầu độ rộ
ng băng thông của cơ sở hạ tầng khá rộng. Sự tiến
bộ trong công nghệ mạng trong những năm qua cho phép những nhà cung
cấp viễn thông thỏa mãn một lượng lớn yêu cầu độ rộng băng thông mạng. Hạ
tầng truyền hình cáp dựa trên cáp đồng trục lai cáp quang và các mạng viễn
thông dựa trên cáp quang rất phù hợp để truyền tải nội dung IPTV.
• Thiết bị người dùng IPTV:
Thiết bị ngườ
i dùng IPTV (IPTVCD) là thành phần quan trọng trong việc
cho phép mọi người có thể truy xuất vào các dịch vụ IPTV. Thiết bị này kết nối
vào mạng băng rộng và có nhiệm vụ giải mã và xử lý dữ liệu video dựa trên IP
gửi đến. Thiết bị người dùng hỗ trợ công nghệ tiên tiến để có thể tối thiểu hóa

hay loại bỏ hoàn toàn ảnh hưởng của lỗi, sự cố mạng khi đang xử lý nội dung
IPTV.
• Mạng gia đình:
Mạng gia đình kết nối với một số thiết bị kĩ thuật số bên trong một diện
tích nhỏ. Nó cải tiến việc truyền thông và cho phép chia sẻ tài nguyên (các
thiết bị) kĩ thuật số đắt tiền giữa các thành viên trong gia đình. Mục đích của
mạng gia đình là để cung cấp việc truy cập thông tin, như là tiếng nói, âm
thanh, dữ liệu, giải trí, giữa nhữ
ng thiết bị khác nhau trong nhà. Với mạng gia
đình, người dùng có thể tiết kiệm tiền và thời gian bởi vì các thiết bị ngoại vi
IPTV
6
như là máy in và máy scan, cũng như kết nối Internet băng rộng, có thể được
chia sẻ một cách dễ dàng.

1.5 Ưu điểm của IP và sự lựa chọn IP cho IPTV:
Truyền hình số được định thời một cách chính xác, là dòng dữ liệu liên
tục có tốc độ bit không đổi, thường hoạt động trên các mạng mà mỗi tín hiệu
được truyền đều phục vụ cho mục đích truyền hình. Trái với truyền hình,
m
ạng IP truyền những loại dữ liệu khác nhau từ rất nhiều nguồn trên một kênh
chung, bao gồm thứ điện tử, trang web, tín nhắn trực tiếp, tiếng nói qua IP
(VoIP) mà nhiều loại dữ liệu khác. Để truyền đồng thời những dữ liệu này,
Mạng Internet phân thông tin thành các gói. Như vậy, rõ ràng là IP và truyền
hình không phải là một sự kết hợp hoàn hảo (lý tưởng) về công nghệ.
Mặc dù không tương thích về că
n bản, nhưng thị trường IPTV vẫn bùng
nổ. Vậy lý do tại sao lại chọn các mạng dựa trên IP để truyền tín hiệu truyền
hình? Câu trả lời cho câu hỏi này có thể tóm tắt thành năm điểm sau:
- Mạng IP băng rộng đã vươn tới rất nhiều gia đình ở nhiều nước,

các nhà cung cấp dịch vụ truyền hình có thể sử dụng những mạng này để
phát các dịch v
ụ truyền hình mà không cần xây dựng hệ thông mạng riêng của
họ.
- IP có thể đơn giản công việc phát các dịch vụ truyền hình mới,
như là chương trình tương tác, truyền hình theo yêu cầu…
- Giá thành của mạng IP tiếp tục giảm do số thiết bị được sản xuất
mỗi năm rất lớn và sự tồn tại của các chuẩn trên toàn thế giới.
- Mạng IP có mặt trên toàn thế gi
ới, và số người dùng mạng
Internet tốc độ cao tiếp tục tăng rất nhanh.
- IP là công nghệ hoàn hảo cho nhiều ứng dụng khác nhau, bao
gồm sự trao đổi dữ liệu, mạng cục bộ, chia sẻ tệp tin, lướt web và nhiều nhiều
nữa…
IP cung cấp cơ chế để định hướng truyền gói giữa các thiết bị được liên
kết trong mạng. IP là một giao thức phổ biến được s
ử dụng khắp các mạng
Internet và hàng triệu các mạng khác có sử dụng IP. Không có IP, mọi việc sẽ
hỗn loạn bởi vì không có cách nào để một thiết bị gửi dữ liệu một cách riêng
biệt tới một thiết bị khác.
Với việc sử dụng các mạng IP để truyền dẫn tín hiệu truyền hình, việc
xem truyền hình hiện đại sẽ rất khác so với xem truyền hình trước đây. Các tín
IPTV
7
hiệu truyền hình bây giờ không khác gì những dữ liệu khác. Nhờ đó, ngoài
các kênh truyền hình quảng bá truyền thống, chúng ta sẽ có thêm những kênh
truyền hình riêng biệt, tương tác để thỏa mãn nhu cầu của từng người.

1.6 Nhu cầu thực tế của IPTV


Theo nhóm nghiên cứu đa phương tiện (MRG ) trong “ Dự đoán IPTV
toàn cầu năm 2005-2009”: tốc độ phát triển IPTV rất cao: gần 1000%. Thị
trường IPTV trên thế giới phát triển ở mứ
c tăng kép hàng năm 78% lên tới
36.9 triệu người sử dụng vào năm 2009. Doanh thu dịch vụ còn tăng nhanh
hơn trong cùng thời kì, từ 880 triệu USD tới 9.9 tỷ USD.
Theo Informa: tốc độ phát triển IPTV tăng nhanh vào 5 năm tới và đạt
25.9 triệu thuê bao IPTV vào cuối năm 2010.
Theo nguyên cứu TDG: Doanh thu IPTV toàn cấu sẽ đạt trên 17 tỷ USD
vào năm 2010.
Và trên thực tế, dịch vụ IPTV đã được triển khai và đạt dược thành công
ở nhiều nước như Italy ( Fast Web), Hồ
ng Kông (PCCW), Canada (
Manitoba) và Japan (Yahoo BB).
Tại thị trường Trung Quốc, IPTV bắt đầu được triển khai từ năm 2004
với 2 nhà cung cấp hàng đầu là CHINA Telecom và ZTE cùng với những nhà
cung cấp khác.
Số lượng thuê bao có thể tăng lến tới 3-6 triệu vào năm 2010.
IPTV được triển khai với băng thông 2M với kĩ thuật nén MPEG-4 part
10 cho TV thường và 6M đối với HDTV.
Các dịch vụ triển khai trên IPTV đến với người dùng:
+ LiveTV: truyền hình trực tuyến
+ VoD: truyền hình theo yêu cầ
u
+ RoD: Dịch vụ ghi hình theo yêu cầu
+ NVoD: Xem chương trình theo lịch phát sóng



IPTV

8
CHƯƠNG 2: CHUẨN NÉN SỬ DỤNG TRONG IPTV
Nén cho phép các nhà cung cấp dịch vụ truyền các kênh hình và tiếng với
chất lượng cao qua mạng IP băng rộng. Do mắt người ko thể phân biệt được
toàn bộ các phần của hình ảnh. Do đó việc nén sẽ làm giảm độ lớn của tín hiệu
ban đầu bằng cách bỏ bớt các phần của hình ảnh.
2.1 Nén MPEG:

MPEG là 1 chuẩn nén được sử dụng rộng rãi trong thông tin vệ tinh,
truyền hình cáp và trong các h
ệ thống truyền hình mặt đất. MPEG (moving
pictures exert group) được thành lập nhằm phát triển các kĩ thuật nén cho phù
hợp vói việc truyền hình ảnh.
Từ khi được thành lập, MPEG đã đưa ra các chuẩn
nén như: MPEG-1, MPEG-2, MPEG4-( Part 2 và part 10), MPEG-7, và MPEG-21.
Trong các chuẩn này, MPEG-2 và MPEG-4 Part 10 được sử dụng rộng rãi trong IPTV.
2.2 Chuẩn MPEG-2:
MPEG 2 là 1 công nghệ đạt được thành công lớn và là 1 chuẩn nén có ưu
thế vượt trội dành cho truyền hình số được truyền qua nhiều mạng truyền thông
băng rộng. Chuẩn nén MPEG-2 được chia thành 2 loại nén hình và nén tiếng.
Nén hình: Video ở dạng cơ bản là 1 chuỗi các ảnh liên tục. 1 frame được
định nghĩa với 1 chuỗi bit header. Mắt người thường thấy thoải mái khi xem TV
với tốc độ 25 hình/s. Sẽ không có lợi nếu phát với tố
c độ nhanh hơn vì người xem
không thể nhận ra sự khác biệt. do đó có thể dung lượng của những hình ảnh
bằng cách nén chúng lại. Các bộ nén hình được sử dụng với mỗi frame mà vẫn
giữ chất lượng hình ảnh cao.
2.2.1 Quá trình nén MPEG:
Phần đầu tiên của nén bao gồm 1 quá trình tiền đồng bộ. Quá trình này cơ
bản bao gồm việc làm giảm kích thước của các frame. Làm giảm kích thước của

các frame chính là làm giảm số lượng bit ,
điều này cũng giúp giảm băng thông
cần thiết để truyền tín hiệu. Tuy nhiên, quá trình này không phải ko có trở ngại. Ví
IPTV
9
dụ, sự giảm kích thước của khung có thể thường xuyên gây ra những lỗi tỉ số
cạnh (giống như sai tỉ lệ 4/3 hay 16/9) khi được thể hiện trên màn hình TV có độ
phân giải thấp.
Phần 2 của quá trình nén tin hiệu là chia 1 frame ảnh ra thành các block có
kích thước 8 nhân 8 pixel –khối mã hóa nhỏ nhất trong giải thuật của MPEG. Có 3
loại block; độ chói Y, thành phần màu đỏ C
r
hoặc xanh C
b.
Các loại block thành
phần màu mang thông tin về những màu khác nhau của hình ảnhtrg khi độ chói
mang thông tin về những phần màu đen hoặc trắng của hình ảnh.
Khi hoàn thành 2 phần trên, MPEG sẽ thực hiện 1 hàm toán được gọi là
biến đổi cosin rời rạc đối với mỗi block riêng biệt. Kết quả thu được là một ma trận
hệ số 8*8. DCT sẽ biến đổi sự khác nhau về không gian thành các tần số khác
nhau, nhưng không làm thay đổi các thông tin trong block, các blcok ban đầu sẽ
được tái tạo lại 1 cách chính xác sử dụng biến đổi ngược. Nguyên tắc thực hiện
hàm này bao gồm việc chia các block thành các phần tùy theo mức độ quan
trọng. Những phần quan trọng sẽ đươc giữ nguyên cho tới bước tiếp theo trong
khi các phần còn lại sẽ bị giảm bớt. Điều này sẽ đảm bảo rằng mắt người không
chú ý tới việc những phần không quan trọng của block bị bỏ bớt khi tốc bít bị hạn
chế.
Bước tiếp theo trong MPEG là quá trình lượng tử hóa. Quá trình lượng tử
hóa dữ liệu số là quá trình làm giảm số lượng bít của các block. Mức lượng tử đối
với mỗi tìn hiệu video là rất quan trọng.

Khi tất cả các block trong frame đều đã đc nén lại, MPEG sẽ ngắt các frame
thành 1 dạng mới gồm nhiều block gọi l à macro block. Mỗi macro block có kích
thướ c 16 nhân 16 chứa các block độ chói và block thành phần màu. Nếu có sự
khác bi
ệt giữa frame cuối cùng và frame hiện tại, các thiết bị nén MPEG sẽ chuyển
những block mới này tới 1 vị trí mới trên frame hiện tại. Điều này giúp không phải
gửi đi những hình ảnh mới hoàn toàn, do đó có thể tích kiệm băng thông. Có 2
cách để thực hiện điều đó:
IPTV
10
Nén theo không gian
là làm giảm các bít trên từng frame riêng biệt. điều này
có thể đạt được do các pixel luôn đứng cạnh nhau trong các frame thường có giá
trị giống nhau. Do đó thay về mã hóa từng pixel riêng biệt. Kĩ thuật nén theo
không gian này mã hóa sự khác biệt giữa các pixel cạnh nhau. Số lượng bít cần
thiết để mã hóa những khác biệt này ít hơn số lượng bít cần thiết để mã hóa từng
pixel riêng biệt.
Nén theo thời gian là làm giảm các bit giữa các frame liên tục. Trong quá
trình sản xuất video có những thông tin được l
ặp lại giữa những frame liên tiếp.
VD: nếu trên hình có 1 bức tường , bức tường vẫn xuất hiện liên tục trong 30 hình
tiếp theo, mà không thay đổi ( bức tường đó không thay đổi trong vòng 1s) . thay
vì mã hóa 30 lần liên tục trong 1s, nên thời gian chỉ gửi đi các thông tin dự đoán
chuyển động giữa những frame hình, trong trương hợp của bức tường trong VD
trên, dự đoán chuyển động được đặt = 0.
Có nhiều phuơng thức khác nhau để nén 1 frame hình. VD như
với 1 frame
hình có độ phức tạp cao thì cần phương pháp nén có yếu tố nén theo không gian
thấp bởi vì chỉ có 1 phần rất nhỏ các pixel được lặp lại. Nếu tốc đọ bit có sự thay
đổi lớn thì khó có thể truyền đi trong mạng IP, vì thế nhiều bộ mã hóa bao gồm cả

chức năng đệm để có thể điều khiển và quản lí tốc độ chung mà tại đó các bit được
truyền đi t
ới tầng tiếp theo của hệ thống sản xuất video.
Bước tiếp theo của quá trình nén MPEG là mã hóa các macroblock thành
các slice. Slice là 1 chuỗi ảnh đặt nằm ngang cạnh nhau từ trái sang phải. Nhiều
slice kết hợp với nhau tạo thành 1 hình. Mỗi slice được mã hóa độc lập với nhau
để hạn chế lỗi.
2.2.2 Các ảnh trong chuẩn nén MPEG:
Chuẩn nén MPEG định nghĩa 3 loại ảnh:
Intra-frame (I-frame) frame được mã hóa riêng biệt không phụ thuộc các
frame trước đó hoặc tiế
p theo.Mã hóa theo hệ thống đc sử dụng gần giống như
IPTV
11
nén JPEG. Đây là frame độc lập và đc sử dụng để tạo ra các loại frame khác.
P-frame ( forward predicted frame) khung dự đoán ảnh tiếp theo là
khung dự đoán ảnh dựa trên các frame I trước đó. MPEG không thực sự mã hóa
ảnh mà chứa các thông tin về chuyển động cho phép IPTVCD có thể tái tạo lại
frame. P-frame yêu cầu ít băng thông hơn I-frame, điều này là yếu tố quan trọng
đối với mạng dựa trên IPTV.
B-frame (Bi-directional predicted frame ) frame dự đoán hướng: B-
frame là frame đc tạo thành từ
việc kết hợp các thông tin từ cả I-frame và P-
frame. Mã hóa B-frame thì tương tự với P-frame, ngoại trừ các vecto chuyển
động phụ thuộc vào các vùng trong các khung tham khảo sau đó. B-frame
chiếm ít dung lượng hơn là I-frame va P-frame. Vì thế dòng Mpeg video gồm
nhiều B-frame thì chiếm dung lượng thấp hơn so với dòng chứa các frame I
va P. Thậm chí, B-frame giúp làm tối thiểu băng thông cần thiết đối với các
dòng MPEG video. Tuy nhiên, B-frame cũng có hạn chế đó là độ trễ. Do
IPTVCD phải kiểm tra 2 khung trước và sau trước khi t

ạo ra B-frame.
3 loại ảnh trên kết hợp với nhau tạo thành 1 chuỗi các frame đc gọi là nhóm
ảnh (GOP ). Mỗi nhóm ảnh bắt đầu bằng một frame I và có một số các frame B và
P, Mỗi nhóm ảnh MPEG có cấu trúc như sau:
[I B B B P B B B P B B B P B B B P]
Mỗi nhóm ảnh cần bắt đầu với một khung I, mặc dù kích thước của mỗi
nhóm ảnh là khác nhau, nhưng trung bình mỗi nhóm ảnh trong IPTV có khoảng
12 đến 15 frame. Mỗi cấu trúc của một nhóm ảnh thông thường có thể được miêu
tả bởi 2 thông số: N, số ảnh trong một nhóm và M, khoảng cách giữa các frame.
Các nhóm ảnh được chia thành 2 loại: nhóm đóng và nhóm mở. Với nhóm đóng,
khung B cuối cùng không yêu cầu khung I đầu tiên cho nhóm ảnh tiếp theo để giải
mã, trong khi v
ới nhóm mở cần yêu cầu khung I cho nhóm ảnh tiếp theo. Các
nhóm ảnh sau đó được kết hợp với nhau để tạo thành dòng video. Mỗi dòng
video bắt đầu biết một đoạn mã, theo sau đó là một header và kết thúc với một
mã duy nhất.
IPTV
12
Thứ tự các khung được truyền đi trên mạng băng rộng thì khác với thứ tự
các khung trong chuối bit đầu vào của bộ mã hóa. Bởi vì bộ giải mã trong IPTVCD
cần xử lý các frame I và P trước khi tạo ra khung B. Mối quan hệ tổng thể giữa
các chuỗi ảnh, ảnh, các slice, các khối macro, các khối và các điểm ảnh được
minh họa ở hình sau:

Hình 2.1 Cấu trúc dòng MPEG video

Mặc dù MPEG-2 được sử dụng trong truyền hình cáp và vệ tinh, nhưng
MPEG-2 có nhưng hạn chế đối với các mạng có băng thông giới hạn.Do đó một
công nghệ nén mới với nhiều tính năng đã được phát triển trong nhưng năm gần
đây vơi mục đích truyền video qua mạng băng thông giới hạn. MPEG-4 part 10

được sử dụng trong hạ tầng mạng IPTV.

2.3 MPEG-4:

Chuẩ
n MPEG-4 thành công hơn so với chuẩn MPEG-2. Thêm vào đó,
MPEG-4 đưa ra 1 hệ thống hoàn chỉnh với các đặc điểm hỗ trợ các định dạng
dữ liệu. Mpeg-4 bao gồm rất nhiều phần có thể thực hiện cùng nhau hoặc riêng
biệt.
• Phần1:Systems;
• Phần2:Visual;
IPTV
13
• Phần3:Audio;
• Phần 4: Conformance xác định việc triển khai một MPEG-4 sẽ như thế nào;
• Phần 5: Các phần mềm tham chiếu, đưa ra một nhóm các phần mềm tham
chiếu quan trọng, được sử dụng để triển khai MPEG-4 và phục vụ như một ví
dụ demo về các bước phải thực hiện khi triển khai;
• Phần 6: Khung chuẩn cung cấp truyền thông đa phương tiện tích hợp
DMIF (Delivery Multimedia Integration Framework), xác định một giao diện
giữa các ứng dụng và mạng/lưu trữ;
• Phần 7: Các đặc tính của một bộ mã hoá video tối ưu (bổ xung cho các
phần mềm tham chiếu, nhưng không phải là các triển khai tối thiểu cần thiết).
• Các phần mới bổ xung tiếp cho chuẩn MPEG-4 sau này là:
• Phần 8: Giao vận (về nguyên tắc không được xác định trong chuẩn, nhưng
phần 8 xác định cần ánh xạ như thế nào các dòng MPEG-4 vào giao vận IP);
• Phần 9: Mô tả phần c
ứng tham chiếu (Reference Hardware Description);
• Phần 10: MPEG-4 Advanced Video Coding /H.264 là thành tựu mới nhất
về nén video, trên cơ sở đồng bộ với khả năng tính toán và dung lượng bộ

nhớ của các máy tính PC hiện nay, ứng dụng các phương pháp mã hoá phức
tạp hơn nhiều các phương pháp trước đó và có thể thực hiện cả trong môi
trường phần mềm và phần cứng, do nhóm chuyên gia MPEG hợp tác với
nhóm IUT Study Group phát triển và có nhiều khả năng sẽ trở thành chuẩ
n mã
hoá video qui mô toàn cầu, duy nhất của ITU và ISO;
• Phần 11: Mô tả khung hình (Scene Description - được tách ra từ phần 1);
• Phần 12: Định dạng file truyền thông ISO (ISO Media File Format);
• Phần 13: Quản lý bản quyền nội dung IPMP (Intellectual Property
Management and Protection Extensions);
• Phần 14: Định dạng fille MP4 (trên cơ sở phần 12);
• Phần 15: Định dạng file AVC (cũng trên cơ sở phần 12);
• Phần 16: AFX (Animation Framwork eXtensions) và MuW (Multi-user
Worlds).


Công nghệ mã hoá video trong MPEG-4.

Chuẩn MPEG-4 là một chuẩn động dễ thay đổi: với MPEG-4, các đối
tượng khác nhau trong một khung hình có thể
được mô tả, mã hoá và truyền
đi một cách riêng biệt đến bộ giải mã trong các dòng cơ bản ES (Elementary
Stream) khác nhau. Cũng nhờ xác định, tách và sử lý riêng các đối tượng
(như nhạc nền, âm thanh xa gần, đồ vật, đối tượng ảnh video như con người
hay động vật, nền khung hình…), nên người sử dụng có thể loại bỏ riêng từng
đối tượng khỏi khuôn hình. Sự tổ hợp lại thành khung hình chỉ được thực hiện
sau khi giải mã các đối tượng này.

Trên Hình 2.2 thể hiện một trường hợp điển hình của tổ hợp khuôn hình
MPEG-4, cho thấy nhiều đối tượng (bàn, quả cầu, bảng đen, người hướng

dẫn và audio) được đặt vào một hệ thống toạ độ không gian 3 chiều (3-D) đối
IPTV
14
với vị trí người xem giả định. Các thiết bị mã hoá và giải mã video đều áp
dụng sơ đồ mã hoá như nhau cho mỗi đối tượng video VO (Video Object)
riêng biệt (hình 2), nhờ vậy người sử dụng có thể thực hiện các hoạt động
tương tác riêng với từng đối tượng (thay đổi tỷ lệ, di chuyển, kết nối, loại bỏ,
bổ xung các đối tượng…) ngay tại vị trí giải mã hay mã hoá.





Hình 2.2 Tổ hợp khung hình trong MPEG-4


IPTV
15

Hình 2.3 Cấu trúc bộ mã hóa và giải mã MPEG-4

Các bộ phận chức năng chính trong các thiết bị MPEG-4 bao gồm:
• Bộ mã hoá hình dạng ngoài Shape Coder dùng để nén đoạn thông tin, giúp
xác định khu vực và đường viền bao quanh đối tượng trong khung hình
scene.
• Bộ dự đoán và tổng hợp động để giảm thông tin dư thừa theo thời gian.
• Bộ mã kết cấu mặt ngoài Texture coder dùng để xử lý dữ liệu bên trong và
các dữ liệu còn lại sau khi đã bù chuyển động.

Hình 2.4 là một ví dụ về mã hoá và tổng hợp khung hình video sử dụng

trong MPEG-4. Nhiều đối tượng, như người, xe ô tô, nhà cửa, được tách ra
khỏi video đầu vào. Mỗi đối tượng video sau đó được mã hoá bởi bộ mã hoá
đối tượng video VO (video object) và sau đó được truyền đi trên mạng. Tại vị
trí thu, những đối tượng này được giải mã riêng rẽ nhờ bộ giải mã VO và gửi
đến bộ tổ hợp compositor. Người sử dụ
ng có thể tương tác với thiết bị để cấu
trúc lại khung hình gốc (a), hay để xử lý các đối tượng tạo ra một khung hình
khác (b). Ngoài ra, người sử dụng có thể download các đối tượng khác từ các
thư viện cơ sở dữ liệu (có sẵn trên thiết bị hay từ xa thông qua mạng LAN,
WAN hay Internet) để chèn thêm vào hay thay thế các đối tượng có trong
khuôn hình gốc (c).



Hình2.4 Mã hóa và tổng hợp khung hình trong MPEG-4

IPTV
16
Để có thể thực hiện việc tổ hợp khung hình, MPEG-4 sử dụng một ngôn
ngữ mô tả khung hình riêng, được gọi là Định dạng nhị phân cho các khung
hình BiFS (Binary Format for Scenes). BiFS không chỉ mô tả ở đâu và khi nào
các đối tượng xuất hiện trong khung hình, nó cũng mô tả cách thức hoạt động
của đối tượng (làm cho một đối tượng xoay tròn hay chồng mờ hai đối tượng
lên nhau) và cả điều kiện hoạt động đối tượ
ng và tạo cho MPEG-4 có khả
năng tương tác. Trong MPEG-4, tất cả các đối tượng có thể được mã hoá với
sơ đồ mã hoá tối ưu riêng của nó – video được mã hoá theo kiểu video, text
được mã hoá theo kiểu text, các đồ hoạ được mã hoá theo kiểu đồ hoạ - thay
vì việc xử lý tất cả các phần tử ảnh pixels như là mã hoá video ảnh động. Do
các quá trình mã hoá đã được tối ưu hoá cho từng loại dữ liệu thích hợp, nên

chuẩn MPEG-4 sẽ cho phép mã hoá vớ
i hiệu quả cao tín hiệu ảnh video,
audio và cả các nội dung tổng hợp như các bộ mặt và cơ thể hoạt hình.

2.4 Tổng quan về MPEG-4 Part 10

Đầu năm 1998, 2 tổ chức ITU-T và VCEG đã cùng đưa ra một chuẩn nén
mới H.26L nhằm tăng gấp đôi hiệu suất nén . Do đó chuẩn nén này sẽ mở ra
nhiều ứng dụng mới như truyền hình qua mạng Internet, truyền hình di động và
phát triển các ứng dụng hi
ện có.
Cuối năm 2001, VCEG và MPEG đã thành lập JVT ( Joint Video Team) có
nhiệm vụ hoàn thành chuẩn nén mới và chính thức được thông qua với tên gọi là
MPEG-4 Part 10 hoặc H.264/AVC vào tháng 3 năm 2003.

2.4.1
Cấu trúc phân lớp của H.264/AVC

Với sự gia tăng các ứng dụng và dịch vụ trên nhiều mạng thì câu hỏi đặt
ra là làm thế nào quản lí được các ứng dụng đó. Do vậy, chuẩn H.264/AVC
phải có độ linh hoạt cao và có thể ứng dụng trên nhiều mạng khác nhau. Do
đó, chuẩn H.264/AVC được thiết kế theo phân lớp mã hóa video VCL ( Video
Coding Layer) và lơp NAL làm nhiệm vụ tương thích với môi trường mạng
khác nhau.


IPTV
17
Hình 2.5: Cấu trúc phân lớp của H.264


a) Lớp mạng NAL ( Network Abstration Layer)

NAL có khả năng ánh xạ từ lớp VCL đến lớp truyền tải:
+ RTP/IP cho dịch vụ thời gian thực qua mạng Internet (conversational
và streaming).
+ Định dạng file: ISO MP4 cho lưu trữ và truyêng tải MMS.
+ H32x cho các dịch vụ đàm thoại có dây và không dây.
+ Dòng truyền tải MPEG-2 cho các dịch vụ quảng bá.

Gói NAL: dữ liệu video được mã hóa được tổ chức trong một đơn vị
NAL( hay gói NAL). Mỗi gói có độ dài tính theo byte. Byte đầ
u tiên của mỗi gói
NAL là byte mào đầu, nó chỉ rõ loại dữ liệu được chứa trong NAL, các byte
còn lại chứa dữ liệu.

Phần dữ liệu của NAL được ghép xen.
Cấu trúc của đơn vị NAL có định dạng chung cho việc sử dụng truyền
trong hệ thống hướng bit và hướng gói.
b) Lớp mã hóa video:
Lớp mã hóa video của H.264/AVC thì tương tự với các tiêu chuẩn khác
như MPEG-2 video. Nó là sự kết hợp dự đoán theo thờ
i gian và theo không
gian,vàvới mã chuyển vị.

Ảnh được tách thành các khối. Ảnh đầu tiên của dãy hoặc điểm truy
nhập ngẫu nhiên thì được mã hóa “Intra”, có nghĩa là không dùng thông tin
nào ngoài thông tin chứa trong bản thân ảnh. Mỗi mẫu của một khối trong một
frame Intra được dự đoán nhờ dùng các mẫu không gian bên cạnh của các
khối đã mã hóa trước đó. Đối với tất cả các ảnh còn lại của dãy hoặc giữa các
điểm truy c

ập ngẫu nhiên, mã hóa “Inter” được sử dụng, dùng dự đoán bù
chuyển động từ các ảnh được mã hóa trước.
c) Khái niệm về ảnh, khung, bán ảnh, macroblock
Tín hiệu video được mã hóa trong H.264 bao gồm tập hợp các ảnh
được mã hóa có trật tự. Một ảnh có thể biểu diễn bằng cả một khung hoặc
một bán ảnh. Nhìn chung, một khung gồm có hai bán ảnh xen kẽ nhau: bán
ảnh trên và bán ảnh dưới. Bán ảnh trên gồm các dòng chẵn 0, 2, 4, …, H/2 -1,
với H là t
ổng số dòng trong một khung. Bán ảnh dưới gồm các dòng lẻ và bắt
đầu từ dòng thứ 2.
IPTV
18

Hình 2.6: Các bán ảnh trong một khung

Các macroblock: Mỗi ảnh video, frame hoặc field, được chia thành các
macroblock có kích thước cố định bao trùm một diện tích ảnh hình chữ nhật
gồm 16 x 16 mẫu thành phần luma và 8 x 8 mẫu cho mỗi một trong hai thành
phần chroma. Tất cả các mẫu macroblock luma hoặc chroma được dự đoán
theo không gian hoặc thời gian, và dự đoán tại chỗ hợp thành được truyền đi
nhờ dùng mã chuyển vị. Do vậy mỗi thành phần màu dự
đoán tại chỗ được
chia nhỏ thành các khối. Mỗi khối được biến đổi nhờ dùng biến đổi nguyên (an
integer transform), và các hệ số biến đổi được lượng tử hóa và được truyền đi
bằngphương pháp mã hóa entropy.

Các macroblock được tổ chức thành các slice, biểu diễn các tập con của
ảnh đã cho và có thể được giải mã độc lập. Thứ tự truyền các macroblock
trong dòng bit phụ thuộc vào bản đồ phân phối Macroblock (Macroblock
Allocation Map) và không nhất thiết phải theo thứ tự quét. H.264 / AVC hỗ trợ

năm dạng mã hóa slice khác nhau. Đơn giản nhất là slice I (Intra), trong đó tất
cả macroblock được mã hóa không có tham chiếu tới các ảnh khác trong dãy
video. Tiếp theo là các slice P và B, ở đó việc mã hóa có tham chiếu tới các
ảnh trước nó (slice P) hoặc cả ảnh trước lẫn ảnh sau (slice B). Hai dạng slice
còn lại là SP (switching P) và SI (switching I), được xác định cho chuyển mạch
hiệu quả giữa các dòng bit được mã hóa ở các tốc độ bit khác nhau.


2.4.1 H.264 CODEC

Giống như các tiêu chuẩn nén trước đây ( ví dụ như MPEG-1, MPEG-
2 và MPEG-4),H.264 không được định nghĩa là bộ CODEC ( một cặp
encoder và decoder) mà H.264 định nghĩa các cú pháp của luồng nén video.
Trong thực tế, bộ mã hóa và giải mã bao gồm các thành phần cơ bản như
trong hình 2.8 và hình 2.9. So với các chuẩn nén trước bao gồm các thành
IPTV
19
phần như bộ dự đoán, biến đổi, lượng tử, mã hóa entropy, H.264 CODEC
còn bao gồm bộ lọc deblocking và có nhiều thay đổi quan trọng trong các chi
tiết về chức năng của các thiết bị.
Bộ mã hóa (hình 2.8) bao gồm 2 dòng dữ liệu , dòng forward (từ trái
sang phải) và dòng tái tạo (từ phải sang trái). Dòng dữ liệu trong bộ giải mã
được truyền từ phải sang trái trong hình 2.9.




Hình 2.7: Sơ đồ bộ mã hóa H.264.



Bộ mã hóa dòng forward

Một khung hoặc trường lối vào Fn được xử lí trong các khối của một
macroblock ( đáp ứng cho 16x16 pixel trong một hình bình thường). Mỗi
macroblock được mã hóa ở chế độ trong ảnh hoặc liên ảnh, với từng block trong
macroblock. Một dự doán PRED (kí hiệu là P trong hình 2.8) được định dạng
dựa trên các mẫu ảnh được tái tạo lại.
Trong chế độ nén liên ảnh, PRED được hình thành từ slice hiện th
ời vừa
được mã hóa, giải mã và tái tạo lại (
uF

n
trong hình, chú ý rằng các mẫu không
được lọc được sủ dụng để tạo nên PRED)
Trong chế độ nén trong ảnh, PRED được hình thành bằng cách dự đoán
bù chuyển động từ một hoặc hai ảnh tham khảo được. Trong hình 2.8, ảnh tham
khảo là ảnh
F′
n −1
vừa được mã hóa. Nhưng, dự đoán tham chiếu đối với mỗi
macroblock có thể được chọn từ các hình ảnh trong quá khứ hoặc trong tương
lai vừa được mã hóa, tái tạo và lọc ( theo thứ tự hiển thị) .
Dự đoán PRED trừ với block hiện tại đer tìm ra sự khác biệt , được biến
đổi và lượng tử hóa để thu được hệ số lưởng tử X sẽ được s
ắp xếp lại và mã
IPTV
20
hóa entropy. Hệ số được mã hóa entropy cùng với thông tin về cạnh được mã
hóa trong mỗi block trong macroblock (chế độ dự đoán, mức lượng tử, thông tin

về vector chuyển động, …) định dạng nên các dòng bit để truyền tơi lớp mạng
trừu tượng để truyền hoặc lưu trữ.



Hình 2.8: Bộ mã hóa

Bộ mã hóa dòng tái tạo

Bên cạnh việc mã hóa và truyền tải các block trong macroblock, bộ mã
hóa còn giải mã ( tái tạo) chúng để làm tham khảo cho các dự đoán trong tương
lai. Hệ số X được giải lượng tử (Q
−1
) và biến đổi ngược (T
−1
) để thu được sụ
khác biệt block D

n . Block dự đoán PRED được cộng vào để tạo thành block
tái tạo uF′n

. Bộ lọc được ứng dụng để giảm ảnh hưởng của méo và các ảnh
tham khảo dự đoán được tạo từ 1 chuỗi các block F′n.


Mục đích chính của bộ giải mã dòng tái tạo trong bộ mã hóa là để chắc
chắn rằng cả bộ mã hóa và giải mã đều sử dụng các tham số khung đã xác định
để tạo ra dự đoán P. Nếu không có các tham số này, dự báo P ở bộ mã hóa và
giải mã sẽ không được xác định, dẫn đến lỗi giữa bộ mã hóa và giải mã.




Hình 2.9 Bộ giải mã
IPTV
21
Bộ giải mã

Bộ giải mã nhận được các dòng bit được nén từ NAL. Các thành phần
dữ liệu được giải mã entropy để tìm ra hệ số lượng tử X. Sử dụng giải lượng
tử và biến đổi ngược để thu được Dn. Sử dụng các thông tin header đươc giải
mã từ các dòng bit, bộ mã hóa tạo ra block dự đoán, giống hệt với PRED được
tạo ra ở bộ mã hóa. PRED được cộng với
D

n để tạo ra uF′n

, sau đó được
lọc để tạo ra các block F′n.



2.4.3 Các đặc điểm chính của MPEG-4 Part 10:

a) Kích thước block ảnh có thể thay đổi được:
Thành phần độ chói của macroblock (16*16 mẫu) có thể được chia theo 4
cách: một macro block 16 *16 phần macroblock, hai macroblock 16*8 phần, hai
8* 16 phần hoặc bốn macroblock 8*8 phần. Nếu kiểu 8*8 phần được chọn, mỗi
bốn 8*8 sub-macroblock trong một macro block có thể được chia theo 4 cách:
một phần sub-macro block 8*8, hai phần sub-macroblock 4*8, hai phần sub-
macroblock 8*4 hoặc bốn phần sub-macroblock 4*4 . Các phần này và các sub-

macroblock tạo ra nhiều cách kết hợp gi
ữa trong mỗi macroblock.
Trong thực tế, phần có kích thước lớn phù hợp với những vị trí không chi
tiết, và phần kích thước nhỏ phù hợp với các vị trí có độ chi tiết cao.




Hinh 2.10: Bù chuyển động

b) Độ chính xác của vector bù chuyển động cao:
IPTV
22

Mỗi phần hay mỗi phần sub-macroblock trong một macro được mã hóa
trong ảnh được dự đoán từ một vùng có cùng kích thước trong ảnh tham khảo.
hầu hết các chuẩn nén trước đó chỉ đạt được độ chính xác ½ của vector bù
chuyển động, nhưng với H.264 có thể đạt được tới ¼.

c) Tham chiếu nhiều ảnh bù chuyển động:

Ảnh P trong MPEG-2 là ảnh dự đoán được tham chiếu từ một ả
nh trước
đó, còn ảnh B là ảnh dự đoán 2 chiều được tham chiếu từ nhiều ảnh I hoặ P
trước và sau nó.
Trong chuẩn nén H.264, ảnh hiện tại có thể tham chiếu bởi nhiều ảnh,
điều này cho phép tăng hiệu suất nén. Một lượng lớn các ảnh được giải nén và
lưu trong bộ giải nén.
Trong các chuẩn nén trước đó, thứ tự các ảnh dùng cho mục đích tham
chiếu bù chuyển độ

ng và thứ tự các ảnh thể hiện có mối quan hệ chặt chẽ với
nhau. Tuy nhiên, chuẩn nén H.264 đã khắc phục nhược điểm này bằng cách
cho phép bộ giải nén lựa chọn thứ tự các ảnh tham chiếu.




Hình 2.11: Tham chiếu đa ảnh

d) Dự đoán trong ảnh:

Các mẫu của một macroblock được dự đoán bằng cách chỉ sử dụng phần
thông tin của macroblock được truyền đi trong một ảnh.
Trong chuẩn nén H.264/AVC, có hai loai dự đoán trong ảnh cho thành
IPTV
23
phần chói Y. Loại thứ nhất là intra 4x4 và loại thứ 2 là intra 16x16. Trong INTRA
4x4, các phần tử ảnh có kích thước 16x16 được chia thành 16 phần có kích
thước 4x4, việc dự đoán được thực hiên với từng phần riêng biệt. Có 9 mode dự
đoán tùy chọn đối với các block thành phần chói Y kích thước 4x4, 4 mode đối
với thành phần chói Y kích thước 16x16, 4 mode cho thành phần màu Cr, Cb. Bộ
nén sẽ lựa chọn mode dự đoán sao cho sự khác biệt giữa P và block được mã
hóa là nhỏ nhất.
c mode dự
đoán thành phần chói Y 4x4
Có 9 mode dự đoán thành phần chói Y kích thước 4x4, đó là:
Mode 0: dự đoán theo chiều dọc
Mode 1: dự đoán theo chiều ngang
Mode CD: dự đoán dựa trên trung bình tất cả các mẫu xung quanh từ bên
trái và từ trên của khối dữ liệu hiện tại.

Mode 3: dự đoán dự trên các mẫu có độ nghiêng 45 độ từ phải sang trái.
Mode 4: dự đoán dự trên các mẫu có độ nghiêng 45 độ từ trái sang phải.
Mode 5 : sử dụng phép ngoạ
i suy với góc có độ nghiêng 26.6 độ so với
chiều dọc.
Mode 6: sử dụng phép ngoại suy với góc có độ nghiêng 26.6 độ so với
chiều ngang
Mode 7: sử dụng phép ngoại suy với góc có độ nghiêng 26.6 độ so với
chiều dọc bên phải
Mode 8: sử dụng phép ngoại suy với góc có độ nghiêng 26.6 độ từ so với
chiều ngang.



Hình 2.12: Mode dự đoán thành phần chói Y kích thước 4x4



Hình 2.13: Mode dự đoán 16x16 liên ảnh
IPTV
24

• Các mode dự đoán thành phần chói Y 16x16

Như dã nói trình bày ở trên, một mode dự đoán được áp dụng cho toàn
bộ một macro thành phần chói kích thước 16x16. Có 4 mode dự đoán đó là dự
đoán theo chiều dọc, dự đoán theo chiều ngang, dự đoán phẳng. Đối với mode
dự đoán phẳng, một hàm tuyến tính được sử dụng giữa các mẫu từ bên trái và
từ trên xuống so với mẫu dự đoán hiệ
n tại. Mode này hoạt động hiệu quả giữa

các vùng có độ chói liên tục thay đổi. Các mode hoạt động giống như đối với
thành phần chói kích thước 4x4, chỉ khác là chúng hoạt động đối với toàn bộ
macroblock thay vì với 16 phần kích thước 4x4.

• Các mode dự đoán các thành phần màu Cr và Cb:

Dự đoán trong ảnh đối với các thành phần màu của một macroblock
tương tự như đối với thành phần chói Y có kích thước 16x16. Bởi vì tín hiệ
u
màu có sự thay đổi liên tục trong hầu hết các trường hợp. Nó luôn áp dụng cho
các khối 8x8 sử dụng dự đoán ngang, dọc, DC và sự đoán phẳng.






Hình 2.14: Dự đoán ảnh I

e) loại bỏ dư thừa không gian:

Biến đổi Cosine rời rạc DCT hai chiều trong các chuẩn MPEG-1, MPEG-2
nhằm mục đích loại bỏ phần dư thừa không gian. DCT được áp dụng cho các
khối 8x8. trong H.264/AVC, DCT được áp dụng với hệ số nguyên. Kích thước
khối thay đổi, có thể là 16x16, 4x4, hoặc trong trường hợp đặc biệt có thể dùng
khối kích thước 2x2. Việc sử dụng khố
i có kích thước nhỏ hơn so với các chuẩn
IPTV
25
nén trước đó cho phép bộ mã hóa tương thích tốt hơn với biên của các đối

tượng chuyển động.





Hình 2.15: Loại bỏ dư thừa không gian

Có 3 loại biến đổi khác nhau được sử dụng trong MPEG-4 Part 10, đó là;
• Một biến đổi Hadamard áp dụng cho mảng 2 chiều kích thước 4x4
các hệ số 1 chiều DC của thành phần chói Y trong mode 16x16.
• Một biến đổi Hadamard áp dụng cho mảng 2 chiều kích thước 2x2
các hệ số 1 chiều DC của thành phần màu Cr, Cb.
• Một biến đổi dựa trên DCT áp dụng cho tất cả các block kích thước
4x4.
D
ữ liệu trong 1 macroblock được truyền di theo thứ tự như trong hình sau:
Nếu macroblock được mã hóa sử dụng mode Intra 16x16, thì block đó sẽ
được dán nhãn là “-1”, và bao gồm các hệ số một chiều được biến đổi trong mỗi
block độ chói 4x4, và được truyền đi đầu tiên. Sau đó, các block độ chói từ 0-15
được truyền đi theo trật tự như trong hình vẽ(các hệ số một chiều trong một
macroblock được mã hóa sử dụng mode Intra 16x16 không được gửi đi). Block
16 và 17 được gửi đi,bao gồm 2 mảng kích thước 2x2 các hệ số một chiều các
thành phần màu Cr, Cb. Cuối cùng là các block từ 18-25(không có các hệ số một
chiều).


Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×