Tải bản đầy đủ (.doc) (78 trang)

Nghiên cứu công nghệ truyền hình internet (IPTV)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (547.32 KB, 78 trang )

MỞ ĐẦU
MỞ ĐẦU
Cuối thập kỷ trước, sự phát triển của các dịch vụ truyền hình vệ tinh, sự
tăng trưởng của dịch vụ truyền hình cáp số, và đặc biệt là sự ra đời của
HDTV đã để lại dấu ấn đối với lĩnh vực truyền hình. Hiện nay xuất hiện
một phương thức cung cấp dịch vụ mới còn mạnh hơn với đe dọa sẽ làm
lung lay mọi thứ đã có. Internet Protocol Television (IPTV) đã ra đời, dựa
trên sự hậu thuẫn của ngành viễn thông, IPTV dễ dàng cung cấp nhiều hoạt
động tương tác hơn, cung cấp sự cạnh tranh mạnh mẽ hơn cho các doanh
nghiệp kinh doanh dịch vụ truyền hình.
IPTV có cơ hội lớn để phát triển nhanh chóng khi mà mạng băng rộng đã
có mặt ở khắp mọi nơi và hiện tại đã có trên 100 triệu hộ gia đình sử dụng
dịch vụ băng rộng trên toàn cầu. Rất nhiều nhà cung cấp dịch vụ viễn thông
lớn trên thế giới đang triển khai thăm dò IPTV và xem đây như một cơ hội
mới để thu lợi nhuận từ thị trường hiện có của họ và coi đó như một giải
pháp tự bảo vệ trước sự lấn sân của các dịch vụ truyền hình cáp.
Nhằm mục đích nghiên cứu công nghệ IPTV, đồ án được xây dựng với
bố cục theo các chương như sau:
• Chương 1: Tổng quan công nghệ IPTV, giới thiệu sơ lược
về công nghệ IPTV.
• Chương 2: Những giải pháp kỹ thuật cơ bản trong IPTV,
trình bày về công nghệ IPTV, các chuẩn nén, các giao thức và
kiến trúc mạng truyền tải hệ thống IPTV.
• Chương 3: Khả năng triển khai IPTV trên mạng viễn
thông Việt Nam, trình bày tình hình phát triển công nghệ IPTV
1
tại Việt Nam, khả năng ứng dụng công nghệ IPTV vào mạng
băng rộng của Việt Nam.
Với lượng thời gian có hạn, em đã nỗ lực thu thập tài liệu và xử lý thông
tin liên quan đến công nghệ IPTV. Tuy nhiên, do công nghệ IPTV còn rất
mới mẻ nên một số nội dung trong đồ án chưa được chi tiết và không thể


tránh khỏi những thiếu xót. Em mong được sự góp ý của các thầy và các
bạn để nắm rõ hơn về công nghệ và cũng để củng cố cho kiến thức khi ra
trường.
Em xin chân thành cảm ơn sự hướng dẫn, chỉ bảo tận tình của thầy giáo
Nguyễn Khắc Hưng, là người đã trực tiếp giúp em hoàn thành đồ án này.
Cuối cùng em xin cảm ơn các thầy cô, các bạn đã dành thời gian đọc và
quan tâm tới đồ án này.
2
CHƯƠNG 1.
TỔNG QUAN CÔNG
NGHỆ IPTV
1.1 Giới thiệu tổng quan công nghệ IPTV
Cùng với sự phát triển của dịch vụ thuê bao băng rộng, việc xây dựng
các nội dung phong phú cho mạng xDSL là vô cùng cần thiết. Việc xây
dựng và hoạch định tốt mạng xDSL cho phép cung cấp tới thuê bao các
đường kết nối tốc độ cao, ổn định và nhờ đó cho phép cung cấp các dịch vụ
gia tăng giá trị cao. Như vậy ngoài các dịch vụ Internet tốc độ cao truyền
thống, việc cung cấp các dịch vụ về Video và IPTV đã trở nên dễ dàng hơn
nhiều.
IPTV là công nghệ truyền dẫn hình ảnh kỹ thuật số tới người sử dụng
dựa trên giao thức Internet với kết nối băng rộng. Dịch vụ này thường được
cung cấp cùng với điện thoại trên Internet (Voice over IP - VoIP), video
theo yêu cầu (Video on Demand - VoD) nên thường được gọi là công nghệ
tam giác (Triple play) về truyền tải dữ liệu, hình ảnh, âm thanh. Một cách
định nghĩa đơn giản hơn, đó là nội dung chương trình truyền hình được
truyền tới người xem (user) dựa trên mạng băng rộng IP. Các user có thể
thông qua máy vi tính PC hoặc máy thu hình phổ thông cộng với hộp phối
ghép set topbox để sử dụng công nghệ IPTV.
Trước đây, công nghệ này gần như không thể với tốc độ tải xuống chậm
của dial-up hạn chế việc truyền đi các khuôn dạng video. Tuy nhiên, hiện

nay IPTV được dự báo sẽ phát triển một cách nhanh chóng do số lượng
người sử dụng dịch vụ băng rộng rất lớn.
3
Công nghệ IPTV có những ưu điểm vượt trội so với “Internet Video”.
Internet Video cung cấp các dịch vụ xem video như phim truyện, web-cams
với chất lượng chưa cao. Ngược lại, công nghệ IPTV tiến bộ hơn, tiện lợi
với người sử dụng hơn, và kết hợp chặt chẽ với công nghệ truy nhập đường
dây thuê bao số (DSL) tốc độ cao như ADSL, ADSL2+, VDSL, PON, vô
tuyến băng rộng,
IPTV có 2 đặc điểm cơ bản là: dựa trên nền công nghệ IP và phục vụ
theo nhu cầu. Tính tương tác là ưu điểm của IPTV so với hệ thống truyền
hình cáp CATV hiện nay, vì truyền hình CATV tương tự cũng như CATV
số đều theo phương thức phân chia tần số, định trước thời gian và quảng bá
đơn hướng (truyền từ một trung tâm đến các máy tivi thuê bao). Mạng
CATV hiện nay chủ yếu dùng cáp đồng trục hoặc lai ghép cáp đồng trục
với cáp quang đều phải chiếm dụng tài nguyên băng tần rất rộng. Hơn nữa
kỹ thuật ghép nối modem cáp hiện nay đều sản sinh ra tạp âm. So với mạng
truyền hình số DTV thì IPTV có nhiều đổi mới về dạng tín hiệu cũng như
phương thức truyền bá nội dung. Trong khi truyền hình số thông qua các
menu đã định trước (thậm chí đã định trước hàng tuần, hoặc hàng tháng) để
các user lựa chọn, thì IPTV có thể đề cao chất lượng phục vụ có tính tương
tác và tính tức thời. Người sử dụng (user hoặc viewer) có thể tự do lựa
chọn chương trình TV của mạng IP băng rộng. Với ý nghĩa đúng của
phương tiện truyền thông (media) giữa server và user.
So với VOD, IPTV có ưu thế là:
• Sử dùng dễ dàng, hiển thị trên tivi hiệu quả cao hơn màn máy vi tính,
thao tác trên hộp ghép nối + bàn phím đơn giản, thực hiện chuyển
đổi nhanh luồng cao tốc/chương trình.
4
• Dễ quản lý, dễ khống chế, sử dụng hộp kết nối làm đầu cuối nhà

cung cấp dịch vụ để tiến hành định chế đối với hộp kết nối không
cần đến nghiệp vụ an toàn và kiểm tra chất lượng. Đây cũng là cơ sở
kỹ thuật để dễ thu phí.
Với sự vượt trội về tính tương tác giữa người xem và dịch vụ gia tăng,
IPTV hoàn toàn có thể làm thay đổi thói quen xem truyền hình truyền
thống bởi nó không chỉ cho phép khách hàng xem các chương trình, mà
còn cho phép khán giả chủ động chọn những nội dung gì mình muốn xem.
Với IPTV, khách hàng có thể tiếp cận những dịch vụ tiên tiến nhất trên nền
băng thông rộng như xem TV trực tiếp qua Internet (Live TV), mua hàng
qua TV, karaoke, game (trò chơi trực tuyến), tạp chí thông tin, điện thoại
hình, đào tạo qua TV, TV Mail, TV Photo, bình chọn qua TV, dự đoán qua
TV, tin nhắn nhanh (IM), quảng cáo Hiện IPTV đang được đánh giá là
một dịch vụ tiềm năng.
1.2 Kiến trúc tổng quan hệ thống IPTV
Hình 1.1 Kiến trúc tổng quan của một hệ thống IPTV
5
Kiến trúc IPTV gồm các khối chức năng sau:
• Content Sources: Nguồn dữ liệu, có chức năng thu nhận các nội
dung dữ liệu như phim ảnh từ các nhà sản xuất và các nguồn
khác. Sau đó, các nội dung này được mã hóa và lưu trữ trong cơ
sở dữ liệu để phục vụ cho dịch vụ video theo yêu cầu (VoD).
• IPTV Service Nodes: Các node dịch vụ IPTV, có chức năng
nhận các luồng dữ liệu hình ảnh dưới các định dạng khác nhau.
Các luồng dữ liệu này sẽ được định dạng và đóng gói lại để
truyền đi với chất lượng dịch vụ (Quality of Service - QoS) đảm
bảo.
• Wide-area Distribution Networks: Mạng phân bố vùng rộng
hình thành nên việc phân bổ khả năng, dung lượng và chất lượng
của dịch vụ. Mạng này cũng gồm các chức năng khác như truyền
đa hướng, việc này rất cần thiết cho việc phân bổ các luồng dữ

liệu IPTV từ các node dịch vụ đến khách hàng một cách tin cậy
và đúng thời gian. Ngoài ra, mạng lõi và mạng truy nhập gồm cả
mạng đường trục quang và bộ ghép kênh truy nhập đường dây
thuê bao số (DSLAMs).
• Customer Access Links: Kết nối truy nhập khách hàng, đòi hỏi
sử dụng các công nghệ DSL tốc độ cao như ADSL2+ và VDSL,
thông tin được truyền đến khách hàng qua đường điện thoại.
• Customer Premises Equipment (CPE): Thiết bị đầu cuối khách
hàng cung cấp chức năng kết cuối mạng băng rộng (B-NT). Thiết
bị này có thể cung cấp các chức năng như cổng định hướng, set-
top box, internet.
6
• IPTV Client: IPTV Client là khối chức năng có nhiệm vụ kết
cuối lưu lượng IPTV tại đầu cuối khách hàng. Thiết bị này, ví dụ
như set-top box (STB), thực hiện chức năng xử lý như thiết lập
kết nối và QoS đối với các node dịch vụ, giải mã các luồng tín
hiệu hình ảnh, chuyển đổi kênh, hiển thị điều khiển và các kết nối
đến các ứng dụng người sử dụng như SDTV hoặc HDTV
monitor.
1.3 Kiến trúc mạng cung cấp dịch vụ Triple Play
Hiện nay, với việc sử dụng các công nghệ mạng truy nhập và chuyển
mạch gói dựa trên giao thức IP, các công ty viễn thông có thể giảm chi phí
đầu tư đồng thời đưa ra được nhiều loại dịch vụ mới. Các nhà cung cấp
đường truyền đang nỗ lực để chuyển đổi từ “kênh sang gói” theo định
hướng công nghệ chiến lược của họ để tăng khả năng tạo ra dịch vụ và
cung cấp với giá thành thấp và tạo ra được một cấu trúc mạng IP linh hoạt.
Sự phát triển của các sản phẩm mới là chìa khóa cho sự chuyển đổi này, cụ
thể như các chuyển mạch mềm dùng cho các dịch vụ thoại, các hệ thống
Headend số để cung cấp truyền hình IP, các hệ thống mạch vòng băng rộng
cho phép hợp nhất thoại, số liệu và truyền hình trên một hạ tầng mạng truy

nhập duy nhất. Với sự tác động của các công nghệ gói, các nhà cung cấp
dịch vụ có thể duy trì khả năng cạnh tranh bằng cách cung cấp các dịch vụ
"Triple-Play" với thoại - số liệu - hình ảnh trên các đường truyền DSL.
7
Hình 1.2 Kiến trúc mạng cung cấp dịch vụ
Triple Play
Trong kiến trúc mạch vòng nội hạt cung cấp dịch vụ Triple Play, một hệ
thống mạch vòng mang các lưu lượng thoại, số liệu và truyền hình từ các
đầu cuối xa (Remote Terminal) sử dụng các đường dây điện thoại tiêu
chuẩn với giao diện DSL. Các đầu cuối xa được kết nối đến đầu cuối trung
tâm (COT) thông qua mạng truy nhập. Khách hàng được kết nối trực tiếp
trên các đôi cáp đồng đến trung tâm có thể nhận được tất cả các dịch vụ
như nhau trực tiếp từ đầu cuối trung tâm. Đầu cuối trung tâm cung cấp các
truy nhập đến mạng PSTN thông qua hệ thống chuyển mạch truyền thống
hoặc chuyển mạch mềm (dùng cho VoIP), cung cấp truy nhập Internet
thông qua thiết bị định tuyến và cung cấp truy nhập đến các dịch vụ truyền
hình thông qua kết nối đến Video Headend.
Giải pháp này sử dụng công nghệ IP tiêu chuẩn. Về mặt kỹ thuật, cách
tiếp cận này loại bỏ sự phức tạp của mạng. Về mặt kinh tế, giải pháp này
giảm đáng kể chi phí xây dựng và vận hành mạng.
Xét về khía cạnh lưu lượng, khách hàng kết nối vào mạng tại đầu cuối xa
hay trung tâm qua các giao tiếp truyền thống như các đường analog/POTS,
E1 hay DSL. Mọi lưu lượng không phải là IP sẽ được chuyển đổi thành các
gói tại RT, ví dụ thoại analog được chuyển thành VoIP. Đầu cuối xa được
8
kết nối đến trung tâm qua các liên kết Ethernet hoặc POTS theo mọi cấu
hình mạng như ring, string, star, v.v phù hợp với cấu hình mạng của nhà
cung cấp. Lưu lượng IP đi từ đầu cuối xa đến đầu cuối trung tâm tại trung
tâm. Đầu cuối trung tâm kết nối với các thiết bị chuyển mạch Lớp 5 và kết
nối đến thiết bị định tuyến truy nhập Internet, chuyển mạch mềm và đến

các Video Headends.
CHƯƠNG 2.
NHỮNG GIẢI PHÁP
KỸ THUẬT CƠ BẢN
TRONG IPTV
2.1 Mô hình kiến trúc hệ thống cung cấp dịch vụ IPTV
Mô hình kiến trúc hệ thống cung cấp dịch vụ IPTV sẽ bao gồm các thành
phần và thể hiện như trong hình vẽ sau đây:
9

Hình 2.1 Mô hình kiến trúc hệ thống cung
cấp dịch vụ IPTV
• Hệ thống cung cấp nguồn dữ liệu: Thu, nhận và xử lý các dữ liệu
chương trình từ các nguồn khác nhau như vệ tinh, truyền hình
mặt đất và các nguồn khác để chuyển sang hệ thống Headen.
• Hệ thống Headend: Thu, điều chế và giải mã nội dung hình ảnh
và âm thanh từ các nguồn khác nhau và sử dụng các thiết bị mã
hóa (encoder) để chuyển đổi nội dung này thành các luồng dữ liệu
IP ở khuôn dạng mã hóa mong muốn.
• Hệ thống Middleware: có vai trò gắn kết một số thành phần logíc
thành một hệ thống phần mềm IPTV/video hoàn chỉnh hơn. Hệ
thống Middleware cung cấp giao diện người sử dụng cho cả dịch
vụ băng rộng và theo yêu cầu. Hệ thống này cũng được sử dụng
như phần mềm liên kết để tích hợp các sản phẩm từ các nhà cung
10
cấp khác nhau thành một mức ứng dụng. Middleware cung cấp
khả năng quản lý thuê bao, nội dung và báo cáo hoàn chỉnh cùng
với các chức năng quản lý EPG và STB, đồng thời vẫn duy trì
tính mở cho việc tích hợp các dịch vụ trong tương lai.
• Hệ thống phân phối nội dung: Bao gồm các cụm máy chủ VoD và

các hệ thống quản lý VoD tương ứng, cho phép lưu trữ các nội
dung đã được mã hóa và thiết lập các chính sách phân phối nội
dung một cách mềm dẻo. Hệ thống này cũng cho phép nhà khai
thác mở rộng một cách kinh tế, phù hợp với tải và yêu cầu dịch
vụ của các thuê bao.
• Hệ thống quản lý bản quyền (DRM): giúp nhà khai thác bảo vệ
nội dung của mình, như trộn các tín hiệu truyền hình hay mã hóa
nội dung VoD, khi truyền đi trên mạng Internet và tích hợp với
tính năng an ninh tại STB phía thuê bao.
• Mạng truy nhập: Hạ tầng mạng IP băng rộng để truyền dịch vụ từ
nhà cung cấp đến khách hàng
• Set-top Box (STB): Thiết bị đầu cuối phía khách hàng cho phép
thu, giải mã và hiển thị nội dung trên màn hình TV. STB cũng có
thể hỗ trợ HDTV, có khả năng kết nối với các thiết bị lưu trữ bên
ngoài, video phone, truy nhập web
• Hệ thống quản lý mạng và tính cước.
2.2 Các chuẩn nén hình ảnh
Cùng với sự phát triển mạnh mẽ của máy tính và sự ra đời của internet,
thì việc tìm ra một phương pháp nén ảnh nhằm giảm bớt không gian lưu trữ
11
thông tin và truyền thông trên mạng là yêu cầu cấp thiết. Các kỹ thuật nén
Video đều cố gắng giảm lượng thông tin cần thiết cho một chuỗi các bức
ảnh, mà không làm giảm chất lượng ảnh. Mục đích của nén video là giảm
bớt số bít khi lưu trữ và truyền bằng cách loại bỏ lượng thông tin dư thừa
trong từng frame và dùng kỹ thuật mã hoá để tối thiểu hoá lượng thông tin
quan trọng cần lưu giữ. Với một thiết bị lưu hình kỹ thuật số thông thường,
ảnh sau khi được số hoá sẽ được nén lại. Quá trình nén sẽ xử lý các dữ liệu
trong ảnh để đưa hình ảnh vào một không gian hẹp hơn như trong thiết bị
nhớ kỹ thuật số hoặc qua đường dây điện thoại, Với thị trường lưu hình
kỹ thuật số hiện nay, các chuẩn nén phổ biến là Motion JPEG (MJPEG),

Wavelet, H.261/ H.263/ H.263+/ H.263++ và MPGE-1/ MPGE-2/ MPGE-
4. Nhìn chung, có hai nhóm tiêu chuẩn chủ yếu: nhóm một gồm định dạng
nén MJPEG và Wavelet; và nhóm hai gồm các định dạng chuẩn còn lại.
Các thuật toán mã hóa của hai nhóm là tương tự nhau nhưng mục đích của
chúng lại khác nhau. H.26x series được phát triển cho điện thoại truyền
hình trong khi MPEG series được phát triển chính cho việc quảng bá hình
ảnh chất lượng cao.
12
Hình 2.2 Lịch sử và xu hướng phát triển của
các chuẩn nén
2.2.1Chuẩn nén MJPEG và Wavelet
Tính chất chung của các ảnh số là tương quan giữa các pixel ở cạnh nhau
lớn, điều này dẫn tới dư thừa thông tin để biểu diễn ảnh. Việc dư thừa
thông tin dẫn tới việc mã hoá không tối ưu. Do vậy, ta cần tìm phương án
biểu diễn ảnh với tương quan nhỏ nhất, để giảm thiểu độ dư thừa thông tin
của ảnh. Có 2 kiểu dư thừa thông tin như sau:
− Dư thừa trong miền không gian: là tương quan giữa không
gian pixel của ảnh (các pixel lân cận của ảnh có giá trị gần
giống nhau, trừ những pixel ở giáp đường biên ảnh).
− Dư thừa trong miền tần số: là tương quan giữa những dải màu
hoặc các dải phổ khác nhau.
− Trọng tâm của các nghiên cứu về nén ảnh là giảm bớt một số
bit để biểu diễn ảnh bằng việc loại bỏ dư thừa trong miền
không gian và miền tần số càng nhiều càng tốt. Các chuẩn nén
MJPEG và Wavelet đều tuân theo nguyên tắc tìm ra các phần
tử dư thừa miền không gian (mỗi Frame nén tự động). Trong
khi đó, đặc trưng của các chuẩn nén thuộc nhóm 2 là loại bỏ
dư thừa ở cả miền không gian và miền tần số của ảnh.
− MJPEG là định dạng nén ảnh lâu đời nhất và đã được dùng
phổ biến. Khi dùng chuẩn nén MJPEG, ảnh được phân chia

thành các khối vuông ảnh, mỗi khối vuông có kích thước 8 x 8
pixel và biểu diễn mức xám của 64 điểm ảnh. Mã hoá biến đổi
cosin rời rạc DCT (Discrete Cosin Tranform) trong chuẩn nén
13
này khai thác sự tương đồng giữa các pixel trong mỗi khối, để
lấy ra các biểu diễn ảnh với tương quan nhỏ. Chuỗi biểu diễn
sẽ bị rút ngắn, tuỳ theo mức nén của hệ thống hiện hành với
qui trình rút ngắn chuỗi biểu diễn. Vì vậy, hình ảnh sau khi
giải nén thường có nhiều sai lệch so với ảnh gốc.
Ở chuẩn nén Wavelet, thay vì mã hoá theo từng khối 8 x 8, việc thực
hiện trên toàn bộ bề mặt ảnh, một loạt các bộ phận lọc ở khâu chuyển đổi
sẽ phân tích các dữ kiện về từng điểm ảnh và cho ra một tập các hệ số. Do
chuẩn Wavelet có tác dụng với toàn bộ bề mặt ảnh, nên các sai lệch ở ảnh
giải nén sẽ khác với MJPEG. Hiệu ứng ghép mảnh không xảy đến với ảnh
được quan sát, nhưng độ phân giải hình ảnh giảm cũng như một vài vết mờ
sẽ xuất hiện.
Các định dạng Wavelet và MJPEG đều gây ra hiện tượng mất thông tin ở
ảnh giải nén. Sự dư thừa khả năng lưu ảnh ở mắt người cảm thụ khi dùng
chuẩn nén Wavelet ít hơn MJPEG 30%.
2.2.2Chuẩn nén MPEG-x và H.26x
MPEG là tên viết tắt của hội phim ảnh thế giới (The Moving Picture
Experts Group) là một sản phẩm nhóm mang tính ISO/IEC được phát triển
cho các thiết bị âm thanh và hình ảnh bằng cách nén dữ liệu chuẩn. MPEG
không phải là một công cụ nén đơn lẻ, ưu điểm của ảnh nén dùng MPEG là
ở chỗ MPEG có một tập hợp các công cụ mã hóa chuẩn, chúng có thể kết
hợp với nhau một cách linh động để phục vụ cho một loạt các ứng dụng
khác nhau. Nguyên lý chung của nén tín hiệu video là loại bỏ sự dư thừa về
không gian và sự dư thừa về thời gian, được thực hiện trước hết nhờ sử
dụng tính chất giữa các ảnh liên tiếp. Chúng ta dùng tính chất này để tạo ra
các bức ảnh mới nhờ vào thông tin từ những bức ảnh gửi trước đó. Do vậy

14
ở phía bộ mã hóa ta chỉ cần giữ lại những ảnh có sự thay đổi so với ảnh
trước, sau đó ta dùng phương pháp nén về không gian trong những bức ảnh
sai khác này. Nói một cách cụ thể, nguyên lý chung của các chuẩn nén là
phỏng đoán trước chuyển động của các frame ở bộ mã hóa. Mỗi frame ở tại
một thời điểm nhất định sẽ có nhiều khả năng giống với các frame đứng
ngay trước và sau đó. Các bộ mã hóa sẽ tiến hành quét lần lượt những phần
nhỏ trong mỗi frame (marco blocks) và phát hiện ra marco block nào không
thay đổi từ frame này tới frame khác. Phía bên thu, tức bộ giải mã đã lưu
trữ sẵn những thông tin không thay đổi từ frame này tới frame khác, chúng
được dùng để điền thêm vào vị trí trống trong ảnh được khôi phục.
Tuy nhiên, do sự tương đồng giữa các frame là rất lớn, nên sự phát hiện
ra các sai lệch là rất khó. Do vậy ảnh khôi phục khó đạt được như ảnh gốc.
Điều này đồng nghĩa với việc chất lượng ảnh cũng tương tự như khi dùng
chuẩn Wavelet và MJPEG, nhưng dung lượng kênh truyền và không gian
lưu trữ của các chuẩn nén H.26x và MPEG-x là nhỏ hơn (ví dụ như không
gian lưu trữ của chuẩn H.263 nhỏ hơn Motion JPEG từ 3 tới 5 lần). Sự
khác biệt giữa các chuẩn nén này (như ở H.26x và MPEG-x) chủ yếu nằm
ở khâu tiên đoán các frame mới và cách thức tính toán sai lệch giữa các
frame hiện tại và frame phỏng đoán. Chuẩn nén H.26x (gồm các thế hệ
H.261, H.262 và H.263, ), thường có tốc độ mã hoá tín hiệu thấp hơn
MPEG-x (khoảng 1,5 Mbps với độ phân giải hình 352 x 288) do dùng chủ
yếu trong viễn thông. Trong khi đó, chuẩn MPEG-2 dùng cho thị trường
giải trí có độ phân giải hình cao hơn, và mang lại chất lượng hình ảnh tốt
(cao hơn 1,5 Mbps với độ phân giải 352x288 hoặc 6 Mbps cho phân giải
hoàn chỉnh).
2.2.3Chuẩn nén MPEG-2
15
MPEG-2, ra đời năm 1994, là tên của một nhóm các tiêu chuẩn mã hóa
cho tín hiệu âm thanh và hình ảnh số, được chấp thuận bởi MPEG (Moving

Picture Expert Group) và được công bố trong tiêu chuẩn quốc tế ISO/IEC
13818. MPEG-2 thường được sử dụng để mã hóa âm thanh và hình ảnh cho
các tín hiệu broadcast bao gồm truyền hình vệ tinh quảng bá trực tiếp và
truyền hình cáp. MPEG-2 với một số sửa đổi cũng là khuôn dạng được sử
dụng bởi các phim DVD thương mại tiêu chuẩn.
MPEG-2 bao gồm các phần chính sau:
− Phần 1 của MPEG-2 tập trung vào cách một hoặc nhiều luồng
video và audio cũng như kiểu dữ liệu khác có thể kết hợp lại
thành 1 hoặc nhiều dòng dữ liệu phù hợp cho việc lưu trữ và
chuyển tải. Mục đích chính của phần 1 là định nghĩa cú pháp
cho việc vận chuyển gói (packet) của các dòng dữ liệu audio
và video và cú pháp cho việc đồng bộ giữa chúng.
− Phần 2 của MPEG-2 xây dựng dựa vào khả năng nén video
định nghĩa bởi chuẩn MPEG-1. Phần này định nghĩa tiều đề và
chuỗi bit, như các thuật toán để xử lý video. Phần 2 cũng định
nghĩa các loại profile dùng cho các chức năng khác nhau, từ
việc mã hóa dữ liệu tộc độ cao tới việc mã hóa ảnh với các độ
phân giải màu khác nhau.
− Phần 3 trình bày mở rộng đa kênh tương thích ngược của
chuẩn audio Mpeg1.
− Phần 4 và 5 tương ứng với phần 4,5 của MPEG-1. Part 4 định
nghĩa cấu tạo của hệ thống, hình ảnh và âm thanh và Part 5
16
gồm ví dụ về bộ mã hóa phần mềm ngôn ngữ C và bộ giải mã
hình ảnh và âm thanh.
− Phần 6: Lệnh và điều khiển phương tiện lưu trữ số (DSM-CC)
đại diện một tập hợp các giao thức điểu khiển chuỗi bit
MPEG-1 và MPEG-2. Một cú pháp cho việc điều khiển đĩa
truy nhập ngẫu nhiên kiểu VCR được định nghĩa, bao gồm các
lệnh như dừng hình, tua nhanh, . …

− Phần 7: Đại diện một khuyến nghị cho thuật toán mã hóa
audio đa kênh không tương thích ngược với khuyến nghị
MPEG-1. Do đó phần 7 loại bỏ sự bắt buộc việc tương thích
ngược với MPEG-1.
− Phần 8 giới thiệu video 10-bit ứng dụng cơ bản cho các studio
yêu cầu lấy mẫu 10bit. Công việc phần 8 bị gián đoạn do thiếu
sự quan tâm công nghiệp.
− Phần 9 định nghĩa khuyển nghị cho giao diện thời gian thực
cho việc chuyển chở tín hiệu điều khiển video theo yêu cầu
giữa thiết bị set-top-box và server headend.
MPEG-2 được dùng để mã hóa hình ảnh động và âm thanh và để tạo ra
ba kiểu khung số liệu (intra frame, forward predictive frame và
bidirectional pridicted frame) có thể được sắp xếp theo một trật tự cụ thể
gọi là cấu trúc nhóm các hình ảnh (group of picture, GOP).
Một luồng video MPEG-2 được tạo nên bởi một chuỗi các khung số liệu
mã hóa hình ảnh. Có ba cách để mã hóa một hình ảnh là: intra-coded (I
picture), forward predictive (P picture) và bidirectional predictive (B
17
picture). Các hình ảnh của luồng video được phân ra thành một kênh chứa
thông tin về độ sáng (luminance, còn gọi là kênh Y) và hai kênh thành phần
màu (chrominance, còn gọi là tín hiệu màu phân biệt Cb và Cr).
MPEG-2 sử dụng các chuẩn mã hóa âm thanh mới, đó là:
− Mã hóa tốc độ bít thấp với tần số lấy mẫu giảm đi một nửa
(MPEG-1 Layer 1/2/3 LSF).
− Mã hóa đa kênh, lên đến 5.1 kênh
− MPEG-2 AAC
MPEG-2 xác định 4 mức rằng buộc thông số mã hóa, gồm độ phân giải
khung, tốc độ khung, tốc độ bit tối đa và kích thước bộ đệm được yêu cầu
cho mỗi mức. Bảng liệt kê các giới hạn trên đối với mỗi mức.
Bảng 2.1 Các rằng buộc thông số mã hóa giới hạn trên MPEG-2

2.2.4Chuẩn nén MPEG-4:
18
MPEG-4 là một chuẩn nén chính được sử dụng để nén dữ liệu về âm
thanh và hình ảnh (audio and visual, AV). Được đưa ra vào năm 1998,
MPEG-4 được lựa chọn cho nhóm các tiêu chuẩn hình ảnh và âm thanh.
MPEG-4 được ứng dụng cho web, CD, videophone và truyền hình quảng
bá.
MPEG-4 tiếp thu các đặc điểm của MPEG-1 và MPEG-2 và các chuẩn
khác liên quan và bổ sung thêm các tính năng mới như hỗ trợ VRML cho
3D, các file bao gồm các vật thể được định hướng (gồm audio, video và
VRML).
MPEG-4 thực sự là một dạng nén ảnh mang tính đột phá của công nghệ
nén hình đương đại, thể hiện rõ nét ở những tiêu chuẩn sau:
− Áp dụng những tiêu chuẩn có tính mở cao với sự hỗ trợ đắc
lực từ ngành công nghiệp an ninh và công nghiệp máy tính.
− Khả năng truyền theo dòng và mạng lưới.
− Tối thiểu hóa dung lượng kênh truyền và không gian lưu trữ
trong khi vẫn giữ được tính trung thực của ảnh.
Những chuẩn nén MPEG-4 có profile dạng đơn giản chiếm lĩnh đa phần
thị trường. MPEG-4 đã được phát triển và hoàn thiện trở thành định dạng
nén hình tiên tiến, hoàn hảo, với tiêu chí tập trung phát triển những nhân tố
giúp tăng cường chất lượng hình ảnh, cũng như phục vụ đắc lực cho các
thiết bị giám sát có các frame dạng chữ nhật. Mỗi bit stream hiển thị trong
định dạng nén MPEG-4 cung cấp một mô tả mang tính phân tầng về hình
ảnh hiển thị. Từng lớp dữ liệu được đưa vào luồng bit bởi những mật mã
đặc biệt gọi là mật mã khởi nguồn.
19
2.2.4.1 Phân phối các luồng dữ liệu
Hình 2.3 Mô hình các lớp MPEG-4
Việc phân phối một cách đồng bộ các luồng thông tin từ nguồn đến đích

được xác định dưới dạng lớp đồng bộ (Sync Layer) và một lớp phân phối
(Delivery Layer) gồm hai lớp được ghép lại là DMIF Layer và TransMux
Layer.
DMIF Layer được điểu khiển bởi giao diện DMIF (Delivery Multimedia
Intergration Framework), là giao diện giữa ứng dụng và truyền tải. Một ứng
dụng đơn lẻ có thể chạy trên các lớp truyền tải khác nhau khi được hỗ trợ
DMIF.
MPEG-4 DMIF hỗ trợ các chức năng sau:
• Là một giao diện ứng dụng trong suốt
• Điều khiển việc thiết lập các kênh FlexMux
20
• Sử dụng các mạng đồng nhất giữa các peer tương tác với nhau:
IP, ATM, di động, PSTN, ISDN băng hẹp
• Hỗ trợ mạng di động, được phát triển cùng với ITU-T
• UserCommands với bản tin xác nhận
• Quản lý thông tin MPEG-4 Sync Layer
Lớp “TransMux” cung cấp các dịch vụ truyền tải phù hợp với các yêu
cầu về QoS. Chỉ giao diện đối với lớp này được xác định bởi MPEG-4
trong khi các sắp xếp cụ thể của các gói dữ liệu và điều khiển báo hiệu cần
được tiến hành cùng với các phần chính có tác dụng qua các giao thức
truyền tải tương ứng. Bất kì giao thức truyền tải tồn tại thích hợp nào như
(RTP)/UDP/IP, (AAL5)/ATM hoặc luồng truyền tải của MPEG-2 qua một
lớp kết nối thích hợp nào có thể trở thành một ví dụ TransMux đặc trưng.
Sử dụng công cụ ghép kênh FlexMux là lựa chọn, lớp này có thể bỏ
trống nếu lớp TransMux ở dưới cung cấp toàn bộ các chức năng yêu cầu.
Tuy nhiên, lớp đồng bộ (Sync Layer) thì luôn phải tồn tại. Chức năng của
lớp này như sau:
• Nhận dạng các khối truy nhập, truyền tải timestamps và thông tin
tham chiếu nhịp và nhận dạng dữ liệu mất
• Lựa chọn dữ liệu chèn vào từ các luồng sơ cấp khác thành luồng

FlexMux
• Truyền thông tin điều khiển
• Chỉ rõ QoS yêu cầu đối với mỗi luồng sơ cấp và luồng FlexMux
21
• Chuyển các yêu cầu QoS thành các tài nguyên mạng thực tế
• Kết hợp các luồng sơ cấp với các đối tượng trung gian
• Truyền đi các sắp xếp của các luồng sơ cấp tới kênh FlexMux và
TransMux
2.2.4.2 Hệ thống
MPEG-4 được xác định là công cụ của các thuật toán nén tiên
tiến đối với các dữ liệu hình ảnh và âm thanh. Các luồng dữ liệu
(Elementary Streams, ES) là kết quả từ quá trình mã hóa được
truyền đi và lưu trữ riêng biệt.
Mối quan hệ giữa các thành phần hình ảnh và âm thanh được mô
tả thành hai mức chính:
• BIFS (Binary Format for Scenes) mô tả sự sắp xếp về không gian
và thời gian của các đối tượng. Người xem có thể có khả năng
tương tác với các đối tượng, ví dụ sắp xếp lại chúng trên màn ảnh
hoặc thay đổi quan điểm về cách xem trong môi trường 3D.
• Tại lớp thấp hơn, Object Descriptors (ODs) xác định quan hệ giữa
Elementary Streams thích hợp với từng đối tượng (ví dụ luồng âm
thanh và hình ảnh của một người trong một cuộc hội nghị truyền
hình). ODs cũng cung cấp thêm các thông tin như nhu cầu URL
để truy nhập Elementary Stream, các đặc tính của bộ giải mã, vật
sở hữu trí tuệ,
2.2.4.3 MPEG-4 Audio
MPEG-4 Audio tạo điều kiện thuận lợi cho một lượng lớn các ứng dụng
từ các bài diễn thuyết đơn giản đến các hình ảnh đa kênh chất lượng cao, và
22
từ các âm thanh tự nhiên đến các âm thanh tổng hợp. Đặc biệt, MPEG-4 hỗ

trợ các biểu diễn hiệu suất cao của các đối tượng hình ảnh bao gồm:
• Các tín hiệu hình ảnh thông thường: Hỗ trợ cho việc mã hóa hình
ảnh thông thường từ chất lượng thấp đến cao được cung cấp bởi
kĩ thuật mã hóa biến đổi. Với chức năng này, một dải rộng các bít
và băng tần được bao phủ. Bắt đầu tại tốc độ bít 6 kbit/s và băng
tần dưới 4kHz và mở rộng tới hình ảnh chất lượng quảng bá từ
đơn tới đa kênh. Chất lượng cao có thể đạt được với độ trễ thấp.
Mã hóa hình ảnh tham số (Parametric Audio Coding) cho phép
âm thanh với tốc độ thấp.
• Các tín hiệu thoại: Mã hóa thoại được tiến hành sử dụng tốc độ từ
2kbit/s tới 24 kbit/s sử dụng công cụ mã hóa thoại. Tốc độ bít
thấp hơn, ví dụ 1,2 kbit/s, cũng có thể khi mã hóa tốc độ thay đổi
được cho phép. Khi sử dụng công cụ HVXC, tốc độ và cường độ
có thể được thay đổi dưới sự điều khiển của người sử dụng trong
khi phát lại. Nếu công cụ CELP được sử dụng, việc thay đổi tốc
độ phát lại có thể đạt được bằng cách sử dụng và thêm vào các
công cụ để việc xử lí được hiệu quả.
2.2.4.4 MPEG-4 Visual
MPEG-4 Visual tiêu chuẩn cho phép mã hóa lai ghép các hình ảnh tự
nhiên (căn cứ vào pixel) và các cảnh nhân tạo (lấy ra từ máy tính). Dưới
đây là tổng quan về các công cụ và thuật toán của chuẩn hình ảnh MPEG-4.
• Các định dạng được hỗ trợ bởi MPEG-4 Visual:
− Tốc độ bít: từ 5kbit/s đến lớn hơn 1 Gbit/s
23
− Các định dạng: phát triển không ngừng cũng như các hình ảnh
kết hợp chặt chẽ với nhau
− Giải pháp: điển hình từ sub-QCIF tới giải pháp ‘Studio’ (4k x
4k pixels)
• Hiệu quả nén
− Đối với toàn bộ các tốc độ bít được đánh địa chỉ, thuật toán

này rất hiệu quả. Thuật toán này bao gồm việc kết hợp mã hóa
với chất lượng được điều chỉnh giữa “khả năng chấp nhận” đối
với tốc độ nén cao với “near lossless’
− Nén hiệu quả đối với mạng lưới 2-D và 3-D
− Truyền hình truy nhập ngẫu nhiên cho phép các chức năng
như tạm dừng, chuyển đổi nhanh của các chương trình truyền
hình được lưu trữ
• Các chức năng Content-Based
− Mã hóa Content-based hình ảnh và video cho phép tách biệt
việc giải mã và tái thiết lại các đối tượng video được định
dạng riêng.
− Truy nhập ngẫu nhiên nội dung các video cho phép các chức
năng như tạm dừng, chyển đổi nhanh các chương trình truyền
hình được lưu trữ.
− Nhân mở rộng nội dung các chương trình truyền hình cho
phép các chức năng như làm thay đổi các text nhân tạo hay tự
24
nhiên, bố cục, hình ảnh và chương trình truyền hình bao phủ
nội dung truyền hình được thay đổi.
• Tính linh động cao về text, hình ảnh và video
− Tính linh động và đa dạng của bộ mã hóa cho phép mã hóa các
luồng bít phức tạp khác nhau đối với một tex, hình ảnh hoặc
video.
− Tính linh động và đa dạng của bộ giải mã các luồng bít text,
hình ảnh hoặc video được giải mã bởi bộ giải mã tại các mức
độ phức tạp khác nhau. Nhìn chung chất lượng khôi phục lại
liên quan đến độ phức tạp của bộ giải mã được sử dụng.
− Tính linh động về không gian cho phép bộ giải mã giải mã
một tập hợp của toàn bộ luồng bít được phát ra bởi bộ mã hóa
để khôi phục lại và hiển thị các tex, hình ảnh và video.

− Tính linh động về thời gian cho phép bộ giải mã giải mã một
tập hợp của toàn bộ luồng bít được phát ra bởi bộ mã hóa để
khôi phục lại và hiển thị video.
− Tính linh động về chất lượng cho phép một luồng bít được
phân tích thành một số các lớp luồng bít có tốc độ bít khác
nhau ví dụ như sự kết hợp của một tập hợp các lớp vẫn có thể
được giải mã thành một tín hiệu có nghĩa. Việc phân tích
luồng bít có thể xảy ra trong quá trình truyền dẫn hoặc giải
mã. Nhìn chung chất lượng khôi phục lại liên quan đến số
lượng lớp được sử dụng để giải mã và khôi phục.
2.2.5 Chuẩn nén H.264/MPEG-4 Part 10/AVC
25

×