CHƯƠNG I
TỔNG QUAN VỀ IPTV
Truyền hình kỹ thuật số là tiến bộ quan trọng nhất trong công nghệ truyền
hình từ khi phương tiện này được tạo ra trong thế kỷ trước. Truyền hình kỹ
thuật số đưa ra cho khách hàng nhiều sự lựa chọn và tạo ra nhiều tương tác
hơn. Hệ thống truyền hình quảng bá tương tự đã được sử dụng rất tốt trong
hơn 60 năm qua.Trong giai đoạn đó, người xem phải trải qua sự chuyển tiếp
từ truyền hình đen trắng sang truyền hình màu đã yêu cầu người xem phải
mua các Tivi màu mới, và các kênh quảng bá phải có các máy phát mới, các
thiết bị sản xuất chương trình mới. Ngày nay, với sự phát triển của ngành
công nghiệp truyền hình sẽ đưa ruyền hình thông thường sang thời đại của
truyền hình kỹ thuật số. Hầu hết các hoạt động của truyền hình phải được
nâng cấp và triển khai dựa trên kỹ thuật số để đưa tới cho khách hàng các
dịch vụ kỹ thuật số tinh vi hơn. Một kỹ thuật mới được gọi là truyền hình
dựa trên giaothức Internet IPTV (Internet Protocol – based Television). Như
tên gọi, IPTV được miêu tả như là một cơ chế để truyền tải luồng nội dung
truyền hình dựa trên nền tảng là một mạng sử dụng giao thức IP. Lợi ích của
cơ chế này là khả năng phân phối nhiều loại tín hiệu truyền hình khác nhau,
tăng các tính năng tương tác và cải tiến để tương thích với các mạng thuê
bao đang tồn tại. Trong chương này sẽ trình bày khái niệm về IPTV, cấu
trúc mạng IPTV, vấn đề phân phối IPTV, các công nghệ cho IPTV, cuối
cùng là các ứng dụng và dịch vụ của IPTV.
1.1 Khái niệm IPTV
Công nghệ IPTV đang giữ phần quan trọng và có hiệu quả cao trong các
mô hình kinh doanh truyền hình thu phí. Nhưng thực chất nghĩa của từ
viết tắt IPTV là gì và ảnh hưởng của nó đối với người xem truyền hình như
thế nào?
Khi mới bắt đầu IPTV được gọi là Truyền hình giao thức Internet
(Internet Protocol Television) hay Telco TV hoặc Truyền hình băng rộng
(Broadband Television). Thực chất tất cả các tên đều được sử dụng để nói
đến việc phân phối truyền hình băng rộng chất lượng cao hoặc nội dung âm
thanh và hình ảnh theo yêu cầu trên một mạng băng rộng. IPTV là một định
nghĩa chung cho việc áp dụng để phân phối các kênh truyền hình truyền
thống, phim truyện, và nội dung video theo yêu cầu trên một mạng riêng. Từ
góc nhìn của người sử dụng thì IPTV chỉ hoạt động như một chuẩn dịch vụ
truyền hình trả tiền. Từ góc nhìn của nhà cung cấp thì IPTV bao gồm việc
thu nhận, xử lý và phân phối chính xác nội dung truyền hình tới thuê bao
thông qua một hạ tầng mạng sử dụng IP. Theo định nghĩa được đưa ra
bởi hiệp hội viễn thông quốc tế tập trung vào nhóm IPTV thì IPTV là các
dịch vụ đa phương tiện (ví dụ như dữ liệu truyền hình, video, âm thanh,
văn bản, đồ họa) được phân phối trên một mạng IP có sự quản lý để cung
cấp các mức yêu cầu về chất lượng của dịch vụ, an toàn, có tính tương tác
và tin cậy. IPTV có một số điểm đặc trưng sau:
• Hỗ trợ truyền hình tương tác: khả năng của hệ thống IPTV cho
phép các nhà cung cấp dịch vụ phân phối đầy đủ các ứng dụng của
truyền hình tương tác. Các dạng dịch vụ IPTV có thể được phân phối
bao gồm chuẩn truyền hình trực tiếp, truyền hình hình ảnh chất lượng
cao HDTV (High Definition Television), các trò chơi tương tác và
truy cập Internet tốc độ cao.
• Dịch thời gian: IPTV kết hợp với một bộ ghi hình video số cho
phép dịch chuyển thời gian để xem nội dung chương trình, đây là một
kỹ thuật ghi hình và lưu trữ nội dung để có thể xem lại sau.
• Tính cá nhân: một hệ thống IPTV end-to-end hỗ trợ thông tin có tính
hai chiều và cho phép các user xem các chương trình theo sở thích,
thói quen…Hay cụ thể hơn là cho các user xem cái gì họ muốn vào
bất kỳ lúc nào.
• Yêu cầu băng thông thấp: để thay thế cho việc phân phối mọi kênh
cho mọi user, công nghệ IPTV cho phép các nhà cung cấp dịch vụ
chỉ phân phối các kênh mà user đã yêu cầu. Đây là đặc điểm hấp dẫn
cho phép các nhà khai thác mạng bảo toàn được băng thông của họ.
• Nhiều thiết bị có thể sử dụng được: việc xem nội dung IPTV không
giới hạn cho Tivi. Khách hàng có thể sử dụng PC của họ và các thiết
bị di động để truy cập các dịch vụ IPTV.
1.2 Cấu trúc mạng IPTV
Có rất nhiều tài liệu trình bày cấu trúc của mạng IPTV, trong phần này
trình bày cấu trúc mạng IPTV theo hai vấn đề. Thứ nhất là cơ sở hạ tầng
của mạng IPTV, đưa ra các thành phần của một hệ thống IPTV end-to-end.
Vấn đề thứ hai là cấu trúc chức năng cho dịch vụ IPTV, nội dung phần
này nói lên chức năng của từng thành phần cụ thể tham giao vào công việc
phân phối nội dung IPTV
1.2.1 Cơ sở hạ tầng của mạng IPTV
Hình 1.1 là mô hình một hệ thống IPTV end-to-end
Hình 1.1 Mô hình hệ thống IPTV end-to-end
1.2.1.1 Trung tâm dữ liệu IPPTV
Trung tâm dữ liệu IPTV (IPTV Data Center) hay Headend là nơi nhận
nội dung từ nhiều nguồn khác nhau, bao gồm video nội bộ, các bộ tập trung
nội dung, các nhà sản xuất nội dung và các kênh truyền hình vệ tinh, mặt
đất, truyền hình cáp. Mỗi lần nhận như vậy, một số thành phần phần cứng
khác nhau như bộ giải mã, các server video, các router IP và các phần cứng
bảo an chuyên dụng đều được sử dụng để chuẩn bị nội dung sẽ được phân
phối trên mạng IP. Cộng với một hệ thống quản lý thuê bao IPTV về thuộc
tính (profile) và hóa đơn thanh toán. Chú ý rằng, vị trí vật lý của trung tâm
dữ liệu IPTV sẽ được xác định bởi nhà cung cấp dịch vụ sử dụng hạ tầng
mạng.
1.2.1.2 Mạng phân phối băng rộng
Việc phân phối các dịch vụ IPTV theo yêu cầu kết nối one-to-one, nếu trong trường hợp việc triển
khai IPTV trên diện rộng thì số kết nối one-to-one sẽ tăng lên. Do đó, yêu cầu về băng thông trên mạng
là khá lớn. Những tiến bộ về công nghệ mạng cho phép các nhà cung cấp viễn thông có được một số lượng
lớn các mạng băng rộng. Riêng mạng truyền hình cáp thì sử dụng hỗn hợp cả cáp đồng trục và cáp quang để
đáp ứng cho việc phân phối nội dung IPTV.
1.2.1.3 Thiết bị khách hàng IPTVCD
Thiết bị khách hàng IPTVCD (IPTV Consumer Device) là các thành phần cho phép user truy cập dịch
vụ IPTV. IPTVCD kết nối tới mạng băng rộng, chúng đảm nhiệm chức năng giải mã, xử lý các luồng
tín hiệu tới từ mạng IP. IPTVCD được hỗ trợ các kỹ thuật tiên tiến để tối thiểu hóa hoặc loại trừ hoàn
toàn ảnh hưởng của các vấn đề về mạng khi xử lý nội dung IPTV. Có rất nhiều dạng IPTVCD như
gateway cho khu dân cư, bộ giải mã set-top boxes, bảng điều khiển trò chơi…
1.2.1.4 Mạng gia đình
Mạng gia đình liên kết các thiết bị kỹ thuật số bên trong một khu vực có diện tích nhỏ. Nó cải thiện
thông tin và cho phép chia sẻ tài nguyên giữa các thành viên trong gia đình. Mục đích của mạng gia đình
là cung cấp quyền truy cập thông tin giữa các thiết bị kỹ thuật số xung quanh nhà thuê bao. Với mạng
gia đình, khách hàng có thể tiết kiệm tiền và thời gian do việc chia sẻ các thiết bị phần cứng rất tốt và dễ
dàng, thông qua các kết nối Internet băng rộng.
1.2.2 Cấu trúc chức năng cho dịch vụ IPTV
Một mạng IPTV có thể bao gồm nhiều thành phần cơ bản, nó cung cấp một cấu trúc chức năng cho
phép phân biệt và chuyên môn hoá các nhiệm vụ. Hình 1.2 trình bày sáu thành phần chính của cấu trúc
chức năng được tạo thành bởi các chức năng sau: cung cấp nội dung, phân phối nội dung, điều khiển
IPTV, truyền dẫn IPTV, thuê bao và bảo an.
1.2.2.1 Cung cấp nội dung
Tất cả nội dung được sử dụng bởi dịch vụ IPTV, bao gồm VoD và truyền hình quảng bá sẽ phải
thông qua chức năng cung cấp nội dung, ở đó các chức năng tiếp nhận, chuyển mã và mã hóa sẽ tạo nên
các luồng video số có khả năng được phân phối qua mạng IP.
1.2.2.2 Phân phối nội dung
Khối phân phối nội dung bao gồm các chức năng chịu trách nhiệm về việc phân phối nội dung đã
được mã hoá tới thuê bao. Thông tin nhận từ các chức năng vận truyển và điều khiển IPTV sẽ giúp
phân phối nội dung tới thuê bao một cách chính xác. Chức năng phân phối nội dung sẽ bao gồm cả việc
lưu trữ các bản copy của nội dung để tiến hành nhanh việc phân phối, các lưu trữ tạm thời (cache) cho VoD
và các bản ghi video cá nhân. Khi chức năng thuê bao liên lạc với chức năng điều khiển IPTV để yêu cầu
nội dung đặc biệt, thì nó sẽ gửi tới chức năng phân phối nội dung để có được quyền truy cập nội dung.
Hình 1.2 Cấu trúc chức năng cho dịch vụ IPTV
1.2.2.3 Điều khiển IPTV
Các chức năng điều khiển IPTV là trái tim của dịch vụ. Chúng chịu trách nhiệm về việc liên kết tất cả
các chức năng khác và đảm bảo dịch vụ hoạt động ở cấp độ thích hợp để thoả mãn nhu cầu của khách
hàng. Chức năng điều khiển IPTV nhận yêu cầu từ thuê bao, liên lạc với chức năng phân phối và vận
chuyển nội dung để đảm bảo nội dung được phân phối tới thuê bao. Một chức năng khác của điều khiển
IPTV là cung cấp hướng dẫn chương trình điện tử EPG (Electronic Program Guide), EPG được thuê bao
sử dụng để chọn nội dung theo nhu cầu. Chức năng điều khiển IPTV cũng sẽ chịu trách nhiệm về quản lý
quyền nội dung số DRM (Digital Rights Management) được yêu cầu bởi thuê bao để có thể truy cập nội
dung.
1.2.2.4 Chức năng vận chuyển IPTV
Sau khi nội dung yêu cầu từ thuê bao được chấp nhận, chức năng vận chuyển IPTV sẽ chịu trách
nhiệm truyền tải nội dung đó tới thuê bao, và cũng thực hiện truyền ngược lại các tương tác từ thuê bao tới
chức năng điều khiển IPTV.
1.2.2.5 Chức năng thuê bao
Chức năng thuê bao bao gồm nhiều thành phần và nhiều hoạt động khác nhau, tất cả đều được sử
dụng bởi thuê bao để truy cập nội dung IPTV. Một số thành phần chịu trách nhiệm liên lạc thông tin với
chức năng truyền dẫn, ví dụ như truy cập getway kết nối với DSLAM, hay trình STB sử dụng trình duyệt
web để kết nối với Middleware server. Trong chức năng này, STB lưu trữ một số các thành phần quan
trọng như các key DRM và thông tin xác thực user. Khối chức năng thuê bao sẽ sử dụng EPG cho phép
khách hàng lựa chọn hợp đồng để truy cập và yêu cầu nó từ các chức năng điều khiển IPTV. Nó cũng nhận
các giấy phép số và các key DRM để truy cập nội dung.
1.2.2.6 Bảo an
Tất cả các chức năng trong mô hình IPTV đều được hỗ trợ các cơ chế bảo an tại các cấp độ khác nhau.
Chức năng cung cấp nội dung sẽ có bộ phận mật mã được cung cấp bởi nhà cung cấp nội dung. Chức năng
phân phối nội dung sẽ được đảm bảo thông qua việc sử dụng DRM. Các chức năng điều khiển và vận
chuyển sẽ dựa vào các chuẩn bảo an để tránh các thuê bao không được xác thực có quyền sửa đổi và truy
cập nội dung. Chức năng thuê bao sẽ bị giới hạn sử dụng các cơ chế bảo an được triển khai tại STB và
Middleware server. Tóm lại, tất cả các ứng dụng và các hệ thống hoạt động trong môi trường IPTV sẽ có
các cơ chế bảo an luôn sẵn sàng được sử dụng để trách các hoạt động trái phép.
Các thành phần trong môi trường IPTV sẽ tương ứng với các chức năng. Ví dụ, chức năng điều
khiển IPTV bao gồm các thành phần Middleware và quản lý quyền nội dung số DRM. Khi phân phối các
nhiệm vụ, một nhóm phụ trách các chức năng điều khiển IPTV sẽ có khả năng sắp xếp tất cả các ứng dụng
tương ứng với các thành phần cho chức năng đó. Hình 1.3 mô tả các thiết bị thực hiện các chức năng
trong môi trường IPTV.
Hình 1.3 Các thành phần của cấu trúc chức năng
1.3 Vấn đề phân phối IPTV
Các kiểu lưu lượng mạng IP thời gian thực khác nhau được tạo ra bởi các loại dịch vụ trên nền
IP khác nhau như VoIP và truy cập Internet tốc độ cao. Với mỗi loại dịch vụ có những đặc điểm riêng về
nội dung, vì thế cần phải có những phương thức phân phối thích hợp. Hiện nay có ba phương thức dùng để
phân phối nội dung IPTV qua mạng IP là unicast, broadcast và multicast.
1.3.1 Unicast
Trong truyền unicast, mọi luồng video IPTV đều được gửi tới một IPTVCD. Vì thế, nếu có nhiều
hơn một user IPTV muốn nhận kênh video tương tự thì IPTVCD sẽ cần tới một luồng unicast riêng rẽ. Một
trong các luồng đó sẽ truyền tới các điểm đích qua mạng IP tốc độ cao. Nguyên tắc thực thi của unicast
trên mạng IP là dựa trên việc phân phối một luồng nội dung được định hướng tới mỗi user đầu cuối. Từ
góc độ của kỹ thuật này, thì việc cấu hình thực thi khá dễ dàng; tuy nhiên nó không có hiệu quả về băng
thông mạng. Hình 1.2 trình bày việc thiết lập các kết nối khi có 5 thuê bao IPTV truy cập một kênh
broadcast trên mạng tốc độ cao hai chiều (two-way).
Như trên hình 1.4, khi nhiều user IPTV truy cập cùng một kênh IPTV
tại cùng một thời điểm, thì một số các kết nối định hướng được thiết lập qua
mạng. Trong ví dụ này, server cần cung cấp kết nối tới mọi thuê bao có yêu
cầu truy cập Kênh 10, với tổng số là năm luồng riêng rẽ bắt đầu từ server
nội dung và kết thúc tại router đích. Năm kết nối này sau đó được định
tuyến tới các điểm đích của nó. Các kết nối được kéo dài tới hai tổng đài
khu vực (Regional Office), với ba kết nối tới tổng đài khu vực 1 và hai kết
nối tới tổng đài khu vực 2. Sau đó các kết nối được thiết lập giữa các
router tại tổng đài khu vực với các getway đặt trong năm hộ gia đình. Đây là
phương thức truyền dẫn IP video tốt cho các ứng dụng theo yêu cầu như
VoD, ở đó mỗi thuê bao nhận một luồng duy nhất.
1.3.2 Broadcast
Các mạng IP cũng hỗ trợ chức năng truyền broadcast, về mặt nào đó
giống như kênh IPTV được đưa tới mọi thiết bị truy cập được kết nối vào
mạng băng rộng. Khi một server được cấu hình truyền broadcast, một kênh
IPTV gửi tới tất cả các thiết bị IPTVCD được kết nối vào mạng bất chấp
thuê bao có yêu cầu kênh đó hay không. Đây sẽ là vấn đề chính do các tài
nguyên IPTVCD bắt buộc phải hoạt động để xử lý các gói tin không mong
muốn. Một vấn đề khác mà broadcast không phù hợp cho các ứng dụng
IPTV là trong thực tế kỹ thuật truyền thông tin này không hỗ trợ việc định
tuyến Từ lâu, hầu hết các mạng đã mở rộng việc sử dụng các router,
nhưng nếu truyền broadcast thì không sử dụng định tuyến. Đây là lý do
làm mạng và các thiết bị IPTVCD khác bị tràn ngập khi tất cả các kênh
được gửi tới tất cả mọi người.
1.3.3 Multicast
Trong phạm vi triển khai IPTV, mỗi nhóm multicast được truyền broadcast các kênh truyền hình
và các thành viên của nhóm tương đương với các thiết bị IPTVCD Vì thế, mỗi kênh IPTV chỉ được đưa tới
IP-STB muốn xem kênh đó. Đây là cách hạn chế được lượng tiêu thụ băng thông tương đối thấp và
giảm gánh nặng xử lý trên server. Hình 1.5 mô tả tác động của việc sử dụng kỹ thuật multicast trong ví
dụ phân phối cho năm thuê bao truy cập Kênh 10 IPTV cùng một lúc. Như hình 1.5, chỉ bản copy đơn
(single) được gửi từ server nội dung tới router phân phối. Router này sẽ tạo ra hai bản copy của luồng
thông tin tới và gửi chúng tới các router đặt tại các tổng đài khu vực theo các kết nối IP định hướng. Sau
đó, mỗi router sẽ tạo ra các bản copy khác để cung cấp cho các thuê bao muốn xem. Vai trò quan trọng
của phương thức này là làm giảm số kết nối IP và dung lượng dữ liệu đi ngang qua mạng. Đây là phương
thức thường được các nhà cung cấp dịch vụ sử dụng để phát quảng bá các chương trình trực tiếp và là một
kỹ thuật có hiệu suất cao cho hạ tầng mạng IP đang tồn tại. Phương thức này không có lợi trong tuyến
hướng lên (upstream) luồng thông tin giữa các thiết bị IPTVCD và broadcast server. Cần chú ý rằng,
việc phát multicast nội dung IPTV thường phức tạp hơn nhiều nếu so sánh với mô hình thông tin unicast
và broadcast.
1.4 Các công nghệ cho IPTV
Có nhiều công nghệ khác nhau được yêu cầu để thực thi đầy đủ hệ thống IPTV trong thực tế, một số
công nghệ chung đã được diễn giải trong các tài liệu khác. Trong phần này chỉ đề cập tới một số công
nghệ cơ bản được sử dụng cho các ứng dụng IPTV.
Hình 1.5 Các kết nối được sử dụng trong kỹ thuật multicast
1.4.1 Vấn đề xử lý nội dung
Các hệ thống xử lý nội dung tiếp nhận các tín hiệu video thời gian thực từ rất nhiều nguồn khác
nhau, hình thức của chúng là một định dạng thích hợp để STB có thể giải mã và hiển thị trên màn hình.
Tiến trình này bao gồm các chức năng sau:
• Nén: các nguồn video tương tự, quá trình nén số được thực thi trên mỗi tín hiệu video
trước khi nó được phát lên hệ thống IPTV. Tốc độ cao nhất của dữ liệu video và độ dài của
gói tin được thực hiện sao cho phù hợp với tất cả các nguồn video đầu vào, và để đơn giản
hóa công việc truyền dẫn và các chức năng ghép kênh.
• Chuyển mã: các luồng video tương tự đã được định dạng số, đôi khi nó cần được chuyển đổi
sang thuộc tính MPEG hoặc cấp độ luồng tới thích hợp với các bộ STB. Chuyển mã nội
dung định dạng HD cung cấp các chuẩn để chuyển mã gốc là MPEG-2 thành H.264 để có
được băng thông thấp hơn cho các mạng DSL
• Chuyển đổi tốc độ: bản chất của việc chuyển đổi tốc độ là tiến trình chuyển đổi tốc độ bit
của luồng video số tới. Ví dụ như luồng chuẩn SD là 4,5 Mbps có thể cần phải giảm xuống
2,5 Mbps để sử dụng trong hệ thống IPTV.
• Nhận dạng chương trình: mỗi luồng video cần được ghi một nhãn duy nhất trong hệ thống
IPTV, do đó các thiết bị ghép kênh và các bộ STB có thể xác định chính xác các luồng video.
Mỗi chương trình audio hay video bên trong mỗi luồng truyền dẫn MPEG phải được xử lý để
đảm bảo không có sự trùng lẫn chương trình.
Việc xử lý nội dung có thể được thực thi trên một luồng video trực tiếp hoặc đã được lưu trữ bên trong
video server
1.4.2 VoD và server
Cấu trúc của hệ thống VoD sử dụng công nghệ video-over-IP trên hình 1.6 bao gồm 4 thành phần
chính. Đầu tiên, nội dung phải được xử lý cho việc lưu trữ và phân phối bằng quá trình nén và mật mã tại
trạm tiền xử lý nội dung. Một VoD server lưu trữ nội dung và tạo luồng gửi tới thuê bao. Mỗi thuê bao sẽ
có một bộ STB để nhận và giải mã nội dung, sau đó đưa lên màn hình hiển thị. Bộ STB cũng cung cấp cho
thuê bao một danh sách các dịch vụ từ thành phần quản lý thuê bao và hệ thống truy cập có điều kiện. Đây
là một hệ thống con nhận các lệnh từ thuê bao, gửi những lệnh thích hợp tới VoD server và phân phối
các key giải mã cho các bộ STB.
Các video server là yếu tố cần thiết cho mọi hệ thống VoD, do chúng tạo ra các luồng video trong
thực tế và gửi chúng tới mỗi thuê bao. Các server có dung lượng bộ nhớ lớn nhỏ khác nhau tùy thuộc vào
các ứng dụng khác nhau. Trong phần này chỉ để cập đến một số khía cạnh của các server và cách thức
chúng được sử dụng cho việc phân phối nội dung. Dung lượng lưu trữ nội dung được hỗ trợ trên một
server có thể lớn hoặc nhỏ. Sẽ không phù hợp nếu server lưu trữ nhiều nhưng chỉ phục vụ một số ít thuê
bao.
Hình 1.6 Cấu trúc hệ thống VoD
Khi đầu tư xây dựng một server, cần phải chú ý tới dung lượng của server để có thể đáp ứng các yêu
cầu đặt ra. Video server có thể là một trong các loại sau:
• Các server sản xuất được sử dụng trong công việc sản xuất các video, ví dụ như trong các mạng
truyền hình. Để cho các đối tượng này, một server cần phải có được nội dung lý tưởng nhất trong
các định dạng khác nhau và nhanh chóng phân phối các file chứa nội dung tới thuê bao khi họ
cần, các server này dung lượng thường rất nhỏ. Thay vào đó, là các thiế bị có dung lượng lớn và
hỗ trợ tốt việc tìm nội dung, bao gồm các công cụ hỗ trợ dữ liệu lớn và dữ liệu đó là các file gồm
nhiều phiên bản.
• Các server cá nhân và công ty được sử dụng trong trường hợp có số luồng video để phân
phối đồng thời thấp, ví dụ như một gian hàng trưng bày của công ty có từ 5 đến 10 người xem
cùng một lúc. Đây là loại server thường được xây dựng trên PC với các phần mềm được
chuyên dụng hóa.
• Các nhà cung cấp server cần các server được thiết kế đặc biệt có khả năng lưu trữ hàng nghìn giờ
nội dung chương trình và khả năng phân phối tới hàng trăm hoặc hàng nghìn người xem cùng
một lúc. Dung lượng của các hệ thống này thật sự rất lớn; ví dụ để cung cấp cho 1000 user cùng
một lúc, với mỗi user là một luồng 2,5 Mbps. Như vậy server cần có tốc độ dữ liệu xuất ra là 2,5
Gbps.
Các nhà cung cấp sử dụng hai phương thức để phân phối server trong mạng của họ, như trên hình 1.7.
Đầu tiên là phương thức tập trung hóa, các server lớn, dung lượng cao được xây dựng tại những vị
trí trung tâm, chúng phân phối nội dung cho thuê bao thông qua các liên kết tốc độ cao kết nối tới mỗi
nhà cung cấp dịch vụ nội hạt. Phương thức thứ hai là phân phối hóa server, ở đó các server nhỏ hơn được
đặt tại các vị trí gần thuê bao và server chỉ cung cấp cho các thuê bao trong vùng đó. Trung tâm Library
server sẽ download các bản copy nội dung cung cấp cho các Hub server phân phối có yêu cầu. Trong
phương thức tập trung hóa thì giảm được số lượng server cần phải xây dựng, giảm giá thành trong việc
truyền dẫn và lưu trữ nội dung tại các vị trí khác nhau. Còn trong phương thức phân phối hóa thì giảm
được số lượng băng thông cần thiết giữa các vị trí. Cả hai phương thức đều được sử dụng trong thực
tế, dung lượng của VoD server phụ thuộc vào cấu trúc hệ thống và sở thích của người xem.
Hình 1.7 Mô hình triển khai server
1.4.3 Các hệ thống hỗ trợ hoạt động
Việc phân phối các dịch vụ video tới khách hàng yêu cầu nhiều thiết bị phần cứng có độ tin cậy cao.
Một phần mềm lớn cũng được yêu cầu để quản lý số lượng công việc khổng lồ đó, từ việc thông báo cho
khách hàng về các chương trình trên các kênh broadcast khác nhau cho tới dữ liệu cần thiết cho việc lập
hoá đơn các dịch vụ mà khách hàng đã đăng ký. Tập trung lại, các hệ thống phần mềm này gọi là hệ thống
hỗ trợ hoạt động OSS (Operations Support Systems) và nó có thể bao gồm nhiều dạng khác nhau. Một số
chức năng được cung cấp bởi các hệ thống IPTV OSS như sau:
• Hướng dẫn chương trình điện tử EPG (Electronic Program Guide) cung cấp cho người xem lịch
phát kênh broadcast và tên các chương trình VoD sẵn có. Hướng dẫn này có thể bao gồm cả
các kênh broadcast thông qua việc lựa chọn chương trình hoặc hướng dẫn chương trình tương
tác cho phép user lên lịch các kênh được phát trong tương lai. Một số các nhà khai thác dịch
vụ IPTV sử dụng các công ty bên ngoài để cung cấp dữ liệu hướng dẫn chương trình
• Hệ thống phân quyền được yêu cầu khi các thuê bao đăng ký xem nội dung thông qua hệ thống
IPTV. Hệ thống này cần có khả năng kiểm tra thông tin tài khoản của khách hàng, đó là căn cứ
để hệ thống phân quyền có thể đáp ứng các yêu cầu của thuê bao hay không. Hệ thống này
cần kết nối với hệ thống lập hoá đơn thuê bao.
• Truy cập nội dung trực tuyến (e-mail, web) được cung cấp bởi một số hệ thống IPTV, cho
phép user có thể xem nội dung trên PC tương tự như xem trên Tivi nhưng không cần bộ giải mã
IP STB.
• Hệ thống lập hoá đơn và quản lý thuê bao sẽ bảo quản dữ liệu chính về mỗi thuê bao, bao gồm
hợp đồng, các chi tiết hoá đơn, các trạng thái tài khoản, và các thông số nhận dạng thiết bị.
Các hệ thống OSS có thể là thành phần đầu tư chính của các nhà cung cấp dịch vụ IPTV về cả thời
gian lẫn tiền bạc. Bởi vì nó đảm bảo các phần mềm cần thiết được mua từ nhiều nhà cung cấp khác nhau
sẽ thực thi đầy đủ các chức năng đã được lựa nhiều công việc cần được hoàn thành trước khi cung cấp
dịch vụ cho số lượng lớn thuê bao. Hơn nữa, các chi phí trên là yếu tố để cố định giá dù dịch vụ thu hút
được 1000 hay 100000 thuê bao. Cũng như vậy, chi phí lắp đặt các hệ thống OSS cần được xem xét cẩn
thận trong kế hoạch kinh doanh của các nhà cung cấp dịch vụ, việc tính toán chi phí lắp đặt OSS nằm
trong giai đoạn đầu tiên của kế hoạch triển khai, các chi phí này có thể vượt trội giá thành của phần cứng hệ
thống cho số lượng thuê bao thấp hơn. Hơn nữa, giá thành để bảo dưỡng cơ sở dữ liệu sẽ không được xem
xét khi triển khai mô hình kinh doanh cho một hệ thống IPTV.
1.5 Các dịch vụ và ứng dụng của triển khai IPTV
Các ứng dụng cho triển khai IPTV cung cấp việc phân phối truyền hình quảng bá số cũng như dịch
vụ VoD. Như vậy, nó cho phép các nhà cung cấp đưa ra dịch vụ gọi là “triple play” bao gồm truyền hình,
thoại và dữ liệu. Hạ tầng mạng IPTV cũng cung cấp hầu hết các ứng dụng video cộng thêm sau khi việc lắp
đặt hạ tầng mạng tại các vị trí phù hợp. Nhưng trong phần này chỉ trình bày một số dịch vụ đã được triển
khai bởi các nhà cung cấp dịch vụ IPTV tại Việt Nam. Đó là truyền hình quảng bá kỹ thuật số, dịch vụ
VoD và quảng cáo có địa chỉ
1.5.1 Truyền hình quảng bá kỹ thuật số
Khách hàng sẽ nhận được truyền hình số thông thường bằng IPTV. Truyền hình quảng bá số được
phân phối tới thuê bao thông qua truyền hình cáp đã được nâng cấp hoặc hệ thống vệ tinh. Sự khởi đầu của
các công nghệ DSL tốc độ cao hơn như ADSL2 và ADSL2+ đã mang đến một cuộc cách mạng lớn
trong lĩnh vực này. Với các công nghệ tốc độ cao này cho phép IPTV có thêm độ tin cậy và tính cạnh tranh
với các dịch vụ truyền hình thu phí khác.
IPTV có đầy đủ khả năng để đưa ra các dịch vụ chất lượng cao khác nhau và nhiều dịch vụ
hơn so với các nhà cung cấp truyền hình thu phí cáp và vệ tinh trong quá khứ. Một lợi ích khác của IPTV
là nó có nhiều nội dung và số kênh lớn hơn để lựa chọn, tùy thuộc vào sở thích của khách hàng. Đặc biệt
khách hàng có thể tự chọn lựa nguồn nội dung đa dạng này.
Chức năng của truyền hình quảng bá thông thường, truyền hình cáp và vệ tinh là cung cấp tất cả các
kênh đồng thời tới nhà thuê bao. Tuy nhiên, IPTV chỉ phân phối các kênh mà khách hàng muốn xem và
nó có khả năng cung cấp không giới hạn số kênh này. Khách hàng sẽ tự do điều khiển những gì họ muốn
xem và xem vào bất cứ lúc nào họ muốn. Đây là đặc tính vốn có và có thể xảy ra của IPTV vì nó có sự kết
hợp của khả năng tương tác hai chiều trên nền mạng IP.
1.5.2 Video theo yêu cầu
VoD là dịch vụ cung cấp các chương trình truyền hình dựa trên các yêu cầu của thuê bao. Các dịch vụ
truyền hình được phát đi từ các bộ lưu trữ phim truyện, chương trình giáo dục hay tin tức thời sự thời
gian thự.Ứng dụng VoD cung cấpcho từng thuê bao riêng lẻ để chọn nội dung video và họ xem nó vào lúc
thích hợp nhất.
Khi hạ tầng mạng IPTV đầu tiên được thiết kế thì các ứng dụng và các dịch vụ tạo lợi nhuận như
điện thoại video, hội thoại truyền hình, đào tạo từ xa và camera giám sát an ninh tại nhà đều có thể cung
cấp cho khách hàng. Có thêm một số dịch vụ và đặc tính tiên tiến hơn so với hệ thống truyền hình quảng bá
truyền thống.
1.5.3 Quảng cáo có địa chỉ
Thông tin tin nhắn đặc biệt hoặc nội dung đa phương tiện giữa thiết bị và khách hàng dựa trên địa chỉ
của họ gọi là quảng cáo có địa chỉ. Địa chỉ được công bố của khách hàng có thể biết được thông qua việc
xem xét kỹ profile của người xem. Nó được thực hiện bởi lệnh để xác định dù tin nhắn quảng cáo phù
hợp hoặc không phù hợp với người nhận. Vì thế, quảng cáo có địa chỉ cho phép tính toán nhanh chóng và
chính xác hiệu quả của chiến dịch quảng cáo.
Sự hợp tác của người xem là diện mạo của quảng cáo có địa chỉ. Ngay khi truyền hình IP được bắt
đầu, các hệ thống truyền hình IP có thể hỏi hoặc nhắc nhở người xem khai báo tên của họ từ danh sách đã
đăng ký. Đổi lại, người xem sẽ muốn chọn tên chương trình của họ. Tại đây, tên chương trình đã có một
profile và các tin nhắn quảng cáo có thể được lựa chọn, cách xem tốt nhất là kết nối tới profile của người
xem. Bởi vì, các đặc tính tiên tiến đã được đưa ra của truyền hình IP ví dụ như các cuộc gọi tới, e-mail và
hướng dẫn chương trình đều nhớ các kênh ưu thích, người xem có thể thực sự xem chúng.
Thu nhập được tạo ra bằng cách gửi các tin nhắn quảng cáo có địa chỉ tới người xem, với các profile
đặc biệt có thể lớn gấp 10 đến 100 lần thu nhập từ quảng cáo quảng bá thông thường. Khả năng gửi
các quảng cáo thương mại tới một số người xem đặc biệt cho phép các nhà quảng cáo cố định được quỹ đầu
tư chính xác cho quảng cáo có địa chỉ. Nó cũng cho phép các nhà quảng cáo thử nghiệm một số quảng cáo
thương mại khác trong cùng một vùng tại cùng một thời điểm.
1.6 Sự khác biệt giữa truyền hình Internet và IPTV
Sự phát triển và tiếp đó là sự xâm chiếm của lĩnh vực công nghệ thông
tin sang lĩnh vực viễn thông và truyền hình-vốn được xem là hai lĩnh vực
hoạt động tương đối độc lập nhau trong suốt quá trình hình thành và phát
triển, khiến hai nghành công nghiệp này ngày một xích lại gần nhau hơn và
xu hướng hội tụ được xem là giải pháp hợp lý cho sự phát triển của chúng
trong nền kinh tế thị trường . Xu hướng này ngày càng được khẳng định khi
các nhà cung cấp Internet đang quan tâm đến việc phân phói các chương
trình truyền hình và các hãng truyền hình cũng phát triển trên các dịch vụ
Internet trên mạng truyền thông của mình.
1.6.1 Khái niệm truyền hình Intenet
Truyền hình Internet (Internet Television) là cụm từ dùng để chỉ dịch
vụ cung cấp chương trình truyền hình qua mạng Internet vì vậy nó còn được
gọi là truyền hình trực tuyến (Online Television). Hiện có hai phương thức
để xem chương trình truyền hình qua mạng Internet là:
• Xem trực tiếp theo thời gian thực Real-time (còn gọi là phương
thức Download and Play). Việc xem trực tiếp cho phép khách hàng
không cần tải file chương trình về máy tính của mình, nhưng cho
chất lượng hình ảnh thấp hơn. Vì vậy chỉ phù hợp với những kết nối
Internet tốc độ cao, hoặc đáp ứng các yêu cầu không cao về chất
lượng ảnh.
• Tải file chương trình về máy tính cá nhân (Download stream-file):
phương thức này sẽ đảm bảo được chất lượng hình ảnh chương
trình, nhưng lại mất thời gian chờ đợi và không áp dụng được cho
các chương trình truyền hình trực tiếp.
1.6.2 Sự khác biệt giữa IPTV và truyền hình Internet
Do đều được truyền trên mạng dựa trên giao thức IP, người ta đôi lúc hay
nhầm IPTV là truyền hình Internet. Tuy nhiên, 2 dịch vụ này có nhiều điểm khác
nhau:
• Các nền khác nhau: Truyền hình Internet sử dụng mạng Internet
công cộng để phân phát các nội dung video tới người sử dụng cuối.
IPTV sử dụng mạng riêng bảo mật để truyền các nội dung video đến
khách hàng. Các mạng riêng này thường được tổ chức và vận hành bởi
nhà cung cấp dịch vụ IPTV.
• Về mặt địa lý: Các mạng do nhà cung cấp dịch vụ viễn thông sở hữu
và điều khiển không cho phép người sử dụng Internet truy cập. Các mạng
này chỉ giới hạn trong các khu vực địa lý cố định. Trong khi, mạng
Internet không có giới hạn về mặt địa lý.
• Quyền sở hữu hạ tầng mạng: Khi nội dung Video được gửi qua
mạng Internet công cộng, các gói sử dụng giao thức Internet mạng nội
dung có thể bị trễ hoặc mất đi khi nó di chuyển trong các mạng khác
nhau tạo nên mạng Internet công cộng. Do đó, nhà cung cấp các dịch vụ
truyền nhình ảnh qua mạng Internet không đảm bảo chất lượng truyền
hình như với truyền hình mặt đất, truyền hình cáp hay truyền hình vệ
tinh. Thực tế là các nội dung video truyền qua mạng Internet khi hiển
thị trên màn hình TV có thể bị giật và chất lượng hình ảnh thấp. Trong
khi, IPTV chỉ được phân phối qua một hạ tầng mạng của nhà cung cấp
dịch vụ. Do đó người vận hành mạng có thể điều chỉnh để có thể cung
cấp hình ảnh với chất lượng cao.
• Cơ chế truy cập: Một set-top box số thường được sử dụng để truy cập
và giải mã nôi j dung viedeo được phân phát qua hệ thống IPTV , trong khi
PC thương được sử dụng để truy cập các dịch vụ Internet. Các loại phần
mềm được sử dụng trong PC thường phụ thuộc vào loại nội dung truyền
hình Internet. Ví dụ như, để download các chương trình TV từ trên mạng
Internet, đôi khi cần phải cài đặt các phần mềm media cần thiết để xem
được nội dung đó. Hay hệ thống quản lí bản quyền cũng cần để hỗ trợ cơ
chế truy cập.
• Giá thành: Phần trăm nội dung chương trình được phân phát qua
mạng Internet công cộng tự do thay đổi. Điều này khiến các công ty
truyền thông đưa ra các loại dịch vụ dựa trên mức giá thành. Giá thành
các loại dịch vụ IPTV cũng gần giống với mức phí hàng tháng của truyền
hình truyền thống. Các nhà phân tích mong rằng truyền hình Internet và
IPTV có thể hợp lại thành 1 loại hình dịch vụ giải trí.
TÓM TẮT
IPTV là một hệ thống cho phép phân phối các chương trình thời gian
thực, phim truyện và các dạng nội dung video tương tác khác trên một
mạng nền IP. Hạ tầng mạng IPTV end-to-end có thể bao gồm tất cả hoặc
một số thành phần sau:
• Trung tâm dữ liệu IPTV là nơi chịu trách nhiệm xử lý và điều chế
nội dung để phân phối trên một mạng băng rộng.
• Mạng phân phối IPTV bao gồm nhiều kỹ thuật để truyền tải nội
dung IPTV từ trung tâm dữ liệu tới người sử dụng.
• Bộ giải mã STB hoặc các gateway được đặt tại nhà thuê bao để
cung cấp các kết nối từ Tivi tới mạng truy cập IP.
• Mạng gia đình có khả năng phân phối dữ liệu, thoại và video giữa
các thiết bị khác nhau.
Ngoài cấu trúc cơ sở hạ tầng, cấu trúc mạng IPTV còn được cụ thể
bằng các cấu trúc chức năng. Cấu trúc chức năng sẽ cụ thể hóa nhiệm vụ
của từng thành phần tham giao vào mạng phân phối IPTV. Cấu trúc chức
năng bao gồm 6 chức năng: cung cấp nội dung, phân phối nội dung, điều
khiển, vận chuyển, thuê bao và bảo an. Khi triển khai mạng IPTV để phân
phối nội dung cho thuê bao thì vấn đề cần quan tâm là các cơ chế được sử
dụng. Có ba cơ chế phân phối là unicast, broadcast, và multicast. Tùy vào
dịch vụ phân phối mà có các cơ chế phân phối thích hợp, ví dụ như để phân
phối dịch vụ VoD thì cần cơ chế multicast, nội dung chỉ được phân phối cho
những thuê bao có yêu cầu. IPTV là một dịch vụ mới, do đó sẽ có các công
nghệ để hỗ trợ triển khai. Các công nghệ cho dịch vụ IPTV đó là vấn đề xử
lý nội dung, các VoD và Video server, và các hệ thống hỗ trợ hoạt động.
Trong đó, công nghệ xử lý nội dung, cụ thể là các tiến bộ trong kỹ thuật nén
dữ liệu và các hệ thống hỗ trợ hoạt động là các công nghệ mới phát triển.
CHƯƠNG II
CHUẨN NÉN SỬ DỤNG TRONG IPTV
Nén cho phép các nhà cung cấp dịch vụ truyền các kênh hình và tiếng với chất lượng cao
qua mạng IP băng rộng. Do mắt người ko thể phân biệt được toàn bộ các phần của hình ảnh.
Do đó việc nén sẽ làm giảm độ lớn của tín hiệu ban đầu bằng cách bỏ bớt các phần của hình
ảnh.
2.1 Nén MPEG
MPEG là 1 chuẩn nén được sử dụng rộng rãi trong thông tin vệ tinh, truyền hình cáp và
trong các hệ thống truyền hình mặt đất. MPEG (moving pictures exert group) được thành lập
nhằm phát triển các kĩ thuật nén cho phù hợp vói việc truyền hình ảnh.
Từ khi được thành lập,
MPEG đã đưa ra các chuẩn nén như: MPEG-1, MPEG-2, MPEG4-( Part 2 và part 10), MPEG-7, và
MPEG-21. Trong các chuẩn này, MPEG-2 và MPEG-4 Part 10 được sử dụng rộng rãi trong IPTV.
2.2 Chuẩn MPEG2
MPEG 2 là 1 công nghệ đạt được thành công lớn và là 1 chuẩn nén có ưu thế vượt trội
dành cho truyền hình số được truyền qua nhiều mạng truyền thông băng rộng. Chuẩn nén
MPEG-2 được chia thành 2 loại nén hình và nén tiếng.
Nén hình: Video ở dạng cơ bản là 1 chuỗi các ảnh liên tục. 1 frame được định nghĩa với
1 chuỗi bit header. Mắt người thường thấy thoải mái khi xem TV với tốc độ 25 hình/s. Sẽ
không có lợi nếu phát với tốc độ nhanh hơn vì người xem không thể nhận ra sự khác biệt. do đó
có thể dung lượng của những hình ảnh bằng cách nén chúng lại. Các bộ nén hình được sử dụng
với mỗi frame mà vẫn giữ chất lượng hình ảnh cao.
2.2.1 Quá trình nén MPEG
Phần đầu tiên của nén bao gồm 1 quá trình tiền đồng bộ. Quá trình này cơ bản bao gồm
việc làm giảm kích thước của các frame. Làm giảm kích thước của các frame chính là làm giảm
số lượng bit , điều này cũng giúp giảm băng thông cần thiết để truyền tín hiệu. Tuy nhiên, quá
trình này không phải ko có trở ngại. Ví dụ, sự giảm kích thước của khung có thể thường xuyên
gây ra những lỗi tỉ số cạnh (giống như sai tỉ lệ 4/3 hay 16/9) khi được thể hiện trên màn hình
TV có độ phân giải thấp.
Phần 2 của quá trình nén tín hiệu là chia 1 frame ảnh ra thành các block có kích thước 8
nhân 8 pixel –khối mã hóa nhỏ nhất trong giải thuật của MPEG. Có 3 loại block; độ chói Y,
thành phần màu đỏ C
r
hoặc xanh C
b.
Các loại block thành phần màu mang thông tin về những
màu khác nhau của hình ảnhtrg khi độ chói mang thông tin về những phần màu đen hoặc trắng
của hình ảnh.
Khi hoàn thành 2 phần trên, MPEG sẽ thực hiện 1 hàm toán được gọi là biến đổi cosin
rời rạc đối với mỗi block riêng biệt. Kết quả thu được là một ma trận hệ số 8*8. DCT sẽ biến
đổi sự khác nhau về không gian thành các tần số khác nhau, nhưng không làm thay đổi các
thông tin trong block, các blcok ban đầu sẽ được tái tạo lại 1 cách chính xác sử dụng biến đổi
ngược. Nguyên tắc thực hiện hàm này bao gồm việc chia các block thành các phần tùy theo
mức độ quan trọng. Những phần quan trọng sẽ đươc giữ nguyên cho tới bước tiếp theo trong
khi các phần còn lại sẽ bị giảm bớt. Điều này sẽ đảm bảo rằng mắt người không chú ý tới việc
những phần không quan trọng của block bị bỏ bớt khi tốc bít bị hạn chế.
Bước tiếp theo trong MPEG là quá trình lượng tử hóa. Quá trình lượng tử hóa dữ liệu số
là quá trình làm giảm số lượng bít của các block. Mức lượng tử đối với mỗi tìn hiệu video là rất
quan trọng.
Khi tất cả các block trong frame đều đã đc nén lại, MPEG sẽ ngắt các frame thành 1
dạng mới gồm nhiều block gọi l à macro block. Mỗi macro block có kích thước 16 nhân 16 chứa
các block độ chói và block thành phần màu. Nếu có sự khác biệt giữa frame cuối cùng và frame
hiện tại, các thiết bị nén MPEG sẽ chuyển những block mới này tới 1 vị trí mới trên frame hiện
tại. Điều này giúp không phải gửi đi những hình ảnh mới hoàn toàn, do đó có thể tích kiệm băng
thông. Có 2 cách để thực hiện điều đó:
Nén theo không gian
là làm giảm các bít trên từng frame riêng biệt. điều này có thể đạt
được do các pixel luôn đứng cạnh nhau trong các frame thường có giá trị giống nhau. Do đó
thay về mã hóa từng pixel riêng biệt. Kĩ thuật nén theo không gian này mã hóa sự khác biệt
giữa các pixel cạnh nhau. Số lượng bít cần thiết để mã hóa những khác biệt này ít hơn số
lượng bít cần thiết để mã hóa từng pixel riêng biệt.
Nén theo thời gian là làm giảm các bit giữa các frame liên tục. Trong quá trình sản
xuất video có những thông tin được lặp lại giữa những frame liên tiếp. VD: nếu trên hình có 1
bức tường , bức tường vẫn xuất hiện liên tục trong 30 hình tiếp theo, mà không thay đổi ( bức
tường đó không thay đổi trong vòng 1s). Thay vì mã hóa 30 lần liên tục trong 1s, nên thời gian
chỉ gửi đi các thông tin dự đoán chuyển động giữa những frame hình, trong trương hợp của
bức tường trong VD trên, dự đoán chuyển động được đặt = 0.
Có nhiều phuơng thức khác nhau để nén 1 frame hình. VD như với 1 frame hình có độ
phức tạp cao thì cần phương pháp nén có yếu tố nén theo không gian thấp bởi vì chỉ có 1 phần
rất nhỏ các pixel được lặp lại. Nếu tốc đọ bit có sự thay đổi lớn thì khó có thể truyền đi trong
mạng IP, vì thế nhiều bộ mã hóa bao gồm cả chức năng đệm để có thể điều khiển và quản lí tốc
độ chung mà tại đó các bit được truyền đi tới tầng tiếp theo của hệ thống sản xuất video.
Bước tiếp theo của quá trình nén MPEG là mã hóa các macroblock thành các slice. Slice
là 1 chuỗi ảnh đặt nằm ngang cạnh nhau từ trái sang phải. Nhiều slice kết hợp với nhau tạo
thành 1 hình. Mỗi slice được mã hóa độc lập với nhau để hạn chế lỗi.
2.2.2 Các ảnh trong chuẩn nén MPEG
Chuẩn nén MPEG định nghĩa 3 loại ảnh:
Intra-frame (I-frame) frame được mã hóa riêng biệt không phụ thuộc các frame trước
đó hoặc tiếp theo. Mã hóa theo hệ thống đc sử dụng gần giống như nén JPEG. Đây là frame độc
lập và đc sử dụng để tạo ra các loại frame khác.
P-frame ( forward predicted frame) khung dự đoán ảnh tiếp theo là khung dự đoán
ảnh dựa trên các frame I trước đó. MPEG không thực sự mã hóa ảnh mà chứa các thông tin về
chuyển động cho phép IPTVCD có thể tái tạo lại frame. P-frame yêu cầu ít băng thông hơn I-
frame, điều này là yếu tố quan trọng đối với mạng dựa trên IPTV.
B-frame (Bi-directional predicted frame ) frame dự đoán hướng: B-frame là
frame đc tạo thành từ việc kết hợp các thông tin từ cả I-frame và P-frame. Mã hóa B-
frame thì tương tự với P-frame, ngoại trừ các vecto chuyển động phụ thuộc vào các vùng
trong các khung tham khảo sau đó. B-frame chiếm ít dung lượng hơn là I-frame va P-
frame. Vì thế dòng Mpeg video gồm nhiều B-frame thì chiếm dung lượng thấp hơn so với
dòng chứa các frame I va P. Thậm chí, B-frame giúp làm tối thiểu băng thông cần thiết
đối với các dòng MPEG video. Tuy nhiên, B-frame cũng có hạn chế đó là độ trễ. Do
IPTVCD phải kiểm tra 2 khung trước và sau trước khi tạo ra B-frame.
3 loại ảnh trên kết hợp với nhau tạo thành 1 chuỗi các frame đc gọi là nhóm ảnh (GOP ).
Mỗi nhóm ảnh bắt đầu bằng một frame I và có một số các frame B và P, Mỗi nhóm ảnh MPEG
có cấu trúc như sau:
[I B B B P B B B P B B B P B B B P]
Mỗi nhóm ảnh cần bắt đầu với một khung I, mặc dù kích thước của mỗi nhóm ảnh là
khác nhau, nhưng trung bình mỗi nhóm ảnh trong IPTV có khoảng 12 đến 15 frame. Mỗi cấu
trúc của một nhóm ảnh thông thường có thể được miêu tả bởi 2 thông số: N, số ảnh trong một
nhóm và M, khoảng cách giữa các frame. Các nhóm ảnh được chia thành 2 loại: nhóm đóng
và nhóm mở. Với nhóm đóng, khung B cuối cùng không yêu cầu khung I đầu tiên cho nhóm
ảnh tiếp theo để giải mã, trong khi với nhóm mở cần yêu cầu khung I cho nhóm ảnh tiếp theo.
Các nhóm ảnh sau đó được kết hợp với nhau để tạo thành dòng video. Mỗi dòng video bắt đầu
biết một đoạn mã, theo sau đó là một header và kết thúc với một mã duy nhất.
Thứ tự các khung được truyền đi trên mạng băng rộng thì khác với thứ tự các khung
trong chuối bit đầu vào của bộ mã hóa. Bởi vì bộ giải mã trong IPTVCD cần xử lý các frame I
và P trước khi tạo ra khung B. Mối quan hệ tổng thể giữa các chuỗi ảnh, ảnh, các slice, các
khối macro, các khối và các điểm ảnh được minh họa ở hình sau:
Hình Cấu trúc dòng MPEG video
Mặc dù MPEG-2 được sử dụng trong truyền hình cáp và vệ tinh, nhưng MPEG-2 có
nhưng hạn chế đối với các mạng có băng thông giới hạn.Do đó một công nghệ nén mới với
nhiều tính năng đã được phát triển trong nhưng năm gần đây vơi mục đích truyền video qua
mạng băng thông giới hạn. MPEG-4 part 10 được sử dụng trong hạ tầng mạng IPTV.
2.3 MPEG-4
Chuẩn MPEG-4 thành công hơn so với chuẩn MPEG-2. Thêm vào đó, MPEG-4 đưa ra 1
hệ thống hoàn chỉnh với các đặc điểm hỗ trợ các định dạng dữ liệu. Mpeg-4 bao gồm rất
nhiều phần có thể thực hiện cùng nhau hoặc riêng biệt.
• Phần1:Systems;
• Phần2:Visual;
• Phần3:Audio;
• Phần 4: Conformance xác định việc triển khai một MPEG-4 sẽ như thế nào;
• Phần 5: Các phần mềm tham chiếu, đưa ra một nhóm các phần mềm tham chiếu quan
trọng, được sử dụng để triển khai MPEG-4 và phục vụ như một ví dụ demo về các bước
phải thực hiện khi triển khai;
• Phần 6: Khung chuẩn cung cấp truyền thông đa phương tiện tích hợp DMIF (Delivery
Multimedia Integration Framework), xác định một giao diện giữa các ứng dụng và mạng
lưu trữ.
• Phần 7: Các đặc tính của một bộ mã hoá video tối ưu (bổ xung cho các phần mềm
tham chiếu, nhưng không phải là các triển khai tối thiểu cần thiết).
• Các phần mới bổ xung tiếp cho chuẩn MPEG-4 sau này là:
• Phần 8: Giao vận (về nguyên tắc không được xác định trong chuẩn, nhưng phần 8 xác
định cần ánh xạ như thế nào các dòng MPEG-4 vào giao vận IP).
• Phần 11: Mô tả khung hình (Scene Description - được tách ra từ phần 1);
• Phần 12: Định dạng file truyền thông ISO (ISO Media File Format);
• Phần 13: Quản lý bản quyền nội dung IPMP (Intellectual Property Management and
Protection Extensions);
• Phần 14: Định dạng fille MP4 (trên cơ sở phần 12);
• Phần 15: Định dạng file AVC (cũng trên cơ sở phần 12);
• Phần 16: AFX (Animation Framwork eXtensions) và MuW (Multi-user Worlds).
2.4 Tổng quan về MPEG-4 Part 10
Đầu năm 1998, 2 tổ chức ITU-T và VCEG đã cùng đưa ra một chuẩn nén mới H.26L
nhằm tăng gấp đôi hiệu suất nén . Do đó chuẩn nén này sẽ mở ra nhiều ứng dụng mới như
truyền hình qua mạng Internet, truyền hình di động và phát triển các ứng dụng hiện có.
Cuối năm 2001, VCEG và MPEG đã thành lập JVT ( Joint Video Team) có nhiệm vụ
hoàn thành chuẩn nén mới và chính thức được thông qua với tên gọi là MPEG-4 Part 10 hoặc
H.264/AVC vào tháng 3 năm 2003.
2.4.1 Cấu trúc phân lớp của H.264/AVC
Với sự gia tăng các ứng dụng và dịch vụ trên nhiều mạng thì câu hỏi đặt ra là làm
thế nào quản lí được các ứng dụng đó. Do vậy, chuẩn H.264/AVC phải có độ linh hoạt
cao và có thể ứng dụng trên nhiều mạng khác nhau. Do đó, chuẩn H.264/AVC được thiết
kế theo phân lớp mã hóa video VCL ( Video Coding Layer) và lơp NAL làm nhiệm vụ
tương thích với môi trường mạng khác nhau.
Hình: Cấu trúc phân lớp của H.264
a)Lớp mạng NAL ( Network Abstration Layer)
NAL có khả năng ánh xạ từ lớp VCL đến lớp truyền tải:
+ RTP/IP cho dịch vụ thời gian thực qua mạng Internet (conversational và
streaming).
+ Định dạng file: ISO MP4 cho lưu trữ và truyêng tải MMS.
+ H32x cho các dịch vụ đàm thoại có dây và không dây.
+ Dòng truyền tải MPEG-2 cho các dịch vụ quảng bá.
Gói NAL: dữ liệu video được mã hóa được tổ chức trong một đơn vị NAL( hay gói
NAL). Mỗi gói có độ dài tính theo byte. Byte đầu tiên của mỗi gói NAL là byte mào đầu,
nó chỉ rõ loại dữ liệu được chứa trong NAL, các byte còn lại chứa dữ liệu.
Phần dữ liệu của NAL được ghép xen.
Cấu trúc của đơn vị NAL có định dạng chung cho việc sử dụng truyền trong hệ thống
hướng bit và hướng gói.
b) Lớp mã hóa Video
Lớp mã hóa video của H.264/AVC thì tương tự với các tiêu chuẩn khác như MPEG-
2 video. Nó là sự kết hợp dự đoán theo thời gian và theo không gian,vàvới mã chuyển vị.
Ảnh được tách thành các khối. Ảnh đầu tiên của dãy hoặc điểm truy nhập ngẫu nhiên
thì được mã hóa “Intra”, có nghĩa là không dùng thông tin nào ngoài thông tin chứa trong
bản thân ảnh. Mỗi mẫu của một khối trong một frame Intra được dự đoán nhờ dùng các
mẫu không gian bên cạnh của các khối đã mã hóa trước đó. Đối với tất cả các ảnh còn lại
của dãy hoặc giữa các điểm truy cập ngẫu nhiên, mã hóa “Inter” được sử dụng, dùng dự
đoán bù chuyển động từ các ảnh được mã hóa trước.
c) Khái niệm về ảnh, khung, bán ảnh, macroblock
Tín hiệu video được mã hóa trong H.264 bao gồm tập hợp các ảnh được mã hóa có
trật tự. Một ảnh có thể biểu diễn bằng cả một khung hoặc một bán ảnh. Nhìn chung, một
khung gồm có hai bán ảnh xen kẽ nhau: bán ảnh trên và bán ảnh dưới. Bán ảnh trên gồm
các dòng chẵn 0, 2, 4, …, H/2 -1, với H là tổng số dòng trong một khung. Bán ảnh dưới
gồm các dòng lẻ và bắt đầu từ dòng thứ 2.
Hình: Các bán ảnh trong một khung
Các macroblock: Mỗi ảnh video, frame hoặc field, được chia thành các
macroblock có kích thước cố định bao trùm một diện tích ảnh hình chữ nhật gồm 16 x 16
mẫu thành phần luma và 8 x 8 mẫu cho mỗi một trong hai thành phần chroma. Tất cả các
mẫu macroblock luma hoặc chroma được dự đoán theo không gian hoặc thời gian, và dự
đoán tại chỗ hợp thành được truyền đi nhờ dùng mã chuyển vị. Do vậy mỗi thành phần
màu dự đoán tại chỗ được chia nhỏ thành các khối. Mỗi khối được biến đổi nhờ dùng
biến đổi nguyên (an integer transform), và các hệ số biến đổi được lượng tử hóa và được
truyền đi bằngphương pháp mã hóa entropy.
Các macroblock được tổ chức thành các slice, biểu diễn các tập con của ảnh đã cho
và có thể được giải mã độc lập. Thứ tự truyền các macroblock trong dòng bit phụ thuộc
vào bản đồ phân phối Macroblock (Macroblock Allocation Map) và không nhất thiết phải
theo thứ tự quét. H.264 / AVC hỗ trợ năm dạng mã hóa slice khác nhau. Đơn giản nhất là
slice I (Intra), trong đó tất cả macroblock được mã hóa không có tham chiếu tới các ảnh
khác trong dãy video. Tiếp theo là các slice P và B, ở đó việc mã hóa có tham chiếu tới
các ảnh trước nó (slice P) hoặc cả ảnh trước lẫn ảnh sau (slice B). Hai dạng slice còn lại là
SP (switching P) và SI (switching I), được xác định cho chuyển mạch hiệu quả giữa các
dòng bit được mã hóa ở các tốc độ bit khác nhau.
2.4.1 H.264 CODEC
Giống như các tiêu chuẩn nén trước đây ( ví dụ như MPEG-1, MPEG-2 và MPEG-
4),H.264 không được định nghĩa là bộ CODEC ( một cặp encoder và decoder) mà H.264
định nghĩa các cú pháp của luồng nén video. Trong thực tế, bộ mã hóa và giải mã bao
gồm các thành phần cơ bản như trong hình 2.8 và hình 2.9. So với các chuẩn nén trước
bao gồm các thành phần như bộ dự đoán, biến đổi, lượng tử, mã hóa entropy, H.264
CODEC còn bao gồm bộ lọc deblocking và có nhiều thay đổi quan trọng trong các chi
tiết về chức năng của các thiết bị.
Bộ mã hóa (hình 2.8) bao gồm 2 dòng dữ liệu , dòng forward (từ trái sang phải) và
dòng tái tạo (từ phải sang trái). Dòng dữ liệu trong bộ giải mã được truyền từ phải sang
trái trong hình 2.9.
Hình 2.7: Sơ đồ bộ mã hóa H.264.
Bộ mã hóa dòng forward
Một khung hoặc trường lối vào Fn được xử lí trong các khối của một macroblock
( đáp ứng cho 16x16 pixel trong một hình bình thường). Mỗi macroblock được mã hóa ở chế
độ trong ảnh hoặc liên ảnh, với từng block trong macroblock. Một dự doán PRED (kí hiệu là
P trong hình 2.8) được định dạng dựa trên các mẫu ảnh được tái tạo lại.
Trong chế độ nén liên ảnh, PRED được hình thành từ slice hiện thời vừa được mã hóa,
giải mã và tái tạo lại (
uF
′
n
trong hình, chú ý rằng các mẫu không được lọc được sủ dụng để
tạo nên PRED)
Trong chế độ nén trong ảnh, PRED được hình thành bằng cách dự đoán bù
chuyển động từ một hoặc hai ảnh tham khảo được. Trong hình 2.8, ảnh tham khảo là ảnh
F′
n
−1
vừa được mã hóa. Nhưng, dự đoán tham chiếu đối với mỗi macroblock có thể được
chọn từ các hình ảnh trong quá khứ hoặc trong tương lai vừa được mã hóa, tái tạo và lọc
( theo thứ tự hiển thị) .
Dự đoán PRED trừ với block hiện tại đer tìm ra sự khác biệt , được biến đổi và lượng
tử hóa để thu được hệ số lưởng tử X sẽ được sắp xếp lại và mã hóa entropy. Hệ số được mã
hóa entropy cùng với thông tin về cạnh được mã hóa trong mỗi block trong macroblock (chế
độ dự đoán, mức lượng tử, thông tin về vector chuyển động, …) định dạng nên các dòng bit
để truyền tơi lớp mạng trừu tượng để truyền hoặc lưu trữ.
Hình 2.8: Bộ mã hóa
Bộ mã hóa dòng tái tạo
Bên cạnh việc mã hóa và truyền tải các block trong macroblock, bộ mã hóa còn giải
mã ( tái tạo) chúng để làm tham khảo cho các dự đoán trong tương lai. Hệ số X được giải
lượng tử (Q
−1
) và biến đổi ngược (T
−1
) để thu được sụ khác biệt block D
′
n . Block dự
đoán PRED được cộng vào để tạo thành block tái tạo uF′n
. Bộ lọc được ứng dụng để giảm
ảnh hưởng của méo và các ảnh tham khảo dự đoán được tạo từ 1 chuỗi các block F′n.
Mục đích chính của bộ giải mã dòng tái tạo trong bộ mã hóa là để chắc chắn rằng cả
bộ mã hóa và giải mã đều sử dụng các tham số khung đã xác định để tạo ra dự đoán P. Nếu
không có các tham số này, dự báo P ở bộ mã hóa và giải mã sẽ không được xác định, dẫn đến
lỗi giữa bộ mã hóa và giải mã.
Hình 2.9 Bộ giải mã
2.4.3 Các đặc điểm chính của MPEG-4 part 10
a) Kích thước block ảnh có thể thay đổi được
Thành phần độ chói của macroblock (16*16 mẫu) có thể được chia theo 4 cách: một
macro block 16 *16 phần macroblock, hai macroblock 16*8 phần, hai 8* 16 phần hoặc bốn
macroblock 8*8 phần. Nếu kiểu 8*8 phần được chọn, mỗi bốn 8*8 sub-macroblock trong