HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Nguyễn Quốc Chính
NGHIÊN CỨU KHẢ NĂNG ỨNG DỤNG
MÃ HÓA VIDEO SVC/H.264 CHO TRUYỀN TẢI
VIDEO TRÊN HỆ THỐNG THÔNG TIN DI ĐỘNG LTE
Chuyên ngành: KỸ THUẬT ĐIỆN TỬ
Mã số: 60.52.70
TÓM TẮT LUẬN VĂN THẠC SĨ
HÀ NỘI – NĂM 2013
Luận văn được hoàn thành tại:
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Người hướng dẫn khoa học: TS. Nguyễn Thị Hằng Nga
Phản biện 1: ……………………………………………….…………
Phản biện 2: …………………………………………………………
Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học
viện Công nghệ Bưu chính Viễn thông
Vào lúc: giờ ngày tháng năm
Có thể tìm hiểu luận văn tại:
- Thư viện của Học viện Công nghệ Bưu chính Viễn thông
1
CHƯƠNG I: CƠ HỘI VÀ THÁCH THỨC KHI TRUYỀN
TẢI VIDEO TRÊN MẠNG 4G
Sự phát triển vượt bậc về công nghệ đã thúc đẩy xu hướng hội tụ công nghệ cố
định và di động, dịch vụ viễn thông và công nghệ thông tin, tích hợp các thiết bị đầu
cuối trở thành hiện thực. Nhu cầu sử dụng các dịch vụ đa phương tiện trên các thiết
bị đầu cuối di động đã và đang bùng nổ trong những năm gần đây, điều này thúc
đẩy việc nghiên cứu phát triển các hệ thống thông tin di động tế bào băng rộng như :
LTE, WiMAX,…Trong đó, công nghệ LTE được các nhà khai thác di động ở Việt
Nam (Viettel, VNPT,…) khá quan tâm và đã triển khai thử nghiệm do khả năng
tương thích ngược với các hệ thống di động hiện có GSM và WCDMA/UMTS.
Có rất nhiều nghiên cứu xảy ra trong truyền video trực tuyến (streaming
video) không dây từ góc độ khác nhau. Hiện nay, bộ mã hóa H.264/AVC được sử
dụng cho các dịch vụ video di động khác nhau. Tuy nhiên, xét tính chất không đồng
nhất của màn hình hiển thị, khả năng tính toán khác nhau của thiết bị di động, và
các điều kiện mạng không đồng nhất, SVC mở rộng của H.264 là một cách tiếp cận
đầy hứa hẹn để cung cấp những nội dung khả năng điều chỉnh cho các ứng dụng di
động trong tương lai.
1.1. Các công nghệ không dây thế hệ thứ 4
1.2. LTE và OFDMA
Mạng LTE bao gồm mạng truy nhập và mạng lõi, được biết đến như mạng
truy cập vô tuyến mặt đất UMTS phát triển (E-UTRAN) và lõi gói phát triển
(Evolved Packet Core - EPC
Hệ thống truy nhập vô tuyến mặt đất UMTS phát triển (E-UTRA) của LTE
sử dụng OFDMA cho đường xuống và FDMA sóng mang đơn (SCFDMA) cho
đường lên.
2
1.3. Các giao thức trên giao diện vô tuyến LTE
1.4. Phân phối video qua mạng LTE
Hình 1.5. Phân phối video thời gian thực qua mạng LTE
1.5. Chất lượng kênh trong mạng LTE
1.6. Thách thức khi truyền tải video qua mạng LTE
1.6.1. Truyền dẫn lại không mong muốn
1.6.2. Băng thông thay đổi
1.6.3. Đặc tính người dùng và thiết bị đầu cuối không đồng nhất
1.7. Kết luận
Từ một số nội dung được trình bày trong chương về tổng quan mạng di động
4G LTE, phương thức truyền tải video qua mạng LTE và khó khăn thách thức khi
truyền tải video H.264 qua mạng không dây, giúp ta thấy được bức tranh tổng quan
và những vấn đề cần quan tâm khi truyền tải video qua mạng LTE. Hiện nay, có
một số phương pháp đã được đề xuất để cải thiện truyền video trực tuyến qua mạng
không dây. Người ta phân loại các phương pháp tiếp cận dựa trên các ngăn xếp
giao thức mạng mà chúng làm việc trên đó và thiết kế hệ thống trên chip (SoC).
Các ngăn xếp giao thức liên quan là lớp ứng dụng, lớp vận chuyển, lớp mạng và
cross-layer (ví dụ, các cơ chế được thiết kế liên quan đến các hoạt động từ nhiều
3
ngăn xếp giao thức). Những vấn đề thiết kế chính nhằm:
(1) Nâng cao khả năng thiết bị đầu cuối của người sử dụng điện thoại di
động;
(2) Tối giảm tác động tổng thể của việc rớt khung trong mạng không dây;
(3) Nâng cao hiệu quả truyền tải và sử dụng tài nguyên cho việc phân phối
video trực tuyến.
Trong lớp ứng dụng, vấn đề chính là hiệu quả mã hóa của bộ codec đó. Mã
hóa video có khả năng điều chỉnh (Scalable Video Coding - SVC) đã được đề xuất
để cung cấp khả năng điều chỉnh của mã hóa video. Trong lớp truyền tải, khả năng
phục hồi lỗi bit là một kỹ thuật chỉnh sửa và truyền các gói với lỗi bít tới các lớp
cao hơn thay vì loại bỏ chúng. Đối với các lớp mạng, các vấn đề chính là tạo ra
tuyến truyền tải video, lựa chọn nút chuyển tiếp và cấp phát tài nguyên để phân
phối các dòng H.264/AVC cho các nhóm người sử dụng trong mạng chuyển tiếp
với nguồn lực tối thiểu hoặc để phục vụ người dùng tối đa với một quỹ tài nguyên
hạn chế. Trong thiết kế cross-layer, thông tin từ lớp ứng dụng, lớp MAC và lớp vật
lý được cùng xem xét để cải thiện hiệu quả phân phối video qua mạng. Cuối cùng,
khả năng thiết bị đầu cuối cũng là một vấn đề quan trọng trong thông tin liên lạc
không dây vì giải mã video đòi hỏi khả năng tính toán mạnh mẽ. Kiến trúc phần
cứng nâng cao của thiết kế SoC được đề xuất với công nghệ VLSI để tăng cường
phân phối video đến người dùng cuối.
Với khuôn khổ hạn hẹp của luận văn này, tôi đi vào nghiên cứu về chuẩn mã
hóa video H.264/SVC và tìm hiểu được ưu điểm của phương pháp mã hóa này để
truyền video qua mạng di động 4G LTE. Từ đó, đề xuất áp dụng khi triển khai 4G
tại Việt Nam.
4
CHƯƠNG II: TÌNH HÌNH TIÊU CHUẨN MÃ HÓA
VIDEO TIÊN TIẾN
2.1. Kỹ thuật nén video số
2.1.1. Khái niệm
2.1.2. Mô hình nén ảnh
2.2. Các đặc điểm của nén tín hiệu số
2.2.1. Xác định hiệu quả của quá trình nén ảnh số
2.2.2. Độ dư thừa số liệu
2.2.3. Sai lệch bình phương trung bình
2.3. Các phương pháp nén
2.3.1. Nén không tổn hao
2.3.2. Nén có tổn hao
2.4. Tiêu chuẩn nén MPEG
2.4.1 Cấu trúc ảnh
2.4.2 Các thành phần cơ bản trong chuẩn nén MPEG
2.5. Chuẩn nén video H.264
H.264/MPEG-4 Part 10 hoặc AVC/H.264 (AVC - Advanced Video Coding)
là một tiêu chuẩn cho nén video, và hiện nay là một trong các định dạng được sử
dụng phổ biến nhất được sử dụng để ghi, nén và phân phối video độ nét cao. Công
việc soạn thảo cuối cùng về phiên bản đầu tiên của tiêu chuẩn này được hoàn thành
tháng 5 năm 2003.
H.264/MPEG-4 AVC được phát triển bởi nhóm các chuyên gia mã hóa
video ITU-T cùng với nhóm các chuyên gia hình ảnh chuyển động MPEG của ISO
/ IEC JTC1.
5
2.5.1. Bộ mã hóa (encoder)
2.5.2. Bộ giải mã hóa (decoder)
2.6. Cú pháp H.264
H.264 cung cấp một định dạng được định nghĩa rõ ràng hoặc cú pháp cho thể
hiện video đã được nén và các thông tin liên quan.
2.7. Các profiles của H.264
Tiêu chuẩn mã hóa video H.264 định nghĩa 21 tập các khả năng (21 sets of
capabilities), được gọi là các profiles với mục tiêu phân loại các ứng dụng khác
nhau.
AVC/H.264 có 10 profiles không có khả năng điều chỉnh, 04 profiles chỉ có
các khung I, 02 profiles multiview (đa hình ảnh) và 05 profiles có khả năng điều
chỉnh
2.8. Ưu điểm của chuẩn nén H.264/AVC
Có lẽ lợi thế lớn nhất của H.264 hơn tiêu chuẩn trước đó là hiệu quả nén của
nó. So sánh với các tiêu chuẩn như MPEG-2 và MPEG-4 Visual, H.264 có thể cung
cấp:
Chất lượng hình ảnh tốt hơn ở cùng một bitrate nén, hoặc một bitrate nén
thấp hơn cho cùng một chất lượng hình ảnh.
2.9. Tổng kết
Nén video tiên tiến H.264/AVC là một tiêu chuẩn công nghiệp cho mã hóa
video mà nó định nghĩa một định dạng hoặc cú pháp nén video và một phương pháp
giải mã cú pháp này. Nó cung cấp một tập hợp các công cụ hoặc các thuật toán có
thể được sử dụng để cung cấp nén video hiệu quả, linh hoạt và mạnh mẽ cho một
phạm vi rộng các ứng dụng, từ các ứng dụng có độ phức tạp thấp, các ứng dụng
video di động bitrare thấp tới các dịch vụ truyền hình quảng bá độ nét cao.
2.10. Tiêu chuẩn mã hóa SVC
Sự phát triển của mã hóa video có khả năng điều chỉnh (Scalable Video
Coding - SVC) mở rộng cho H.264, chuẩn hóa theo tiêu chuẩn H.264/SVC. SVC hỗ
trợ mã hóa cho video theo một cách mà nhiều phiên bản của các tín hiệu video có
6
thể được giải mã ở một loạt các bitrate, độ phân giải không gian và / hoặc độ phân
giải thời gian và tốc độ khung hình có hiệu quả. Bằng cách kết hợp nhiều phiên bản
mã hóa, nó có thể được phân phối theo cách hiệu quả hơn so với phương án mã hóa
và truyền mỗi phiên bản riêng biệt.
H.264/SVC được đưa ra trong Phụ lục G của H.264/AVC và H.264/SVC có
05 profiles trong tổng số 21 profiles của AVC.
2.10.1. Truyền tải Simucast (Simucast transmission)
2.10.2. Truyền tải có khả năng điều chỉnh (Scalable transmission)
Hình 2.14. Các luồng có khả năng điều chỉnh
2.10.3. Ứng dụng của mã hóa video có khả năng điều chỉnh
SVC đã được đề xuất cho một số kịch bản ứng dụng.
Nhiều bộ giải mã:
Suy giảm nhẹ hoặc tăng cường (Graceful degradation / enhancement)
Lưu trữ
2.10.4. Mã hóa video có khả năng điều chỉnh trong H.264
Mã hóa video có khả năng điều chỉnh (Scalable Video Coding - SVC) được
đưa ra trong Phụ lục G của các phiên bản gần đây của tiêu chuẩn H.264/AVC và
điều chỉnh khả năng của các tiêu chuẩn ban đầu. Một phần mềm thực hiện, mô hình
video có khả năng điều chỉnh (the Joint Scalable Video Model), JSVM, hiện có sẵn
để tải về và trải nghiệm.
H.264 SVC hỗ trợ ba loại hoặc lớp chính cho khả năng điều chỉnh (hình
2.15):
7
1. Khả năng điều chỉnh thời gian: Lớp cơ bản được mã hoá ở độ phân giải
thời gian thấp hoặc tốc độ khung hình thấp, các lớp tăng cường thêm vào làm tăng
tốc độ khung hình của trình tự giải mã.
2. Khả năng điều chỉnh không gian: Các lớp cơ bản được mã hoá ở độ
phân giải không gian thấp, các lớp tăng cường thêm vào làm tăng độ phân giải
không gian của chuỗi được giải mã.
3. Khả năng điều chỉnh chất lượng: Các lớp cơ bản được mã hoá tại một
chất lượng hình ảnh thấp bằng cách sử dụng một QP cao, các lớp tăng cường thêm
vào làm tăng chất lượng hình ảnh của chuỗi được giải mã.
Hình 2.15. Tổng quan các loại khả năng điều chỉnh
2.10.5. Khả năng điều chỉnh thời gian
2.10.6. Khả năng điều chỉnh chất lượng
2.10.7. Khả năng điều chỉnh không gian
2.10.7.1. Tổng quan về khả năng điều chỉnh không gian
2.10.7.2. Chi tiết khả năng điều chỉnh không gian
8
2.10.8. Chi tiết khả năng điều chỉnh chất lượng
2.10.9. Kết hợp các khả năng điều chỉnh (Combined scalability)
2.11.Kết luận
Sự khác biệt cơ bản giữa SVC và AVC là việc mã hóa các tín hiệu video
được thực hiện như là một tập các lớp. Các lớp khác nhau phụ thuộc vào nhau, tạo
thành một hệ thống phân cấp. Một lớp đặc biệt, cùng với các lớp mà nó phụ thuộc
vào cung cấp các thông tin cần thiết để giải mã tín hiệu video ở một độ trung thực
cụ thể (particular fidelity). Độ trung thực ở đây liên quan đến một hoặc nhiều độ
phân giải không gian, độ phân giải thời gian, hoặc tỉ lệ tín hiệu trên nhiễu (SNR).
Các lớp thấp nhất, tức là, lớp mà không phụ thuộc vào bất kỳ lớp nào khác, được
gọi là lớp cơ sở và cung cấp các mức chất lượng thấp nhất. Mỗi lớp bổ sung cải
thiện chất lượng của tín hiệu trong bất kỳ một trong ba chiều (không gian, thời gian,
hoặc SNR).
Theo thiết kế, một khía cạnh rất quan trọng của SVC là lớp cơ sở phù hợp
với AVC. Nói cách khác, lớp cơ sở của một tín hiệu SVC được giải mã bởi một bộ
giải mã AVC. Điều này đảm bảo một tín hiệu SVC là tương thích ngược với AVC,
mặc dù ở mức thấp hơn của độ trung thực so với tín hiệu đầy đủ nếu có liên quan
đến nhiều hơn một lớp. Lưu ý rằng một bộ mã hóa SVC không cần phải luôn luôn
tạo ra các luồng bít được mã hóa theo lớp - nếu nó hoạt động trong một môi trường
mà không cần thiết hoặc không yêu cầu phải có khả năng điều chỉnh thì nó có thể
tạo ra các luồng bít AVC truyền thống.
9
CHƯƠNG III: NGHIÊN CỨU ỨNG DỤNG SVC/H.264
VÀO CUNG CẤP VIDEO TRÊN LTE VÀ ĐỀ XUẤT TRIỂN
KHAI
Trái ngược với mạng hữu tuyến, trong đó QoS có thể được đảm bảo bằng tối
ưu hóa độc lập tại mỗi lớp trong các kết nối mô hình hệ thống mở (OSI), trong các
mạng không dây có một kết nối mạnh mẽ giữa các lớp mà làm cho cách tiếp cận
theo lớp không hiệu quả [37]. Vì lý do này, thiết kế cross-layer là cần thiết để tối ưu
hóa việc sử dụng các phương tiện không dây và cung cấp QoS chấp nhận được cho
người sử dụng không dây. Cross-layer tối ưu hóa phân phối video qua mạng LTE
được thảo luận bởi các tác giả [19]. Khả năng điều chỉnh được cung cấp bởi video
SVC và thiết kế cross-layer cung cấp lựa chọn hấp dẫn cho việc thực hiện các thuật
toán truyền video trực tuyến thích ứng. Đặc biệt, nó rất hữu ích để đạt được các
thích ứng trong lớp MAC và lớp ứng dụng bằng cách sử dụng kênh thông tin chất
lượng từ lớp vật lý.
Rất nhiều nghiên cứu đã được thực hiện trên truyền tải video dựa trên SVC
qua các mạng truy cập không dây, bao gồm cả LTE. Chất lượng kênh của người
dùng cá nhân có sẵn trong lớp MAC của eNodeB dưới hình thức phản hồi chỉ số
chất lượng kênh (CQI). Một số sơ đồ lập biểu miền tần số MAC LTE được trình
bày trong tài liệu sử dụng những thông tin phản hồi cho lập biểu phụ thuộc kênh.
Chủ động loại bỏ các khung hình video trong lớp MAC của mạng WiMAX dựa trên
thông tin trạng thái kênh (CSI – Channel State Information) được thảo luận trong
[25]. Lập biểu hoặc thích ứng gói trong lớp MAC của trạm gốc được sử dụng bởi
hầu hết các công việc hiện có trong tài liệu. Một khung báo hiệu cross-layer cho
một thích ứng video có khả năng điều chỉnh động trong dung lượng mạng hay thay
đổi (varying) được trình bày trong [13]. Các tác giả so sánh thích ứng gói nhanh lớp
MAC với thích ứng dài hạn (long-term) và tương đối chậm trong lớp ứng dụng bằng
cách sử dụng một đoạn video H.264/SVC thực. Các tác giả kết luận rằng việc làm
rớt (dropping) các gói dữ liệu trong máy chủ video là một giải pháp hiệu quả hơn
10
lớp MAC làm rớt trong trạm cơ gốc để giảm nghẽn trong cả hai môi trường có dây
trong mạng lõi và môi trường không dây tới UE. Hầu hết các tài liệu hiện có thảo
luận về khả năng thích nghi xảy ra trong lớp MAC của trạm gốc. Tuy nhiên, làm rớt
các gói tin trong eNodeB không phải là một giải pháp chung cho nghẽn trong môi
trường không dây và các tuyến truyền dẫn trong một hệ thống LTE. Các gói tin bị
rớt trong eNodeB là sự lãng phí tài nguyên trong backhaul LTE và mạng lõi. Rớt
các khung hình video trong lớp truyền tải thời gian thực (RTP) của máy chủ video
làm giảm sự tắc nghẽn trong cả eNodeB và tuyến backhaul.
SVC là đặc biệt thích hợp cho multicast bởi vì nó tạo điều kiện cho việc cung
cấp các dòng phương tiện truyền thông (streaming media) tới một tập hợp các máy
thu với dung lượng kênh không đồng nhất. Khi một dòng video không khả năng
điều chỉnh cần phải được phân phối đến tất cả người dùng trong một nhóm
multicast, nó phải được truyền tại tốc độ của người sử dụng kém nhất (weakest)
trong nhóm.
Multicast/Broadcast đóng một vai trò rất quan trọng trong các dịch vụ giải
trí và các ứng dụng. Trong chế độ điểm - đa điểm của MBMS, một nhóm các thuê
bao MBMS dùng một kênh chung. Chúng chia sẻ tài nguyên thời gian và tần số
giống nhau cũng như sơ đồ điều chế và mã hóa giống nhau (MCS). Điều này nhấn
mạnh rằng để thực hiện đầy đủ các yêu cầu QoS, MCS đã được điều chỉnh tới thiết
bị đầu cuối yếu nhất của một nhóm thuê bao. Vì vậy, thích ứng với các sơ đồ MCS
tới các thiết bị đầu cuối yếu nhất là rất quan trọng để đáp ứng người sử dụng ở cạnh
tế bào. SVC cung cấp một lựa chọn hấp dẫn cho việc gửi cùng một đoạn video trong
nhiều lớp như lớp cơ sở và các lớp nâng cao. Tiếp nhận các lớp cơ sở là đủ cho chất
lượng cơ bản của video, và lớp tăng cường thêm vào để cung cấp chất lượng video
nâng cao. Điều này có thể được sử dụng trong dịch vụ MBMS cell đơn (single-cell
MBMS) để cung cấp chất lượng cơ bản cho người sử dụng ở cạnh tế bào hoặc
người sử dụng có chất lượng kênh thấp và để cung cấp video chất lượng cao cho
người sử dụng chất lượng kênh cao. Trong đặc tả kỹ thuật 3GPP phiên bản 8, truyền
dẫn MBMS được phân loại thành truyền dẫn cell đơn và truyền dẫn mạng tần số
11
đơn Multicast Broadcast (MBSFN). Trong hoạt động MBSFN, dữ liệu MBMS được
truyền đồng thời trong không khí từ nhiều tế bào đồng bộ chặt chẽ về thời gian
3.1. MBSFN trong LTE
Để hỗ trợ truyền tải điểm-đa điểm trong mạng thông tin di động thì 3GPP
đưa ra đặc tả MBMS (Multimedia Broadcast Multicast)
3GPP định nghĩa hai chế độ hoạt động của MBMS là:
- Chế độ Broadcast.
- Chế độ Multicast.
3.1.1. Triển khai các dịch vụ MBMS trong LTE
Có thể có hai loại truyền dữ liệu MBMS trong LTE
• Truyền tải đơn cell
• Truyền tải đa cell
3.1.2. MBMS trên mạng tần số đơn
3.1.3. MBSFN trong LTE
Hình 3.1: Kiến trúc hệ thống MBSFN LTE
3.2. Truyền video trực tuyến qua mạng không dây
3.2.1. Sự tăng cường của các giao thức truy nhập vô tuyến LTE cho
truyền video trực tuyến hiệu quả.
Để cung cấp đường truyền tin cậy trên các kênh không dây, hệ thống LTE hỗ
trợ hai sơ đồ: ARQ (Automatic Repeat reQuest – Yêu cầu phát lại tự động) và
HARQ (Hybrid Automatic Repeat reQuest – Yêu cầu phát lại tự động lai ghép). Cả
12
hai sơ đồ ARQ và HARQ thực hiện truyền lại dữ liệu khi nó không được phân phối
đúng tới máy thu. Trong khi sơ đồ ARQ hoạt động ở lớp RLC, thì HARQ làm việc
ở lớp MAC. Đặc biệt, sơ đồ HARQ khai thác lợi ích mã hóa kênh cũng như phân
tập thời gian thông qua truyền lại. Mặc dù các sơ đồ ARQ và HARQ đã được sử
dụng rộng rãi để cung cấp truyền tải đáng tin cậy trong các mạng không dây, nhưng
chúng có những điểm yếu sau đây: Đầu tiên, các sơ đồ ARQ và HARQ không đảm
bảo chất lượng phương tiện truyền thông cho dịch vụ trực tuyến đa phương tiện
bằng cách sử dụng chương trình mã hóa SVC, bởi vì chúng không xem xét các đặc
điểm truyền thông cơ bản như mức độ ưu tiên của các khung hình phương tiện. Thứ
hai, các sơ đồ ARQ và HARQ gây ra kết quả trễ cao trong việc phân phối dữ liệu và
thông lượng hệ thống thấp, bởi vì chúng hoạt động độc lập. Các tiêu chuẩn LTE xác
định các thông số có liên quan đến các bộ định thời phát lại ARQ và phản hồi
HARQ.
Để khắc phục được hai hạn chế trên, trong tài liệu [11], các tác giả đã giới
thiệu sơ đồ điều khiển dữ liệu nhận thức mạng và ưu tiên PNDC (Priority and
Network-aware Data Control) để tăng cường chất lượng của luồng dịch vụ sử dụng
công nghệ mã hóa SVC truyền tải qua mạng không dây LTE. Sơ đồ này thực hiện
điều khiển số truyền dẫn lại HARQ trong lớp MAC thấp hơn trên cơ sở ưu tiên của
các khung SVC. Đồng thời, nó cũng điều chỉnh động bộ định thời truyền dẫn lại
ARQ trong lớp điều khiển liên kết vô tuyến RLC (Radio Link Control) theo sự
tương tác giữa HARQ và ARQ thích ứng.
Còn trong luận văn [9], tác giả đã đề xuất một sơ đồ truyền tải lại HARQ
thích ứng nhận thức nội dung để tăng chất lượng video tại máy thu của người sử
dụng. Điều này đạt được bằng cách đếm việc truyền tải lại theo sự quan trọng của
các gói video. Hơn nữa, việc đếm truyền tải lại chỉ thực hiện cho các khung video
quan trọng để tăng tỷ lệ thành công của các khung đó. Đối với những người sử dụng
ở điều kiện kênh không thuận lợi, sơ đồ đề xuất tăng cường chất lượng video nhận
được thêm 8%. Ưu điểm chính của sơ đồ này là các lợi ích của nó là sự gia tăng
không đáng kể của trễ và không đòi hỏi tính toán mở rộng tại thiết bị người sử
13
dụng. Đồng thời, tác giả cũng đề xuất một chế độ hoạt động của RLC là chế độ lai
ghép HM (Hybrid Mode). Chế độ này tăng cường chất lượng video thêm 7% khi so
với chế độ RLC không nhận thực UM (RLC Unacknowladged Mode), nó cũng làm
giảm trễ từ đầu cuối đến đầu cuối bằng 99% khi so sánh với chế độ nhận thực AM
(Acknowledged Mode).
3.2.2. Thiết kế Cross-Layer cho truyền video trực tuyến (Video
Streaming) qua mạng không dây
Mục tiêu thiết kế chính của phương pháp này là để giảm thiểu việc trao đổi
thông tin giữa các lớp khác nhau và phụ thuộc giữa mỗi lớp phải được tối thiểu.
Khe giao thức TCP / IP trên mạng Internet là một ví dụ rất tốt của phương pháp này.
Tuy nhiên, đặc điểm các mạng không dây là rất khác so với các hệ thống hữu tuyến.
Trong thiết kế cross-layer, sự phụ thuộc giữa các lớp được khai thác để thỏa
mãn QoS nhu cầu của các ứng dụng. Đối với điều này, các lớp chia sẻ thông tin với
các lớp khác để có thể thích ứng và ổn định cao nhất trong các tình huống điều kiện
kênh không ổn định
Sơ đồ truyền tải luồng video mã hóa theo chuẩn SVC/H.264 với sơ đồ lập
biểu và thích ứng động dựa trên chất lượng kênh được đề xuất trong [34]. Kết quả
mô phỏng cho thấy chất lượng video được cải thiện cho số lượng nhiều người sử
dụng hơn với lưu lượng video tốc độ bít giảm. Đồng thời, đối với người sử dụng ở
mép của tế bào thì chất lượng video tăng khoảng 13% khi áp dụng sơ đồ thích ứng
này.
3.2.3. Các thuật toán phát video trực tuyến thích nghi sử dụng mã
hóa SVC
Sơ đồ lập biểu gói dựa trên cơ sở Gradient cho phân phối video có khả năng
điều chỉnh cho nhiều người sử dụng trên các mạng không dây được trình bày trong
[12].
Thuật toán cấp phát tài nguyên và lập biểu khác, trong đó các ưu tiên truyền
dẫn của người sử dụng khác nhau bằng cách xem xét các nội dung video, yêu cầu về
thời hạn, và lịch sử truyền dẫn, được đề xuất trong [45]. Phân tập thời gian, tần số
14
và nhiều người sử dụng của hệ thống OFDM được sử dụng cho các phương pháp
được đề xuất. Tác giả của [18] giới thiệu sơ đồ luồng video có khả năng điều chỉnh
đa người sử dụng bị ràng buộc bởi lưu lượng và trễ mà nó cải thiện méo đầu cuối –
tới – đầu cuối (end-to-end) trung bình của luồng video được truyền so với các chiến
thuật trực tuyến truyền thống (traditional streaming strategies). Lưu lượng luồng
video khả năng điều chỉnh phân phối trong môi trường mạng IP / UMTS được thảo
luận trong [40]. Dựa trên nội dung của mỗi gói tin, các ưu tiên được gán dựa vào tác
động tổn thất suy giảm của mỗi gói tin trên chất lượng video đầu cuối – tới – đầu
cuối (end-to-end) trong bài báo này. Mỗi lớp có một phạm vi ưu tiên, và mỗi gói có
ưu tiên khác nhau theo tải trọng của nó. Các gói tin có chứa dữ liệu của một khung-I
được đánh dấu với xác suất rớt thấp nhất, các gói tin có chứa dữ liệu của một
khung-P được đánh dấu với xác suất rớt trung bình và những gói tin chứa dữ liệu
của một khung-B được đánh dấu với xác suất rớt cao .
Việc phân tích và thiết kế của các bộ lập biểu nhận biết kênh (channel-aware
schedulers) cho unicast đã nhận được quan tâm đáng kể trong cộng đồng nghiên
cứu. Tuy nhiên, với sự gia tăng của các dịch vụ truyền hình di động, video multicast
được dự kiến sẽ tăng thị phần của mình trong tải lưu lượng truy cập của mạng di
động. Các thuật toán lập biểu mới cho việc phân phối video multicast của dòng
video SVC trong các mạng không dây đã được nghiên cứu trong [44]. Nếu phân bổ
tài nguyên trong một nhóm Multicast là tĩnh, các tài nguyên sẽ bị lãng phí hoặc
cuộc gọi sẽ bị chặn dẫn đến chất lượng thấp hơn. Sơ đồ phân bổ băng thông động
cho các mạng WiMAX di động dựa trên SVC được thảo luận trong [21]. Thuật toán
này mới đề xuất các phương pháp để giải quyết vấn đề này. Cuộc gọi mới, chuyển
giao cuộc gọi, và các cuộc gọi chuyển động được đưa vào tài khoản cho chiến lược
phát thanh quản lý tài nguyên để đạt được kết quả tối ưu. Dựa trên các SNR nhận
được của mỗi trạm thuê bao (SS), các trạm gốc điều chỉnh profiles burst (lý lịch
burst) bằng cách sử dụng bộ giải mã SVC để cải thiện chất lượng hình ảnh và thông
lượng hệ thống. Lưu lượng được xử lý bởi một thuật toán lập biểu vòng robin được
đánh trọng số (weighted round robin) khi cuộc gọi được chấp nhận.
15
Tương tự như lập biểu thích ứng, kỹ thuật điều chế thích nghi rất quan trọng
cho việc phân phối các lớp khác nhau trong SVC với tầm quan trọng khác nhau. Sơ
đồ AMC đơn giản nhưng hữu ích được trình bày trong [39], trong đó bit không sử
dụng trong tiêu đề của RTP, UDP và các gói tin IP được sử dụng để mang các lớp
thông tin SVC (để xác định các lớp SVC được mang trong gói) tới lớp MAC.
Những thông tin này được sử dụng bởi các lớp MAC để phân biệt lớp SVC nhận
được trong gói tin và đưa ra quyết định liên quan đến điều chế được sử dụng.
3.3. Kết quả nghiên cứu ưu điểm của SVC cho truyền tải luồng
video qua mạng LTE thông qua phần mềm mô phỏng
Do hạn chế về điều kiện phần mềm mô phỏng Opnet hỗ trợ mô phỏng mạng
LTE, nên để thấy được ưu điểm của việc sử dụng mã hóa video SVC/H.264 cho
luồng video truyền tải qua mạng LTE, luận văn đã thực hiện tham khảo kết quả
nghiên cứu của tài liệu tham khảo [35] và [38] để trình bày các mục 3.3 và 3.4 trong
chương này.
3.3.1. Phân tích SVC dựa trên cơ sở sơ đồ thích ứng cho Unicast và
Multicast
3.3.1.1 Các máy thu không đồng nhất với Multicast
3.3.1.2. Suy giảm nhẹ trong Multicast (Graceful Degradation in
Multicast)
3.3.1.3. Luồng video nhận thức mạng và UE trong Unicast (UE and
Network Aware Streaming in Unicast)
3.3.2. Kết quả mô phỏng và phân tích (Simulation Results and
Analysis)
3.3.2.1. Các máy thu không đồng nhất với Multicast
16
Hình 3.4. So sánh thông lượng trung bình SVC và H.264
Kết quả được tổng hợp trong bảng 3.3.
Bảng 3.3. So sánh các video H.264 và SVC
Parameters H.264 CIF H.264 QCIF SVC CIF + QCIF
PSNR (dB) 50,37 32,11 50,81
Throughput 3.8 Mbps 1.2 Mbps 4.1 Mbps
Delay 4.3 ms 6.5 ms 7 ms
Jitter 27 µs 22 µs 34 µs
Từ kết quả mô phỏng đưa ra ở trên, chúng ta có thể thấy rằng multicast SVC
yêu cầu tốc độ dữ liệu ít hơn đáng kể (4,1 Mbps) so với simulcasting của hai H.264
Hình 3.5. So sánh rung pha SVC và H.264
17
video (5 Mbps). Hầu như bị giảm 18% trong tốc độ bit đạt được với video nhiều
lớp SVC trong trường hợp này. Có một gia tăng nhỏ trong trễ và rung pha vì mã
hóa SVC của video. Tuy nhiên, ảnh hưởng của sự gia tăng nhỏ trong trễ và rung
pha có thể được điều khiển dễ dàng bằng cách sử dụng bộ đệm bộ giải mã và bộ
đệm rung pha trong máy thu.
3.3.2.2. Suy giảm nhẹ trong Multicast (Graceful Degradation in
Multicast)
Hình 3.6. Tổn hao gói của các video H.264 đối với các UE cách trạm gốc 5km và
10km
Các kết quả từ Hình 3.6, 3.7 và 3.8 được tóm tắt trong Bảng 3.4. Kết quả cho
thấy suy giảm nhẹ (graceful degradation) về chất lượng cho người sử dụng SVC tại
Km 10 với giảm thông lượng trung bình và tỷ lệ mất gói tin, nhưng với giá trị
PSNR chấp nhận được. Mặc dù các tác giả đã phân tích khả năng điều chỉnh thời
gian cho suy giảm nhẹ (graceful degradation), khả năng điều chỉnh chất lượng và
khả năng điều chỉnh thời gian có thể được áp dụng đồng thời cho các loại hình suy
giảm nhẹ (graceful degradation).
18
Hình 3.7. Tổn hao gói của các video H.264 đối với các UE cách trạm gốc 5km và
10km (với sự suy giảm nhẹ)
Hình 3.8. So sánh thông lượng trung bình với khả năng điều chỉnh thời gian SVC
Bảng 3.4. So sánh H.264 và SVC với khả năng suy giảm nhẹ (Graceful Degradation)
Tham số
H.264 CIF
(10km)
SVC CIF+QCIF –
3TLs
(5km)
SVC CIF+QCIF
– chỉ có TL0
(10km)
PSNR (dB) 50,37 50,81 35,82
Tỷ lệ mất gói 3/30 2/30 2/30
Thông lượng 3,8 Mbps 4,1 Mbps 2 Mbps
* Các giá trị PSNR được đưa ra cho chuỗi video đầu vào và đưa ra cho so
sách suy giảm nhẹ với khả năng điều chỉnh thời gian của SVC
19
3.1.2.3. Luồng video nhận thức mạng và UE trong Unicast (UE and
Network Aware Streaming in Unicast)
3.3.3. Kết luận
Những ưu điểm của việc sử dụng SVC so với H.264/AVC trong các kịch bản
Multicast LTE và Unicast trong các mạng LTE là thể hiện rõ ràng từ những phân
tích ở trên. Các kết quả cho thấy rằng giảm mất gói đáng kể và tiết kiệm giảm thông
(18 đến 30%) với chất lượng video chấp nhận là đạt được với sơ đồ đề xuất dựa trên
SVC so với H.264
3.4. Các kết quả thử nghiệm truyền tải video mã hóa SVC phát
quảng bá qua mạng LTE trong thực tế
3.4.1. Kịch bản đo ngoài trời
3.4.2. Kết quả
Hình 3.12 mô tả bản đồ vùng phủ thể hiện khả năng có thể giải mã lớp
truyền tải H.264/SVC tốt nhất dọc theo đường đo kiểm. Người ta đã quan sát thấy
rằng các lớp cơ bản, lớp truyền tải 1, có thể được nhận được với một xác suất 97%
tại tất cả các điểm trên đường đo đạc. 3% trải nghiệm thiết bị đầu cuối di động bị
rớt tại khoảng cách 2km đến trạm gốc phục vụ. Ở đây, công suất nhận bị rớt khi
dưới -92 dBm, đó là dưới độ nhạy thu của mẫu di động thử nghiệm, và các thiết bị
đầu cuối di động bị mất đồng bộ hóa đến trạm gốc. Nói chung, hình 3.12 cho thấy
H.264/SVC trên LTE hỗ trợ hầu hết 2 hoặc 3 lớp truyền tải SVC trong lúc di
chuyển thông qua sector phục vụ. Trong khu vực gần các trạm gốc, hệ thống sử
dụng hầu hết thời gian lớp truyền tải SVC cao nhất để cung cấp chất lượng video tốt
nhất. Trong trường hợp chất lượng kênh xấu tạm thời, có thể dễ dàng gây ra bởi các
hiệu ứng di động hoặc che khuất tạm thời gây ra bởi các loại xe khác, các bộ giải
mã SVC có thể chỉ có thể giải mã thành công 2 lớp. Trong một môi trường di động,
một tình huống như thế này có thể chỉ kéo dài trong một vài mili giây đến hàng
giây. Do đó, rớt đột ngột đến lớp 2 và sau đó trở lại 3 hoặc 4 lớp SVC thậm chí có
thể không gây chú ý cho một người dùng cụ thể.
20
Hình 3.12. Bản đồ vùng phủ thể hiện khả năng có thể giải mã lớp truyền tải
H.264/SVC tốt nhất dọc theo đường đo kiểm
3.4.3. Kết luận
Các tác giả đã tiến hành thử nghiệm việc truyền tải các luồng video được mã
hóa video SVC/H.264 qua mạng LTE. Ở đây, luồng video được mã hõa H.264/SVC
với độ phân giải 720p được truyền với bảo vệ lỗi không cân bằng sử dụng một ánh
xạ tài nguyên phân cấp trong lớp MAC LTE. Các thử nghiệm đã được thực hiện
trong một kịch bản đô thị lớn thực sự trong Testbed LTE-Advanced Berlin. Kết quả
đo cho thấy, thích nghi nhanh trong một môi trường di động là đặc biệt quan trọng
đối với nội dung thời gian thực, nhưng có thể được nhận ra với SVC trên LTE thiết
kế cross-layer. Tiếp cận cross-layer được thực hiện đầy đủ cho thấy hiệu suất đáng
nể. Trong 97% các trường hợp, lớp cơ sở SVC có thể được nhận bởi các thiết bị đầu
cuối di động, ngay cả khi các thiết bị đầu cuối di chuyển lên đến 50 km / h. Nếu
thiết bị đầu cuối là trong vòng 500 m của trạm gốc phục vụ, 3 hoặc 4 lớp SVC luôn
luôn có thể được giải mã. Điều này cho thấy rằng SVC trên LTE cho phép truyền tải
video rất mạnh mẽ. Trong khu vực gần các trạm gốc, hệ thống sử dụng hầu hết thời
gian lớp truyền tải SVC cao nhất để cung cấp chất lượng video tốt nhất. Trong
trường hợp chất lượng kênh xấu tạm thời, có thể dễ dàng gây ra bởi các hiệu ứng di
21
động hoặc che khuất tạm thời gây ra bởi các loại xe khác, các bộ giải mã SVC có
thể chỉ có thể giải mã thành công 2 lớp. Trong một môi trường di động, một tình
huống như thế này có thể chỉ kéo dài trong một vài mili giây đến hàng giây. Do đó,
rớt đột ngột đến lớp 2 và sau đó trở lại 3 hoặc 4 lớp SVC thậm chí có thể không gây
chú ý cho một người dùng cụ thể.
3.5. Tình hình ứng dụng SVC cho truyền tải trên mạng LTE
Đối với công nghệ 3G UMTS hiện nay thì người ta đang sử dụng kỹ thuật
mã hóa AVC/H.264 để truyền tải video. Và việc triển khai các thiết bị phần cứng
thực hiện hỗ trợ việc truyền tải video mã hóa SVC/H.264 đã được ứng dụng trong
lĩnh vực hội nghị truyền hình, ví dụ như một số hãng công nghệ lớn đã có sản phẩm
riêng của mình như hãng Vidyo, Polycom…Còn việc sử dụng SVC cho truyền tải
trên mạng LTE đang ở trong quá trình thử nghiệm trong thực tế để đánh giá hiệu
quả. Các kết quả thử nghiệm đã được trình bày trong mục 3.3 và 3.4 của chương
này.
3.6. Dự báo triển khai LTE tại Việt Nam
Theo [10], đến cuối năm 2011 thì có khoảng 9 triệu thuê bao LTE trên toàn
thế giới. Người ta dự báo đến cuối năm 2016, dự báo sẽ có khoảng 830 triệu thuê
bao LTE trên toàn thế giới, trong đó khu vực Châu Á – Thái Bình Dương sẽ có
khoảng 309 triệu thuê bao.
Bảng 3.7 : Dự báo thị trường LTE
Đồng thời, lưu lượng di động sẽ lớn hơn 127 exabyte (EB) vào năm 2020,
trong đó Châu Á sẽ chiếm khoảng 34,3% tổng số lưu lượng di động, tiếp theo là
Châu Âu với 22% và Châu Mỹ là 21,4%.
22
Hình 3.13. Lưu lượng dữ liệu và thoại di động giai đoạn 2010 – 2020 (EB hàng năm)
Ngày 01 tháng 9 năm 2010, Bộ Thông tin và Truyền thông đã cấp phép cho
05 doanh nghiệp được thử nghiệm mạng và dịch vụ LTE, bao gồm: VNPT; Viettel;
VTC; FPT Telecom; CMCTI.
Theo [1] thì tác giả đã đề xuất nên cấp phép triển khai thương mại mạng 4G
LTE/SEA tại Việt Nam là vào cuối năm 2017, các doanh nghiệp sẽ lắp đặt mạng
trong năm 2018 và chính thức cung cấp dịch vụ vào đầu năm 2019.
Cũng theo [14], tại Việt Nam, dự kiến 03 nhà mạng là Viettel, Mobiphone,
Vinaphone sẽ triển khai mạng LTE vào năm 2016, cùng với đó thì, do các dịch vụ
video qua mạng không dây được kỳ vọng là nguồn mang lại lợi nhuận chính cho
các nhà cung cấp dịch vụ di động nên việc nghiên cứu các kỹ thuật liên quan đến
công nghệ truyền tải video qua mạng di động LTE, từ đó đề xuất phương án triển
khai là một vấn đề mang tính thực tế cao tại thời điểm hiện nay.
3.6. Đề xuất mô hình ứng dụng SVC/H.264 cho truyền tải video
trên hệ thống LTE
Kết quả nghiên cứu ở các phần 3.1, 3.2, 3.3, 3.4, 3.5, là những kết quả
nghiên cứu chuyên sâu trong phạm vi hẹp, rời rạc của ứng dụng công nghệ mã hóa
SVC/H.264 trên mạng LTE. Đặc thù của công nghệ này phụ thuộc rất nhiều vào
môi trường truyền của mạng LTE và khả năng xử lý của máy đầu cuối. Do đó muốn
sử dụng tối đa các ưu điểm của SVC/H.264, việc nghiên cứu áp dụng đồng bộ các
giải pháp để nâng cao chất lượng truyền tải video trên mạng LTE là rất cần thiết.
23
Một số công trình nghiên cứu đã được giới thiệu trong luận văn nhưng chưa có mô
hình áp dụng toàn trình về việc áp dụng video mã hóa SVC truyền tải trên mạng
LTE. Do đó, trên cơ sở nghiên cứu nắm bắt các kỹ thuật, tác giả xin đề xuất mô
hình ứng dụng công nghệ SVC/H.264 cho truyền tải video trên mạng LTE trong
hình vẽ 3.14.
Trên cơ sở mô hình đề xuất, tác giả cũng đề xuất một số vấn đề cần quan tâm
khi lựa chọn hệ thống LTE và thiết kế mạng LTE cung cấp dịch vụ video như sau:
1. Sử dụng kỹ thuật mã hóa video SVC/H.264 để truyền tải video qua hệ
thống LTE nhằm nâng cao hiệu quả sử dụng tài nguyên mạng LTE;
2. Sử dụng dịch vụ eMBMS trong LTE để cung cấp hiệu quả tần số cao hơn
và truyền dẫn điểm - đa điểm đáng tin cậy hơn cho LTE;
3. Hệ thống ứng dụng các thuật toán hỗ trợ truyền tải tối ưu SVC qua mạng
LTE: thuật toán điều khiển dữ liệu thích ứng mạng và theo các mức ưu
tiên PNDC (Priority and Network-aware Data Control) (Hỗ trợ lập biểu
và thích ứng đường truyền trong lớp MAC…phù hợp đặc thù mạng dựa
trên các thông tin CQI và dựa trên chính nội dung video); thuật toán điều
khiển thích ứng giữa các lớp cross-layer;
4. Mấy đầu cuối hỗ trợ công nghệ video SVC/H.264.