HỌC
VIỆN
CÔNG
NGHỆ
BƯU
CHÍNH
VIỄN
THÔNG
Phạm
Thị
Huyên
NGHIÊN
CỨU
CÁC
CHUẨN
MÃ
HOÁ
VIDEO
VÀ
ỨNG
DỤNG
TRONG
CÁC
HỆ
THỐNG
DI
ĐỘNG
Chuyên
ngành:
Khoa
học
máy
tính
Mã
số:
60.48.01
TÓM
TẮT
LUẬN
VĂN
THẠC
SĨ
Hà Nội - 2012
Luận văn được hoàn thành tại:
HỌC
VIỆN
CÔNG
NGHỆ
BƯU
CHÍNH
VIỄN
THÔNG
Người hướng dẫn khoa học:
TS. Vũ Văn Thỏa
Phản biện 1:
……………………………………………………………
Phản biện 2:
………………………………………………………….
Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học
viện Công nghệ Bưu chính Viễn thông
Vào lúc: giờ ngày tháng năm
Có thể tìm hiểu luận văn tại:
- Thư viện của Học viện Công nghệ Bưu chính Viễn thông
1
MỞ ĐẦU
Trong những năm gần đây, nhu cầu các dịch vụ dữ liệu trên mạng di động,
nhất
là
dữ
liệu
đa phương
tiện
là rất lớn.
Cùng
với
nhu
cầu
đó, vấn
đề
đặt
ra
là làm
thế nào
tìm
được
một
kỹ thuật
mã
hoá
dữ
liệu chuẩn, có hiệu quả để truyền các dữ liệu này trên mạng
di động.
Hiện nay, chúng ta đang sống trong một kỷ nguyên mới “Kỷ nguyên truyền thông đa
phương tiện”. Các thiết bị mới, các kỹ thuật
mới lần lượt ra đời nhằm mục đích đáp ứng
nhu cầu giải trí cho con người ngày một tốt
hơn. Các ứng dụng đa
phương
tiện thời gian
thực truyền trên mạng di động, mạng Internet, mạng truyền hình…ngày càng phát triển rầm
rộ. Các nhà sản xuất thiết bị chú trọng áp dụng các công nghệ nén tiên tiến vào thiết bị của
mình
nhằm
thõa
mãn
nhu
cầu
“chất
lượng
trung
thực
về
âm
thanh,
hình
ảnh”
của
khách
hàng
cũng như khả năng đáp ứng
yêu cầu thực tế của công nghệ.
Trong thực tế,
gắn liền
giữa độ phức tạp, tốn kém chi phí đầu tư cơ sở hạ tầng, thiết bị đầu cuối…, luôn đi kèm với
công nghệ cao. Bên cạnh đó vấn đề truyền thông nội dung đa phương tiện hiện nay đang
gặp một số khó khăn: băng thông đường truyền, nhiễu kênh, giới hạn của pin cho các ứng
dụng…. Trong khi băng thông kênh truyền phải chờ đợi một công nghệ mới của tương lai
mới có thể cải thiện, còn việc cải thiện giới hạn của pin dường như không đáp ứng được sự
phát triển của các dịch vụ trong tương lai, thì phương pháp giảm kích thước dữ liệu bằng
các kỹ thuật nén là một cách giải quyết hiệu quả các khó khăn trên.
Để
có
thể
hiểu
biết
hơn
về
các
tiêu
chuẩn
nén
tiên
tiến
này,
em
đã
chọn
đề
tài
“Nghiên
cứu
các
chuẩn
mã
hóa
video
và
ứng
dụng
trong
các
hệ
thống
di
động
”
làm đề
tài luận văn của mình.
Từ
những
phân
tích
trên,
có
thể
thấy rằng
đề
tài
“Nghiên
cứu
các
chuẩn
mã
hóa
video
và
ứng
dụng
trong
các
hệ
thống
di
động
”
mang tính cấp thiết và có ý nghĩa cả về lý
thuyết lẫn ứng dụng thực tế. Luận văn bao gồm những chương sau:
Chơng
1:
Các
chuẩn
mã
hóa
video
Chơng
2:
Ứng
dụng
các
chuẩn
mã
hóa
video
trong
MobileTV
Chơng
3:
Nghi
n
cứu
các
giải
pháp
ánh
giá
chất
ng
video
trong
các
hệ
thống
di
ộng
Sau một thời gian nỗ lực hết mình, về cơ bản luận văn cũng đã cho cái nhìn tổng quát
về các chuẩn
mã hóa
MPEG2, MPEG-4 và H.264, đồng thời với
ứng dụng các chuẩn
mã
hoá trong MobileTV cũng giúp cho ta hiểu rõ hơn
những ưu điểm của
các chuẩn
mã hóa
này. Tuy nhiên do có sự hạn chế về kinh nghiệm, thời gian,…nên sẽ không tránh khỏi sai
2
sót, kính mong Quý Thầy Cô, bạn bè, đồng nghiệp tham khảo đóng góp ý kiến để luận văn
được hoàn thiện hơn.
Em xin chân thành cảm ơn
TS.
Vũ
Văn
Thoả
đã bớt thời gian quý báu, hướng dẫn
tận tình và cung cấp tài liệu bổ ích cho em trong quá trình làm luận văn. Đồng thời cũng xin
cảm
ơn
Quý
Thầy Cô
của
Học
viện
công
nghệ
bưu
chính
viễn
thông
đã
tận
tình
dạy dỗ,
truyền
thụ
kiến
thức
và
kinh
nghiệm
cho
em
trong
thời
gian
học
tập
và
nghiên
cứu
tại
trường.
3
CHƠNG
1-
CÁC
CHUẨN
MÃ
HÓA
VIDEO
1.1
Chuẩn
MPEG2
1.1.1
Tổng
quan
về
MPEG-2
1.1.1.1 Lịch sử phát triển của chuẩn nén MPEG
Thuật
ngữ
MPEG
viết
tắt
của
cụm
từ
Moving
Picture
Experts
Group
là
1
nhóm
chuyên
nghiên
cứu
phát
triển
các
tiêu
chuẩn
về
hình
ảnh
số
và
nén
âm thanh
theo
chuẩn
ISO/IEC từ năm 1988. Cho đến nay nhóm làm việc MPEG đã phát triển và phát hành nhiều
tiêu
chuẩn
nén
cho
các
loại
ứng
dụng
khác
nhau,
nhưng
nổi
bật
là
các
chuẩn
MPEG-1,
MPEG-2, MPEG-4, và H.264/AVC. MPEG chỉ là một tên riêng, tên chính thức của nó là:
ISO/IEC JTC1 SC29 WG11.
1.1.1.2 Kỹ thuật mã hóa VIDEO MPEG-2
Tất cả các chuẩn quốc tế hiện tại cho nén video như là MPEG-1,2,4, ITU-T H261,
H263, H264 đều là các
sơ đồ
mã hóa lai. Các sơ đồ
này dựa trên
các
nguyên lý của dự
đoán bù chuyển động và mã hóa chuyển đổi trên cơ sở khối.
Các khung mã hóa Intra (các khung I) được phân chia thành các khối 8x8 pixels. Các
khối này tiếp theo được nén sử dụng DCT, lượng tử hóa (Q), quét zig-zag, mã hóa Entropy
(sử dụng kỹ thuật mã hóa có độ dài từ mã thay đổi VLC). Các khung mã hóa Inter là kết quả
của bù chuyển động bằng cách trừ đi một dự đoán đã được bù chuyển động. Các khung dư
(khung sai số) sau đó được chia thành các khối 8x8 pixel và được nén theo cách giống như
với các khối của khung I.
1.1.2.
Thuật
toán
Watermarking
cho
VIDEO
MPEG-2
Ý tưởng chung của Watermarking là nhúng một vài dữ liệu mở rộng vào trong một bản
tin chủ. Thông tin nhúng gọi là watermark và dữ liệu chủ gọi là vật mang. Các ứng dụng của
Watermarking có thể là bảo vệ bản quyền, nhận thực, ẩn dữ liệu, các thông tin mật…
Watermarking
tại
miền
không
gian
Các thuật toán watermarking thế hệ đầu tiên làm việc trong miền không gian bởi vì nó ít
yêu cầu phức tạp và đắt trong xử lý máy tính. Một phương pháp trong đó là mã hóa LSB: bit
LSB của byte dữ liệu sẽ được sửa đổi để nhúng các watermark. Mã hóa LSB rất dễ bị bẻ vỡ vì
4
nó chỉ thực hiện che phần LSB của các byte dữ liệu, vì vậy nó nhanh chóng được thay thế bằng
các kỹ thuật khác.
Watermarking
tại
miền
DCT
Chúng ta thấy rằng sau khi chuyển đổi miền làm việc từ
miền không gian sang miền
DCT, sự tương quan của các pixel không gian sẽ được giải tương quan thành các phần tần số rời
rạc. Hệ số DC và tần số thấp của ma trận DCT sẽ quyết định các đặc tính tự nhiên nhất của một
ảnh. Sau khi cắt xén các hệ số tần số cao, tính trung thực của ảnh vẫn còn đủ tốt cho sự cảm thụ
thị giác con người thông qua biến đổi ngược IDCT. Vì vậy một phương pháp tự nhiên là nhúng
một ma trận các hệ số DCT watermark vào một ma trận các hệ số DCT ảnh trong vùng tần số
trung bình hay thấp hơn để đạt được watermark mạnh
Tính
chất
mạnh
của
watermarking
DCT
là
nếu
một
kẻ
tấn
công
cố
gắng
loại
bỏ
watermarking tại các tần số trung bình thì sẽ phá mất đi tính trung thực của ảnh, vì một vài chi
tiết thu nhận là tại các tần số trung bình.
1.1.3
Công
nghệ
mã
hóa
và
giải
mã
Video
trong
MPEG2
•
Mã
hoá
MPEG
-2:
Tín hiệu Video và Audio được mã hóa (theo như nguyên lý mã hóa MPEG ) và tạo thành
các dòng dữ liệu cơ sở ES (Elementary Stream). Dòng ES được sử dụng để tạo nên dòng dữ liệu
cơ sở được đóng gói
PES (Packetized Elementary Stream). Dòng PES lại được tiếp tục đóng gói
tạo thành dòng truyền tải TS (Transport Stream).
•
Giải
mã
MPEG
-2:
MPEG -2 Coder và Decoder không nhất thiết phải có cùng cấp chất lượng. Tính phân cấp
cho phép các bộ giải mã MPEG đơn giản, rẻ tiền, có khả năng giải mã một phần của toàn bộ
dòng bít và như vậy có khả năng tạo được hình ảnh tuy chất lượng có thấp hơn các bộ giải mã
toàn bộ dòng bít.
1.1.4.
Các
Profiles
và
Levels
trong
MPEG2
Profiles:
Là khái niệm cho ta biết cấp chất lượng bộ công cụ mã hóa được sử dụng
chuẩn mã hóa này. Ở đây có sự thoả hiệp giữa tỷ số nén và giá thành bộ giải nén.
Levels
:
Khái
niệm Levels trong chuẩn
MPEG-2 cho
ta biết mức độ
phân
giải của
ảnh, bao gồm từ định dạng trung gian cho nguồn tín hiệu SIF ( Source Intermediate
Format), định dạng cơ sở MPEG -1 (360 x 288 @ 25Hz hay 360 x 240 @ 30Hz), đến
5
truyền hình số phân giải cao HDTV (hệ thống truyền hình với trên 1000 dòng quét).
1.2
Chuẩn
MPEG4
1.2.1
Tổng
quan
về
MPEG4
MPEG-4 là chuẩn ISO/IEC được phát triển bởi nhóm MPEG (Moving Picture Expert
Group), nhóm này cũng đã xây dựng các chuẩn MPEG-1 và MPEG-2. Các chuẩn này mô tả
phương pháp tương tác hình ảnh trên CD-ROM, DVD và truyền hình số. MPEG-4 với tên
gọi chính thức do ISO/IEC đặt tên là "ISO/IEC 14496" hoàn thành 10/1998 và trở thành tiêu
chuẩn quốc tế 1/1999. Các mở rộng để tương thích hoàn toàn với các chuẩn trước đó được
hoàn thành vào cuối năm 1999, phiên bản này được gọi là MPEG-4 Version 2, được công
nhận là chuẩn quốc tế đầu năm 2000. Một số mở rộng được các nhóm làm việc trong MPEG
tiếp tục đưa vào kể từ đó đến nay. MPEG-4 dựa vào sự thành công của ba lĩnh vực:
- Truyền hình số
- Các ứng dụng tương tác đồ hoạ (tổng hợp nội dung)
- Tương tác đa phương tiện (World Wide Web, phân phối và truy cập nội dung)
Mã hoá video theo tiêu chuẩn MPEG-4 là đề tài phức tạp có phạm vi rộng, chúng ta
đề cập về nguyên lý cơ bản của mã hoá video theo tiêu chuẩn MPEG-4, có thể được sử dụng
làm cơ sở cho việc xem xét, nghiên cứu các kỹ thuật nén video theo MPEG-4 cụ thể.
1.2.2.
Công
nghệ
mã
hóa
video
trong
MPEG-4
Không giống các chuẩn MPEG trước đó, ví dụ như trong MPEG-2, nơi mà nội dung
được tạo ra từ nhiều nguồn như video ảnh động,
đồ họa, văn bản… và được tổ hợp thành
chuỗi các khung hình phẳng, mỗi khung hình (bao gồm các đối tượng như người, đồ vật, âm
thanh, nền khung hình…) được chia thành các phần tử ảnh pixels và xử lý đồng thời, giống
như cảm nhận của con người thông qua các giác quan trong thực tế. Các pixels này được mã
hoá như thể tất cả chúng đều là các phần tử ảnh video ảnh động. Tại phía thu của người sử
dụng, quá trình giải mã diễn ra ngược với quá trình mã hoá không khó khăn. Vì vậy có thể
coi
MPEG-2
là
một
công
cụ
hiển
thị
tĩnh,
và
nếu
một
nhà
truyền
thông
truyền
phát
lại
chương
trình
của
một
nhà
truyền
thông
khác
về
một
sự
kiện,
thì
logo
của
nhà
sản
xuất
chương trình này không thể loại bỏ được. Với MPEG-2, bạn có thể bổ xung thêm các phần
tử đồ hoạ và văn bản
vào chương trình hiển
thị cuối cùng (theo
phương thức chồng lớp),
nhưng không thể xoá bớt các đồ hoạ và văn bản có trong chương trình gốc.
6
Chuẩn MPEG-4 khắc phục được hạn chế này và là một chuẩn động dễ thay đổi. Với
MPEG-4,
các
đối
tượng
khác
nhau
trong
một
khung
hình
có
thể
được
mô
tả,
mã
hoá
và
truyền đi một cách riêng biệt đến bộ giải mã trong các dòng cơ bản ES (Elementary Stream)
khác nhau.
1.2.3
Các
PROFILE
và
LEVEL
trong
MPEG4
Chuẩn MPEG-4 bao gồm nhiều tính năng ưu việt khác nhau, không phải bất kỳ ứng
dụng nào cũng đòi hỏi tất cả các tính năng của MPEG-4. Để sử dụng công cụ MPEG-4 một
cách hiệu quả nhất, mỗi thiết bị chuẩn MPEG-4 sẽ chỉ được trang bị một số tính năng phù
hợp với một phạm vi ứng dụng nhất định, và để tạo điều kiện cho người sử dụng lựa
chọn
công cụ MPEG-4, các thiết bị MPEG-4 chia thành các nhóm công cụ gọi là các profile, mỗi
nhóm (profile) chỉ chứa một vài tính năng cần thiết của chuẩn
mã hoá thích hợp cho
một
phạm vi ứng dụng nào đó. Điều này cho phép người sử dụng dễ dàng lựa chọn bộ công cụ
hỗ trợ các tính năng mà họ cần từ vô số các bộ công cụ MPEG-4 khác nhau. Mỗi profile lại
có các mức levels khác nhau, thể hiện mức độ phức tạp xử lý tính toán dữ liệu của công cụ
đó (thông qua việc định rõ tốc độ bit, con số tối đa của các đối tượng trong khung hình, độ
phức tạp của quá trình giải mã audio …)
1.2.4
Các
bộ
phận
cấu
thành
chuẩn
MPEG4
MPEG-4 bao gồm các bộ phận riêng rẽ, có quan hệ chặt chẽ với nhau và có thể được
triển khai ứng dụng riêng hay tổ hợp với các phần khác. Các phần cơ bản là:
Phần 1: System;
Phần 2: Visual;
Phần 3: Audio;
Phần 4: Conformance xác định việc triển khai một MPEG-4 sẽ như thế nào
Phần 5: Các phần
mềm tham chiếu, đưa ra
một nhóm các phần mềm tham chiếu
quan
trọng,
được
sử
dụng
để
triển
khai
MPEG-4
và
phục
vụ
như
một
ví
dụ
demo
về
các
bước phải thực hiện khi triển khai.
Phần
6:
Khung
chuẩn
cung
cấp
truyền
thông
đa
phương
tiện
tích
hợp
DMIF
(Delivery Multimedia
Integration Framework), xác định một giao diện giữa các ứng dụng
và mạng/lưu trữ.
Phần 7: Các đặc tính của một bộ mã hoá video tối ưu (bổ xung cho các phần mềm
tham chiếu, nhưng không phải là các triển khai tối thiểu cần thiết).
7
Các phần mới bổ xung tiếp cho chuẩn MPEG-4 sau này là:
Phần 8: Giao vận (về nguyên tắc không được xác định trong chuẩn, nhưng phần 8
xác định cần ánh xạ như thế nào các dòng MPEG-4 vào giao vận IP).
Phần 9: Mô tả phần cứng tham chiếu (Reference Hardware Description).
Phần
10:
MPEG-4
Advanced
Video
Coding/H.264
là
thành
tựu
mới
nhất
về
nén
video.
Phần 11: Mô tả khung hình (Scene Description - được tách ra từ phần 1).
Phần 12: Định dạng file truyền thông ISO (ISO Media File Format).
Phần
13:
Quản
lý
bản
quyền
nội
dung
IPMP
(Intellectual
Property
Management
and Protection Extentions).
Phần 14: Định dạng file MP4 (trên cơ sở phần 12).
Phần 15: Định dạng file AVC (cũng trên cơ sở phần 12).
Phần 16: AFX (Animation Framwork eXtensions) và MuW (Multi-user Worlds)
1.2.5
Một
số
ứng
dụng
chuẩn
MPEG4
Khả năng phân cấp và phân chia độc lập các khung hình thành các đối tượng khiến
cho MPEG-4 trở thành một công cụ hữu hiệu trong việc tạo thuận lợi cho các ứng dụng trên
Internet
nói
riêng
và
trên
môi
trường
mạng
nói
chung
(kể
cả
các
mạng
LAN,
WAN,
Intranet…) đó là các ứng dụng:
Truyền thông multimedia theo dòng (Multimedia stream), trong đó dòng audio và
video sẽ được biến đổi thích nghi với yêu cầu băng thông và chất lượng hình nhờ loại bỏ
những đối
tượng
(hình
ảnh,
âm thanh)
không
cần thiết khỏi
dòng
dữ liệu và
đồng bộ
các
thông tin được nhúng trong dòng dữ liệu đó.
Lưu giữ và phục hồi dữ liệu audio và video: do MPEG-4 phân chia các khung hình
thành các đối tượng, việc trình duyệt Browser trên cơ sở nội dung (đối tượng) mong muốn
sẽ được thực hiện một cách dễ dàng và nhờ vậy, các ứng dụng lưu giữ hay phục hồi thông
tin trên cơ sở nội dung MPEG-4 sẽ được thuận lợi hơn;
Truyền
thông
báo
đa
phương
tiện:
các
thông
báo
dưới
dạng
text,
audio
và
video
MPEG-4 sẽ được truyền đi với yêu cầu băng thông ít hơn, và có khả năng tự điều chỉnh chất
lượng cho phù hợp với khả năng băng thông của thiết bị giải mã;
Thông tin giải trí: những sự trình diễn
nghe nhìn tương
tác (thế
giới ảo, trò chơi
tương tác …) có thể được triển khai trên cơ sở chuẩn MPEG-4 sẽ làm giảm yêu cầu về băng
8
thông và làm cho thế giới ảo trở nên sinh động và giống như thực tế trên các trang web
1.3
Chuẩn
H264
1.3.1
Tổng
quan
về
chuấn
nén
H264
Chuẩn nén video
mới
nhất H264, còn được biết với tên gọi MPEG-4 Part 10/AVC
(Advanced
Video
Coding-
Mã
hóa
video
nâng
cao).
H264
được
mong
đợi
sẽ
trở
thành
chuẩn nén video được sử dụng rộng rãi nhất trong thời gian sắp tới.
H264
là
một
chuẩn
mở
hỗ
trợ
hầu
hết
các
công
nghệ
nén
video
hiện
nay.
Mã
hóa
H264 có thể giảm kích cỡ của một file video tới 80% so với chuẩn MPEG và 50% so với
chuẩn MPEG 4 Part 2 mà vẫn giữ lại được chất lượng của hình ảnh. Do đó, sử dụng H264
giúp giảm thiểu băng thông truyền tải trong mạng máy tính và giúp không còn tốn quá nhiều
dung
lượng
để
lưu
trữ
các
file
video.
Nhìn
theo
một
cách
khác,
với
một
số
bit
rate
thấp
nhưng chúng ta vẫn có thể có được chất lượng video tốt.
1.3.2
Những
đặc
tính
nổi
bật
của
chuẩn
H264
H264 là kết quả của một dự án hợp tác giữa tổ chức ITU-T’s Video Coding Experts
Group và ISO/IEC Moving Picture Experts Group (MPEG).
Được thiết kế nhằm giải quyết các yếu điểm trong các chuẩn mã hóa video trước đây,
H264 được đặt ra với các tính năng nổi bật sau:
Giảm được số bit rates trung bình tới 50% và vẫn đưa ra được một chất lượng video
cố định so sánh với bất kì chuẩn video nào khác.
Giảm thiểu lỗi khi truyền video qua nhiều mạng khác nhau.
Mang lại khả năng truyền video với độ trễ thấp (phù hợp trong video conferencing),
độ trễ cao hơn đi kèm với chất lượng tốt hơn.
Cấu trúc rõ ràng giúp đơn giản hóa quá trình hoạt động.
Có quá trình giải mã toán chính xác, đưa ra chính xác cần bao nhiêu phép tính số học
cần được bộ mã hóa và bộ giải mã thực hiện, do đó tránh được lỗi trong quá trình tích
lũy.
1.3.3
Kỹ
thuật
nén
video
H264
Đầu tiên bộ giải mã Entropy nhận được các dòng bit nén từ NAL, một mặt sẽ giải mã
Entropy để tách thông tin đầu mục và vector dự đoán chuyển động đưa vào bù chuyển động,
mặt
khác
các
hệ
số
DCT
được
giải
lượng
tử
và
biến
đổi
ngược
IDCT
để
biến
tín
hiệu
từ
9
miền tần số thành tín hiệu ở miền không gian, các hệ số biến đổi ngược thu được sẽ cộng
với tín hiệu dự đoán. Sau đó một phần được đưa qua bộ lọc tách khối để loại bỏ hiện tượng
nhiễu trước khi đưa vào lưu trữ, phần còn lại được sử dụng cho mục đích dự đoán.
1.3.4
So
sánh
đặc
điểm
nổi
bật
của
các
chuẩn
nén
Chuẩn
MPEG2:
Chuẩn MPEG là một chuẩn thông dụng đã được sử dụng rộng rãi trong hơn một thập
kỉ qua. Tuy nhiên, kích thước fle lớn so với những chuẩn mới xuất hiện gần đây, và có thể
gây khó khăn cho việc truyền dữ liệu.
Chuẩn
MPEG4:
MPEG-4 là chuẩn cho các ứng dụng MultiMedia. MPEG-4 trở thành một tiêu chuẩn
cho nén ảnh kỹ thuật truyền hình số, các ứng dụng về đồ hoạ và Video tương tác hai chiều
(Games, Videoconferencing) và các ứng dụng Multimedia tương tác hai chiều (World Wide
Web
hoặc
các
ứng
dụng
nhằm
phân
phát
dữ
liệu
Video
như
truyền
hình
cáp,
Internet
Video ). MPEG -4 đã trở thành một tiêu chuẩn công nghệ trong quá trình sản xuất, phân
phối và truy cập vào các hệ thống Video. Nó đã góp phần giải quyết vấn đề về dung lượng
cho các thiết bị lưu trữ, giải quyết vấn đề về băng thông của đường truyền tín hiệu Video
hoặc kết hợp cả hai vấn đề trên.
Chuẩn
H
264:
Chuẩn H 264AVC, cũng được biết đến như là chuẩn MPEG 10, nổi lên dẫn đầu trong
lĩnh vực công nghệ nén hình ảnh. H 264 cũng cho chất lượng hình ảnh tốt nhất, kích thước
file nhỏ nhất, hổ trợ DVD, và truyền với tốc độ cao so với các chuẩn trước đó. H264 cũng là
một chuẩn phức hợp.
10
CHƠNG
2
-
ỨNG
DỤNG
CÁC
CHUẨN
MÃ
HÓA
VIDEO
TRONG
MOBILETV
2.1
Tổng
quan
về
Mobi
eTV
2.1.1
Giới
thiệu
chung
Truyền
hình
di
động
(Mobile
TV)
là
công
nghệ
mã
hoá
và
truyền
dẫn
các
chương
trình truyền hình hoặc video để có thể thu được trên các thiết bị di động như điện thoại di
động, các thiết bị hỗ trợ số cầm tay (PDA), các thiết bị đa phương tiện vô tuyến, các máy
điện thoại có khả năng thu tín hiệu truyền hình di động.
Với
Mobile
TV
người
xem có
thể
truy nhập
một
dải
rộng
các
chương
trình
truyền
hình
trong
khi
di
chuyển.
Các
chương
trình
truyền
hình
có
thể
được
truyền
tải
dòng
(streaming)
tới
máy
di
động
để
xem
ở
tốc
độ
giống
như
khi
được
phát
hoặc
các
chương
trình
có
thể
được
xem
với
trễ
thời
gian
hoặc
có
thể
được
ghi
lại
toàn
bộ
giống
như
băng
cassette video hoặc đĩa DVD. Mobile TV không chỉ cho phép truyền dẫn một chiều thông
thường mà còn cho phép truyền tín hiệu truyền hình tương tác nhờ sử dụng các kênh phản
hồi cung cấp bởi mạng tế bào.
Các yêu cầu về mặt công nghệ hỗ trợ việc truyền dẫn tín hiệu truyền hình di động là:
- Truyền dẫn theo khuôn dạng lý tưởng phù hợp với các thiết bị truyền hình di động.
- Công nghệ tiêu thụ công suất thấp;
- Thu nhận tín hiệu ổn định khi di động;
-
Chất
lượng
hình
ảnh
rõ
nét
mặc
dù
bị
tổn
hao
tín
hiệu
do
fading
và
hiệu
ứng
đa
đường;
- Hỗ trợ di động ở tốc độ lên tới 250 km/h hoặc cao hơn;
- Có khả năng thu tín hiệu trong một vùng rộng khi di chuyển.
Hiện
nay có
hai
phương
pháp
chính
để
phát
tín
hiệu
truyền
hình
di
động.
Phương
pháp thứ nhất là phát qua mạng tế bào hai chiều và phương pháp thứ hai là phát qua mạng
quảng bá dành riêng, một chiều. Mỗi phương pháp có các ưu nhược điểm riêng:
- Phát tín hiệu truyền hình qua mạng tế bào có ưu điểm là sử dụng được cơ sở hạ tầng
mạng đã được thiết lập, do đó sẽ giảm chi phí triển khai. Đồng thời, nhà khai thác đã có sẵn
thị
trường
truy nhập
tới
các
thuê
bao
hiện
tại,
các
thuê
bao
này chỉ
cần
đăng
ký
dịch
vụ
truyền hình di động mà họ muốn sử dụng.
11
- Các hệ thống Mobile TV dành riêng được thiết kế để tối ưu hoá sự phân phát tín
hiệu truyền hình di động. Các hệ thống này có thể phát trên mặt đất, phát qua vệ tinh hoặc
kết hợp cả mặt đất và vệ tinh. Một trong những ưu điểm chính của các hệ thống Mobile TV
dành riêng là nội dung Mobile TV có thể được phát quảng bá tới nhiều người sử dụng đồng
thời. Nhược điểm của các hệ thống này là yêu cầu đầu tư đáng kể vào cơ sở hạ tầng mạng
và các lựa chọn nội dung bị hạn chế.
Như
vậy,
Mobile
TV
được phân
loại thành
Mobile
TV dựa trên các
mạng
3G, các
mạng quảng bá mặt đất và vệ tinh, và các mạng vô tuyến băng rộng. Đối với mạng 3G, các
dịch vụ được chia thành chế độ quảng bá, multicast và chế độ unicast. Tất cả các công nghệ
trên đều đang tiếp tục được phát triển do sự phát triển của các dịch vụ truyền hình di động.
2.1.2
Các
tiêu
chuẩn
đối
với
MobileTV
Mobile TV có khoảng trên 30 loại khuôn dạng file âm thanh gồm dạng các file đơn
giản có đuôi .wav, .mpg, Real, QuickTime, Windows Media 9 và các khuôn dạng file khác.
Các
tiêu
chuẩn
được
sử
dụng
làm
nền
tảng
chung
cho
việc
phân
phát
các
dịch
vụ
Mobile
TV.
Các
tiêu
chuẩn
có
thể
khác
nhau
dựa
trên
công
nghệ
nhưng
đã
đạt
được
sự
thống
nhất
chung.
Các
tiêu
chuẩn
Mobile
TV
được
tổng
kết
trong
khuyến
nghị
ITU-R
BT.1833, ngoài các tiêu chuẩn trong khuyến nghị này, còn có các công nghệ truyền hình di
động đã được tiêu chuẩn hoá và được triển khai ở nhiều nước trên thế giới như công nghệ
VSB tiên tiến, hệ thống quảng bá đa phương tiện di động ở Trung Quốc (CMMB).
2.1.3
Các
nguồn
tài
nguyên
đối
với
MobileTV
Đối với Mobile TV, một nguồn tài nguyên chung quan trọng là phổ tần số. Ở Anh và
Mỹ phổ tần số dành cho truyền hình truyền thống nằm trong dải VHF và UHF. Ở Anh công
ty BT Movio đã sử dụng phổ tần dành cho quảng bá âm thanh số (DAB)
để phát tín hiệu
truyền hình di động sử dụng tiêu chuẩn DAB-IP. Ở Hàn Quốc phổ tần DAB dành cho các
dịch vụ vệ tinh được sử dụng để phát dịch vụ truyền hình di động theo khuôn dạng tín hiệu
quảng bá đa phương tiện số qua vệ tinh (DMB-S). Hàn Quốc cũng cho phép sử dụng phổ
tần VHF để cung cấp dịch vụ truyền hình di động sử dụng công nghệ quảng bá đa phương
tiện
số
mặt
đất
(DVB-T).
Công
nghệ
quảng
bá
đa
phương
tiện
số
cho
các
máy
cầm
tay
(DVB-H)
là
một
tiêu
chuẩn
được
thiết
kế
sử
dụng
các
mạng
DVB-T
để
phát
các
dịch
vụ
DVB-H và sử dụng chung phổ tần của DVB-T. Ở Mỹ, Modeo, nhà khai thác DVB-H, đã
12
thiết
lập
một
mạng
hoàn
toàn
mới
dựa
trên
DVB-H
sử
dụng
băng
tần
L
ở
1670
MHz;
HiWire, một nhà khai thác khác sử dụng phổ tần 700 MHz để phát dịch vụ DVB-H
2.1.4
Công
nghệ
broadcast
và
unicast
đối
với
Mobile
TV
Có hai chế độ phân phát nội dung tới thiết bị Mobile TV là: chế độ broadcast và chế
độ unicast. Ở chế độ broadcast, cùng nội dung giống nhau được phát tới số lượng không hạn
chế người sử dụng, trong khi ở chế độ unicast nội dung được phát theo yêu cầu tới người sử
dụng cụ thể dựa trên việc lựa chọn nội dung.
2.1.4.1 Công nghệ broadcast
Công nghệ cung cấp tới nhiều người sử dụng cùng nội dung ở cùng thời điểm được
gọi là broadcast, ví dụ như sự quảng bá tín hiệu truyền hình tương tự và radio. Công nghệ
này có tính cá nhân thấp vì tất cả người sử dụng đều thu được cùng nội dung. Tuy nhiên,
công nghệ này phù hợp với thị trường vì không bị hạn chế kỹ thuật về số lượng người sử
dụng có thể thu nội dung ở cùng thời điểm.
2.1.4.2 Công nghệ unicast
Công nghệ cung cấp tín hiệu truyền hình di động theo chế độ một-tới-một được gọi
là unicast. Công nghệ này có tính cá nhân cao vì mỗi người sử dụng chỉ xem dòng truyền tải
unicast của mình. Unicast cũng có ưu điểm là các nguồn tài nguyên mạng chỉ được sử dụng
khi một người sử dụng kích hoạt việc sử dụng dịch vụ. Hơn nữa, với unicast, mạng có thể
tối ưu về mặt truyền dẫn đối với mỗi người sử dụng đơn lẻ. Tuy nhiên các mạng unicast bị
hạn chế về số lượng người sử dụng được hỗ trợ bởi vì nguồn tài nguyên là hữu hạn (băng
thông hạn chế).
2.1.5
Mobile
TV
sử
dụng
công
nghệ
vô
tuyến
băng
rộng
Các mạng vô tuyến đã và đang được sử dụng rộng rãi trên toàn cầu. Các mạng này
được
xem
là
có
tiềm
năng
lớn
để
truyền
tải
các
dịch
vụ
đa
phương
tiện
và
các
dịch
vụ
truyền hình di động.
2.1.5.1 Mobile TV sử dụng công nghệ WiFi
Các mạng WiFi (802.11x) đã trở nên phổ biến trong việc cung cấp dịch vụ truy nhập
Internet. Các mạng WiFi ngày nay đang được sử dụng nhiều trong các khu vực công cộng
như các toà nhà, quán càfê, bệnh viện, khách sạn, sân bay…WiFi cho phép truyền dẫn ở tốc
13
độ cao hơn so với các mạng di động. Do truyền dẫn dữ liệu ở tốc độ cao, WiFi được xem là
một phương thức để truyền dẫn tín hiệu truyền hình di động. Với
WiFi người sử dụng
di
động có thể tải các nội dung truyền hình qua Internet sử dụng máy di động cầm tay. Tuy
nhiên vẫn còn tồn tại các vấn đề cần giải quyết như chuyển vùng giữa mạng WiFi và các
mạng tế bào, vấn đề tính cước…
2.1.5.2 Mobile TV sử dụng công nghệ WiMAX
Công nghệ WiMAX (Liên hoạt động toàn cầu đối với truy nhập vi ba) là công nghệ
cho
phép
truyền
dẫn
các
dịch
vụ
dữ
liệu
trong
một
vùng
phủ
rộng
hơn
so
với
WiFi.
WiMAX có thể cung cấp dung lượng cao hơn và do đó đắt hơn so với WiFi. WiMAX rất
phù
hợp
để
truyền
dẫn
video
và
nội
dung
đa
phương
tiện.
Các
ứng
dụng
điển
hình
của
WiMAX là âm thanh và video theo yêu cầu. Với WiMAX, người sử dụng di động có thể tải
về hoặc xem dòng video trực tiếp khi đang di chuyển trên tàu, ôtô…
WiMAX hỗ trợ sự chuyển vùng giữa mạng WiMAX và các mạng di động, các máy
cầm tay di động có thể chuyển từ mạng di động tới các kết nối vô tuyến. Tuy nhiên, nhược
điểm
của
WiMAX
là
việc
sử
dụng
dải
phổ
tần
số
cần
được
cấp
phép,
không
giống
như
WiFi.
WiMAX di động là công nghệ tiềm năng cung cấp các
dịch vụ đa phương tiện với
các lý do sau :
- Đa số các công nghệ phân phát đa phương tiện di động dựa trên chế độ IP unicast
hoặc multicast.
- Các công nghệ WiMAX cung cấp môi trường để phân phát dịch vụ đa phương tiện
trên nền IP, và được xem là công nghệ tiềm năng khi phổ tần của các mạng 3G và DVB-H
hạn hẹp.
-
Các
máy
điện
thoại
di
động
đã
bắt
đầu
cung
cấp
các
giao
diện
WiFi
(802.16b),
WiMAX hoặc WiBro (tiêu chuẩn vô tuyến băng rộng được phát triển bởi Viện nghiên cứu
điện tử và viễn thông Hàn Quốc ETRI).
- Các ứng dụng khả dụng có thể cung cấp dịch vụ Mobile TV trên nền WiMAX hoặc
vô tuyến băng rộng với sự tương thích toàn cầu.
Ưu điểm của WiMAX và WiFi là chúng đều cung cấp chế độ unicast điểm-tới-điểm
cũng như phát nội dung quảng bá trong một mạng. Điều này làm cho WiMAX và WiFi phù
hợp để cung cấp các dịch vụ quảng bá truyền hình di động, truyền tải dòng video và video
theo yêu cầu với sự tương tác đối với người sử dụng di động.
14
Tại Việt Nam, việc phát triển các dịch vụ 3G trong những năm sắp tới không chỉ là
con bài chiến lược của các mạng di động trong việc bắt kịp với xu hướng về công nghệ mới
mà còn là yếu tố then chốt trong việc cải thiện chất lượng dịch vụ tại khu vực đô thị, cũng
như giữ gìn các khách hàng VIP, thu hút thêm các khách hàng trẻ tuổi. Đây cũng chính là lý
do vì sao các mạng di động lớn nhất Việt Nam đều có những cam kết đầy quyết tâm cho
việc đầu tư 3G.
Chuẩn
3G
mà
Bộ
TT-TT
cấp
phép
cho
các
nhà
cung
cấp
dịch
vụ
viễn
thông
là
WCDMA
(tiêu
chuẩn
IMT-2000)
sử
dụng
băng
tần
1900-2200
MHz.
Các
đơn
vị
không
được cấp phép lần này vẫn có thể cung cấp dịch vụ 3G ở băng tần khác hoặc liên danh với
các đơn vị có giấy phép 3G nếu muốn sử dụng băng tần 1900-2200 MHz.
Sau khi chính thức nhận được giấy phép 3G một tháng, VinaPhone sẽ cung cấp những
dịch vụ công nghệ 3G đầu tiên tới khách hàng. Thời điểm triển khai 3G của MobiFone là 3
tháng
sau
khi
được
cấp
phép.
Trong
khi
đó,
Viettel
là
9
tháng.
Vietnamobile
(cũng
như
EVN Telecom) không
thể triển khai dịch vụ
3G đầu tiên
muộn hơn
9 tháng sau khi nhận
được giấy phép.
Theo nhận định của các chuyên gia về viễn thông, có thể dự đoán một mạng di động sẽ
triển khai phủ sóng cũng như cung cấp các dịch vụ 3G ra sao căn cứ vào một số yếu tố. Thứ
nhất, những thử nghiệm triển khai thành công 3G trước đó với các đối tác quốc tế. Thứ hai,
kinh nghiệm triển khai các dịch vụ trên nền 2G. Thứ ba, đội ngũ nhân sự có trình độ tiếp
nhận, triển khai công nghệ mới ra sao…
Viễn cảnh kinh doanh 3G cũng không đơn giản, trong 2 năm đầu sẽ không có quá 8%
người sử dụng chuyển đổi sang 3G và với sự sụt giảm về doanh số do cạnh tranh cộng với
việc phải đầu tư rất lớn cho 3G sẽ gây sức ép không nhỏ cho doanh nghiệp, khiến bài toán
kinh doanh càng trở nên phức tạp và khó khăn hơn.
2.2
Mã
hóa
trong
MobileTV
Các nguồn âm thanh và video có thể là các máy quay phim video hoặc máy thu/giải
mã tín hiệu từ vệ tinh hoặc nội dung video, băng video đã được lưu giữ cần phải được mã
hóa
thành
các
gói
IP
và
được
truyền
qua
các
hệ
thống
di
động
đến
các
thiết
bị
đầu
cuối.
Hình dưới đây mô tả quá trình truyền tải tín hiệu MobileTV trong hệ thống di động.
Các tín hiệu video/audio sẽ thu được trên các thiết bị di động như điện thoại di động,
các thiết bị
hỗ trợ
số
cầm tay (PDA), các thiết bị đa phương tiện
vô tuyến, các
máy điện
thoại có khả năng thu tín hiệu truyền hình di động. Tuy nhiên, các máy thu di động có công
15
suất pin hạn chế, kích thước màn hình nhỏ, anten nhỏ được tích hợp ở bên trong máy và có
bộ nhớ giới hạn. Hơn nữa máy thu có thể chuyển động với tốc độ thậm chí lên tới 200 km/h.
Do đó, các chuẩn mã hóa video có vai trò rất quan trọng trong công nghệ Mobile TV trên
nền 3G.
Trong luận văn chỉ khảo sát công nghệ MobileTV truyền dẫn trong mạng 3G và các
vấn đề mã hóa dựa theo chuẩn 3GPP.
2.2.1
Mã
hoá
nội
dung
Để có thể truyền tải các file đa phương tiện
âm thanh và video
hoặc tín hiệu truyền
hình trực tiếp truyền tải dòng, các mạng di động 3G cần đáp ứng được các yêu cầu sau đây:
- Mạng cần có các giao thức đã được tiêu chuẩn hoá và thống nhất để thiết lập cuộc
gọi, trả lời, thiết lập cuộc gọi video hoặc truyền tải dòng video. Các giao thức này cần được
tuân theo đồng nhất qua các mạng để các cuộc gọi có thể được thiết lập giữa những người
sử dụng ở các mạng khác nhau.
- Mạng phải có các tiêu chuẩn để mã hoá âm thanh và video đối với các ứng dụng khác
nhau như truyền tải dòng video và cuộc gọi video. Các giao thức sử dụng các thuật toán nén
hiệu quả
cao như MPEG-4 hoặc
H.264 để
giảm băng
thông
yêu
cầu đối với âm thanh và
video đã được mã hoá.
- Mạng phải đáp ứng được tốc độ dữ liệu phù hợp để có thể truyền tải các khung video
liên tục không bị ngắt quãng.
2.2.2
Mã
hoá
video
Với MPEG-4 có cơ chế khác để cung cấp tốc độ bit cao hơn tới các client khi mạng có
băng thông cao hơn. Server truyền tải dòng MPEG-4 sẽ phát dòng cơ sở có độ phân dải thấp
và một số dòng phụ. Client thu dòng cơ sở và các dòng phụ này khi băng thông khả dụng
làm cho chất lượng hình ảnh tốt hơn.
Vì MPEG-4 có nhiều profile và lớp, 3GPP đã tiêu chuẩn hoá các đặc tả sau cho việc
sử dụng trong mạng 3G (các bộ mã hoá/giải mã 3G-324M):
Mã
hoá
video:
Với
profile
MPEG-4
đơn
giản
lớp
1,
hỗ
trợ
được
khuyến
nghị
là
MPEG-4 profile hiển thị đơn giản lớp 1 (ISO/IEC 14496-2). Tốc độ khung có thể lên tới 15
fps và độ phân giải là 176 x 144 pixels.
Mã
hoá
tiếng:
Mã
hoá
và
giải
mã
AMR
là
yêu
cầu
bắt
buộc,
G723.1
được
khuyến
nghị.
16
2.3
Bảo
mật
trong
Mobi
eTV
2.3.1
Bảo
mật
đường
truyền
tín
hiệu
Sau khi người sử dụng thu được thông tin truy nhập qua thông báo dịch vụ, hệ thống
không thể hạn chế việc thu dòng media. Các dòng media phải được mật mã để giới hạn khả
năng thu tới những người sử dụng đã đăng ký sử dụng dịch vụ. Nói khác đi, tất cả máy thu
có
thể
thu
được
các
dòng
media
nhưng
chỉ
có
những
người
sử
dụng
đã
đăng
ký
sử
dụng
dịch vụ mới có thể giải mật mã và chi trả cho các dịch vụ này.
2.3.2
Bảo
mật
nội
dung
Có 3 phương pháp để bảo mật nội dung :
Cách bảo mật đầu tiên đó là bảo mật phát sóng được cung cấp bởi phương pháp truyền
thống tùy thuộc vào hệ thống truy cập có thể thay đổi để phù hợp với điều kiện môi trường
di động. Điều này dẫn tới thiết bị cầm tay sẽ được độc quyền cho các mạng cụ thể.
Phương
pháp
thứ
hai
là
sử
dụng
mã
hóa
thông
thường
tại
các
cấp
truyền
dẫn
như
ISMAcrypt và sử dụng tính độc quyền hay DRM mở tại cấp nội dung.
Phương pháp thứ ba là sử dụng một
mã công khai như IPsec tại lớp phát sóng hoặc
cũng có thể sử dụng một DRM 2.0 công khai để bảo vệ nội dung.
Phương pháp thứ hai và thứ ba có ưu điểm là các hệ thống phát sóng sẽ thông nhất và
thêm vào đó các thiết bị cầm tay có thể triển khai cho bất kì nhà khai thác mạng nào.
2.3.3
Bảo
mật
thiết
bị
đầu
cuối
Cấu trúc thu của điện thoại di động DVB-H gồm 2 phần:
Một
bộ
giải
điều
chế
DVB-H
(gồm
khối
điều
chế
DVB-T,
mođun
Time
slicing
Mođun MPE-FEC) và một đầu cuối DVB-H.
Tín hiệu vào là tín hiệu DVB-T. Khối điều chế DVB-T thu lại các gói dòng truyền tải
MPEG-2, tín hiệu này cung cấp các mode truyền dẫn (2K, 8K và 4K) với các tín hiệu mang
thông số truyền dẫn –TPS tương ứng. Mođun Time Slicing giúp tiết kiệm công suất tiêu thụ
và hỗ trợ việc chuyển giao mạng linh hoạt hơn. Mođun MPE-FEC cung cấp mã sửa lỗi tiến
cho phép bộ thu có thể đương đầu với các điều kiện thu đặc biệt khó khăn.
Hiện nay nhiều hãng sản xuất điện thoại đã có các thế hệ điện thoại di động DVB-H
đầu tiên: NOKIA 7700 và 7710, PHILIPS HoTMAN 2, SIEMENS…
17
CHƠNG
3
-
NGHIÊN
CỨU
CÁC
GIẢI
PHÁP
ÁNH
GIÁ
CHẤT
LỢNG
VIDEO
TRONG
CÁC
HỆ
THỐNG
DI
ỘNG
Trong hai chương trước luận văn đã nghiên cứu các chuẩn mã hóa video và ứng dụng
trong MobileTV. Một vấn đề cần phải tiếp tục nghiên cứu là tín hiệu video khi phân phát
trong các hệ thống di động có bảo đảm chất lượng không? Vì thế cần phải nghiên cứu các
giải pháp đánh giá chất lượng chất lượng video trong các hệ thống di động. Đây chính là nội
dung sẽ được trình bày trong chương này.
3.1.
Các
phơng
pháp
o
ánh
giá
chất
ng
video
Chất
lượng
ảnh
video
tác
động
tới
chất
lượng
dịch
vụ
trong
các
hệ
thống
di
động
có
thể
được đo theo hai cách chủ yếu như sau:
Định
tính:
sử
dụng
thực
nghiệm
quan
sát
và
những
người
tham
gia
đánh
giá
chất
lượng theo các thang điểm như MOS.
Định lượng: tại lớp dịch vụ, sử dụng các thiết bị đo để đo các tham số khác nhau ảnh
hưởng tới chất lượng tổng thể của tín hiệu video.
3.1.1
Phương
pháp
đo
chất
lượng
video
định
tính
Giải
pháp
này sử
dụng
một
nhóm
người
tham gia
xếp
loại
và
đánh
giá
chất
lượng
hình ảnh. Môi trường và người được dùng để kiểm tra định tính thay đổi tùy theo nhà cung
cấp dịch vụ. Các bước tiến hành để xác định số đo định tính đối với chất lượng video như
sau:
Xác định một loạt các mẫu video để tiến hành kiểm tra
Lựa chọn một số tham số cấu hình
Thiết lập môi trường kiểm tra tuân thủ với các tham số cấu hình mong muốn
Tập hợp người tham gia vào kiểm tra
Tiến hành kiểm tra và phân tích các kết quả.
3.1.2
Phương
pháp
đo
chất
lượng
video
định
lượng
Để đánh giá chất lượng video trong môi trường di động, điều quan trọng là cần thực
hiện các phép đo chất lượng video một cách hiệu quả theo thời gian. Các kỹ thuật đo chất
lượng video định lượng dù không chính xác như phép đo chất lượng video định tính, nhưng
tạo ra được sự hài hòa khi thực hiện các phép đo đánh giá chất lượng video.
18
Có thể phân loại các kỹ thuật đo chất lượng video định lượng thành bốn nhóm chính:
Các kỹ thuật dựa trên các mô hình cảm nhận video của con người
Các kỹ thuật dựa trên các tham số tín hiệu video
Các kỹ thuật dựa trên các tham số suy giảm chất lượng mạng
Các kỹ thuật dựa trên khoảng thời gian suy giảm chất lượng tín hiệu video
3.2
Khảo
sát
phần
mềm
ánh
giá
chất
ng
video
3.2.1
Giới
thiệu
chung
-
T
n
v
phi
n
bản
phần
mềm
MSU Video Quality Measurement Tool 2.7.2
-
Nh
sản
uất
bản
qu
ền
Phần
mềm
MSU
Video
Quality
Measurement
Tool
2.7.2
là
sản
phẩm
của
công
ty
MSU Graphics & Media Lab (Video Group).
Bản dùng thử của phần mềm có thể download miễn phí tại địa chỉ:
-
Mô
tả
các
chức
năng
chính
của
phần
mềm
Chức năng chính của phần
mềm là so sánh sự sai khác giữa file video gốc với các file
video nhận được sau quá trình mã hóa và giải mã theo các chuẩn khác nhau. Cụ thể là:
Chức năng tính toán:
Các giá trị tham số cho mỗi khung.
Giá trị trung bình cho chuỗi.
Các giá trị tham số cho thành phần màu cụ thể.
Hỗ trợ 20 tham số đối tượng:
Hỗ trợ hơn 20 mẫu video:
-
Y
u
cầu
hệ
thống
Máy tính với hệ điều hành Windows 2000, XP.
Tệp chương trình: netspeed_tool.exe với dung lượng 746 KB.
3.2.2
Khảo
sát
tính
năng
và
phương
pháp
đo
của
phần
mềm
-
C
i
ặt
các
tham
số
o
File selection:
Original file: file video gốc. Các file khác sẽ được so sánh với nó.
19
Processed (compressed): file được xử lý, nó sẽ được so sánh với file gốc.
Comparative analysis: Cho phép so sánh một lần hai file với cùng một file gốc
(ví dụ được nén bởi các mã khác nhau).
Second
processed
(another
codec):
file
thứ
hai
được
xử
lý
để
phân
tích
so
sánh.
Use mask file: Kích hoạt masking.
Use black
mask: Các
vùng đen của
một
mask file đưa ra là những vùng
mà
nên được đánh dấu.
Open with AviSynth: Chương trình cố gắng phát ra AviSynth script thích hợp
và
mở
file
sử
dụng
script
này.
Checkbox
chỉ
được
kích
hoạt
khi
AviSynth
được
cài
đặt
trong
máy
tính.
Người
dùng
có
thể
điều
chỉnh
sự
tạo
ra
script
bằng cách dùng nút Advanced.
Preview: Sử dụng nút Preview để duyệt trước nội dung file được chọn.
Metric selection: Lựa chọn mức độ, đơn vị đo.
Output Selection:
Save CSV file: Lưu kết quả vào file CSV.
Save
metric
visualization
video/image:
lưu
video
với
metric
visualization
được
chọn.
Save “bad frames”: Tự động chọn và lưu các khung với sự sai khác lớn nhất giữa
file gốc và các file được xử lý.
-
Thực
hiện
o
Nhấn nút Process
-
Kết
quả
o:
Per-frame
values:
file
CVS
(comma
separated
values),
bao
gồm
các
giá
trị
của
mỗi tham số được chọn cho mỗi khung của mỗi file tham chiếu.
Avarage values: file CVS, bao gồm các giá trị trung bình của mỗi tham số được
chọn cho mỗi file tham chiếu.
Visualization: file video (*.AVI) cho biết các giá trị tham số trong mỗi pixel của
mỗi
khung
của
mỗi
video
tham chiếu.
Visualization
video
được
tạo
ra
cho
mỗi
tham số mỗi thành phần màu và mỗi file tham chiếu.
-
Xử
ý
kết
quả:
Thống kê các giá trị sau đây
Số mã có bị mờ hơn
mã gốc trên khung nào và mặt nạ trung bình.
20
Số mã có nhiều blocking hơn mã gốc trên khung nào và mặt nạ trung bình.
Số
mã
có
chất
lượng
thấp
hơn
mã
gốc
trên
khung
nào,
mặt
nạ
trung
bình
trong
PSNR, VQM, SSIM.
3.2.3.
Đánh
giá
tính
năng
đo
kiểm
của
phần
mềm
-
ánh
giá
chung:
Phần
mềm
MSU
Video
Quality
Measurement
Tool
2.7.2
có
các
ưu,
nhược
điểm sau đây:
Phần mềm cho phép thực hiện đánh giá chất lượng video đã qua một hệ thống truyền
dẫn/xử lý thông qua việc so sánh file video gốc và file video nhận được tại thiết bị di
động đầu cuối
Phần
mềm có các tính
năng kết xuất dữ liệu khi thực hiện các phép đo dưới nhiều
dạng theo các độ đo khác nhau. Do đó rất thuận tiện cho việc phân tích đánh giá và
tìm lỗi khi truyền tín hiệu video trong các hệ thống di động.
-
Kết
uận:
Có thể sử dụng phần mềm MSU Video Quality Measurement Tool 2.7.2 làm công cụ
đo đánh giá chất lượng video trong các hê thống di động
Trong chương này đã trình bày các phương pháp đo đánh giá chất lượng video
đối
với hệ thống di động.
Để đánh giá chất lượng video trong môi trường di động, điều quan
trọng là cần thực hiện các phép đo chất lượng video một cách hiệu quả theo thời gian. Các
kỹ thuật đo chất lượng video định lượng dù không chính xác như phép đo chất lượng video
định
tính,
nhưng
tạo
ra
được
sự
hài
hòa
khi
thực
hiện
các
phép
đo
đánh
giá
chất
lượng
video. Các phép đo chất lượng video định lượng có ưu điểm là thực hiện nhanh chóng để hỗ
trợ
cho
việc
điều
chỉnh
tối
ưu
quá
trình
phát
và
thu
tín
hiệu
video
trong
các
hệ
thống
di
động. Các phép đo định lượng và các đánh giá định tính sẽ hỗ trợ cho nhau trong quá trình
đánh giá chất lượng tín hiệu video trong các hệ thống di động.
21
KẾT
LUẬN
+
Kết
quả
ạt
c
của
uận
văn
Luận
văn
ã
ạt
c
các
kết
quả
sau:
- Nghiên cứu các chuẩn mã hoá video bao gồm MPEG 2, MPEG 4 và H264
- Nghiên cứu ứng dụng các chuẩn mã hóa trong MobileTV
- Đề xuất các giải pháp đánh giá chất lượng tín hiệu video và các phần mềm đo chất
lượng tín hiệu video trong hệ thống di động
+
Một
số
hớng
nghi
n
cứu
tiếp
theo:
Sau khi nghiên cứu xong đề tài, em xin đưa ra một số hướng nghiên cứu tiếp theo:
- Biện pháp đảm bảo chất lượng cho mạng di động 3G
- Xây dựng phần mềm đánh giá chất lượng video
- Các tiêu chuẩn về bảo mật trong mạng 3G
22
DANH
MỤC
TÀI
LIỆU
THAM
KHẢO
[1] TS. Nguyễn Thanh Bình, Ths. Võ Nguyễn Quốc Bảo, “Xử lý âm thanh, hình ảnh”, Học
viện công nghệ Bưu chính viễn thông, Hà Nội, 2007.
[2]
KS. Cao Văn Liết,
“Bù chuyển động trong kỹ thuật mã hóa nội dung nguồn video tự
nhiên sử dụng tiêu chuẩn nén MPEG-4”, Tạp chí khoa học kỹ thuật truyền hình 1/2005.
[3]
KS.
Trương
Thị
Thủy,
“Tiêu
chuẩn
mã
hóa
tiên
tiến
H.264-MPEG-4
AVC”,
Tạp
chí
khoa học kỹ thuật truyền hình 1/2004.
[4] Th.S. Nguyễn Minh Hồng, “Chuẩn nén H.264/AVC và khả năng ứng dụng trong truyền
hình”, Tạp chí khoa học kỹ thuật truyền hình 2/2005.
[5] Gs.TS. Nguyễn Kim Sách, “Truyền hình số có nén và Multimedia”, Nhà xuất bản khoa
học kỹ thuật, Hà Nội, 2000.
[6] Ths Phạm Đình Chung, Ths Vũ Anh Tuấn, “Nghiên cứu các công nghệ truyền hình di
động
(MobileTV)
và
khả
năng
ứng
dụng
tại
Việt
Nam”
-
Đề
tài
cấp
Bộ,
Mã
số
108-09-
KHKT-RD, Viện KHKTBĐ, 2009
[7] Iain E. G. Richardson, “H.264 And MPEG-4 Video Compression”, The Robert Gordon
University, Aberdeen, UK, 2003
[8] JVT “Draft ITU-T recommendation and final draft international standard of joint video
specification (ITU-T rec. H.264– ISO/IEC 14496-10 AVC),”
[9]
THOMAS
SIKORA,
“MPEG-1
and
MPEG-2
Digital
Video
Coding
Standards”,
McGraw Hill Publishing Company, 2004
[10] T. Wiegand, G.J.
Sullivan, G. Bjontegaard, A. Luthra, ”Overview of
the
H.264/AVC
Video Coding Standard” Senior Member, IEEE, 2003
[11] :
[12]
[13] , University of Illinois at Chicago (UIC)
[14]
[15]