Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (6.18 MB, 26 trang )
<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">
<small>HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG</small>
<small>VŨ THỊ HUONG £ «ANG</small>
NGHIÊN CUU UNG”. 'NG CUA. SUAN NEN MPEG-4
<small>CHUY. ' .GANH: KY THUẬT VIÊN THONGMA SO: 60.52.02.08</small>
TOM TAT LUAN VAN THAC SI
HÀ NỘI - 2014
</div><span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2"><small>Luận văn được hồn thành tại:</small>
<small>HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THONG</small>
<small>Phản biện 1: TS.Nguyễn Ngoc Mi: .</small>
<small>Phản biện 2: PGS.1s. LEM, Tú</small>
<small>Luận van sé duoc bảo vệ trước Hội đông cham luận văn thạc sĩ</small>
<small>tại Học viện Cơng nghệ Bưu chính Viễn thơng</small>
<small>Vào lúc: ...9. g10 ..30.. ngày ...09... tháng .08.. năm ..2014..</small>
<small>Có thê tìm hiêu luận văn tại:</small>
<small>- Thư viện của Học viện Công nghệ Bưu chính Viễn thơng</small>
</div><span class="text_page_counter">Trang 3</span><div class="page_container" data-page="3">Với sự phát triển nhanh chóng của mạng Internet băng rộng làm
thay đổi cả về nội dung và kĩ thuật truyền hình. Hiện nay truyền hình có nhiều dạng khác nhau: truyền hình số, truyền hình vệ tinh, truyền
hình cáp, truyền hình Internet và IPTV. IPTV đang là cấp độ cao nhất và là cơng nghệ truyền hình của tương lai.
<small>Vì đữ liệu video thô chiếm một lượng lớn băng thông nên thườngsử dụng nén dé thu được hiệu quả truyền dẫn. Nén cho phép các nhàcung cấp dịch vụ IPTV quảng bá các kênh video và audio chất lượng</small>
cao qua một mang IP băng rộng. Chuan nén video MPEG-4 Part 10/H.264 là một trong những định dạng hav được sử dụng nhất hiện nay để ghi, nén, phân phối video độ nét c „ với nhiều ứng dụng rộng rãi từ cỏc ng dng video streaming â .a ơternet tc bit thấp tới quảng bá HDTV. Chuan MPEG-4 Part 10/H.. ^4 kế thừa các ưu điểm của các chuẩn nén trước đó như M: 7G-2, MPE..4.... nhưng MPEG-4 Part 10/H.26MPEG-4 có hiệu suất .en tốt 1. + và linh hoạt hon trong việc lưu trữ và truyền dẫn.
Với đề tài:" Nghiên cứu tm, dung của chuẩn nén MPEG-4 Part
10/H.264 kết hợp -_ “ideo stre. +ing", luận văn của em gồm 3
Chương 1: Tu + qu’ . về các chuẩn nén trong video streaming.
<small>Chương 2: Chua. ‘én video MPEG.</small>
Chương 3: Ung du. - của bộ mã hóa MPEG-4 Part 10/H.264 va
<small>video streaming vào IPTV.</small>
</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4"><small>TRONG VIDEO STREAMING</small>
<small>1.1. Giới thiệu</small>
Có 2 mơ hình truyền dẫn video lưu trữ trên mạng Internet đó là chế độ download và chế độ streaming. Video streaming có các u
cầu về băng thơng, độ trễ và mất mát. Tuy nhiên, mạng Internet nỗ
lực tối đa hiện nay không cung cấp bất kỳ đảm bảo về QoS.
Nén video làm giảm số bit dùng dé biểu diễn từng pixel trong anh. Các thuật toán nén ảnh sinh ra các tạp nhiễu (artifact) nhìn thấy được.
<small>Nén ln là sự được- mat giữa mức artifact và băng thông.</small>
<small>1.2. Các yêu cầu kỹ thuật của các chya nén trong videostreaming</small>
e Bang thong: Dé thu được cha ‘rong chap nhan duoc
theo cảm giác, một ứng dung sti. wing điển inh cần có u cầu
băng thơng tối thiéu.
<small>e Tré: Streamine . ‡eo yêu ca. ‘ré end-to-end giới hạn dé</small>
<small>gói có thê tới phía thu de aig lúc 4 giải mã va hién thị.</small>
<small>e Mất gói: “+ gói là k. “ng thé tránh được trên Internet.</small>
Do đó, mong mv “¿¡ một x_ Jeo stream mạnh tránh mat gol.
e Chức ¬ăng. .nu video-cassette-recoder (VCR): Một số
ứng dung streaming su cầu các chức năng giống như VCR như là
dừng, tạm dừng/tiếp tụ‹ “i, ...
¢ Độ phức tạp giải mã hóa: Một số thiết bị như điện thoại
<small>di động, thiết bị số cá nhân (PDA) yêu cầu tốn ít năng lượng. Do đó,</small>
<small>u cầu độ phức tạp giải mã hóa thấp.</small>
<small>1.3. Các chuẩn nén trong video streaming1.3.1. Cơ sở nén</small>
Một video clip là một chuỗi các ảnh hoặc khung. Từng ảnh có thể được xử lý riêng biệt như là một ảnh tĩnh. Một ví dụ điển hình là
chuẩn JPEG..
<small>s* Nén trong khung</small>
Nén một ảnh đơn trong miền không gian được gọi là nén trong
<small>khung.</small>
</div><span class="text_page_counter">Trang 5</span><div class="page_container" data-page="5"><small>s* Nén liên khung</small>
Một chuỗi các ảnh video có sự thay đổi nhỏ từ một ảnh này tới ảnh tiếp theo, ngoại trừ một số thay đổi cảnh. Nén theo thời gian hoặc liên khung loại bỏ dư thừa giữa các khung liên tiếp nhau.
<small>“+ Thị giác</small>
Võng mạc và vỏ não cùng nhau xử lý cảnh nhìn thấy theo cách phát hiện các biên và các đường. Một kiến trúc nén tốt là phải tận dụng được cơ chế của thị giác.
<small>1.3.2. Các thuật toản nén</small>
<small>Có 4 loại dư thừa chính trong tín hiệu video là: khơng gian, thời</small>
gian, giác quan, thống kê.
<small>s* Mã hóa trong khung hay nén” ơng gian</small>
Mã hóa biến đổi, trong đó một ble «c >» các pixel được biến đồi sang miền tần số, sau đó lượng tử hóa và mã › 2 entropy.
Mã hóa biến đổi
Mã hóa biến đổi chuyển Z ¡ mảng k. *ng gian của các pixel block, một bản đồ bit sang miề. ta số. Biến a. cosin rời rac DCT được thơng qua rộng rãi cho video ¬dec. Một số biến đổi khác được
<small>nghiên cứu là DFT... a WHT.</small>
<small>Nén wavelet</small>
Cung cấp suv *u 7 en lại thời gian-tần số của ảnh va có thé thu
được cùng chất lượn, ảnh như DCT ở tỉ số nén cao hơn nhiều.
<small>s* Nén dựa vào. Â hình</small>
Đây là sự thay thé cho mã hóa dang sóng. Codec cố gang mơ hình hóa cảnh và sau đó phát các ký hiệu mơ tả, thay vì biểu diễn lại ảnh
<small>khơng gian.</small>
<small>Chia nhỏ (fractal)</small>
Trong những anh nhất định, các phan của anh tương đồng với các phần khác của cùng một ảnh.Các phan giống nhau của ảnh được định
<small>vị và sau đó áp dụng thuật tốn chia nhỏ.</small>
Mã hóa dựa trên doi twong
Mã hóa đối tượng được thơng qua là cơ sở cho mã hóa MPEG-4. Một cảnh được biểu diễn lại bằng một số đối tượng video. Mỗi đối
</div><span class="text_page_counter">Trang 6</span><div class="page_container" data-page="6">như DCT và wavelet có thé được sử dụng dé nén các đối tượng.
<small>Mã hóa entropy</small>
Mã hóa entropy có thê mang lại biểu diễn ảnh ngắn hơn nhiều với bang cách sử dụng các từ mã ngắn hon cho các chuỗi bit có khả năng
<small>hơn và từ mã dài hơn cho các chuỗi ít khả năng hơn.</small>
Biến đổi cosin rời rac
Biến đổi này là cơ sở cho tat cả các codec video phổ biến. Ảnh được chia thành các block thơng thường và sau đó mỗi block biến đơi
thành block hệ số biến đổi. Các hệ số được chuẩn hóa và lượng tử
<small>s* Mã hóa độ dài thay doi (VI „</small>
<small>Bằng cách quét các hệ số theo due zg. >zag thì kết quả dần chạytới 0. Các hệ số sau đó được ch"yên đổi t. xh một chuỗi các cặpcường độ chạy. Các hệ số cườnz đọ hay này sac *6 được mã hóa với</small>
từ mã độ dài thay đơi.
<small>s* Nón liên kh' .g +y nén the. 'hời gian</small>
<small>Co sở của loại nén nay là c ˆ phát sự sai khác giữa các khung.</small>
Hau hết sự sai khae |... ¬áckhung ` từ đối tượng chuyền động.
% Uớ ánh ch yên động
<small>Để tạo ra vec + ch yên động, bộ mã hóa phải ước tính chuyển</small>
động của các phần i. anh. Dự đốn chuyển động so sánh một khung
<small>trước đó với khung hig. ‘tai, va sau đó ước tính bao nhiêu block của</small>
anh đã di chuyên.
<small>1.3.3. Các bộ codec nén</small>
<small>1) H.261 - hội nghị video</small>
Đây là chuẩn mã hóa video đầu tiên và là khởi đầu cho chuẩn
<small>MPEG-1. H.261 cho điện thoại video và hội nghị video qua đường</small>
ISDN. Chuẩn định nghĩa kích thước màn hình là định dạng trung
<small>bình chung (CIF) 352 x 288 va Quarter CIF 176 x 144 pixel, sử dung</small>
quét tiến lên va lay mau 4:2:0. Tốc độ dữ liệu từ 64 kb/s tới 2 Mb/s được chuẩn hỗ trợ. Nén dựa trên DCT với mã hóa độ dài thay đơi.
<small>2) MPEG-I</small>
</div><span class="text_page_counter">Trang 7</span><div class="page_container" data-page="7">Độ phân giải thông thường là nguồn hoặc định dạng đầu vào chuẩn (SIF). Độ phân giải không gian khác nhau : 352 x 288 ở 25 fps cho PAL va 351 x 240 ở 30 fps cho NTSC. Chuan này sử dụng quét tiến lên. Nén video giống như H.261 sử dung DCT với mã độ dai thay đối.
Chuan này được thiết kế cho các ứng dụng lưu trữ như CD-ROM, tốc độ dữ liệu lên tới 1.5 Mb/s và không hỗ trợ streaming.
<small>3) H.263</small>
H.263 là sự phát triển của H.261 hướng tới các ứng dụng tốc độ bit thấp, có từ năm 1992. Chuẩn H.263 hỗ trợ độ phân giải SQCIF, QCIF, CIF, 4CIF, 16 CIF. H.263 hiện nay 1 chuẩn cơ sở cho mã hóa
<small>video tự nhiên MPEG-4.</small>
<small>4) MPEG-2</small>
Một hệ thống độ phân giải ca hơn, cha tượng cao cho truyền hình quảng bá, MPEG-2 dành dé ay thế ch. hệ thống tổng hop tương tự (NTSC, PAL) bane .ệ thống -uyén dẫn số, mã hóa DVD.
Ứng dụng chính sử dune „¿+ thơng ke. lớn hơn 4 Mb/s. Profile
chính ở mức chính (MP@ML) ›. TV độ nét chuẩn với tốc độ dữ liệu
lên tới 15 Mb/s. Ch uu. Ay dành chỗ trợ tốc độ bit TV độ nét cao
<small>(lên tới 80 Mb/s’ va một ofile studio chỉ có khung I (50 Mb/s).5) MP. ¬-4</small>
MPEG-4 là hệ ti. 12 MPEG đầu tiên mà hỗ trợ streaming là một phan của chuẩn. MPEL. + phiên bản 1 hỗ trợ: Tốc độ bit điển hình từ 5 kb/s tới 10 Mb/s; định dạng quét: video trộn lẫn hoặc lũy tiễn. Độ phân giải: điển hình từ sub-QCIF tới trên HDTV.
MPEG-4 khơng dùng bản đồ bit 2 chiều va vng góc như các chuẩn mã hóa trước đó mà thơng qua mã hóa đối tượng.
<small>6) AVC (Advanced Video Codec, H.264)</small>
Nhóm video kết hợp (JVT - Joint Video Team) được thành lập dé phát triển video codec tiên tiến hay AVC. Nó được gọi là H.264 bởi
ITU và MPEG-4 Part 10 bởi tổ chức MPEG.
<small>“+ Các chuẩn MPEG khác</small>
<small>MPEG-7</small>
</div><span class="text_page_counter">Trang 8</span><div class="page_container" data-page="8">Đây là hệ thống được chuẩn hóa để mơ tả nội dung âm
thanh-hình ảnh. Điều này cho phép tìm kiếm nhanh và hiệu quả. Các ảnh và âm thanh có thê được trình bày trong các trừu tượng: bố cục, mô tả văn bản của nội dung, màu sắc.
<small>MPEG-21 là một framework cho các tai nguyên da phương tiện</small>
tích hợp qua một dải rộng các nền tang va dịch vu. Streaming media
là một phan quan trọng của framework này. Một trọng tâm của
<small>MPEG-2I là bán nội dung. Chia khóa là quản lý sở hữu trí tuệ.</small>
“ Chuan VC-1
VC-1 là viết tắt của Video Codec 1, đrợc chuẩn hóa bởi cộng đồng kỹ sư truyền hình va ảnh động SM” .£. Chuan được phát hành vào 2006. Một trong những triển kh“ p. ‘ile cao nhất được thông qua bởi nền tảng mã hóa đa phươns tiện WN. 79 của Microsoft. Một
số đặc điểm của VC-1 như sau:
e Triển khai qua một ở.. rộng ne. “Aang.
<small>e Hỗ trợ 3 profiler ag 'êt: simple, »>ain, advanced.</small>
e Hỗ trợ ASF để cau trúcc ¬ø IPTV.
<small>e Hỗ trợmô“ sain hthướcb. ^k.</small>
e Loaikk 1g bố s' .g:VC-1 đưa ra một loại khung mới là BI.
e Hoạt động "“ ,nột dải rộng các công nghệ truyền tải mạng.
Chương | trình bày , cu cầu kỹ thuật của nén video trong video streaming, cơ sở của nén video và một số chuẩn nén phổ biến. Các công nghệ nén khác nhau được phát triển cho các mục đích khác nhau. Đối với ứng dụng video streaming, bộ video codec phải đảm bảo được các yêu cầu về băng thơng, độ trễ, mat gói, độ phức tạp...
</div><span class="text_page_counter">Trang 9</span><div class="page_container" data-page="9"><small>MPEG-4 PART 10/ H.26MPEG-4</small>
<small>2.1. Giới thiệu</small>
MPEG là nhóm chuyên gia về hình ảnh, được thành lập vào năm 1288 với nhiệm vụ xây dựng tiêu chuẩn cho tín hiệu audio và video
SỐ. Ngày nay, MPEG đã trở thành một kỹ thuật nén audio và video
<small>phô biến nhất, tùy thuộc vào yeu cầu cụ thé của từng thiết bị sẽ có</small>
<small>một tiêu chuẩn thích hợp nhưng vẫn trên một nguyên lý thống nhất.</small>
<small>2.2. Mã hóa và giải mã MPEG</small>
<small>Bitstream QTs,</small>
<small>Nén MPEG chia một chuỗi video thành các nhóm ảnh. Từng ảnh</small>
<small>trong nhóm sẽ được chia thành các slice macroblock. Một</small>
macroblock bao gồm 4 block độ chói và 1 block U và V.
<small>MPEG định nghĩa 3 loại khung trong nhóm: khung I (Intraframe),</small>
<small>khung dự đoán hay khung P, khung hai hướng hay khung B.</small>
Cơ sở của công nghệ nén MPEG là kết hợp nén trong khung
<small>(intra-frame) và nén liên khung (inter-frame).</small>
</div><span class="text_page_counter">Trang 10</span><div class="page_container" data-page="10"><small>Điều khiến tốc độ</small>
<small>| "= Dòng bit đã</small>
<small>Video vào ^ - Hệ số ; aig . ma hoa</small>
<small>+ (4) DCT > Luong tu | lwong tr. | Mã hóa ; Bộ ;</small>
<small>Hình 2.2: .ơ đơ. ‘un MPEG</small>
Sơ đồ nén MPEG như... *ø hình 2.2. Ảnh hiện tại được so sánh
với ảnh trước tạo ra ảnh sai kha Ảnh này sau đó được nén trong ảnh qua các bước: biến 7 CT, lượn... tử hóa, mã hóa. Dữ liệu của ảnh sai khác và vect“ chuyc động mang thông tin về anh sau nén liên khung được dua “i bộ £ „m đầu ra.
Hình 2.3: Sơ đồ giải nén MPEG
Quá trình giải nén: đầu tiên là giải mã entropy, sau đó tách dit liệu ảnh (hệ số biến đổi DCT) ra khỏi các vector chuyển động. Dữ liệu
</div><span class="text_page_counter">Trang 11</span><div class="page_container" data-page="11">ảnh sẽ được giải lượng tử hoa và biến đổi DCT ngược. Nếu anh là
ảnh loại I bắt đầu ở mỗi nhóm ảnh trong chuỗi, ở đầu ra sẽ nhận được ảnh hoàn chỉnh bằng cách trên. Nếu ảnh là ảnh loại P thì cũng thực hiện giải lượng tử hóa và biến đổi DCT ngược kết hợp với việc sử dụng vector chuyển động và lưu vào bộ nhớ ảnh trước. Ta nhận được
ảnh sau khi cộng dự đoán anh và kết quả biến đổi DCT ngược.
Vào tháng 10 năm 1998, MPEG-4 đã ra đời, với tốc độ mã hóa khoảng 1.5 Mb/s, chuan nén MPEG-4 đã giải quyết phần nào van đề tắc nghẽn mạng và sự hạn chế về băng thông. MPEG-4 bao gồm các bộ phận riêng rẽ, có quan hệ chặt chẽ với r¬au và có thể được triển khai ứng dụng riêng hoặc tô hợp với các -ˆ .an khác.
<small>2.3.1 Cơng nghệ mã hóa và giải rv . vi. `9 trong MPEG-4</small>
<small>Bộ mã hóa [| E——] | Bộ giải mã _ </small>
<small>-VO-I | -VO-I</small>
<small>ideo đã ân chia cá ộ | nạ Video da</small>
<small>Video đầu vào Phân chia các Bộ mã b’ j Bo L Bộ Hộ giải mã T ông đạp ideo dau ra</small>
<small>—————> đôi tượng x—> ghép hân ry, ———>. VŒ R VO-2 các VO</small>
<small>video (VO) L— kênh</small>
<small>Bê. .hóa Bộ giải mã</small>
<small>.O-n VO-n</small>
Hình 2.4: Cau 1. ac bộ mã hóa và giải mã MPEG-4
Với MPEG-4, các đối tượng khác nhau trong một khung hình có
<small>mã trong các dòng cơ bản ES khác nhau.</small>
- _ Mã hóa hình dạng: dùng để nén đoạn thơng tin, giúp xác định khu vực và đường viền bao quanh đối tượng trong khung hình
- Mã hóa kết cấu: kết cấu của một đối tượng video thường
được mã hóa bang DCT. Có thé mã hóa sử dụng biến đổi wavelet.
- _ Mã hóa chuyền động: Nếu đối tượng chuyên động, thơng số chun động cho tồn bộ đối tượng được truyền.
</div><span class="text_page_counter">Trang 12</span><div class="page_container" data-page="12"><small>Object DescriptorProfile</small>
<small>Hình 2.5: Cac profil” .à mu_ level tron, MPEG-4</small>
<small>MPEG-4 chia thành c4 nhóm cơn, ¬^ụ gọi là các profile, mỗi</small>
profile chỉ chứa một va’ .nh . ¬g cần thic. của chuẩn mã hóa thích
<small>mức level khác nk vu.</small>
Có nhiều mm pro“.e như media profile, scene graph profile,
<small>MPEG-J profile,...</small>
<small>Nhóm media pro. > có: audio profile, visual profile, graphics</small>
profile. Trong đó visua. profile gồm có các profile sau: Simple
<small>profile Simple scalable profile, Core profile (profile 161), Main</small>
<small>profile, N-bit profile, Scalable texture profile Simple face, Hybrid</small>
<small>profile, Basic animated texture profile.</small>
Dé cung cấp nén video tốt hơn các chuẩn nén trước đó, chuẩn MPEG-4 part 10/H.264 hay H.264/AVC được phát triển bởi nhóm
video kết hợp JVT bao gồm các chuyên gia đến từ MPEG và VCEG
<small>của ITU-T. H.264/AVC dap ứng hiệu qua mã hóa, đặc tả cú pháp đơn</small>
giản, tích hợp mã hóa video với tất cả các giao thức và kiến trúc ghép
</div><span class="text_page_counter">Trang 13</span><div class="page_container" data-page="13">kênh hiện tại. Do đó, H.264/AVC có thé hỗ trợ các ứng dụng như
<small>video broadcasting, video streaming, video conferencing qua mạng</small>
cô định, không dây va qua các giao thức truyền tải khác nhau. Tính kế thừa của chuẩn nén MPEG-4 Part 10/H.264:
= Phân chia hình ảnh thành các block bao gồm nhiều pixel.
= Khai thác triệt dé sự dư thừa về mặt khơng gian tồn tại giữa
các hình ảnh liên tiếp.
<small>" Khai thác sự phụ thuộc tạm thời của các block của các hình</small>
ảnh liên tiếp.
= Khai thác tất cả sự dư thừa về thống kê, giảm tương quan thống kê bằng mã hóa entropy.
H.264 có những sự thay đổi quan trọn ưong chỉ tiết của các phần tử chức năng như dự đoán trong ảnh - se. đổi số nguyên 4 x 4 mới, nhiều ảnh tham chiếu, các kích thước block hay đơi, độ chính xác
1/4 cho bù chuyển động, bộ lọc tác. hối, cải tic. nd hóa entropy.
H.264 sử dụng một số r' ương pi > để phục hồi lỗi. Thiết lập tham số, thứ tự macroblo...›. *m dẻo, slic =huyển đổi, phương pháp
<small>slice dư thừa được thêm vào.</small>
Lớp mã hóa ideo củ_MPEG-4/H.264 là sự kết hợp của mã hóa khơng gian và m. 62° aời gian. Bộ mã hóa có thé lựa chọn mã hóa trong anh hoặc mã I. > liên ảnh cho miền khối. Bộ lọc tách khối làm giảm sự nhiễu khối tại ‹ + đường biên của block. Các vector chuyền
động và các mode dự đốn trong ảnh có thé làm biến đổi kích thước block trong ảnh. Cuối cùng, vector chuyển động hay các mode dự đoán liên ảnh được liên kết với thông tin của hệ số biến đồi lượng tử
<small>hóa và được mã hóa sử dụng mã entropy như CAVLC hay CABAC.</small>
<small>s* Chia ảnh thành các macro-block</small>
<small>Mỗi ảnh video, frame được chia thành các macroblock có kích</small>
thước cố định bao phủ một diện tích ảnh hình chữ nhật gồm 16 x 16 mẫu cho các thành phan chói và 8 x 8 mẫu cho một trong hai thành phần màu.
</div>