Tải bản đầy đủ (.docx) (40 trang)

Nén video theo chuẩn MPEG 1, MPEG 2 và ứng dụng thử nghiệm

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.35 MB, 40 trang )

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
──────── * ───────
BÁO CÁO MÔN:
TRUYỀN THÔNG ĐA PHƯƠNG TIỆN
Nén video theo chuẩn MPEG-1,
MPEG-2 và ứng dụng thử nghiệm
Sinh viên thực hiện : Lê Văn Quân - 20102035
Phạm Gia Lâm - 20111745
Vũ Trọng Luân - 20111826
Quách Trung Nguyên - 20111933
Lớp : CNTT & TT 1.1, 1.2
Giáo viên hướng dẫn : PGS.TS Nguyễn Thị Hoàng Lan
Hà Nội, tháng 12 năm 2014
Đề tài 04 – Nén video theo chuẩn MPEG-1, MPEG-2 và ứng dụng thử nghiệm
MỤC LỤC
2
Nhóm 04 – CNTT&TT 1.1, 1.2 K56
2
Đề tài 04 – Nén video theo chuẩn MPEG-1, MPEG-2 và ứng dụng thử nghiệm
LỜI NÓI ĐẦU
Ngày nay , cùng với sự phát triển vượt bậc của ngành công nghiệp công
nghệ thông tin cùng sự ra đời của Internet thì vấn đề giải trí đi kèm cùng với nó
mà không thể thiếu đó là video. Nhưng nếu để nguyên kích cỡ ban đầu của các
đoạn video đó thì việc truyền tải đến người dùng là rất khó khăn vì dung lượng
của nó là rất lớn đòi hỏi phải có cơ sở hạ tầng , đường truyền mạng đủ mạnh
mới có thể đáp ứng được và nó cũng lỗi thời rất nhanh do công nghệ quay video
ngày càng tiến tiến hơn. Chính vì thế các nhà phát triển côn nghệ đã xây dựng
nên các kĩ thuật nén video. Các kỹ thuật nén video này đều cố gắng giảm lượng
thông tin cần thiết cho một chuỗi các bức ảnh mà không làm giảm chất lượng
ảnh cũng như thông tin mà nó mang theo.


Mục đích của nén video là giảm bớt số bít khi lưu trữ và truyền bằng cách
loại bỏ lượng thông tin dư thừa trong từng frame và dùng kỹ thuật mã hoá để tối
thiểu hoá lượng thông tin quan trọng cần lưu giữ. Với một thiết bị lưu hình kỹ
thuật số thông thường, ảnh sau khi được số hoá sẽ được nén lại. Quá trình nén sẽ
xử lý các dữ liệu trong ảnh để đưa hình ảnh vào một không gian hẹp hơn như
trong thiết bị nhờ kỹ thuật số hoặc qua đường dây điện thoại
Với mỗi công nghệ truyền hình mới ra đời, sẽ có một công nghệ nén
Video phù hợp. Nén Video từ những năm 1950 được thực hiện bằng công nghệ
tương tự với tỷ số nén thấp. Ngày nay công nghệ nén đạt được hiệu quả cao hơn
nhờ chuyển đổi tín hiệu Video từ tín hiệu tương tự sang tín hiệu số. Với đề tài
“Nén video theo chuẩn MPEG-1, MPEG_2 và ứng dụng thử nghiệm”, mục đích
của bài khoá luận của em là tìm hiểu một số các chuẩn nén MPEG ứng dụng nén
video đã được sử dụng trong việc nén video phổ biến hiện nay.

3
Nhóm 04 – CNTT&TT 1.1, 1.2 K56
3
Đề tài 04 – Nén video theo chuẩn MPEG-1, MPEG-2 và ứng dụng thử nghiệm
PHÂN CÔNG THÀNH VIÊN TRONG NHÓM
MSSV Họ tên Công việc
Tỉ lệ đóng góp
20111745 Phạm Gia Lâm
Tìm hiểu chung về
các chuẩn MPEG ,
nén video theo
chuẩn MPEG-1
30%
20111933
Quách Trung
Nguyên

Tìm hiểu chuẩn
MPEG -2, sự khác
nhau giữa MPEG-1
và MPEG-2.
20%
20111826 Vũ Trọng Luân
So sánh công
nghệ nén video
các chuẩn MJPEG,
MPEG-1 và MPEG-
2.
20%
20102035 Lê Văn Quân
Tổng hợp slide,
trình bày báo cáo
và thử nghiệm
ứng dụng nén
video, so sánh và
giải thích.
30%
4
Nhóm 04 – CNTT&TT 1.1, 1.2 K56
4
Đề tài 04 – Nén video theo chuẩn MPEG-1, MPEG-2 và ứng dụng thử nghiệm
CHƯƠNG 1. Tìm hiểu chung về các chuẩn MPEG
1.1. Giới thiệu về chuẩn nén video MPEG
MPEG (Moving Picture Expert Group) là nhóm chuyên gia về hình ảnh,
được thành lập từ tháng 2 năm 1988 với nhiệm vụ xây dựng tiêu chuẩn cho
tín hiệu Audio và Video số. Ngày nay, MPEG đã trở thành một kỹ thuật nén
Audio và Video phổ biến nhất vì nó không chỉ là một tiêu chuẩn riêng biệt

mà tuỳ thuộc vào yêu cầu cụ thể của từng thiết bị sẽ có một tiêu chuẩn thích
hợp nhưng vẫn trên cùng một nguyên lý thống nhất.
Nguồn dữ liệu
Bộ giải nén
Bộ nén
Kênh truyền
Dữ liệu đã giải nén
Bộ giải mã đơn giản
Bộ mã hóa phức tạp
Dòng bit chuẩn
Dữ liệu ra
(a)
(b)
Dữ liệu vào
Hình 1: (a) Tổng quan của một hệ thống có nén, bên phía nguồn sử dụng
bộ nén gọi là compressor hay coder, bên phía nhận sử dụng bộ giải nén là
expander hay decoder.
(b) Minh họa sự bất đối xứng trong hệ thống, bộ mã hóa luôn phải phức
tạp hơn bộ giải mã.
Việc nén dữ liệu là tất yếu cần thiết do hai lý do chính sau đây. Thứ nhất là
do lưu trữ: dữ liệu sau khi nén có dung lượng nhỏ hơn, do vậy cần ít không gian
lưu trữ hơn. Thứ hai là do băng thông: dữ liệu sau khi nén có tốc độ bit thấp hơn
nên cần băng thông ít hơn.
5
Nhóm 04 – CNTT&TT 1.1, 1.2 K56
5
Đề tài 04 – Nén video theo chuẩn MPEG-1, MPEG-2 và ứng dụng thử nghiệm
Tỉ lệ giữa tốc độ bit của nguồn so với tốc độ bit của kênh truyền gọi là tỉ lệ
nén Compression factor hay là Coding gain.
Hệ thống truyền tải là bất đối xứng. Bộ mã hóa cần phải thông minh để

thích ứng linh hoạt với phần dữ liệu cần mã hóa, còn bộ giải mã chỉ cần làm đơn
giản để có thể hiểu được thông tin của kênh truyền mang tới. Điều này thích hợp
cho hoạt động quảng bá khi mà số lượng thiết bị mã hóa ít còn số lượng bộ giải
mã là rất nhiều. Với những ứng dụng kiểu điểm-điểm thì hướng thiết kế như vậy
không thể hiện được tính ưu việt.
Bộ mã hóa
Bộ giải mã
Tín hiệu Video
Tín hiệu Video
Dòng bit
MPEG định nghĩa phần này
Bộ mã hóa không được định nghĩa bởi MPEG trừ việc phải tạo ra dòng bit chuẩn
Bộ giải mã phải có khả năng hiểu được tất cả mọi dòng bit chuẩn
Không định nghĩa
Bộ mã hóa hiện tại
Bộ giải mã hiện tại
Bộ mã hóa trong tương lai
Bộ mã hóa có cấu trúc bí mật
Dòng bit chuẩn
Dòng bit chuẩn
Dòng bit chuẩn
Bộ giải mã hiện tại vẫn có khả năng làm việc
Bộ giải mã có thể làm việc được
(a)
(b)
(c)
Hình 2: (a) MPEG định nghĩa giao thức giữa bộ mã hóa và bộ giải mã.
(b) Hướng thiết kế của MPEG là cho phép tạo ra bộ mã hóa tốt hơn
trong tương lai nhưng vẫn đảm bảo tương thích với bộ giải mã hiện
có.

(c) Chi tiết thiết kế của bộ mã hóa không nhất thiết phải công khai,
đó có thể là bí mật thương mại của nhà sản xuất.
6
Nhóm 04 – CNTT&TT 1.1, 1.2 K56
6
Đề tài 04 – Nén video theo chuẩn MPEG-1, MPEG-2 và ứng dụng thử nghiệm
1.2. Giới thiệu về các chuẩn MPEG
- Tiêu chuẩn đầu tiên được nhóm MPEG đưa ra là MPEG-1, mục tiêu của
MPEG-1 là mã hoá tín hiệu Audio-Video với tốc độ khoảng 1.5Mb/s và
lưu trữ trong đĩa CD với chất lượng tương đương VHS.
- Tiêu chuẩn thứ 2 : MPEG-2 được ra đời vào năm 1990, không như
MPEG-1 chỉ nhằm lưu trữ hình ảnh động vào đĩa với dung lượng bit thấp.
MPEG-2 với “công cụ ” mã hoá khác nhau đã được phát triển. Các công
cụ đó gọi là “Profiles” được tiêu chuẩn hoá và có thể sử dụng để phục vụ
nhiều mục đích khác nhau.
- Tiêu chuẩn tiếp theo mà MPEG đưa ra là MPEG-4, được đưa ra vào
tháng 10 năm 1998, đã tạo ra một phương thức thiết lập và tương tác mới
với truyền thông nghe nhìn trên mạng Internet, tạo ra một phương thức
sản xuất, cung cấp và tiêu thụ mới các nội dung video trên cơ sơ nội dung
và hướng đối tượng (content/object-based).
- MPEG-7: là một chuẩn dùng để mô tả các nội dung Multimedia, chứ
không phải là một chuẩn cho nén và mã hoá audio/ảnh động như MPEG-
1, MPEG-2 hay MPEG-4. MPEG-7 sử dụng ngôn ngữ đánh dấu mở rộng
XML(Extansible Markup Language) để lưu trữ các siêu dữ liệu Metadata,
đính kèm timecode để gắn thẻ cho các sự kiện, hay đồng bộ các dữ liệu.
MPEG-7 bao gồm 3 bộ chuẩn sau:
+ Bộ các sơ đồ đặc tả (Description Schemes) và các đặc tả (Description).
+ Ngôn ngữ xác định DDL (Description Definition Language) để định
nghĩa các sơ đồ đặc tả.
+ Sơ đồ mã hoá quá trình đặc tả.

1.3. Cấu trúc dòng bit MPEG video
7
Nhóm 04 – CNTT&TT 1.1, 1.2 K56
7
Đề tài 04 – Nén video theo chuẩn MPEG-1, MPEG-2 và ứng dụng thử nghiệm
Hình 3 : Cấu trúc dòng Bit MPEG Video
Trong đó :
• Seq ( sequence) : là thông tin về chuỗi bit
 Seq SC : sequence sevice class ( lớp seq )
 Video Params : chứa thông tin về chiều cao, bề rộng, tỷ lệ
khuôn hình các phần tử ảnh.
 Bitstream params : thông tin về tốc độ bit và các thông số
khác
 QTs ,Misc : Nén trong ảnh (ảnh I – I Frame) , Nén liên ảnh
(ảnh P – P Frame)
• GOP ( group of picture ): thông tin về nhóm ảnh
8
Nhóm 04 – CNTT&TT 1.1, 1.2 K56
8
Đề tài 04 – Nén video theo chuẩn MPEG-1, MPEG-2 và ứng dụng thử nghiệm
Là tổ hợp của nhiều các khung I, P, B. Cấu trúc nhóm ảnh gồm 2 tham
số là: m và n (tham số m xác định số khung hình B và P xuất hiện giữa 2
khung hình I gần nhau nhất, tham số n xác định số khung B xuất hiện
giữa 2 khung P). Mỗi một nhóm ảnh bắt đầu bằng một khung I và xác
định điểm bắt đầu để tìm kiếm và biên tập.
Các tham số của đoạn mào đầu của GOP:
 Time codes : mã xác định thời gian
 GOP params : miêu tả cấu trúc GOP
 Picts : thông tin về ảnh
• Picts : thông tin về ảnh , bao gồm các tham số :

 Type: Cho phép bộ giải mã xác định ảnh đựơc mã hoá là
ảnh I, P hay B.
 Buffer Params: thông tin về Buffer(chỉ thứ tự truyền
khung để bộ giải mã có thể sắp xếp các loại ảnh theo một
thứ tự đúng).
 Encode Params: chứa thông tin về đồng bộ, độ phân giải
và phạm vi của vector chuyển động.
 Slice: Mảng bao gồm một vài cấu trúc khối kề nhau.
• Slice : Mảng bao gồm một vài cấu trúc khối kề nhau
Các thông số bao gồm :
 Vert PoS: Slice bắt đầu từ dòng nào.
 Qscale: Thông tin về bảng lượng tử.
 MB : (Macroblock)
• MB (macroblock) :
Một cấu trúc khối là một nhóm các khối tương ứng với lượng thông
tin chứa đựng trong kích thước 16x16 điểm trên bức ảnh.
Các tham số của nhóm MB:
 Addr Iner: Số lượng MB được bỏ qua.
 Type : Loại vector chuyển động dung cho Macroblock.
 Qscale : Bảng lượng tử dùng cho Macroblock.
 Coded Block Pattern (CBP): chỉ rõ Block nào được mã
hoá.
9
Nhóm 04 – CNTT&TT 1.1, 1.2 K56
9
Đề tài 04 – Nén video theo chuẩn MPEG-1, MPEG-2 và ứng dụng thử nghiệm
1.4. Các loại ảnh trong chuẩn MPEG
Ảnh I (Intra-picture): là ảnh chỉ sử dụng nén trong ảnh, mang thông tin về
một ảnh hoàn chỉnh. Ảnh I cho phép truy cập ngẫu nhiên, có độ nén thấp
nhất.

Ảnh P (Predicted-picture): ảnh dự đoán trước, là ảnh được mã hóa có bù
chuyển động từ ảnh I hoặc ảnh P phía trước.
Ảnh B (Bi-directional predicted picture): ảnh dự đoán hai chiều, là ảnh
được mã hóa sử dụng bù chuyển động từ các ảnh I hoặc P trước và sau.
Ảnh B cho hệ số nén là cao nhất.
Hình 4: Cấu trúc ảnh MPEG
10
Nhóm 04 – CNTT&TT 1.1, 1.2 K56
10
Đề tài 04 – Nén video theo chuẩn MPEG-1, MPEG-2 và ứng dụng thử nghiệm
1.5. Nguyên lí nén MPEG
Hình 5 : Nén MPEG
* Cơ sở của công nghệ nén video MPEG là sự kết hợp giữa nén trong ảnh
(Intra-Frame Compression) và công nghệ nén liên ảnh ( Inter-Frame
Compression). Trong đó:
- Nén trong ảnh (Intra -Frame Compression): là loại nén nhằm giảm bớt
thông tin dư thừa trong miền không gian. Nén trong ảnh sử dụng cả hai
quá trình có tổn hao và không có tổn hao để giảm bớt dữ liệu trong
ảnh. Quá trình này không sử dụng thông tin của các ảnh trước và sau
ảnh đang xét.
- Nén liên ảnh (Intra -Frame Compression): Trong tín hiệu video có
chứa thông tin dư thừa trong miền thời gian. Nghĩa là với một chuỗi liên tục
các ảnh, lượng thông tin chứa đựng trong mỗi ảnh thay đổi rất ít từ ảnh này
sang ảnh khác. Tính toán sự dịch chuyển vị trí của nội dung ảnh là một
phần rất quan trọng trong kỹ thuật nén liên ảnh. Trong thuật nén MPEG,
quá trình xác định Vector chuyển động được thực hiện bằng cách chia hình
ảnh thành các Macro-Block, mỗi Macro-Block có 16 x 16 phần tử ảnh
(tương đương với 4 Block, mỗi Block có 8 x 8 phần tử ảnh). Để xác định
11
Nhóm 04 – CNTT&TT 1.1, 1.2 K56

11
Đề tài 04 – Nén video theo chuẩn MPEG-1, MPEG-2 và ứng dụng thử nghiệm
chiều chuyển động, người ta tìm kiếm vị trí của Macro-Block trong ảnh tiếp
theo, kết quả của sự tìm kiếm sẽ cho ta Vector chuyển động của Macro-
Block.

* Nguyên lý nén MPEG :
Dạng thức đầu vào là Rec- 601 4:2:2 hoặc 4:2:0. Ảnh hiện tại được so
sánh với ảnh trước tạo ra ảnh khác biệt. Ảnh này sau đó lại được nén
trong ảnh qua các bước : biến đổi DCT, lượng tử hóa, mã hoá. Dữ liệu
của ảnh khác biệt và vector chuyển động (được xác định như trên )
mang thông tin về ảnh sau nén liên ảnh được đưa đến bộ đệm ở đầu ra.
Tốc độ bít của tín hiệu video được nén không cố định, phụ thuộc vào nội
dung ảnh đang xét (ví dụ một phần nén ít hơn hoặc nhiều hơn), nhưng tại đầu ra
bộ mã hoá dòng bít phải cố định để xác định tốc độ cho dung lượng kênh
truyền.
1.6. Ứng dụng của nén dữ liệu bằng MPEG
Ứng dụng của nén dữ liệu là vô cùng rộng lớn và do vậy tổ chức
ISO đã cố gắng tạo ra một chuẩn nén có thể đáp ứng nhu cầu rộng lớn
trong các ứng dụng cần nén.
Chuẩn nén video MPEG ra đời là bước tiến vĩ đại trong công nghệ
nén dữ liệu và đặc biệt là nén video. Nó có nhiều ứng dụng hữu ích cho
cuộc sống mà không thể không nói đến như :
+ Nén dữ liệu đĩa DVD phù hợp cho việc lưu trữ
+ Mã hóa các các video trực tiếp cho các chương trình có trong một
chương trình phát thanh
+ Mã hóa cho video hội nghị 2 chiều
+ Thay đổi công nghệ truyền video trên truyền hình từ analog sang truyền
hình digital
…….

12
Nhóm 04 – CNTT&TT 1.1, 1.2 K56
12
Đề tài 04 – Nén video theo chuẩn MPEG-1, MPEG-2 và ứng dụng thử nghiệm
CHƯƠNG 2. Tìm hiểu về các sơ đồ nén và đặc
điểm nén video theo các chuẩn: MPEG-1, MPEG-
2, MPEG-2 có phát triển gì so với MPEG-1?
2.1. Tìm hiểu về chuẩn nén video MPEG-1
2.1.1. Giới thiệu khái quát
MPEG -1 được hình thành vào năm 1988, là tiêu chuẩn của nhóm chuyên gia
về hình ảnh MPEG ở trong giai đoạn đầu tiên (tương ứng với tiêu chuẩn
ISO/IEC 11172 của ITU). Mục đích của MPEG -1 là nghiên cứu một tiêu chuẩn
mã hoá video và âm thanh kèm theo trong các môi trường lưu trữ như: CD-
ROM, đĩa quang … Tốc độ mã hoá từ 1.2Mb/s đến 1.5 Mb/s.
Chuẩn nén MPEG -1 bao gồm 4 phần :
- Các hệ thống : ISO/IEC 11172 -1
- Video : ISO/IEC 11172 -2
- Audio : ISO/IEC 11172 -3
- Hệ thống kiểm tra: ISO/IEC 11172 -4
Trong các phần trên ta nghiên cứu một vài thông số trong phần Video
(ISO/IEC 11172 -2).
2.1.2. Định dạng trung gian SIF (Source Intermediate Format)
Khi truyền hình màu phát triển, xuất hiện nhiều hệ truyền hình
khác nhau như: NTSC , PAL … với các hệ thống quét truyền hình
khác nhau như hệ 525/60 và 625/50. Do đó cần có một định dạng
chung cho nhau phù hợp mỗi hệ thống. Định dạng trung gian cho
nguồntín hiệu được gọi là SIF (Source Intermediate Format).
Trong định dạng chung này, tần số lấy mẫu được lấy theo xác định
của chuẩn CCIR-601. Do đó số mẫu trên một dòng tích cực của cả
hai tiêu chuẩn 525/60 và 625/50 là bằng nhau. Quá trình chuyển đổi từ

định dạng theo tiêu chuẩn CCIR-601 sang định dạng SIF được thực hiện
bằng cách sử dụng một bộ lọc thập phân theo chiều ngang cho các mành
lẻ của tín hiệu Y, một bộ lọc theo chiều ngang và một bộ lọc theo chiều
thẳng đứng cho các mành số lẻ cho các tín hiệu Cr và Cb như sau:
13
Nhóm 04 – CNTT&TT 1.1, 1.2 K56
13
Đề tài 04 – Nén video theo chuẩn MPEG-1, MPEG-2 và ứng dụng thử nghiệm
Hình 6:Quá trình biến đổi sang định dạng SIF và kích thước mảng các
điểm ảnh
 Quá trình tính toán giá trị cho các điểm ảnh trong lọc thập phân
như sau:
Vị trí các điểm ảnh được tính
n-3 n-2 n-1 n n+1 n+2 n+3
x (-29) x 0 x 88 x 133 x 88 x 0 x (-29)
/ 256
Hình 7: Tính toán giá trị cho các điểm ảnh trong bộ lọc thập phân
Giá trị điểm ảnh tại vị trí n được tính bằng: tích số của các giá trị điểm ảnh từ
(n-3) đến (n+3) với các hệ số của bộ lọc tương ứng tại vị trí này trên hình vẽ
trên.
Tổng các kết quả này được chia cho 256 và thu được giá trị điểm ảnh
ở vị trí n. Phép tính tiếp theo được thực hiện cho điểm ảnh ở vị trí n+2.
Một quá trình lọc tương tự áp dụng theo chiều thẳng đứng tạo ra giá trị thập
phân tín hiệu Cr và Cb theo chiều này.
14
Nhóm 04 – CNTT&TT 1.1, 1.2 K56
14
Đề tài 04 – Nén video theo chuẩn MPEG-1, MPEG-2 và ứng dụng thử nghiệm
+ Số các điểm ảnh trên một dòng tích cực được giảm từ 360 xuống 352 để thu
được một bội số của 16 nhằm tổ chức thuận lợi các cấu trúc khối điểm ảnh 16x16

với cấu trúc 4:2:0. Ảnh tích cực đã được làm giảm xuống (352 x 240) được gọi là
vùng điểm ảnh xác định (có ý nghĩa ) cho SIF. Định dạng SIF phối hợp với cấu
trúc lấy mẫu 4:2:0 làm giảm thêm số liệu tín hiệu màu. Các thông số cho định
dạng SIF đối với các tiêu chuẩn truyền hình được cho trong bảng sau: tính chất các
định danh SIF cơ bản
1.1. Cấu trúc dòng bit và các tham số của MPEG-1
Cấu trúc dòng bít của MPEG -1 cũng tương tự như cấu trúc dòng
bít của MPEG, nó được phân thành các lớp như cấu trúc của MPEG
video như trình bày bên phần I :
• Sequence (chuỗi ảnh) : gồm nhiều nhóm ảnh GOP, có chức năng là
dòng bít video.
15
Nhóm 04 – CNTT&TT 1.1, 1.2 K56
15
Đề tài 04 – Nén video theo chuẩn MPEG-1, MPEG-2 và ứng dụng thử nghiệm
• GOP (Group of Picture ): gồm từ 1- n ảnh bắt đầu bằng ảnh I, có chức
năng là đơn vị truy xuất.
• Picture I, P, B: gồm nhiều Slice, chức năng là đơn vị mã hoá cơ bản.
• Slice : gồm nhiều các Macro Block, là đơn vị để tái đồng bộ phục hồi lỗi.
• Macro-Block : gồm 16 x 16 pixel, là đơn vị bù chuyển động.
• Block : gồm 8 x 8 pixel, là đơn vị tính DCT.
Một vài thông số theo chuẩn MPEG-1 :
16
Nhóm 04 – CNTT&TT 1.1, 1.2 K56
16
Đề tài 04 – Nén video theo chuẩn MPEG-1, MPEG-2 và ứng dụng thử nghiệm
2.1.3. Qúa trình nén video theo chuẩn MPEG -1
Đặc trưng của nén video theo chuẩn này là :
+ sử dụng chủ yếu cho lưu trữ và truyền thông tin video
17

Nhóm 04 – CNTT&TT 1.1, 1.2 K56
17
Đề tài 04 – Nén video theo chuẩn MPEG-1, MPEG-2 và ứng dụng thử nghiệm
+ độ phân giải thấp : 720 x 576
+ tốc độ frame : 30 fps
+ cấu trúc lấy mẫu : 4:2:0
Giải thích sơ đồ : đầu vào của quá trình nén video là đoạn video
gốc (tỉ lệ 4:2:2 ,4:2:0). khi video được đưa vào nó sẽ được biến đổi
DCT thuận ( biến đổi cosin rời rạc để biểu diễn giá trị điểm ảnh
sang miền tần số) , tiếp theo là sau quá trình DCT thuận là quá trình
lượng tử hóa để biến đổi số nguyên thành số thực và có 2 lựa việc
tiếp sau được thực hiện:
+ Dữ liệu sau khi được chuyển sang số thực nó sẽ được mã hóa
entropy , trôn dữ liệu rồi ghi ra bộ đệm thành dòng bit mã hóa để
ghi file
+ Sau khi được lượng tử hóa thì lại tiến hành giải lượng tử hóa ,
biến đổi DCT ngược để xác lập lại ảnh trước đó. ảnh này sẽ là đầu
vào của khối đánh giá chuyển động. Khi vào khối đánh giá chuyển
động ảnh sẽ được chia thành các macro block kích thước 16x16
điểm ảnh ( mối macro block lại chia thành 4 block với kích thước
18
Nhóm 04 – CNTT&TT 1.1, 1.2 K56
18
Đề tài 04 – Nén video theo chuẩn MPEG-1, MPEG-2 và ứng dụng thử nghiệm
8x8 điểm ảnh ). Bằng việc đánh giá sự thay đổi của các macro
block sẽ tìm ra được vector chuyển động. Và từ vector chuyển động
xác định được ảnh dự đoán kế cận nó
2.1.4. Quá trình giải nén video theo chuẩn MPEG-1
Giải thích quá trình giải nén video theo chuẩn MPEG-1 : quá trình
giải nén video theo chuẩn MPEG-1 ngược lại với quá trình nén của

nó. Dòng bit được mã hóa sẽ được đưa vào bộ đệm rồi thực hiện
giải mã entropy. Sau đó thực hiện biến đổi cosin rời rạc ngược
,lượng tử hóa ngược kết hợp với vector bù chuyển động để tìm ra
các frame và sắp sếp lại chúng theo trật tự để khôi phục lại video
ban đầu (có sự mất mát thông tin trong quá trình biến đổi cosin rời
rạc , lượng tử hóa )
2.2. Tìm hiểu về chuẩn nén video MPEG-2
2.2.1. Cơ bản về MPEG-2
MPEG-2, ra đời năm 1994, là tên của một nhóm các tiêu chuẩn mã hóa cho tín
hiệu âm thanh và hình ảnh số, được chấp thuận bởi MPEG (Moving Picture Expert
Group) và được công bố trong tiêu chuẩn quốc tế ISO/IEC 13818. MPEG-2 (hay còn
gọi là H.222 / H.262 theo quy định của ITU ) là một tiêu chuẩn mã hóa nén (thường
được gọi tắt là chuẩn nén) trong bộ tiêu chuẩn MPEG dùng để mã hóa luồng dữ liệu
hình có kết hợp với các thông tin về âm thanh.
Chuẩn nén MPEG -2 là chuẩn nén phát triển tiếp sau MPEG -1, có kế thừa tất
cả các tiêu chuẩn của MPEG-1và mục đích là nhằm hỗ trợ việc truyền video số, tốc độ
bít lớn hơn 4 Mb/s, bao gồm các ứng dụng DSM (phương tiện lưu trữ số), các hệ thống
truyền hình hiện tại (NTSC, PAL, SECAM), cáp, thu lượm tin tức điện tử, truyền hình
trực tiếp từ vệ tinh, truyền hình mở rộng (EDTV), truyền hình độ phân giải cao
(HDTV)….
Các tiêu chuẩn MPEG-2 bao gồm một số bộ phận, trong ISO / IEC 13.818 được
xác định :
Phần 1 Hệ thống - mô tả đồng bộ hóa và ghép kênh âm thanh và video. Chứa các mô
tả của dòng chương trình và luồng giao thông.
Phần 2 Video - Codec. Còn được gọi bằng tên H.262.
19
Nhóm 04 – CNTT&TT 1.1, 1.2 K56
19
Đề tài 04 – Nén video theo chuẩn MPEG-1, MPEG-2 và ứng dụng thử nghiệm
Phần 3 Audio - Codec. Một phần mở rộng đa kênh của MPEG-1 Audio. Chứa các mô

tả của MP1 , MP2 và MP3.
Phần 4 Mô tả các thủ tục kiểm tra cho phù hợp.
Phần 5 Mô tả các phần mềm mô phỏng.
Phần 6 Mở rộng cho DSM-CC (Storage Digital Media Command and Control.)
Phần 7 Advanced Audio Coding (AAC)
Phần 9 Mở rộng cho các ứng dụng thời gian thực.
Phần 10 Phần mở rộng phù hợp cho DSM-CC.
Phần 11 IPMP ( Sở hữu trí tuệ quản lý và bảo vệ) trên MPEG-2 hệ thống.
(Phần 8 "mở rộng 10-bit của video" đã bị từ chối.)
MPEG-2 thường được sử dụng để mã hóa âm thanh và hình ảnh cho các tín
hiệu broadcast bao gồm truyền hình vệ tinh quảng bá trực tiếp và truyền hình cáp.
MPEG-2 với một số sửa đổi cũng là khuôn dạng được sử dụng bởi các phim DVD
thương mại tiêu chuẩn.
Chuẩn MPEG -2 bao gồm 4 phần chính:
- Các hệ thống : ISO/IEC 13818 -1.
- Video : ISO/IEC 13818 -2
- Audio : ISO/IEC 13818 -3
- Các hệ thống kiểm tra : ISO/IEC 13818 -4.
Cụ thể một số phần chính :
- MPEG-2 Video part (Part 2): tương tự MPEG-1, nhưng chỉ hỗ trợ video xen kẽ
(interlaced video, là khuôn dạng được sử dụng cho các hệ thống truyền hình
quảng bá). MPEG-2 video không được tối ưu hóa cho các tốc độ bit thấp (nhỏ
hơn 1 Mbps), nhưng lại thực hiện tốt hơn MPEG-1 ở tốc độ 3 Mbps và cao hơn.
Tất cả các bộ giải mã tín hiệu video tuân theo chuẩn MPEG-2 hoàn toàn có khả
năng phát lại các luồng video MPEG-1. Do có nhiều cải tiến, MPEG-2 video và
các hệ thống MPEG-2 được sử dụng trong hầu hết các hệ thống truyền dẫn
HDTV.
- MPEG-2 Audio part (Part 3): cải tiến chức năng âm thanh của MPEG-1 bằng
cách cho phép mã hóa các chương trình âm thanh với nhiều hơn hai kênh. Part
3 cũng cũng tương thích với chuẩn trước, cho phép các bộ giải mã âm thanh

MPEG-1 giải mã các thành phần âm thanh nổi (stereo).
20
Nhóm 04 – CNTT&TT 1.1, 1.2 K56
20
Đề tài 04 – Nén video theo chuẩn MPEG-1, MPEG-2 và ứng dụng thử nghiệm
MPEG-2 được dùng để mã hóa hình ảnh động và âm thanh và để tạo ra ba kiểu
khung số liệu (intra frame, forward predictive frame và bidirectional pridicted frame)
có thể được sắp xếp theo một trật tự cụ thể gọi là cấu trúc nhóm các hình ảnh (group of
pictures, GOP).
Một luồng video MPEG-2 được tạo nên bởi một chuỗi các khung số liệu mã
hóa hình ảnh. Có ba cách để mã hóa một hình ảnh là: intra-coded (I picture), forward
predictive (P picture) và bidirectional predictive (B picture). Các hình ảnh của luồng
video được phân ra thành một kênh chứa thông tin về độ sáng (luminance, còn gọi là
kênh Y) và hai kênh thành phần mầu (chrominance, còn gọi là các tín hiệu mầu phân
biệt Cb và Cr). MPEG-2 sử dụng các chuẩn mã hóa âm thanh mới, đó là:
- Mã hóa tốc độ bit thấp với tần số lấy mấu giảm đi một nửa (MPEG-1 Layer
1/2/3 LSF).
- Mã hóa đa kênh, lên đến 5.1 kênh
- MPEG-2 AAC.
Một số tốc độ bit cung cấp bởi chuẩn MPEG-2 : 16kHz, 22.05 kHz và 24kHz.
-Layer I : 32,48,56,64,80,96,112,128,144,160,176,192,224,256kbps.
Những tốc độ này là có thể ở chế độ Mono hay stereo.
-Layer II : 8,16,24,32,40,48,56,64,80,96,112,128,144,160 kbps.
Những tốc độ này là có thể ở chế độ Mono hay stereo.
Dưới đây là một danh sách mà MPEG-2 tập tin thường gặp : mpg, mpeg,.m2v
(MPEG-2 Elementary Video Stream),.m2a (MPEG-2 Elementary Audio
Stream),.m2s (MPEG-2 Elementary Data Stream), ts (MPEG-2 Transport Stream), ps
(MPEG-2 Program Stream),.vob(DVD Video Object),.vro(Video Recording
Object),.mod(MPEG-2 với AC3 Audio z. B. ở JVC hoặc Panasonic máy ảnh
video),.m2t (MPEG-2 Transport z. B. trên máy ảnh Sony HD).

2.2.2. Mã hóa và giải mã video
- Mã hóa MPEG-2 :
21
Nhóm 04 – CNTT&TT 1.1, 1.2 K56
21
Đề tài 04 – Nén video theo chuẩn MPEG-1, MPEG-2 và ứng dụng thử nghiệm
Hình 1: Chuẩn nén MPEG-2.
Tín hiệu Video và Audio được nén (theo như nguyên lý nén MPEG ) và tạo thành các
dòng dữ liệu cơ sở ES (Elementary Stream). Dòng ES được sử dụng để tạo nên dòng
dữ liệu cơ sở được đóng gói PES (Packetized Elementary Stream). Dòng PES lại được
tiếp tục đóng gói tạo thành dòng truyền tải TS (Transport Stream).
- Giải mã MPEG -2:
MPEG -2 Coder và Decoder không nhất thiết phải có cùng cấp chất lượng. Tính phân
cấp cho phép các bộ giải mã MPEG đơn giản, rẻ tiền, có khả năng giải mã một phần
của toàn bộ dòng bít và như vậy có khả năng tạo được hình ảnh tuy chất lượng có thấp
hơn các bộ giải mã toàn bộ dòng bít.
22
Nhóm 04 – CNTT&TT 1.1, 1.2 K56
22
Đề tài 04 – Nén video theo chuẩn MPEG-1, MPEG-2 và ứng dụng thử nghiệm
Hình 2 : Giải mã phân cấp theo SNR.
Tiêu chuẩn MPEG cho phép phân cấp theo tỷ số tín hiệu trên tạp âm (SNR) và theo độ
phân giải. Trong đó :
- Tính phân cấp theo tỷ số tín hiệu trên tạp âm ( SNR Scalability) có nghĩa là chất
lượng hình ảnh và tỷ số tín hiệu trên tạp âm có tính thoả hiệp. Một bộ giải mã có tốc
độ bít thấp, có thể có đầy đủ độ phân giải nhưng tỷ số tín hiệu trên tạp âm (SNR) thấp
hơn so với bộ giải mã có tốc độ bít cao.
- Tính phân cấp theo không gian (Spatial Scalablity) có nghĩa là có sự thoả hiệp đối độ
phân giải. Một máy thu có tốc độ bít thấp cho hình ảnh có độ phân giải thấp hơn so với
máy thu có khả năng giải mã toàn bộ dòng bít.

23
Nhóm 04 – CNTT&TT 1.1, 1.2 K56
23
Đề tài 04 – Nén video theo chuẩn MPEG-1, MPEG-2 và ứng dụng thử nghiệm
Hình 3 : Giải mã phân cấp theo không gian.
Một số hệ thống nén có khả năng tạo ra tín hiệu có thể phân cấp (scaleable signal).
Quá trình này là quá trình mà sau khi cho tín hiệu đầu vào thì ta sẽ thu được tín hiệu
đầu ra gồm có một tín hiệu chính (main signal) và một tín hiệu hỗ trợ ( helper signal).
Bản thân tín hiệu chính có thể được giải mã độc lập cho chất lượng hình ảnh nhất định,
nhưng nếu có thêm tín hiệu hỗ trợ thì chất lượng hình ảnh sẽ được tăng lên.
Bộ mã hóa có khả năng phân cấp theo SNR
Hình ảnh chất lượng trung bình
Hình ảnh có chất lượng tốt hơn
Tín hiệu cơ bản
Tín hiệu tăng cường
Tín hiệu vào
(a)
Bộ mã hóa có khả năng phân cấp theo không gian
Hình ảnh độ phân giải thấp
Hình ảnh độ phân giải cao
Tín hiệu cơ bản
Tín hiệu tăng cường
(b)
Tín hiệu vào
Hình 4: (a) Bộ phân cấp theo tỉ lệ tín/tạp cho ra một tín hiệu có tỉ số tín/ồn ở mức
trung bình và một tín hiệu để giảm ồn.
24
Nhóm 04 – CNTT&TT 1.1, 1.2 K56
24
Đề tài 04 – Nén video theo chuẩn MPEG-1, MPEG-2 và ứng dụng thử nghiệm

(b) Bộ phân cấp theo không gian cho ra một tín hiệu ở mức trung bình
và một tín hiệu để tăng chất lượng hình ảnh.
Hình 4a chỉ ra một bộ mã hóa MPEG, bằng cách lượng tử lại có trọng số sẽ thu được
một hình ảnh có tỉ lệ tín/tạp ở mức trung bình. Tại bộ giải mã, hình ảnh này hoàn toàn
có khả năng tái tạo lại, nhưng kèm theo đó chắc chắn là có ồn lượng tử lớn làm chất
lượng hình kém hơn. Sự sai khác do ồn này có thể được nén và gửi đi như là tín hiệu
hỗ trợ. Một bộ giải mã đơn giản thì chỉ giải mã tín hiệu chính còn bộ giải mã phức tạp
hơn thì có thể giải mã cả tín hiệu chính và tín hiệu hỗ trợ cho kết quả là một hình ảnh ở
mức ồn thấp. Đây là nguyên lí của bộ phân cấp theo tỉ lệ tín/tạp.
Hình 4b là nguyên lí của bộ phân cấp theo không gian. Nếu chỉ cần mã hóa ở mức
trung bình thì một tí hiệu có độ phân giải trung bình được tạo ra và có thể được giải
mã bằng TV có độ phân giải tiêu chuẩn SDTV. Nhưng nếu gửi kèm vào đó một tín
hiệu tăng cường thì một bộ giải mã thích hợp tại nơi thu có thể kết hợp cả hai tín hiệu
để cho ra hình ảnh có độ phân giải cao HDTV.
Chuẩn MPEG-2 tăng số kênh âm thanh lên tới 5 kênh nhưng vẫn đảm bảo tương thích
với MPEG-1. Ngoài ra MPEG-2 còn có những phương pháp mã hóa âm thanh khác
hiệu quả hơn nhưng không tương thích ngược với MPEG-1. Đó là chuẩn nén MPEG-2
AAC (advance audio coding).
2.2.3. Profiles và Levels
• Profiles: Là khái niệm cho ta biết cấp chất lượng bộ công cụ nén được sử dụng
chuẩn nén này. Ở đây có sự thoả hiệp giữa tỷ số nén và giá thành bộ giải nén.
- Simple Profiles (Profiles đơn giản): Số bước nén thấp nhất, chỉ cho phép mã hoá
các ảnh loại I và P. Do có tổn thất cao về tốc độ bít, nó không được sử dụng trong
nén với kỹ thuật chuẩn đoán ảnh hai chiều (các ảnh B).
- Main Profiles (Profiles chính): Là sự thoả hiệp tốt nhất giữa tổn hao tốc độ bít và
chi phí, do nó sử dụng tất cả các ảnh I, P và B trong nén. Chất lượng tốt hơn
Profiles đơn giản nhưng nó đòi hỏi phải sử dụng các thiết bị mã hoá và giải mã
phức tạp hơn.
- SNR Profiles Scalable (Profiles phân cấp theo SNR): Tiêu chuẩn MPEG-2 cho
phép phân cấp tỷ số tín hiệu trên tạp âm, có nghĩa là chất lượng hình ảnh và tỷ số

tín hiệu trên tạp âm có tính thoả hiệp. Chuỗi ảnh chia thành hai lớp phân biệt nhau
về chất lượng. Các lớp thấp bao gồm ảnh có chất lượng cơ sở, ví dụ như chứa tín
hiệu theo chuẩn 4:2:0. Các lớp cao bao gồm lớp hoàn thiện hơn so với lớp thấp
hơn, như với tín hiệu video trong chuẩn 4:2:2. Có thể mã hoá kênh khác nhau cho
các lớp riêng.
- Spatially Scalable Profiles (phân cấp theo không gian): Tính phân cấp theo không
gian có nghĩa là có sự thoả hiệp với độ phân giải. Chuỗi ảnh được chia ra thành hai
lớp tương ứng với các độ phân giải khác nhau của ảnh. Lớp thấp hơn bao gồm ảnh
25
Nhóm 04 – CNTT&TT 1.1, 1.2 K56
25

×