Tải bản đầy đủ (.doc) (111 trang)

Đồ án tổng quan về chuẩn nén MPEG 4 h 264 AVC và khả năng ứng dụng trong thực tiễn

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.49 MB, 111 trang )

NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN
Tên đề tài : “Tổng quan về chuẩn nén MPEG-4 H.264/AVC và khả năng ứng dụng
trong thực tiễn”
GVHD : TS. TRẦN DŨNG TRÌNH
SVTH : NGUYỄN QUANG HOÀNG SƠN
MSSV : 103101088
LỚP
: 03DDT2
..................................................................................................................................
..................................................................................................................................
..................................................................................................................................
..................................................................................................................................
..................................................................................................................................
..................................................................................................................................
..................................................................................................................................
..................................................................................................................................
..................................................................................................................................
..................................................................................................................................
..................................................................................................................................
..................................................................................................................................
..................................................................................................................................
..................................................................................................................................
..................................................................................................................................
..................................................................................................................................
..................................................................................................................................
..................................................................................................................................
..................................................................................................................................
..................................................................................................................................
..................................................................................................................................
..................................................................................................................................
Tp.HCM ngày tháng năm 2008


GVHD

TS. Trần Dũng Trình

NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN
Tên đề tài : “Tổng quan về chuẩn nén MPEG-4 H.264/AVC và khả năng ứng dụng
trong thực tiễn”
GVHD : TS. TRẦN DŨNG TRÌNH
GVPB : KS. TRẦN DUY CƯỜNG

GVHD: TS. TRẦN DŨNG TRÌNH

SVTH : NGUYỄN QUANG HỒNG SƠN


SVTH : NGUYỄN QUANG HOÀNG SƠN
MSSV : 103101088
LỚP
: 03DDT2
..................................................................................................................................
..................................................................................................................................
..................................................................................................................................
..................................................................................................................................
..................................................................................................................................
..................................................................................................................................
..................................................................................................................................
..................................................................................................................................
..................................................................................................................................
..................................................................................................................................
..................................................................................................................................

..................................................................................................................................
..................................................................................................................................
..................................................................................................................................
..................................................................................................................................
..................................................................................................................................
..................................................................................................................................
..................................................................................................................................
..................................................................................................................................
..................................................................................................................................

Tp.HCM ngày tháng năm 2008
GVPB

KS. Trần Duy Cường

MỤC LỤC
LỜI GIỚI THIỆU...................................................................................... 6
CÁC THUẬT NGỮ TIẾNG ANH............................................................8
LỜI MỞ ĐẦU.......................................................................................... 10
CHƯƠNG I. CƠ SỞ VỀ NÉN TÍN HIỆU VIDEO.............................11
I.1

SỰ CẦN THIẾT CỦA NÉN TÍN HIỆU........................................................11

GVHD: TS. TRẦN DŨNG TRÌNH

SVTH : NGUYỄN QUANG HỒNG SƠN


I.2


Q TRÌNH SỐ HĨA TÍN HIỆU................................................................12

I.2.1
LẤY MẪU.........................................................................................12
I.2.2
LƯỢNG TỬ HĨA..............................................................................12
I.2.3
MÃ HĨA............................................................................................13
I.3
TỐC ĐỘ BIT VÀ THƠNG LƯỢNG KÊNH TRUYỀN TÍN HIỆU SỐ........14
I.3.1
TỐC ĐỘ BÍT......................................................................................14
I.3.2
THƠNG LƯỢNG KÊNH TRUYỀN..................................................14
I.4
Q TRÌNH BIẾN ĐỔI TÍN HIỆU MÀU...................................................14
I.5

CÁC TIÊU CHUẨN LẤY MẪU TÍN HIỆU VIDEO SỐ.............................16

I.6

MƠ HÌNH NÉN TÍN HIỆU VIDEO.............................................................17

I.6.1
I.6.2

NÉN TÍN HIỆU VIDEO....................................................................17
LƯỢNG TIN TRUNG BÌNH (ENTROPY).......................................18


CHƯƠNG II. CÁC KỸ THUẬT NÉN VIDEO...................................21
II.1

PHÂN LOẠI CÁC KỸ THUẬT NÉN..........................................................21

II.2

QUÁ TRÌNH BIẾN ĐỔI...............................................................................21

II.2.1
ĐIỀU XUNG MÃ VI SAI DPCM......................................................22
II.2.2
MÃ HÓA BIẾN ĐỔI..........................................................................22
II.2.2.1
Biến đổi cosin rời rạc DCT...............................................................22
II.2.2.2
Biến đổi Hadamard...........................................................................23
II.3 Q TRÌNH LƯỢNG TỬ............................................................................24
II.3.1
LƯỢNG TỬ HĨA VƠ HƯỚNG........................................................24
II.3.2
LƯỢNG TỬ HĨA VECTOR.............................................................25
II.4 Q TRÌNH MÃ HĨA................................................................................25
II.4.1
MÃ HĨA ĐỘ DÀI THAY ĐỔI..........................................................25
II.4.1.1
Mã hóa Huffman...............................................................................26
II.4.1.2
Mã hố mức dọc chiều dài RLC.......................................................26

II.4.2
MÃ HĨA SỐ HỌC............................................................................27
II.5 TIÊU CHUẨN ĐÁNH GIÁ CHẤT LƯỢNG ẢNH NÉN.............................30

CHƯƠNG III. CÁC CHUẨN NÉN THUỘC HỌ MPEG TRƯỚC
MPEG-4 H.264/AVC................................................................................ 31
III.1 GIỚI THIỆU VỀ LỊCH SỬ PHÁT TRIỂN CỦA KỸ THUẬT MPEG.........31
III.2 CÁC TIÊU CHUẨN NÉN TRƯỚC MPEG-4 H.264/AVC...........................31
III.2.1
TIÊU CHUẨN MPEG-1....................................................................31
III.2.1.1 Các đặc điểm của tiêu chuẩn MPEG-1.............................................32
III.2.1.2 Cấu trúc dòng bit của MPEG-1.........................................................33
III.2.2
TIÊU CHUẨN MPEG-2....................................................................34
III.2.2.1 Các đặc điểm của tiêu chuẩn MPEG-2.............................................34
III.2.2.2 Sự khác nhau chính giữa MPEG-1 và MPEG-2................................35

GVHD: TS. TRẦN DŨNG TRÌNH

SVTH : NGUYỄN QUANG HỒNG SƠN


III.2.3
III.2.4

TIÊU CHUẨN MPEG-4....................................................................36
SO SÁNH ĐẶC ĐIỂM NỔI BẬT CỦA CÁC CHUẨN NÉN...........37

CHƯƠNG IV. CHUẨN NÉN MPEG-4 H.264/AVC...........................38
IV.1


TỔNG QUAN VỀ CHUẨN NÉN MPEG-4 H.264/AVC..............................38

IV.1.1
LỊCH SỬ PHÁT TRIỂN CỦA MPEG-4 H.264/AVC........................38
IV.1.2
CÁC PROFLIES VÀ LEVELS TRONG H.264/AVC........................39
IV.1.2.1 CÁC PROFILES..............................................................................39
IV.1.2.2 CÁC LEVELS..................................................................................40
IV.2 NHỮNG ĐẶC TÍNH NỔI BẬT CỦA CHUẨN NÉN H.264/AVC...............41
IV.3

KỸ THUẬT NÉN VIDEO H.264/AVC.........................................................44

IV.3.1
GIẢI THÍCH NGUYÊN LÝ HOẠT ĐỘNG CƠ BẢN......................44
IV.3.1.1 Sơ đồ mã hóa....................................................................................44
IV.3.1.2 Sơ đồ giải mã....................................................................................45
IV.3.2
KHỐI NÉN THỜI GIAN...................................................................46
IV.3.2.1 Dự đốn một chiều (mã hóa ảnh Prediction).....................................46
IV.3.2.2 Dự đốn hai chiều( mã hóa ảnh Bidiriectional Prediction)...............47
IV.3.2.3 Dự đốn liên ảnh (Inter-Frame)........................................................51
IV.3.2.4 Mã hóa ảnh SP (switching P) và SI (switching I).............................53
IV.3.3
KHỐI NÉN KHÔNG GIAN..............................................................54
IV.3.3.1 Chia ảnh thành các MacroBlock.......................................................55
IV.3.3.2 Dự đoán trong ảnh (Intra-frame).......................................................56
IV.3.3.3 Dự đoán trọng số:.............................................................................62
IV.3.3.4 Kỹ thuật tiên đoán bù chuyển động và ước lượng chuyển động.......63

IV.3.3.5 Phép biến đổi nguyên ICT (Integer Discrete Cosin Transform)........71
IV.3.3.6 Quá trình lượng tử............................................................................75
IV.3.3.7 Quá trình giải lượng tử:....................................................................77
IV.3.3.8 Quét Zig-Zag....................................................................................78
IV.3.3.9 Mã hóa xen kẽ..................................................................................80
IV.3.3.10 Sắp xếp thứ tự Slice..........................................................................80
IV.3.4
MÃ HĨA ENTROPY.........................................................................81
IV.3.4.1 Mã hóa Entropy Exp-Golomb...........................................................82
IV.3.4.2 Mã hóa độ dài biến đổi thích nghi nội dung CAVLC........................84
IV.3.4.3 Mã hóa số học nhị phân thích nghi nội dung CABAC......................87
IV.3.5
BỘ LỌC TÁCH KHỐI TRONG VỊNG............................................89
IV.3.5.1 Ngun tắc của lọc tách khối............................................................90
IV.3.5.2 Q trình lọc khối.............................................................................91
IV.3.6
CẤU TRÚC VÀ CÚ PHÁP CHUẨN H.264/AVC.............................94
IV.3.6.1 Lớp trừu tượng mạng NAL...............................................................95
IV.3.6.2 Lớp mã hóa video VCL (Video Coding Layer).................................96
IV.3.6.3 Kỹ thuật FMO và Data Partitioned Slices.........................................96
IV.3.6.4 Kỹ thuật Arbitrary Slice Ordering.....................................................96
IV.3.6.5 Cấu trúc dòng bit H.264/AVC...........................................................97

CHƯƠNG V. MỘT SỐ ỨNG DỤNG CHUẨN H.264/AVC...............99
GVHD: TS. TRẦN DŨNG TRÌNH

SVTH : NGUYỄN QUANG HOÀNG SƠN


V.1


TRUYỀN HÌNH INTERNET IPTV..............................................................99

V.2

TRUYỀN HÌNH VỆ TINH DVB-S2..........................................................100

V.3

TRUYỀN HÌNH DI DỘNG........................................................................100

CHƯƠNG VI. MƠ PHỎNG Q TRÌNH NÉN-GIẢI NÉN CỦA
H.264/AVC BẰNG MATLAB...............................................................103
VI.1 LƯU ĐỒ GIẢI THUẬT..............................................................................103
VI.2 CHƯƠNG TRÌNH MƠ PHỎNG:...............................................................103
VI.3 KẾT QUẢ MÔ PHỎNG.............................................................................104

PHỤ LỤC............................................................................................... 106
TÀI LIỆU THAM KHẢO.....................................................................113

LỜI GIỚI THIỆU

H

iện nay, chúng ta đang sống trong một kỷ nguyên mới “Kỷ nguyên truyền
thông đa phương tiện” các thiết bị mới, các kỹ thuật mới lần lượt ra đời nhằm

mục đích đáp ứng nhu cầu giải trí cho con người ngày một tốt hơn. Các ứng dụng đa
phương tiện thời gian thực truyền trên mạng di động, mạng Internet, mạng truyền
hình…ngày càng phát triển rầm rộ, các nhà sản xuất thiết bị chú trọng áp dụng các

công nghệ nén tiên tiến vào thiết bị của mình nhằm thõa mãn nhu cầu “chất lượng
trung thực về âm thanh, hình ảnh” của con người cũng như khả năng đáp ứng yêu cầu

GVHD: TS. TRẦN DŨNG TRÌNH

SVTH : NGUYỄN QUANG HỒNG SƠN


thực tế của công nghệ. Thế nhưng không phải nhu cầu nào của chúng ta đều có thể
được đáp ứng một cách thuận lợi, vì sự gắn liền giữa độ phức tạp, tốn kém chi phí đầu
tư cơ sở hạ tầng, thiết bị đầu cuối…, luôn đi kèm với công nghệ cao. Bên cạnh đó vấn
đề truyền thơng nội dung đa phương tiện hiện nay đang gặp một số khó khăn: băng
thông đường truyền, nhiễu kênh, giới hạn của pin cho các ứng dụng…. Trong khi băng
thông kênh truyền phải chờ đợi một công nghệ mới của tương lai mới có thể cải thiện,
cịn việc cải thiện giới hạn của pin dường như không đáp ứng được sự phát triển của
các dịch vụ trong tương lai, thì phương pháp giảm kích thước dữ liệu bằng các kỹ
thuật nén là một cách giải quyết hiệu quả các khó khăn trên.
Cho đến nay có rất nhiều kỹ thuật nén dữ liệu đa phương tiện như: chuẩn JPEG, chuẩn
JPEG2000 và chuẩn MPEG… tuy nhiên hiệu quả nén của các tiêu chuẩn này cũng
chưa được cao, và vẫn chưa đáp ứng tốt yêu cầu của truyền hình HDTV…cũng như
việc lưu trữ dung lượng cịn rất lớn. Gần đây nhất là sự thành công của tiêu chuẩn mã
hóa MPEG-2 được đánh dấu nổi bật từ những lần phóng thương mại đầu tiên các hệ
thống vệ tinh DTH vào giữa những năm 1990 và thành công của chuẩn nén MPEG-4
Part 2 trong ứng dụng truyền hình số, các ứng dụng đồ họa… Nhưng với yêu cầu bộ
mã hóa có thể tương thích với các ứng dụng tốc độ bit thấp, thì nó khơng đáp ứng hiệu
quả. Từ việc nghiên cứu khắc phục nhược điểm của MPEG-2, phát triển bổ sung cho
MPEG-4 Part 2 để cho ra đời những chuẩn nén tiên tiến hơn, mà nổi bật là MPEG-4
H.264/AVC. Nó là sự kết hợp hồn hảo giữa 2 tổ chức nổi tiếng: nhóm chuyên gia mã
hóa video của tổ chức ITU và nhóm chuyên gia xử lý ảnh động ISO/IEC. Ta thử xét
một ví dụ minh họa trong truyền hình số, nếu sử dụng kỹ thuật nén MPEG-2 cung cấp

định dạng SDTV với độ phân giải 640x480 pixel thì cần băng thơng 4.3Mbps trên một
kênh truyền cịn đối với HDTV thì cần 19Mbps, nhưng nếu sử dụng chuẩn nén H.264
thì băng thơng cho truyền hình SDTV chỉ có 1.5 – 2 Mbps hoặc 6-9 Mbps đối với
HDTV. Chính vì những ưu điểm đó mà MPEG-4 H.264/AVC đã dần dần chứng tỏ vị
thế số 1 của mình, những ưu việt mà chuẩn nén này mang lại chắc chắn sẽ có ảnh
hưởng tích cực đến thị trường phim ảnh, cũng như ngành công nghiệp chế tạo thiết bị
đầu cuối. Để có thể hiểu biết hơn về tiêu chuẩn nén tiên tiến này, em đã chọn đề tài
“Tổng quan về chuẩn nén MPEG-4 H.264/AVC và khả năng ứng dụng trong thực

GVHD: TS. TRẦN DŨNG TRÌNH

SVTH : NGUYỄN QUANG HỒNG SƠN


tiễn” làm đề tài tốt nghiệp của mình. Sau hơn 3 tháng nỗ lực hết mình, về cơ bản Đồ
án cũng đã cho ta cái nhìn tổng quát về chuẩn nén MPEG-4 H.264/AVC, đồng thời với
sự minh họa bằng chương trình Matlab 7.01, cũng giúp cho ta hiểu rõ hơn những ưu
điểm của chuẩn nén này, tuy nhiên do có sự hạn chế về kinh nghiệm, thời gian,…nên
sẽ không tránh khỏi sai sót, kính mong Q Thầy Cơ, bạn bè, đồng nghiệp tham khảo
đóng góp ý kiến.
Em xin chân thành cảm ơn TS. Trần Dũng Trình đã bỏ ra chút thời gian quý báu,
hướng dẫn tận tình và cung cấp tài liệu bổ ích trong q trình làm Đồ án. Đồng thời
cũng xin cảm ơn Quý Thầy Cô Trường Đại Học Kỹ Thuật Cơng Nghệ Thành Phố Hồ
Chí Minh, đã tận tình dạy dỗ, truyền thụ kiến thức và kinh nghiệm cho em trong suốt
hơn bốn năm qua, cảm ơn các bạn bè đã quan tâm, chia xẻ, đóng góp ý kiến.
Kính chúc Quý Thầy Cô và bạn bẻ được nhiều sức khỏe.
Tp.hcm, tháng 01/2008
Sinh viên thực hiện

Nguyễn Quang Hoàng

Sơn

CÁC THUẬT NGỮ TIẾNG ANH
BAC
CA
CC
CIF
DAB
DCT
DFT
DPCM
DS
DTH

Mã hóa số học nhị phân (Binary Arithmetic Coding)
Mã hóa thích nghi theo nội dung (Context Adaptive)
Mã xóa (Clear code)
Định dạng mã hóa hình ảnh có kích thước 352 x 288 (Common
Intermediate Format)
Phát quảng bá âm thanh số (Digital Audio Broadcasting)
Biến đổi Cosine rời rạc (Discrete Cosine Transform)
Biến đổi Fourier rời rạc (Discrete Fourier Transform)
Điều xung mã vi sai (Differential Pulse Code Modulation)
Thuật tốn tìm kiểu hình thoi (Diamond Search)

GVHD: TS. TRẦN DŨNG TRÌNH

SVTH : NGUYỄN QUANG HOÀNG SƠN



DWT
EOI
ES
Exp-Golomb
FLC
FMO
GOP
GMC
HDS
HDTV
HEXBS
ICT
IDR

IDCT
IP
ISDN
JPEG
JPEG2000
LOSSLESS
LOSSY
MB
MBAFF
MC
ME
MMS
MSE
MPEG
NAL
NNS

PCM
PF
MF
PSNR
QCIF
QP
RBSP
RGB
RLC
RSVP

Biến đổi Wavelet rời rạc (Discrete Wavelet Transform)
Mã kết thúc (End Of Information)
Dịng cơ bản (Elemenatary Stream)
Mã Exponential Golomb
Mã hóa có chiều dài cố định (Fixed-Length Code)
Thứ tự MB mềm dẻo (Flexible Macroblock Order)
Nhóm ảnh (Group Of Pictures)
Bù chuyển động tồn phần (Global Motion Compensation)
Thuật tốn tìm hình thoi nằm ngang (Horizontal Diamond search)
Truyền hình phân giải cao (High Definition Television)
Thuật tốn tìm kiểu hình lục giác (Hexagon-Based Search)
Biến đổi nguyên Cosine rời rạc (Integer Discrete Cosine Transform)
Ảnh làm tươi tức thời bộ giải mã (Instantaneous Decoder Refresh
Picture)
Biến đổi ngược Cosine rời rạc (Inverse Discrete Cosine Transform)
Giao thức Internet ( Internet Protocol)
Mạng tích hợp dịch vụ số (Integrated Service Digital Network)
Chuẩn nén ảnh của ủy ban JPEG quốc tế (Joint Photographic Experts
Group)

Chuẩn nén ảnh JPEG2000
Kỹ thuật nén ảnh không tổn hao (khơng mất dữ liệu)
Kỹ thuật nén ảnh có tổn hao (có mất dữ liệu)
Đa khối (Macroblock)
Mã hóa khung mành thích nghi (Macroblock-Adaptive Frame-Field
coding)
Bù chuyển động (Motion Compensation)
Ước lượng chuyển động(Motion Estimate)
Dịch vụ tin nhắn đa phương tiện (Multimedia Messaging Services)
Sai số bình phương trung bình (Mean Square Error)
Nhóm chun gia nén ảnh động (Moving Pictures Experts Group)
Lớp trừu tượng mạng (Network Abstraction Layer)
Tìm ở khối gần nhất (Nearest Neighbors Search)
Điều xung mã (Pulse Code Modulation)
Hệ số co dãn (Parameter Factor)
Hệ số nhân(Multipy Factor)
Tỷ số tín hiệu đỉnh trên nhiễu (Peak Signal to Noise Ratio)
Định dạng hình ảnh có kích thước 176 x 144 (Quarter Common
Intermediate Format)
Thông số lượng tử (Quantization Parameter)
(Raw Byte Sequence Payload)
Ba màu cơ bản màu đỏ/Xanh/Lam (Red/Green/Blue)
Mã hoá dọc chiều dài (Run Length Coding)
Giao thức dành riêng tài nguyên mạng (Resource Reservation
Protocol)

GVHD: TS. TRẦN DŨNG TRÌNH

SVTH : NGUYỄN QUANG HOÀNG SƠN



RTP
SDTV
SMIL
SRC
TSS
UMTS
VCL
VLC
VO
VOP
YCbCr
ISO
IEC
JTC1
SC29
WG11

Giao thức truyền tải thời gian thực (Real Time Transport Protocol)
Truyền hình tiêu chuẩn ( Standard Televison)
Ngơn ngữ tích hợp Multimedia đồng bộ (Synchronized Multimedia
Integration Language)
Điều khiển tốc độ bit biến đổi được ( Scalable Rate Control)
Thuật tốn tìm ba bước (Three-Step search)
(Universal Mobile Telecommications System)
Lớp mã hóa Video (Video Coding Layer)
Mã có chiều dài thay đổi (Variable Length Code)
Đối tượng Video (Video Object)
Đối tượng mặt phẳng Video (Video Object Plane)
Độ chói, màu lam, màu đỏ (Luminance, Blue chrominance, Red

chrominance)
Tổ chức quốc tế về tiêu chuẩn chất lượng (International Organization
for Standardization)
Ủy ban kỹ thuật điện quốc tế (International Electro-technical
Commission)
Ủy ban kỹ thuật 1 (Joint Technical Committee 1)
Ủy ban phụ 29 (Sub-committee 29)
Nhóm làm việc 11( Work Group 11)

LỜI MỞ ĐẦU
Để có thể đi sâu vào nghiên cứu chuẩn nén MPEG-4 H.264/AVC, thì chúng ta cần nắm
được các thuật ngữ, các kỹ thuật cần thiết cho việc nén tín hiệu, cũng như là các ưu
nhược điểm của các chuẩn nén trước đó đã mang lại.Vì đây là một đề tài lý thuyết, nên
bước quan trọng nhất của quá trình làm Đồ án tốt nghiệp là tìm kiếm tài liệu và tổng
hợp nó thành một chuỗi các kiến thức liên tục tránh lang man và yếu tố thuyết phục
người tham khảo cũng rất quan trọng, do đó bên cạnh trình bày chi tiết về cách thức
nén, em đã cố gắng mô phỏng một phần ưu điểm của chuẩn nén này nhằm góp phần
sinh động cho đề tài.
TỔ CHỨC ĐỒ ÁN

GVHD: TS. TRẦN DŨNG TRÌNH

SVTH : NGUYỄN QUANG HỒNG SƠN


Đồ án được trình bày thành 6 chương và 1 phụ lục.
Chương I: Trình bày cơ sở về nén tín hiệu video, các thơng số đặc trưng của tín hiệu
số và q trình biến đổi tín hiệu màu, phân loại các nguyên lý nén.
Chương II: Trình bày các kỹ thuật được sử dụng trong nén Video, các phép biến đổi
và các kỹ thuật mã hóa, các tiêu chuẩn đáng giá chất lượng ảnh nén MSE, PSNR,

MAE,SAE …
Chương III: Trình bày các chuẩn nén thuộc họ MPEG, cấu trúc dòng bit, các ưu điểm
đã đạt được.
Chương IV: Cũng là chương quan trọng nhất, trình bày chuẩn nén tiên tiến nhất hiện
nay: MPEG-4 H.264/AVC, các đặc tính nổi bật và các kỹ thuật mới trong chuẩn nén
này.
Chương V: Các ứng dụng của MPEG-4 H.264/AVC trong thực tế và tương lai.
Chương VI: Mô phỏng một phần quá trình nén và giải nén của MPEG-4 H.264/AVC,
mơ phỏng kiểu mã hóa tiên tiến như bù chuyển động với kích thước 4x4, sử dụng bảng
lượng tử vơ hướng 52 giá trị…
Tuy nhiên, do kinh nghiệm cịn hạn chế, đồng thời MPEG-4 H.264/AVC là một kỹ
thuật còn trong giai đoạn nghiên cứu và phát triển, nên chắc chắn Đồ án sẽ khơng
tránh khỏi sai sót, kính mong Q Thầy Cơ, và bạn bè đồng nghiệp đóng góp ý kiến
nhằm hoàn thiện tốt Đồ án tốt nghiệp này.

CHƯƠNG I.
I.1

CƠ SỞ VỀ NÉN TÍN HIỆU VIDEO

SỰ CẦN THIẾT CỦA NÉN TÍN HIỆU

Một tín hiệu video số thường chứa một lượng lớn dữ liệu, do đó sẽ gặp rất nhiều khó
khăn trong việc lưu trữ và truyền đi trong một băng thông kênh truyền hạn chế. Với sự
phát triển của khoa học kỹ thuật, ngày nay đã sản xuất được bộ cảm biến màu có độ
phân giải lên đến 16 triệu pixel tương đương với một bức ảnh có độ phân giải
4096x4096 pixels, nhưng thực tế ứng dụng cần độ phân giải cao nhất hiện nay cũng
chỉ dùng lại ở 1920x1080 pixel, do đó để có thể tiết kiệm khơng gian lưu trữ và băng
thơng kênh truyền thì cần nén tín hiệu.


GVHD: TS. TRẦN DŨNG TRÌNH

SVTH : NGUYỄN QUANG HỒNG SƠN


Q trình nén ảnh thực hiện được là do thơng tin trong bức ảnh có tổ chức, có trật tự,
vì vậy nếu xem xét kỹ tính trật tự, cấu trúc ảnh sẽ phát hiện và loại bỏ được các lượng
thông tin dư thừa, chỉ giữa lại các thông tin quan trọng nhằm giảm số lượng bit khi lưu
trữ cũng như khi truyền mà vẫn đảm bảo tính thẩm mỹ của bức ảnh. Tại đầu thu, bộ
giải mã sẽ tổ chức, sắp xếp lại được bức ảnh xấp xỉ gần chính xác so với ảnh gốc
nhưng vẫn đảm bảo thông tin cần thiết. Tín hiệu video thường chứa đựng một lượng
lớn các thông tin dư thừa, chúng thường được chia thành 5 loại như sau:
 Có sự dư thừa thơng tin về không gian: giữa các điểm ảnh lân cận trong phạm
vi một bức ảnh hay một khung video, còn gọi là thừa tĩnh bên trong từng frame.
 Có sự dư thừa thông tin về thời gian: giữa các điểm ảnh của các khung video
trong chuỗi ảnh video, còn gọi là thừa động giữa các frame
 Có sự dư thừa thơng tin về phổ: giữa các mẫu của các dữ liệu thu được từ các
bộ cảm biến trong camera, máy quay…
 Có sự dư thừa do thống kê: do bản thân của các ký hiệu xuất hiện trong dòng
bit với các xác suất xuất hiện khơng đồng đều.
 Có sự dư thừa tâm thị giác: thông tin không phù hợp với hệ thống thị giác con
người, những tần số quá cao so với cảm nhận của mắt người.
Ưu điểm của việc nén tín hiệu:
 Tiết kiệm băng thơng kênh truyền ( trong thời gian thực hoặc nhanh hơn).
 Kéo dài thời giản sử dụng của thiết bị lưu trữ, giảm chi phí đầu tư cho thiết bị
lưu trữ.
 Giảm dung lượng thơng tin mà khơng làm mất tính trung thực của hình ảnh.
Có nhiều phương pháp nén tín hiệu, phương pháp nén bằng cách số hóa tín hiệu vẫn
tỏ ra hữu hiệu trong mọi thời đại, một mặt nó có thể làm giảm lượng thông tin không
quan trọng một cách đáng kể, mặt khác nó cịn giúp cho tín hiệu được bảo mật hơn.


I.2

Q TRÌNH SỐ HĨA TÍN HIỆU

Q trình số hố tín hiệu tương tự, bao gồm q trình lọc trước (prefiltering), lấy mẫu,
lượng tử và mã hoá minh họa như hình I.1. Quá trình lọc trước nhằm loại bỏ các tần số

GVHD: TS. TRẦN DŨNG TRÌNH

SVTH : NGUYỄN QUANG HOÀNG SƠN


khơng cần thiết ở tín hiệu cũng như nhiễu, bộ lọc này còn gọi là bộ lọc chống nhiễu
xuyên kênh Aliasing.
I.2.1 LẤY MẪU
Thực chất đây là một phép toán rời rạc hay là một phép điều biên xung PAM và được
thực hiện bằng các mạch Op-amp có cực khiển strobe. Nó tạo ra giá trị tín hiệu tương
tự tại một số hữu hạn các giá trị có biến rời rạc gọi là các mẫu. Các mẫu được lấy cách
đều nhau gọi là chu kỳ lấy mẫu. Tần số lấy mẫu phải thoả mãn định lý NyquistShannon :
f s 2 f maz

Trong đó:

+ fs là tần số lấy mẫu.
+ fmax là tần số cực đại của phổ tín hiệu tương tự.

I.2.2 LƯỢNG TỬ HĨA.
Q trình lượng tử là q trình chuyển một xung lấy mẫu thành một xung có biên độ
bằng mức lượng tử gần nhất hay nói cách khác là lượng tử chuyển đổi các mức biên độ

của tín hiệu đã lấy mẫu sang một trong các giá trị hữu hạn các mức nhị phân. Lượng tử
hố biến đổi tín hiệu liên tục theo thời gian thành tín hiệu có biên độ rời rạc, nhằm làm
giảm ảnh hưởng của tạp âm trong hệ thống, hạn chế các mức cho phép của tín hiệu lấy
mẫu và chuẩn bị truyền tín hiệu gốc từ tương tự sang số. Giá trị thập phân của các mẫu
hiệu
gốc
sau khi lượng tử hố sẽ được biểuTín
diễn
dưới
dạng số nhị phân n bit (N= 2 n), với n là độ

phân giải lượng tử hố, n càng lớn thì độ chia càng mịn, do đó độ chính xác càng cao.
t
Do làm trịn các mức nên tín hiệuXung
bị méo
dạng
do
sai
số
lượng
tử
gọi
là méo lượng tử,
lấy mẫu
tỷ số tín hiệu trên méo lượng tử (S/N) được xác định bởi:
S
6,02n  1,76(dB )
N

TS chu kyø lấy mẫu


t

Tín hiệu được lấy
mẫu

t
Mã hoá tín
hiệu
1000
0001
0000

GVHD: TS. TRẦN DŨNG TRÌNH

t
SVTH : NGUYỄN QUANG HỒNG SƠN

Hình I.1: Sơ đồ quá trình tạo tín hiệu số.


Lượng tử hóa có hai loại:
 Lượng tử tuyến tính: phép nén tín hiệu theo quy luật đường cong đồng đều,
bước lượng tử bằng nhau.
 Lượng tử phi tuyến: phép nén tín hiệu theo quy luật đường cong khơng đồng
đều, tập trung nhiều mức lượng tử ở những vùng tín hiệu nhỏ. Trong kỹ thuật
nén ảnh, nén video thì loại lượng tử phi tuyến được dùng nhiều hơn vì nó giảm
dung lượng đến mức tối đa với độ méo lượng tử có thể chấp nhận được.
I.2.3 MÃ HĨA
Là q trình thay thế mỗi mức điện áp cố định sau khi lượng tử bằng một dãy nhị phân

gọi là từ mã. Tất cả các từ mã đều chứa số xung nhị phân cố định và được truyền trong
khoảng thời gian giữa 2 thời điểm lấy mẫu cạnh nhau. Bộ mã được sử dụng để tái tạo
các xung nhị phân hoặc các từ mã từ các giá trị đã lượng tử xuất hiện ở đầu ra của bộ
lượng tử hoá.

I.3

TỐC ĐỘ BIT VÀ THƠNG LƯỢNG KÊNH TRUYỀN TÍN HIỆU SỐ

I.3.1 TỐC ĐỘ BÍT
Tốc độ bit là số lượng bit được truyền đi hay lưu trữ trong một đơn vị thời gian.
C  f s * n (bit/s)

Trong đó :

GVHD: TS. TRẦN DŨNG TRÌNH

SVTH : NGUYỄN QUANG HỒNG SƠN


+ f s là tần số lấy mẫu (Hz).
+ n là số bit nhị phân trong một ký hiệu.
+ C là tốc độ bit (bps).
I.3.2 THÔNG LƯỢNG KÊNH TRUYỀN
Là tốc độ số liệu cực đại có thể truyền được trên kênh truyền có độ rộng băng tần B.
C  B. log 2 (1  S

N

) (bps)


Trong đó
+ C là tốc độ bit (bps)
+ S N là tỷ số tín hiệu trên nhiễu trắng.
+ B là băng thông kênh truyền (Hz).
Tốc độ bit càng lớn thì tín hiệu tương tự khơi phục lại càng trung thực tuy nhiên nó sẽ
là cho dung lượng lưu trữ và băng thông kênh truyền càng lớn. Trong thực tế để truyền
3
4

tín hiệu có tốc độ bit là C (bps) thì cần băng thơng kênh truyền là: B  C (Hz)
Ví dụ: với n = 4, fs = 44,1Khz thì:
Tốc độ truyền thơng tin là : C = n x fs = 4 x 44,1 = 176,3.103 bits/s
3
4

Và độ rộng băng tần là B  C =

I.4

3
x 176,4.10 3 132,3 Khz
4

Q TRÌNH BIẾN ĐỔI TÍN HIỆU MÀU

R, G, B

Hình II.2. Minh họa quá trình biến đổi
màu.

Hình I.2. Q trình biến đổi màu

GVHD: TS. TRẦN DŨNG TRÌNH

SVTH : NGUYỄN QUANG HOÀNG SƠN


Một bức ảnh được chuyển từ RGB sang YUV nhằm giảm dung lượng lưu trữ cũng như
truyền đi, trong quá trình giải mã, trước khi hiển thị ảnh thì nó được biến đổi ngược lại
thành RGB. Công thức minh họa quá trình biến đổi như sau:
Y k r R  (1  k b  k r )G  k b B
0.5
Cb 
(B  Y )
1  kb

(1)

0.5
Cr 
(R  Y )
1  kr

Với k b  k r  k g 1 , kb = 0.114, kr = 0.299, khi thế vào cơng thức (1) thì ta được:
Y 0.299 R  0.587G  0.114 B
0.5
Cb 
( B  Y )  0.169 R  0.331G  0.5 B
1  0.114
0.5

Cr 
( R  Y ) 0.5R  0.419G  0.081B
1  0.299

Nên ta có ma trận biến đổi từ RGB sang YUV như sau:
Y  0.299
Cb   0.169
  
Cr  0.5

0.587
 0.331
 0.419

0.114   R 
0.5  G 
 0.081  B 

Thực hiện tương tự ta suy ra được ma trận biến đổi từ YUV sang RGB như sau:
0
 R  1
G   1  0.344
  
 B  1
1.772

I.5

1.402  Y 
 0.714 Cb 

 Cr 
0

CÁC TIÊU CHUẨN LẤY MẪU TÍN HIỆU VIDEO SỐ

Kiểu lấy mẫu cho ảnh video cũng là một vấn đề khá quan trọng của kỹ thuật nén ảnh.
Một số kiểu lấy mẫu phổ biến minh họa như hình I.3 và có đặc điểm như sau:
 Tốc độ lấy mẫu 4:1:1 - tần số lấy mẫu tín hiệu chói là 13,5MHz, và mỗi tín
hiệu hiệu màu là 3,375MHz.
 Tốc độ lấy mẫu 4:2:2 - tần số lấy mẫu tín hiệu chói là 13,5MHz, và mỗi tín
hiệu hiệu màu là 6,75MHz.
 Tốc độ lấy mẫu 4:4:4 - cả 3 thành phần có cùng độ phân giải, nghĩa là tần
số lấy mẫu tín hiệu chói là 13,5MHz, và mỗi tín hiệu hiệu màu là 13,5MHz.

GVHD: TS. TRẦN DŨNG TRÌNH

SVTH : NGUYỄN QUANG HOÀNG SƠN


 Tốc độ lấy mẫu 4:2:0 - là kiểu phổ biến, tần số lấy mẫu tín hiệu chói là
13,5MHz, và mỗi tín hiệu hiệu màu là 6,75MHz theo cả 2 chiều
Ví dụ : Một bức ảnh có độ phân giải 720 × 576 pixels
Độ phân giải của thành phần Y là 720 × 576 pixels được mã hóa bằng từ mã 8 bits.
 Nếu sử dụng kiểu lấy mẫu 4:4:4 thì độ phân giải của thành phần Cb, Cr là 720 ×
576 mẫu cũng được mã hóa bằng từ mã 8 bits.
=> Vậy tổng số bits sử dụng để mã hóa bức ảnh là 720 × 576 × 8 × 3 = 9 953 280 bits
 Nếu sử dụng kiểu lấy mẫu 4:2:0 thì độ phân giải của thành phần Cb, Cr là 360 ×
288 mẫu, cũng được mã hóa bằng từ mã 8 bits.
=> Vậy tổng số bits sử dụng là (720 × 576 × 8) + (360 × 288 × 8) × 2 = 4 976 640 bits


Hình I.3. Các tiêu chuẩn lấy mẫu phổ biến
Trong kiểu 4:4:4, tổng số mẫu cần thiết là 12 mẫu, do đó tổng số bit là 12 × 8 = 96
bits, và trung bình là 96/4 = 24 bits/pixel
Trong kiểu 4:2:0, tín hiệu được quét xen kẽ, do đó chỉ cần thiết 6 mẫu, 4 mẫu cho
thành phần Y, 1 mẫu cho thành phần Cb, 1 mẫu cho thành phần Cr, do đó tổng số bits
cần thiết là 6 × 8 = 48 bits, và trung bình là 48/4 = 12 bits/pixel.
Ta thấy kiểu lấy mẫu 4:2:0 giảm một ½ số lượng bits so với 4:4:4, đó cũng chính là lý
do mà kiểu lấy mẫu này được sử dụng phổ biến.

GVHD: TS. TRẦN DŨNG TRÌNH

SVTH : NGUYỄN QUANG HỒNG SƠN


I.6

MƠ HÌNH NÉN TÍN HIỆU VIDEO

Nén thời gian

Nén khơng gian
Bộ mã hóa ENTROPY

Lưu trữ ảnh
Hình I.4. Sơ đồ khối nén tín hiệu Video cơ bản
Các khối chính là:
- Khối nén dư thừa thời gian.
 Dự đoán chuyển động
 Bù chuyển động
- Khối nén dư thừa theo không gian.

 Biến đổi DCT, DWT
 Lượng tử hóa
 Xắp xếp lại trật tự và mã hóa Entropy
I.6.1 NÉN TÍN HIỆU VIDEO
Tín hiệu video có dải phổ nằm trong khoảng 0 -> 6Mhz, do thành phần tần số cao chỉ
xuất hiện ở các đường viền của hình ảnh nên năng lượng phổ rất ít tập trung ở miền
tần số cao mà chủ yếu tập trung ở miền tần số thấp. Điều đó có nghĩa là số lượng bit ở
miền tần số thấp sẽ nhiều hơn ở miền tần số cao.
Trong các hệ thống nén, tỉ số nén chính là tham số quan trọng đánh giá khả năng nén
của hệ thống, ta gọi n1, n2 là số lượng bit của tín hiệu trước và sau khi nén nên ta có
cơng thức như sau:
Tỷ số nén sẽ là C 

n1
n2

Phần trăm nén hay còn gọi là độ dư thừa dữ liệu tương đối.
 n 
n  n2
R 1  2  x 100%  1
x 100%
n1 
n1


GVHD: TS. TRẦN DŨNG TRÌNH

SVTH : NGUYỄN QUANG HỒNG SƠN



Nếu n1= n2 thì ta có C =1, và R = 0 nghĩa là khơng có sự dư thừa dữ liệu.
Nếu n2<Ví dụ : n1 = 100Mb/s, n2 = 20Mb/s thì C = 5:1, R = 80%. Tức là ảnh có sự dư thừa
lớn, hiệu quả nén đạt 80%.
I.6.2 LƯỢNG TIN TRUNG BÌNH (ENTROPY)
Trước khi nghiên cứu các phương pháp nén, ta cần đánh giá lượng thông tin chủ yếu
được chứa đựng trong hình ảnh, từ đó xác định dung lượng tối thiểu cần sử dụng để
miêu tả, truyền tải thông tin về hình ảnh.
Thơng tin được ký hiệu là ai và có xác suất p(ai) thì lượng tin được xác định theo công
thức sau:
I (ai ) log 2 [

1
]  log 2 p (ai )
p (ai )

Theo công thức trên ta thấy lượng tin chứa đựng trong một hình ảnh sẽ tỉ lệ nghịch với
khả năng xuất hiện của ảnh đó, nghĩa là sự kiện ít xảy ra sẽ chứa đựng nhiều thông tin
hơn và bằng tổng số lượng thông tin của từng phần tử ảnh.
Gọi lượng tin trung bình của hình ảnh là H(X) và được tính bằng cơng thức sau:
N

H (X )  p (ai ) * log 2 [
1

1
] 
p (ai )

N


 p (a

i

) * log 2 p (ai )

1

Xác suất phân bố càng nhiều thì lượng tin trung bình entropy càng nhỏ. Entropy đạt
giá trị cực đại đối với phân bố đều, do đó nếu một ký hiệu có xác suất lớn sẽ có số
Entropy nhỏ.
Ví dụ: Giả sử có một ảnh đen trắng với độ phân giải lượng tử 8 bit. Ký hiệu i là mức
xám của pixel và bộ ký hiệu A là tập hợp tất cả các mức xám từ 0->255, mức xám 0
tương ứng với màu đen, mức xám 255 tương ứng với màu trắng. Do đó, Entropy của
255

ảnh là H (X )  p (i ) log 2 p (i )
0

Giả sử ta có kích thước 4x8 pixels như sau:
21

21

21

95

169


243

243

243

21

21

21

95

169

243

243

243

21

21

21

95


169

243

243

243

GVHD: TS. TRẦN DŨNG TRÌNH

SVTH : NGUYỄN QUANG HỒNG SƠN


21

21

21

95

169

243

243

243


Ta sẽ xét các độ dư thừa của các pixel trong ảnh, hoặc giữa các ảnh liên tiếp như sau.
 Giả sử các mức xám của tín hiệu hình đen trắng độc lập thống kê với nhau, dựa
vào số liệu thống kê cụ thể là.
Mức xám

Số lượng pixel

Xác suất.

21

12

3/8

95

4

1/8

169

4

1/8

243

12


3/8

Entropy của phần ảnh tĩnh này là:
H(x)

=

3
3 1
1 1
1 3
3
log 2  log 2  log 2  log 2
8
8 8
8 8
8 8
8



6
3 2
1
log 2  log 2
8
8 8
8


 0,75 x 1,58  3 1,815 bits / pixel

Tuy nhiên, trong thực tế các mức xám của các pixel không độc lập thống kê với
nhau, nên ta có thể biểu diễn theo từng cặp pixel liên tiếp như sau:
Giá trị cặp mức xám

Số lượng cặp

Xác suất

(21, 21)

8

1/4

(21, 95)

4

1/8

(95, 169)

4

1/8

(169, 243)


4

1/8

(243, 243)

8

1/4

(243, 21)

4

1/8

H(x)

=

1
1 1
1 1
1 1
1 1
1 1
1
log 2  log 2  log 2  log 2  log 2  log 2
4
4 8

8 8
8 8
8 4
4 8
8



2
1 4
1
log 2  log 2
4
4 8
8

2.5bits / cặp
pixels

Ngồi ra cịn có thể biểu diễn theo phần chênh lệch mức xám của 2 pixel liên
tiếp như sau.

GVHD: TS. TRẦN DŨNG TRÌNH

SVTH : NGUYỄN QUANG HỒNG SƠN


21

0


0

74

74

74

0

0

21

0

0

74

74

74

0

0

21


0

0

74

74

74

0

0

21

0

0

74

74

74

0

0


Giá trị mức xám

Số lượng

Xác suất.

21

4

1/8

0

16

1/2

74

12

3/8

H(x)

=

1

1 1
1 3
3
log 2  log 2  log 2
8
8 2
2 8
8

 0,75 x 1,58  3 1,41 bits / pixel

Như vậy, số lượng tin trung bình tối thiểu cần thiết để truyền một phần tử ảnh sẽ khác
nhau, nghĩa là độ dư thừa trong ảnh và giữa các bức ảnh sẽ phụ thuộc vào cách mã hóa
Entropy. Do đó cần phải xem xét kỹ để chọn ra loại mã hóa hiệu quả nhất.

CHƯƠNG II. CÁC KỸ THUẬT NÉN VIDEO
II.1

PHÂN LOẠI CÁC KỸ THUẬT NÉN

Nén video được chia thành hai họ lớn: Nén không tổn hao và nén tổn hao.
 Nén không tổn hao là quy trình biểu diễn các ký hiệu trong dịng bit nguồn
thành dịng các từ mã sao cho ảnh được khơi phục hồn tồn giống ảnh gốc, các
thuật tốn chỉ phụ thuộc vào cách thống kê nội dung dữ liệu và thường dựa trên
việc thay thế một nhóm các ký tự trùng lặp bởi một nhóm các ký tự đặc biệt

GVHD: TS. TRẦN DŨNG TRÌNH

SVTH : NGUYỄN QUANG HỒNG SƠN



khác ngắn hơn mà không quan tâm đến ý nghĩa của dịng bit dữ liệu, nên địi
hỏi phải có thiết bị lưu trữ và đường truyền lớn hơn.
 Nén có tổn hao, tức là ảnh được khơi phục khơng hồn tồn giống ảnh gốc,
dạng nén này thích hợp cho việc lưu trữ và truyền ảnh tĩnh, ảnh video qua một
mạng có băng thơng hạn chế. Các dạng nén này thường có hệ số nén cao hơn
(từ 2:1 đến 100:1) và gây nên tổn hao dữ liệu và sự suy giảm ảnh sau khi giải
nén do việc xóa và làm trịn dữ liệu trong một khung hay giữa các khung. Nó
liên quan đến việc dùng các phép biến đổi tín hiệu từ miền này sang miền khác.
Trong thực tế phương pháp nén tổn hao thường được sử dụng nhiều hơn và các kỹ
thuật nén tổn hao thường sử dụng như: mã hóa vi sai, biến đổi cosin rời rạc DCT,
lượng tử vơ hướng, qt zig-zag, mã hóa Entropy…

II.2

Q TRÌNH BIẾN ĐỔI
Biến
đổi
T

Giải
nén

Biến đổi
ngược
T-1

Lượng tử
hóa
Q



hóa
C

Giải lượng
tử hóa R

Giải
mã D

Hình II1. Mô hình hệ thống nén
tổn hao.
Tín hiệu ngõ vào được biến đổi nhằm mục đích biểu diễn một số liệu khác thích hợp
để nén hơn so với tín hiệu nguồn. Ở phía giải mã tín hiệu nén sẽ được biến đổi ngược
lại để thu tín hiệu gốc. Một số phép biến đổi được áp dụng phổ biến hiện nay như:
II.2.1 ĐIỀU XUNG MÃ VI SAI DPCM
Các phương pháp nén dùng DPCM dựa trên nguyên tắc phát hiện sự giống nhau và
khác nhau giữa các điểm ảnh gần nhau để loại bỏ các thông tin dư thừa. Trong DPCM
chỉ có phần khác nhau giữa mẫu - mẫu được truyền đi, sự khác nhau này được cộng
vào giá trị mẫu đã giải mã hiện hành ở phía giải mã để tạo ra giá trị mẫu phục hồi.
hóa
Hình II.2. mơ tả sơ
củalượng
bộ mã hóa và giải mãMã
DPCM.
 đồ khốiBộ
tử

Bộ tiên

đoán

GVHD: TS. TRẦN DŨNG TRÌNH

entropy



SVTH : NGUYỄN QUANG HỒNG SƠN

Hình II.2. Bộ mã hóa và bộ


Ví dụ
Mẫu tín hiệu vào

115 117 116 117 118 117 115 116

Sự khác nhau
Dòng bit được nén như sau:

115

2

-1

1

1


-1

-2

1

2

-1

1

1

-1

-2

1

II.2.2 MÃ HÓA BIẾN ĐỔI
Nhằm biến đổi các hệ số trong miền thời gian (video số), không gian 2D (bức ảnh
tĩnh) thành các hệ số trong miền tần số. Các hệ số này ít tương quan hơn có phổ năng
lượng tập trung hơn, thuận tiện cho việc loại bỏ thông tin dư thừa.
II.2.2.1 Biến đổi cosin rời rạc DCT
Vì ảnh gốc có kích thước rất lớn cho nên trước khi đưa vào biến đổi DCT, ảnh được
phân chia thành các MB biểu diễn các mức xám của điểm ảnh. Việc phân khối này sẽ
làm giảm được một phần thời gian tính tốn các hệ số chung, mặt khác biến đổi cosin
đối với các khối nhỏ sẽ làm tăng độ chính xác khi tính tốn với dấu phẩy tĩnh, giảm

thiểu sai số do làm tròn sinh ra. Phép biến đổi DCT cơ bản hoạt động dựa trên cơ sở
ma trận vuông của mẫu sai số dự đoán, kết quả cho ta một ma trận Y là những hệ số
DCT được minh họa như sau:
Y = AXAT
Trong đó A là ma trận hệ số biến đổi, các thành phần của A như sau:

Ai , j

( 2 j  1)i
C i cos
Với
2N


1
 Ci 
N


C  2
 i
N
N1 N1

Nếu i = 0
Nếu i > 0

Tương đương với Yx , y C x C y  X i, j Cos
i 0 J 0


(2 j  1) y
(2i  1) x
Cos
2N
2N

Phép biến đổi DCT nguyên 4x4 của chuỗi ngõ vào X được cho bởi công thức

GVHD: TS. TRẦN DŨNG TRÌNH

SVTH : NGUYỄN QUANG HỒNG SƠN


1
 2 cos 0

 1
 
 2 cos 8 
 

A
1
2 
 cos

 2
 8 

 1 cos 3 

 
 2
 8 


1
cos 0
2

1
cos 0
2

1
cos 0
2

1
 3 
cos 
2
 8 

1
 5 
cos 
2
 8 

1

 6 
cos

2
 8 

1
 10 
cos

2
 8 

1
 9 
cos

2
 8 

1
 15 
cos

2
 8 





1
 7  
cos
 
2
 8  
1
 14  
cos

2
 8 

1
 21  
cos

2
 8  

Phép biến đổi ngược DCT cho bởi công thức:
X=ATYA
Tương đương với:
N1 N1

X i , j   C x C y Yx , y Cos
x 0 y 0

(2 j  1) y
(2i  1) x

Cos
2N
2N

II.2.2.2 Biến đổi Hadamard
Là một ví dụ tổng quát hóa của biến đổi Fourier rời rạc, nó thực hiện các phép tốn
cộng và trừ trên các ma trận 2m x 2m trực giao, đối xứng, tuyến tính…được định nghĩa
theo cơng thức sau:
H n 1  H nT

trong đó Hn là ma trận NxN với N = 2 m , m thường là các giá trị 1, 2 ,3

tương ứng với các khối 2x2, 4x4, và 8x8, H n được tạo ra từ phép toán Kronecker như
sau: Hn = H 1  H 1 .....  H 1 n lần.
Ví dụ H2 = H1  H1
Với H1=

II.3

1 1 1 


2 1  1

QUÁ TRÌNH LƯỢNG TỬ

Sau khi thực hiện biến đối DCT, các hệ số sẽ được lượng tử hoá dựa trên một bảng
lượng tử Q(u,v) với 0≤u, v≤ n-1, n là kích thước khối. Bảng này được định nghĩa bởi
từng ứng dụng cụ thể, các phần tử trong bảng lượng tử có giá trị từ 1 đến 255 được gọi
là các bước nhảy cho các hệ số DCT. Quá trình lượng tử được coi như là việc chia các

hệ số DCT cho bước nhảy lượng tử tương ứng, kết quả này sau đó sẽ được làm tròn
xuống số nguyên gần nhất. Các hệ số năng lượng thấp này, tượng trưng cho các sự

GVHD: TS. TRẦN DŨNG TRÌNH

SVTH : NGUYỄN QUANG HỒNG SƠN


thay đổi pixel - pixel cỡ nhỏ, có thể bị xóa mà khơng ảnh hưởng đến độ phân giải của
ảnh phục hồi. Tại bộ mã hố sẽ có một bảng mã và bảng các chỉ số nội bộ, từ đó có thể
ánh xạ các tín hiệu ngõ vào để chọn được các từ mã tương ứng một cách tốt nhất cho
tập hợp các hệ số được tạo ra. Có 2 loại lượng tử hóa chủ yếu:
II.3.1 LƯỢNG TỬ HĨA VƠ HƯỚNG
Lượng tử từng giá trị một cách độc lập hay nói cách khác là ánh xạ một mẫu của tín
hiệu ngõ vào tạo thành một hệ số lượng tử ở ngõ ra. Đây là một quá trình tổn hao vì
khi giải lượng tử, khơng thể xác định chính xác giá trị gốc từ số nguyên đã được làm
tròn. Lượng tử hóa thuận theo cơng thức FQ = round(X/QP)
Lượng tử hóa ngược theo công thức Y = FQ*QP. Với QP là bước nhảy lượng tử. Ví dụ
q trình giải lượng tử cho một tín hiệu

ngõ vào như sau:

Y
X

QP = 1

QP = 2

QP = 3


QP = 5

-4

-4

-4

-3

-5

-3

-3

-2

-3

-5

-2

-2

-2

-3


0

-1

-1

0

0

0

0

0

0

0

0

1

1

0

0


0

2

2

2

3

0

3

3

2

3

5

4

4

4

3


5

5

5

4

6

5







II.3.2 LƯỢNG TỬ HÓA VECTOR
Là một quá trình biểu diễn một tập vector (mỗi vector gồm nhiều giá trị) bằng một tập
các số hữu hạn các ký hiệu ở ngõ ra, bảng mã ánh xạ sẽ có các giá trị xấp xỉ với giá trị
gốc. Vector lượng tử sẽ được lưu ở cả bộ mã hóa và bộ giải mã, quá trình nén một bức
ảnh sử dụng lượng tử vector bao gồm các bước sau.
 Phân chia bức ảnh gốc thành các phân vùng MxN pixel
 Chọn vector thích ứng nhất từ bảng mã

GVHD: TS. TRẦN DŨNG TRÌNH

SVTH : NGUYỄN QUANG HỒNG SƠN



 Truyền chỉ số của vector thích ứng đến bộ giải mã.
 Tại bộ giải mã, ảnh cấu trúc lại sẽ xấp xỉ với phân vùng đã lựa chọn vector
lượng tử.
Và sơ đồ khối của lượng tử vector như sau:

Hình II.3. Q trình lượng tử vector

II.4

Q TRÌNH MÃ HĨA

Bộ mã hóa có chức năng loại bỏ độ dư thừa trong các ký tự ở ngõ ra lượng tử hóa và
ánh xạ các ký tự này thành các từ mã tạo thành dòng bit ở ngõ ra bằng các loại mã hóa
như: mã hóa dự đốn, mã hóa VLC, mã hóa số học nhị phân, mã hóa theo hình dạng…
II.4.1 MÃ HĨA ĐỘ DÀI THAY ĐỔI
Kỹ thuật mã hóa độ dài thay đổi VLC dựa trên xác suất các giá trị biên độ giống nhau
trong một ảnh để lựa chọn các từ mã để mã hố. Bộ mã hóa có độ dài thay đổi ánh xạ
các ký hiệu ngõ vào thành một chuỗi từ mã có độ dài thay đổi ở ngõ ra nhưng chứa số
lượng bít nguyên. Các ký hiệu có xác suất cao sẽ được gán từ mã có độ dài ngắn, cịn
các ký hiệu có xác suất thấp sẽ được gán từ mã có độ dài lớn hơn, do đó nó sẽ làm tối
thiểu chiều dài trung bình của từ mã. Tại phía giải nén có các chỉ định mã giống nhau
được dùng để khôi phục lại các giá trị dữ liệu gốc. Các loại mã hóa VLC cơ bản như:
mã hóa Huffman, mã hố RLC, mã hóa Exp-Golomb…
II.4.1.1 Mã hóa Huffman
Mã hóa Huffman là mã hóa thõa mãn tối ưu tính prefix và phương pháp mã hóa
thường dựa vào mơ hình thống kê. Dựa vào dữ liệu gốc, người ta tính xác suất xuất

GVHD: TS. TRẦN DŨNG TRÌNH


SVTH : NGUYỄN QUANG HỒNG SƠN


×