MỤC LỤC
LỜI MỞ ĐẦU
............................................................................................... 3
DANH MỤC CÁC TỪ VIẾT TẮT ............................................................................ 7
DANH MỤC CÁC BẢNG ......................................................................................... 8
DANH MỤC CÁC HÌNH VẼ .................................................................................. 10
CHƯƠNG 1 - TỔNG QUAN ................................................................................... 12
1.1 Một số phương pháp nén video phổ biến .......................................................... 12
1.1.1 Nén dư thừa về không gian.................................................................................. 12
1.1.2 Nén dư thừa thời gian........................................................................................... 13
1.2 Một số chuẩn lấy mẫu tín hiệu video................................................................. 13
1.3 Các tiêu chuẩn nén video với bitrate thấp ......................................................... 14
1.3.1 Chuẩn H.263......................................................................................................... 14
1.3.2 Chuẩn H.265/HEVC ............................................................................................ 15
1.3.3 Chuẩn H.264/AVC............................................................................................... 15
1.4 Hình học Fractal ................................................................................................ 19
1.4.1 Giới thiệu hình học Fractal .................................................................................. 19
1.4.2 Các ứng dụng của hình học Fractal..................................................................... 21
1.5 Các công trình nghiên cứu liên quan đến Fractal .............................................. 23
1.5.1 Các công trình nghiên cứu ứng dụng Fractal cho nén hình ảnh........................ 23
1.5.2 Các công trình nghiên cứu ứng dụng Fractal cho nén video ............................. 24
1.6 Kết luận chương ................................................................................................ 25
CHƯƠNG 2 - NÉN HÌNH ẢNH SỬ DỤNG FRACTAL ....................................... 26
2.1 Nén hình ảnh sử dụng Fractal Coding ............................................................... 26
2.1.1 Cơ sở lý thuyết nén ảnh sử dụng Fractal Coding ............................................... 26
2.1.2 Nén ảnh xám sử dụng Fractal Coding ................................................................ 39
2.1.3 Nén ảnh màu sử dụng Fractal .............................................................................. 44
2.1.4 Kết quả nén ảnh xám và ảnh màu sử dụng Fractal Coding............................... 47
2.1.5 Nhận xét ................................................................................................................ 60
2.2 Cải tiến chất lượng nén cho Fractal Coding ...................................................... 62
2.2.1 Cải tiến tỷ số nén cho Fractal Coding đề xuất .................................................... 63
1
2.2.2 Kết quả cải tiến tỷ số nén cho Fractal Coding .................................................... 67
2.2.3 Cải tiến thời gian mã hóa cho Fractal Coding đề xuất ....................................... 76
2.2.4 Kết quả cải tiến thời gian mã hóa của Fractal Coding ....................................... 85
2.3 Kết luận chương ................................................................................................ 89
CHƯƠNG 3 - TÍCH HỢP FRACTAL CODING TRONG QUÁ TRÌNH NÉN
INTRA-FRAME CỦA CHUẨN H.264 ................................................................... 92
3.1 Tích hợp Fractal Coding trong intra-frame của tiêu chuẩn H.264 .................... 92
3.1.1 Phương pháp tích hợp Fractal Coding vào intra-frame của H.264 đề xuất...... 93
3.1.2 Phương pháp cải thiện tỉ lệ nén được đề xuất..................................................... 96
3.1.3 Đề xuất tăng cường mã hóa Fractal với biến đổi wavelet ................................. 97
3.1.4 Kết quả thực nghiệm ............................................................................................ 99
3.2 Xây dựng mô hình truyền dữ liệu thời gian thực sử dụng tiêu chuẩn H.264 đã tích
hợp Fractal Coding ................................................................................................. 105
3.2.1 Phương pháp thực hiện nhúng H.264F vào VLC Player được đề xuất.......... 105
3.2.2 Kết quả nhúng H.264F vào VLC Player .......................................................... 110
3.3 Kết luận chương .............................................................................................. 112
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN.......................................................................... 114
TÀI LIỆU THAM KHẢO ...................................................................................... 116
DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ CỦA LUẬN ÁN ................. 122
2
LỜI MỞ ĐẦU
Nén dữ liệu (data compression) là phương pháp mã hóa kỹ thuật số nhằm giảm
dung lượng của dữ liệu. Tùy theo lượng dữ liệu trước và sau giải nén, người ta chia
nén thành hai dạng: nén không mất dữ liệu (lossless) và nén bị mất dữ liệu (lossy)
[23].
Các thuật toán nén không mất dữ liệu thường dựa trên giả thuyết dư thừa trong
dữ liệu, từ đó thể hiện dữ liệu một cách chính xác mà không mất thông tin. Điển hình
cho nén không mất dữ liệu có thể kể đến mã hóa RLE (Run-length Encoding), thay
thế một loạt dữ liệu liền nhau lặp lại thành một dữ liệu đại diện khác.
Nén mất dữ liệu làm giảm số lượng bit bằng cách xác định các thông tin không
cần thiết và loại bỏ chúng.
Một trong những dạng nén mất dữ liệu phổ biến nhất là nén video. Một tín hiệu
video số thường chứa một lượng lớn dữ liệu âm thanh và hình ảnh, do đó sẽ gặp rất
nhiều khó khăn trong việc lưu trữ và truyền đi trong một băng thông kênh truyền thực
tế. Với sự phát triển của khoa học công nghệ hiện nay, bộ cảm biến màu có 16 triệu
màu với độ phân giải rất cao lên đến 4096 x 4096 pixels đã được sản xuất. Tuy nhiên,
ứng dụng thực tế cần độ phân giải cao hiện nay cũng chỉ dừng lại ở mức 1920 x 1080
pixels. Nguyên nhân của vấn đề này là những video có độ phân giải rất cao như 2K
và 4K sẽ tiêu tốn nhiều không gian lưu trữ và chiếm dụng nhiều băng thông trên kênh
truyền dẫn. Trước nhu cầu sử dụng thông tin và hình ảnh đòi hỏi ngày càng cao về
mặt chất lượng trong khi vẫn bị giới hạn bởi không gian lưu trữ và băng thông kênh
truyền đòi hỏi cần có một giải pháp có thể giải quyết được vấn đề này. Do đó, để có
thể tiết kiệm không gian lưu trữ và băng thông kênh truyền thì cần thiết phải nén tín
hiệu video. Quá trình nén video thực hiện được là do thông tin trong các video thường
có trật tự, có tổ chức, vì thế nếu xem kỹ cấu trúc video có thể phát hiện được nhiều
loại thông tin dư thừa khác nhau. Các thông tin dư thừa nằm trong video có thể chia
thành năm loại.
3
Thứ nhất là dư thừa về không gian. Sự dư thừa về không gian giữa các điểm ảnh
ngay trong một khung hình gọi là thừa tĩnh. Dư thừa về mặt không gian là do các chi
tiết điểm ảnh giống nhau trên cùng một khung hình, ví dụ như nhiều điểm ảnh giống
nhau tạo thành bầu trời xanh. Thứ hai là dư thừa về thời gian. Sự dư thừa về thời gian
giữa các điểm ảnh của các khung video gọi là thừa động. Dư thừa về thời gian là do
những hình ảnh giống nhau lặp lại liên tục từ khung hình này sang khung hình khác.
Thứ ba là sự dư thừa thông tin về phổ. Đó là sự dư thừa về phổ giữa các mẫu tín hiệu
thu được từ các bộ cảm biến trong camera. Thứ tư là sự dư thừa do thống kê. Bản
thân các ký hiệu xuất hiện trong dòng bit với các xác suất xuất hiện không đồng đều.
Thứ năm là sự dư thừa tâm thị giác. Sự dư thừa do các thông tin không phù hợp với
hệ thống thị giác của con người.
Các thuật toán nén video cần giảm được lượng thông tin thừa này bằng các
phương pháp khác nhau để giảm dung lượng của video, nhằm tiết kiệm băng thông
truyền, giảm chi phí lưu trữ sao cho vẫn duy trì được chất lượng ở mức chấp nhận
được.
Từ yêu cầu đặt ra để giảm lượng thông tin dư thừa, nhiều phương pháp nén
video đã được đề xuất nhằm giảm lượng thông tin dư thừa trong dữ liệu video tương
ướng với năm loại thông tin dư thừa đã nêu. Đó là dư thừa về không gian, dư thừa về
thời gian, dư thừa thông tin về phổ, dư thừa thông tin do thống kê và dư thừa tâm thị
giác.
Trong các phương pháp nén video đã được đề xuất, hai phương pháp chính hiện
tại đang được áp dụng phổ biến là giảm thông tin dư thừa về không gian và giảm
thông tin dư thừa về thời gian.
Phương pháp nén dư thừa về không gian tập trung vào các thuật toán nhằm giảm
tối đa các dư thừa về mặt không gian giữa các điểm ảnh, từ đó nâng cao tỷ lệ nén.
Các tiêu chuẩn nén video theo phương pháp này đã được công bố. Trong đó, MJPEG
là đại diện tiêu biểu.
Phương pháp nén dư thừa về thời gian tập trung vào các thuật toán nhằm giảm
tối đa các dư thừa về mặt thời gian giữa bằng cách cố gắng xác định được tối đa các
điểm ảnh giống nhau giữa các khung hình của một video. Việc giảm trừ tối đa các
điểm ảnh giống nhau này cho phép tăng tỷ lệ nén video. Có nhiều tiêu chuẩn nén
4
video theo phương pháp nén dư thừa về thời gian, trong đó, MPEG là tiêu chuẩn tiêu
biểu.
Từ năm 2003, một tiêu chuẩn nén mới đã được đề xuất, đó là tiêu chuẩn H.264.
H.264 là một tiêu chuẩn nén sử dụng phương pháp nén dư thừa về thời gian. Bản chất
của tiêu chuẩn H.264 là sự phát triển của tiêu chuẩn MPEG, trong đó áp dụng thêm
các kỹ thuật nhằm nâng cao hơn nữa tỷ lệ nén và cố gắng cải thiện chất lượng hình
ảnh của video tương ứng với tỷ lệ nén đạt được.
Năm 2013, một tiêu chuẩn phát triển dựa trên tiêu chuẩn H.264 được đề xuất.
H.265 có tỷ lệ nén gấp đôi so với tiêu chuẩn H.264 ở cùng một mức độ chất lượng
hình ảnh video. Mục tiêu của tiêu chuẩn H.265 là chuẩn nén hỗ trợ cho các video độ
phân giải cực cao 8K UHD và kỳ vọng hỗ trợ lên đến độ phân giải 4320P ( 8192 x
4320).
Như vậy, hướng phát triển của các tiêu chuẩn nén video là sự kế thừa và phát
triển của các tiêu chuẩn trước đó để hướng tới hai mục đích chính. Đó là nâng cao tỷ
lệ nén và cải thiện chất lượng hình ảnh sau giải nén tương đương với tỷ lệ nén đã đạt
được.
Hình học Fractal là nguồn cảm hứng cho thuật toán nén mà điển hình hơn là
thuật toán nén hình ảnh. Lĩnh vực này hiện đang chiếm được sự quan tâm của rất
nhiều nhà khoa học trên thế giới cũng như ở Việt Nam. Nén hình ảnh sử dụng Fractal
mang đến tỉ lệ nén vượt trội so với bất kỳ phương pháp mã hóa nén nào trước đây mà
vẫn đảm bảo được chất lượng tốt nhất có thể cho hình ảnh. Ưu điểm của nén hình ảnh
sử dụng Fractal là tỷ lệ nén cao vượt trội và quá trình giải nén rất nhanh. Tuy nhiên,
khối lượng tính toán rất lớn trong quá trình nén ảnh làm cho thời gian nén ảnh cũng
rất lớn.
Từ đó, ý tưởng kết hợp Fractal và tiêu chuẩn H.264 được hình thành nhằm áp
dụng ưu điểm về tỷ số nén của Fractal vào tiêu chuẩn nén video H.264 đang được áp
dụng rộng rãi là một nỗ lực nhằm tạo ra một tiêu chuẩn nén hình ảnh có tỷ số nén cao,
thời gian nén ảnh đảm bảo tương đương với các tiêu chuẩn hiện thời và có thời gian
giải nén ảnh vượt trội. Bên cạnh đó, việc nâng cao tỷ số nén ảnh và giảm thời gian
nén ảnh đối với phương pháp nén ảnh sử dụng Fractal cũng là một vấn đề cần được
giải quyết.
5
Trong Luận án này sẽ trình bày về việc sử dụng Fractal trong việc nén hình ảnh
và video để đưa ra một phương pháp giải quyết các vấn đề đã nêu ở trên.
Ngoài phần mở đầu và kết luận, nội dung Luận án bao gồm có 3 chương:
Chương 1: Tổng quan: Chương này giới thiệu tổng quan về lý thuyết liên quan
đến hình học Fractal và phương pháp nén hình ảnh sử dụng hình học Fractal. Nội
dung của chương cũng giới thiệu về các lý thuyết liên quan hoặc được sử dụng trong
nghiên cứu của tác giả.
Chương 2: Phương pháp nén hình ảnh sử dụng Fractal: Nội dung của chương
này giới thiệu về phương pháp sử dụng thuật toán Fractal để nén hình ảnh. Giới thiệu
phương pháp cải tiến các chỉ tiêu nén hình ảnh sử dụng hình học là tỷ số nén và thời
gian nén và trình bày các kết quả thực nghiệm đã đạt được.
Chương 3: Tích hợp Fractal coding trong quá trình nén Intra-frame của tiêu
chuẩn H.264: Nội dung chương 3 trình bày phương pháp tích hợp Fractal Coding
trong quá trình nén intra-frame của tiêu chuẩn H.264 và những kết quả thực nghiệm
mà tác giả đã đạt được trong quá trình nghiên cứu.
6
DANH MỤC CÁC TỪ VIẾT TẮT
VIẾT TẮT
TIẾNG ANH
TIẾNG VIỆT
AVC
Advanced Video Coding
Tiêu chuẩn nén video tiên tiến
CNN
Celular Neural Network
Mạng nơ-ron tế bào
CPU
Central Processing Unit
Bộ xử lý trung tâm
CR
Compression Ratio
Tỷ số nén
DCT
Discrete Cosine Transform
Phép biến đổi Cosin rời rạc
DSP
Digital signal processing
Mạch xử lý tín hiệu số
FCIC
Fractal Color Image Coding
Phương pháp nén ảnh màu sử dụng
Fractal
FIC
Fractal Image Compression
Nén hình ảnh sử dụng Fractal
FPGA
Field programmable Gate Array
Mảng cổng lập trình được dạng
trường
GOP
Group of Picture
Nhóm các ảnh
H.264
H.264/MPEG-4 Part 10 or AVC
Một tiêu chuẩn nén video
HEVC
High Efficiency Video Coding
Tiêu chuẩn nén video hiệu năng cao
HV
Horizontal vertical Partition
Phân hoạch theo không gian
IFS
Iterated Function System
Hệ thống chức năng lặp
JPEG
Joint Photographic Experts Group
Phương pháp nén ảnh
NAL
Network abstraction layer
PIFS
Partition Iterated Function System
Hệ thống chức năng lặp phân mảnh
PSNR
Peak signal-to-noise ratio
Tỷ số tín hiệu cực đại trên nhiễu
RIFS
Recurrent Iterated Function System Hệ thống chức năng lặp đệ quy
RLE
Run-length Encoding
Thuật toán nén dữ liệu lossless
RMS
Root mean square
Giá trị trung bình bình phương
SDK
Services Development Kit
Bộ phát triển dịch vụ
SFC
Seperated Fractal Coding
Mã hóa Fractal thành phần
SoC
System on Chip
Hệ thống tích hợp trên một chip
UHD
Ultra high definition television
Truyền hình độ phân giải siêu cao
VCL
Video Coding Layer
Lớp mã hóa video
7
DANH MỤC CÁC BẢNG
2.1
Phần mềm sử dụng cho bo mạch FPGA ……………………………………..
41
2.2
Tài nguyên hệ thống được sử dụng trong thực thi ……………………………
42
2.3
Tập các miền với kích thước dải khác nhau và số lượng miền ………………
46
2.4
So sánh hiệu suất hoạt động trên nền tảng FPGA và DSP theo phương pháp
Fisher ………………………………………………………………………..
47
2.5
Hiệu suất PSNR và thời gian mã hóa ………………………………………..
48
2.6
Các thông số nén Fractal của hình Lena ……………………………………...
50
2.7
Kết quả FCIC hình ảnh của Lena ……………………………………………
50
2.8
Các ảnh gốc được lựa chọn và tính chất ảnh …………………………………
51
2.9
Kết quả FCIC hình ảnh của ảnh Fruit ………………………………………..
51
2.10
Kết quả FCIC hình ảnh của ảnh Leaves ……………………………………...
52
2.11
Kết quả FCIC hình ảnh của ảnh Natural …………………………………….
53
2.12
So sánh tỷ số nén giữa 3 ảnh Fruit, Leaves, Natural …………………………
53
2.13
So sánh tỷ số PSNR giữa 3 ảnh Fruit, Leaves, Natural ………………………
54
2.14
So sánh tỷ số nén và PSNR giữa Fractal và JPEG đối với ảnh Lena ………..
55
2.15
So sánh tỷ số nén và PSNR giữa Fractal và JPEG đối với ảnh Fruit …………
55
2.16
So sánh tỷ số nén và PSNR giữa Fractal và JPEG đối với ảnh Leaves ………
56
2.17
So sánh tỷ số nén và PSNR giữa Fractal và JPEG đối với ảnh Natural ………
57
2.18
Bảng kết quả so sánh giữa thực hiện nén ảnh bằng Fractal và JPEG ……….
57
2.19
So sánh hình ảnh nén thực hiện bằng Fractal và JPEG ở tỉ lệ 4 :4 : 4 ………
59
2.20
So sánh hình ảnh nén thực hiện bằng Fractal và GPEG ở tỉ lệ 4:2:2 ………..
59
2.21
So sánh hình ảnh nén thực hiện bằng Fractal và JPEG ở tỉ lệ 4:2:0 …………
60
2.22
So sánh hình ảnh nén thực hiện bằng Fractal và GPEG tại tỉ lệ 4:2:0 ………
60
2.23
Nén ảnh màu Fractal ảnh Lena ………………………………………………
67
2.24
Nén ảnh màu Fractal ảnh Parrot …………………………………………….
68
2.25
Nén ảnh màu Fractal ảnh One Tiger ………………………………………...
69
2.26
Nén ảnh màu Fractal ảnh Two Tiger ………………………………………...
69
2.27
Nén ảnh màu Fractal ảnh Flower ……………………………………………
70
2.28
Nén ảnh màu Fractal ảnh Fruit ………………………………………………
70
2.29
Nén ảnh màu Fractal ảnh Balloon …………………………………………..
71
8
2.30
Bảng 2.30: Nén ảnh màu Fractal ảnh Natural ………………………………
71
2.31
Kết quả giải nén bởi việc điều chỉnh RMS ………………………………….
73
2.32
Kết quả FCIC với một luồng xử lý ………………………………………….
83
2.33
Kết quả FCIC với hai luồng xử lý …………………………………………..
84
2.34
Kết quả FCIC với bốn luồng xử lý ………………………………………….
85
2.35
So sánh theo tỷ lệ phần trăm giữa 4 luồng, 2 luồng và 1 luồng …………….
85
2.36
Kết quả FCIC với 1 luồng, 2 luồng, 4 luồng xử lý của các ảnh Parrot, Flower,
Natural, One-tiger, Two-tiger, Red-tree và Roses …………………………..
86
3.1
So sánh về chất lượng giữa video H.264 và H.264F ………………………..
94
3.2
Thông số của các video kiểm tra …………………………………………….
96
3.3
Tỷ số nén của H.264 và H.264F đối với video Foreman ……………………
97
3.4
Tỷ số nén của H.264 và H.264F đối với video Bridge ………………………
97
3.5
Tỷ số nén của H.264 và H.264F đối với video Bridge-Far …………………..
97
3.6
Tỷ số nén của H.264 và H.264F đối với video Grandma ……………………
97
3.7
Tỷ số nén của H.264 và H.264F đối với video Highway ……………………
98
3.8
So sánh PSNR giữa ảnh chuẩn và ảnh fractal trong video Foreman ………..
98
3.9
So sánh PSNR giữa ảnh chuẩn và ảnh fractal trong video Bridge …………..
99
3.10
So sánh PSNR giữa ảnh chuẩn và ảnh fractal trong video Bridge Far ………
99
3.11
So sánh PSNR giữa ảnh chuẩn và ảnh fractal trong video Grandma …………
100
3.12
So sánh PSNR giữa ảnh chuẩn và ảnh fractal trong video highway ………...
100
3.13
Bitrate so sánh giữa nén Fractal và H.264 …………………………………..
101
3.14
Thông số của video thử nghiệm ……………………………………………..
107
3.15
So sánh khi chạy video Fractal và video H.264 ……………………………..
107
9
DANH MỤC CÁC HÌNH VẼ
1.1
Quy trình nén dư thừa không gian …………………………………………..
12
1.2
Nén dư thừa thời gian ……………………………………………………….
13
1.3
Quy trình mã hóa và giải mã video chuẩn H.264 ……………………………
16
1.4
Phân chia Macroblock trong video ………………………………………….
16
1.5
Cấu trúc dòng bit trong H.264 ………………………………………………
17
1.6
Sơ đồ bộ mã hóa của chuẩn H.264 ………………………………………….
18
1.7
Một số hình dạng Fractal cơ bản …………………………………………….
19
1.8
Đồ thị Mandelbrot …………………………………………………………...
20
2.1
Tam giác Sierpinski …………………………………………………………
26
2.2
Ảnh Sunset với các miền và vùng được tìm thấy ……………………………
34
2.3
Sơ đồ khối quá trình mã hóa của FIC ………………………………………
36
2.4
Sơ đồ khối quá trình giải mã của FIC ………………………………………
37
2.5
Hình ảnh Lena theo phân hoạch Quadtree …………………………………
38
2.6
Hình ảnh lena với phân hoạch HV …………………………………………
39
2.7
Xử lý hoạt động nén ảnh Fractal ……………………………………………
43
2.8
Module nén ảnh màu Fractal ………………………………………………
44
2.9
Các thành phần của ảnh màu …………………………………………………
45
2.10
Các chế độ lấy mẫu tín hiệu ………………………………………………….
45
2.11
Mô hình mã hóa Fractal triển khai trên FPGA ……………………………….
46
2.12
Ảnh chuẩn và ảnh giải nén Lena với ET = 6, RET = 16 ………………………
49
2.13
Ảnh chuẩn và ảnh giải nén Lena với ET = 6, RET = 20 ………………………
49
2.14
Định dạng ảnh PPM ………………………………………………………….
76
2.15
Phân phối trật tự hình ảnh vào vùng 16x16 …………………………………..
76
2.16
Thuật toán FCIC được đề xuất ……………………………………………….
77
2.17
Trình tự các bộ nhớ stack được đề xuất ………………………………………
78
2.18
Vi tri
̣ ́ domain có thể có xung quanh range ……………………………………
79
2.19
Giảm dữ liệu bằng cách tạo trung bình cộng của bốn giá trị điểm ảnh ……….
79
2.20
Ví dụ về ánh xạ của miền vào vùng …………………………………………..
80
2.21
Định dạng của bộ nhớ vùng ………………………………………………….
81
10
2.22
Xác định offset của miền …………………………………………………….
81
2.23
Phân chia section …………………………………………………………….
82
2.24
Phân chia section của OPENMP ……………………………………………..
83
3.1
Các bước chính để mã hóa một frame trong X264 …………………………..
93
3.2
Sơ đồ nhúng mã hóa fractal vào intra-block trong H.264 ……………………
94
3.3
Cải thiện tỉ lệ nén …………………………………………………………….
95
3.4
Nhúng wavelet và fractal vào x264 ………………………………………….
96
3.5a
Sơ đồ khối nén ảnh sử dụng wavelet
3.5b
Nhúng wavelet và fractal vào x264 …………………………………………
97
3.6
Ảnh chuẩn và ảnh giải nén Fractal của video Foreman ………………………
99
3.7
Ảnh chuẩn và ảnh giải nén Fractal của video Bridge ………………………
100
3.8
Ảnh chuẩn và ảnh giải mã Fracal của video Brigde Far ……………………. 100
3.9
Ảnh chuẩn và ảnh giải mã Fracal của video Grandma ………………………. 101
3.10
Ảnh chuẩn và ảnh giải mã Fractal của video Highway ……………………..
101
3.11
Quá trình giải mã H.264 trên FFMPEG ……………………………………
103
3.12
Quá trình giải mã đơn vị NAL trên FFMPEG ………………………………. 104
3.13
Giải mã các thành phần trong FFMPEG ……………………………………. 104
3.14
Nhúng giải mã Fractal cho FFMPEG ……………………………………….. 105
3.15
Cơ chế hoạt động của VLC …………………………………………………. 106
3.16
Luồng của VLC ……………………………………………………………... 107
3.17
Hình chụp khi chạy video bridge_qcif.frt …………………………………... 109
3.18
Hình chụp khi chạy video bridge-far_qcif.frt ………………………………. 109
3.19
Hình chụp khi chạy video highway_qcif.frt ………………………………… 109
11
CHƯƠNG 1 - TỔNG QUAN
1.1
Một số phương pháp nén video phổ biến
Như đã trình bày trong phần mở đầu, hai phương pháp nén video phổ biến đang
được áp dụng hiện nay là phương pháp nén dư thừa về không gian và phương pháp
nén dư thừa về thời gian.
1.1.1 Nén dư thừa về không gian
Quy trình nén dư thừa về không gian được thể hiện qua hình Hình 1.1: Quy trình
nén dư thừa không gian, trong đó khối nén dư thừa không gian tính đến sự tương tự
của các pixel lân cận ngay trong một khung hình.
Hình 1.1: Quy trình nén dư thừa không gian
Nén dư thừa không gian bao gồm các bước sau:
Chuyển qua không gian màu YUV: Quy trình này sẽ được đề cập đến trong
Luận án.
Chia khung hình thành các vùng nhỏ có kích thước 8x8 pixels.
Biến đổi DCT đối với từng vùng nhằm giữ lại thông tin chính.
12
Luận án đầy đủ ở file: Luận án full