Tải bản đầy đủ (.pdf) (122 trang)

Nghiên cứu ứng dụng kỹ thuật fractal vào nén trong ảnh video

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.95 MB, 122 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

THÁI NAM SƠN

NGHIÊN CỨU ỨNG DỤNG KỸ THUẬT FRACTAL
VÀO NÉN TRONG ẢNH VIDEO

LUẬN ÁN TIẾN SĨ KỸ THUẬT VIỄN THÔNG

HÀ NỘI - 2018


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

THÁI NAM SƠN

NGHIÊN CỨU ỨNG DỤNG KỸ THUẬT FRACTAL
VÀO NÉN TRONG ẢNH VIDEO

LUẬN ÁN TIẾN SĨ KỸ THUẬT VIỄN THÔNG

Chuyên ngành: KỸ THUẬT VIỄN THÔNG
Mã số: 62520208
GIẢNG VIÊN HƯỚNG DẪN KHOA HỌC:
PGS.TS. NGUYỄN TIẾN DŨNG

HÀ NỘI - 2018



MỤC LỤC

LỜI MỞ ĐẦU

....................................................................................................... 3

DANH MỤC CÁC TỪ VIẾT TẮT ....................................................................................... 7
DANH MỤC CÁC BẢNG .................................................................................................... 8
DANH MỤC CÁC HÌNH VẼ ............................................................................................. 10
CHƯƠNG 1 -

TỔNG QUAN ......................................................................................... 12

1.1 Một số phương pháp nén video phổ biến ..................................................................... 12
1.1.1 Nén dư thừa về không gian .............................................................................................. 12
1.1.2 Nén dư thừa thời gian ....................................................................................................... 13
1.2 Một số chuẩn lấy mẫu tín hiệu video ........................................................................... 13
1.3 Các tiêu chuẩn nén video với bit-rate thấp................................................................... 14
1.3.1 Chuẩn H.263 ..................................................................................................................... 14
1.3.2 Chuẩn H.265/HEVC ........................................................................................................ 15
1.3.3 Chuẩn H.264/AVC ........................................................................................................... 15
1.4 Hình học Fractal ........................................................................................................... 19
1.4.1 Giới thiệu hình học Fractal............................................................................................... 19
1.4.2 Các ứng dụng của hình học Fractal ................................................................................. 21
1.5 Cơ sở lý thuyết nén ảnh sử dụng Fractal ...................................................................... 23
1.5.1 Hình học Fractal................................................................................................................ 23
1.5.2 Hệ thống chức năng lặp đệ quy (RIFS)........................................................................... 26
1.5.3 Biến đổi Affine.................................................................................................................. 27
1.5.4 Hệ thống hàm lặp bộ phận (PIFS) ................................................................................... 29
1.5.5 Quá trình mã hóa............................................................................................................... 31

1.5.6 Quá trình giải mã .............................................................................................................. 32
1.5.7 Cấu trúc phân hoạch ......................................................................................................... 33
1.6 Các công trình nghiên cứu liên quan đến Fractal......................................................... 35
1.6.1 Các công trình nghiên cứu ứng dụng Fractal cho nén hình ảnh .................................... 35
1.6.2 Các công trình nghiên cứu ứng dụng Fractal cho nén video ......................................... 36
1.7 Kết luận chương ........................................................................................................... 37
CHƯƠNG 2 -

NÉN HÌNH ẢNH SỬ DỤNG FRACTAL .............................................. 38

2.1 Nén hình ảnh sử dụng Fractal ...................................................................................... 38
2.1.1 Nén ảnh xám sử dụng Fractal .......................................................................................... 38
1


2.1.2 Nén ảnh màu sử dụng Fractal .......................................................................................... 43
2.1.3 Kết quả nén ảnh xám và ảnh màu sử dụng Fractal......................................................... 46
2.1.4 Nhận xét............................................................................................................................. 59
2.2 Cải tiến chất lượng nén cho FIC .................................................................................. 61
2.2.1 Cải tiến tỷ số nén cho FIC đề xuất ................................................................................... 63
2.2.2 Kết quả cải tiến tỷ số nén cho FIC ................................................................................... 67
2.2.3 Cải tiến thời gian mã hóa cho Fractal Coding đề xuất ................................................... 75
2.2.4 Kết quả cải tiến thời gian mã hóa của Fractal Coding.................................................... 84
2.3 Kết luận chương ........................................................................................................... 88
CHƯƠNG 3 - TÍCH HỢP FRACTAL CODING TRONG QUÁ TRÌNH NÉN INTRAFRAME CỦA CHUẨN H.264 ............................................................................................ 91
3.1 Tích hợp Fractal Coding trong intra-frame của tiêu chuẩn H.264 ............................... 91
3.1.1 Phương pháp tích hợp Fractal Coding vào intra-frame của H.264 đề xuất .................. 92
3.1.2 Phương pháp cải thiện tỉ lệ nén được đề xuất ................................................................. 95
3.1.3 Đề xuất tăng cường mã hóa Fractal với biến đổi wavelet .............................................. 97
3.1.4 Kết quả thực nghiệm......................................................................................................... 98

3.2 Xây dựng mô hình truyền dữ liệu thời gian thực sử dụng tiêu chuẩn H.264 đã tích hợp
Fractal Coding ................................................................................................................... 104
3.2.1 Phương pháp thực hiện nhúng H.264F vào VLC Player được đề xuất ...................... 104
3.2.2 Kết quả nhúng H.264F vào VLC Player ....................................................................... 109
3.3 Kết luận chương ......................................................................................................... 110
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ........................................................................................ 112
TÀI LIỆU THAM KHẢO ................................................................................................. 114
DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ CỦA LUẬN ÁN ............................. 120

2


LỜI MỞ ĐẦU

Nén dữ liệu (data compression) là phương pháp mã hóa kỹ thuật số nhằm giảm
dung lượng của dữ liệu. Tùy theo lượng dữ liệu trước và sau giải nén, người ta chia
nén thành hai dạng: nén không mất dữ liệu (lossless) và nén bị mất dữ liệu (lossy)
[23].
Các thuật toán nén không mất dữ liệu thường dựa trên giả thuyết dư thừa trong
dữ liệu, từ đó thể hiện dữ liệu một cách chính xác mà không mất thông tin. Điển hình
cho nén không mất dữ liệu có thể kể đến mã hóa RLE (Run-length Encoding), thay
thế một loạt dữ liệu liền nhau lặp lại thành một dữ liệu đại diện khác.
Nén mất dữ liệu làm giảm số lượng bit bằng cách xác định các thông tin không
cần thiết và loại bỏ chúng.
Một trong những dạng nén mất dữ liệu phổ biến nhất là nén video. Một tín hiệu
video số thường chứa một lượng lớn dữ liệu âm thanh và hình ảnh, do đó sẽ gặp rất
nhiều khó khăn trong việc lưu trữ và truyền đi trong một băng thông kênh truyền thực
tế. Với sự phát triển của khoa học công nghệ hiện nay, bộ cảm biến màu có 16 triệu
màu với độ phân giải rất cao lên đến 4096 x 4096 pixels đã được sản xuất. Tuy nhiên,
ứng dụng thực tế cần độ phân giải cao hiện nay cũng chỉ dừng lại ở mức 1920 x 1080

pixels. Nguyên nhân của vấn đề này là những video có độ phân giải rất cao như 2K
và 4K sẽ tiêu tốn nhiều không gian lưu trữ và chiếm dụng nhiều băng thông trên kênh
truyền dẫn. Trước nhu cầu sử dụng thông tin và hình ảnh đòi hỏi ngày càng cao về
mặt chất lượng trong khi vẫn bị giới hạn bởi không gian lưu trữ và băng thông kênh
truyền đòi hỏi cần có một giải pháp có thể giải quyết được vấn đề này. Do đó, để có
thể tiết kiệm không gian lưu trữ và băng thông kênh truyền thì cần thiết phải nén tín
hiệu video. Quá trình nén video thực hiện được là do thông tin trong các video thường
có trật tự, có tổ chức, vì thế nếu xem kỹ cấu trúc video có thể phát hiện được nhiều
loại thông tin dư thừa khác nhau. Các thông tin dư thừa nằm trong video có thể chia
thành năm loại.

3


Thứ nhất là dư thừa về không gian. Sự dư thừa về không gian giữa các điểm ảnh
ngay trong một khung hình gọi là thừa tĩnh. Dư thừa về mặt không gian là do các chi
tiết điểm ảnh giống nhau trên cùng một khung hình, ví dụ như nhiều điểm ảnh giống
nhau tạo thành bầu trời xanh. Thứ hai là dư thừa về thời gian. Sự dư thừa về thời gian
giữa các điểm ảnh của các khung video gọi là thừa động. Dư thừa về thời gian là do
những hình ảnh giống nhau lặp lại liên tục từ khung hình này sang khung hình khác.
Thứ ba là sự dư thừa thông tin về phổ. Đó là sự dư thừa về phổ giữa các mẫu tín hiệu
thu được từ các bộ cảm biến trong camera. Thứ tư là sự dư thừa do thống kê. Bản
thân các ký hiệu xuất hiện trong dòng bit với các xác suất xuất hiện không đồng đều.
Thứ năm là sự dư thừa tâm thị giác. Sự dư thừa do các thông tin không phù hợp với
hệ thống thị giác của con người.
Các thuật toán nén video cần giảm được lượng thông tin thừa này bằng các
phương pháp khác nhau để giảm dung lượng của video, nhằm tiết kiệm băng thông
truyền, giảm chi phí lưu trữ sao cho vẫn duy trì được chất lượng ở mức chấp nhận
được.
Từ yêu cầu đặt ra để giảm lượng thông tin dư thừa, nhiều phương pháp nén

video đã được đề xuất nhằm giảm lượng thông tin dư thừa trong dữ liệu video tương
ướng với năm loại thông tin dư thừa đã nêu. Đó là dư thừa về không gian, dư thừa về
thời gian, dư thừa thông tin về phổ, dư thừa thông tin do thống kê và dư thừa tâm thị
giác.
Trong các phương pháp nén video đã được đề xuất, hai phương pháp chính hiện
tại đang được áp dụng phổ biến là giảm thông tin dư thừa về không gian và giảm
thông tin dư thừa về thời gian.
Phương pháp nén dư thừa về không gian tập trung vào các thuật toán nhằm giảm
tối đa các dư thừa về mặt không gian giữa các điểm ảnh, từ đó nâng cao tỷ lệ nén.
Các tiêu chuẩn nén video theo phương pháp này đã được công bố. Trong đó, MJPEG
là đại diện tiêu biểu.
Phương pháp nén dư thừa về thời gian tập trung vào các thuật toán nhằm giảm
tối đa các dư thừa về mặt thời gian giữa bằng cách cố gắng xác định được tối đa các
điểm ảnh giống nhau giữa các khung hình của một video. Việc giảm trừ tối đa các
điểm ảnh giống nhau này cho phép tăng tỷ lệ nén video. Có nhiều tiêu chuẩn nén
4


video theo phương pháp nén dư thừa về thời gian, trong đó, MPEG là tiêu chuẩn tiêu
biểu.
Từ năm 2003, một tiêu chuẩn nén mới đã được đề xuất, đó là tiêu chuẩn H.264.
H.264 là một tiêu chuẩn nén sử dụng phương pháp nén dư thừa về thời gian. Bản chất
của tiêu chuẩn H.264 là sự phát triển của tiêu chuẩn MPEG, trong đó áp dụng thêm
các kỹ thuật nhằm nâng cao hơn nữa tỷ lệ nén và cố gắng cải thiện chất lượng hình
ảnh của video tương ứng với tỷ lệ nén đạt được.
Năm 2013, một tiêu chuẩn phát triển dựa trên tiêu chuẩn H.264 được đề xuất.
H.265 có tỷ lệ nén gấp đôi so với tiêu chuẩn H.264 ở cùng một mức độ chất lượng
hình ảnh video. Mục tiêu của tiêu chuẩn H.265 là chuẩn nén hỗ trợ cho các video độ
phân giải cực cao 8K UHD và kỳ vọng hỗ trợ lên đến độ phân giải 4320p (8192 x
4320).

Như vậy, hướng phát triển của các tiêu chuẩn nén video là sự kế thừa và phát
triển của các tiêu chuẩn trước đó để hướng tới hai mục đích chính. Đó là nâng cao tỷ
lệ nén và cải thiện chất lượng hình ảnh sau giải nén tương đương với tỷ lệ nén đã đạt
được.
Hình học Fractal là nguồn cảm hứng cho thuật toán nén mà điển hình hơn là
thuật toán nén hình ảnh. Lĩnh vực này hiện đang chiếm được sự quan tâm của rất
nhiều nhà khoa học trên thế giới cũng như ở Việt Nam. Nén hình ảnh sử dụng Fractal
mang đến tỉ lệ nén vượt trội so với bất kỳ phương pháp mã hóa nén nào trước đây mà
vẫn đảm bảo được chất lượng tốt nhất có thể cho hình ảnh. Ưu điểm của nén hình ảnh
sử dụng Fractal là tỷ lệ nén cao vượt trội và quá trình giải nén rất nhanh. Tuy nhiên,
khối lượng tính toán rất lớn trong quá trình nén ảnh làm cho thời gian nén ảnh cũng
rất lớn.
Từ đó, ý tưởng kết hợp Fractal và tiêu chuẩn H.264 được hình thành nhằm áp
dụng ưu điểm về tỷ số nén của Fractal vào tiêu chuẩn nén video H.264 đang được áp
dụng rộng rãi là một nỗ lực nhằm tạo ra một tiêu chuẩn nén hình ảnh có tỷ số nén cao,
thời gian nén ảnh đảm bảo tương đương với các tiêu chuẩn hiện thời và có thời gian
giải nén ảnh vượt trội. Bên cạnh đó, việc nâng cao tỷ số nén ảnh và giảm thời gian
nén ảnh đối với phương pháp nén ảnh sử dụng Fractal cũng là một vấn đề cần được
giải quyết.
5


Trong Luận án này sẽ trình bày về việc sử dụng Fractal trong việc nén hình ảnh
và video để đưa ra một phương pháp giải quyết các vấn đề đã nêu ở trên.
Ngoài phần mở đầu và kết luận, nội dung Luận án bao gồm có 3 chương:
Chương 1: Tổng quan: Chương này giới thiệu tổng quan về lý thuyết liên quan
đến hình học Fractal và phương pháp nén hình ảnh sử dụng hình học Fractal. Nội
dung của chương cũng giới thiệu về các lý thuyết liên quan hoặc được sử dụng trong
nghiên cứu của tác giả.
Chương 2: Phương pháp nén hình ảnh sử dụng Fractal: Nội dung của chương

này giới thiệu về phương pháp sử dụng thuật toán Fractal để nén hình ảnh. Giới thiệu
phương pháp cải tiến các chỉ tiêu nén hình ảnh sử dụng hình học là tỷ số nén và thời
gian nén và trình bày các kết quả thực nghiệm đã đạt được.
Chương 3: Tích hợp Fractal coding trong quá trình nén Intra-frame của tiêu
chuẩn H.264: Nội dung chương 3 trình bày phương pháp tích hợp Fractal Coding
trong quá trình nén intra-frame của tiêu chuẩn H.264 và những kết quả thực nghiệm
mà tác giả đã đạt được trong quá trình nghiên cứu.

6


DANH MỤC CÁC TỪ VIẾT TẮT

VIẾT TẮT

TIẾNG ANH

TIẾNG VIỆT

AVC

Advanced Video Coding

Tiêu chuẩn nén video tiên tiến

CNN

Celular Neural Network

Mạng nơ-ron tế bào


CPU

Central Processing Unit

Bộ xử lý trung tâm

CR

Compression Ratio

Tỷ số nén

DCT

Discrete Cosine Transform

Phép biến đổi Cosin rời rạc

DSP

Digital signal processing

Mạch xử lý tín hiệu số

FCIC

Fractal Color Image Coding

Phương pháp nén ảnh màu sử dụng

Fractal

FIC

Fractal Image Compression

Nén hình ảnh sử dụng Fractal

FPGA

Field programmable Gate Array

Mảng cổng lập trình được dạng
trường

GOP

Group of Picture

Nhóm các ảnh

H.264

H.264/MPEG-4 Part 10 or AVC

Một tiêu chuẩn nén video

HEVC

High Efficiency Video Coding


Tiêu chuẩn nén video hiệu năng cao

HV

Horizontal vertical Partition

Phân hoạch theo không gian

IFS

Iterated Function System

Hệ thống chức năng lặp

JPEG

Joint Photographic Experts Group

Phương pháp nén ảnh

NAL

Network abstraction layer

PIFS

Partition Iterated Function System

Hệ thống chức năng lặp phân mảnh


PSNR

Peak signal-to-noise ratio

Tỷ số tín hiệu cực đại trên nhiễu

RIFS

Recurrent Iterated Function System Hệ thống chức năng lặp đệ quy

RLE

Run-length Encoding

Thuật toán nén dữ liệu lossless

RMS

Root mean square

Giá trị trung bình bình phương

SDK

Services Development Kit

Bộ phát triển dịch vụ

SFC


Seperated Fractal Coding

Mã hóa Fractal thành phần

SoC

System on Chip

Hệ thống tích hợp trên một chip

UHD

Ultra high definition television

Truyền hình độ phân giải siêu cao

VCL

Video Coding Layer

Lớp mã hóa video

7


DANH MỤC CÁC BẢNG

2.1


Phần mềm sử dụng cho bo mạch FPGA ……………………………………..

41

2.2

Tài nguyên hệ thống được sử dụng trong thực thi ……………………………

42

2.3

Tập các miền với kích thước dải khác nhau và số lượng miền ………………

46

2.4

So sánh hiệu suất hoạt động trên nền tảng FPGA và DSP theo phương pháp
Fisher ………………………………………………………………………..

47

2.5

Hiệu suất PSNR và thời gian mã hóa ………………………………………..

48

2.6


Các thông số nén Fractal của hình Lena ……………………………………...

50

2.7

Kết quả FCIC hình ảnh của Lena ……………………………………………

50

2.8

Các ảnh gốc được lựa chọn và tính chất ảnh …………………………………

51

2.9

Kết quả FCIC hình ảnh của ảnh Fruit ………………………………………..

51

2.10

Kết quả FCIC hình ảnh của ảnh Leaves ……………………………………...

52

2.11


Kết quả FCIC hình ảnh của ảnh Natural …………………………………….

53

2.12

So sánh tỷ số nén giữa 3 ảnh Fruit, Leaves, Natural …………………………

53

2.13

So sánh tỷ số PSNR giữa 3 ảnh Fruit, Leaves, Natural ………………………

54

2.14

So sánh tỷ số nén và PSNR giữa Fractal và JPEG đối với ảnh Lena ………..

55

2.15

So sánh tỷ số nén và PSNR giữa Fractal và JPEG đối với ảnh Fruit …………

55

2.16


So sánh tỷ số nén và PSNR giữa Fractal và JPEG đối với ảnh Leaves ………

56

2.17

So sánh tỷ số nén và PSNR giữa Fractal và JPEG đối với ảnh Natural ………

57

2.18

Bảng kết quả so sánh giữa thực hiện nén ảnh bằng Fractal và JPEG ……….

57

2.19

So sánh hình ảnh nén thực hiện bằng Fractal và JPEG ở tỉ lệ 4 :4 : 4 ………

59

2.20

So sánh hình ảnh nén thực hiện bằng Fractal và GPEG ở tỉ lệ 4:2:2 ………..

59

2.21


So sánh hình ảnh nén thực hiện bằng Fractal và JPEG ở tỉ lệ 4:2:0 …………

60

2.22

So sánh hình ảnh nén thực hiện bằng Fractal và GPEG tại tỉ lệ 4:2:0 ………

60

2.23

Nén ảnh màu Fractal ảnh Lena ………………………………………………

67

2.24

Nén ảnh màu Fractal ảnh Parrot …………………………………………….

68

2.25

Nén ảnh màu Fractal ảnh One Tiger ………………………………………...

69

2.26


Nén ảnh màu Fractal ảnh Two Tiger ………………………………………...

69

2.27

Nén ảnh màu Fractal ảnh Flower ……………………………………………

70

2.28

Nén ảnh màu Fractal ảnh Fruit ………………………………………………

70

2.29

Nén ảnh màu Fractal ảnh Balloon …………………………………………..

71

8


2.30

Bảng 2.30: Nén ảnh màu Fractal ảnh Natural ………………………………


71

2.31

Kết quả giải nén bởi việc điều chỉnh RMS ………………………………….

73

2.32

Kết quả FCIC với một luồng xử lý ………………………………………….

83

2.33

Kết quả FCIC với hai luồng xử lý …………………………………………..

84

2.34

Kết quả FCIC với bốn luồng xử lý ………………………………………….

85

2.35

So sánh theo tỷ lệ phần trăm giữa 4 luồng, 2 luồng và 1 luồng …………….


85

2.36

Kết quả FCIC với 1 luồng, 2 luồng, 4 luồng xử lý của các ảnh Parrot, Flower,
Natural, One-tiger, Two-tiger, Red-tree và Roses …………………………..

86

3.1

So sánh về chất lượng giữa video H.264 và H.264F ………………………..

94

3.2

Thông số của các video kiểm tra …………………………………………….

96

3.3

Tỷ số nén của H.264 và H.264F đối với video Foreman ……………………

97

3.4

Tỷ số nén của H.264 và H.264F đối với video Bridge ………………………


97

3.5

Tỷ số nén của H.264 và H.264F đối với video Bridge-Far …………………..

97

3.6

Tỷ số nén của H.264 và H.264F đối với video Grandma ……………………

97

3.7

Tỷ số nén của H.264 và H.264F đối với video Highway ……………………

98

3.8

So sánh PSNR giữa ảnh chuẩn và ảnh Fractal trong video Foreman ………..

98

3.9

So sánh PSNR giữa ảnh chuẩn và ảnh Fractal trong video Bridge …………..


99

3.10

So sánh PSNR giữa ảnh chuẩn và ảnh Fractal trong video Bridge Far ………

99

3.11

So sánh PSNR giữa ảnh chuẩn và ảnh Fractal trong video Grandma ……

100

3.12

So sánh PSNR giữa ảnh chuẩn và ảnh Fractal trong video highway ………...

100

3.13

Bit-rate so sánh giữa nén Fractal và H.264 …………………………………..

101

9



DANH MỤC CÁC HÌNH VẼ

1.1

Quy trình nén dư thừa không gian …………………………………………..

12

1.2

Nén dư thừa thời gian ……………………………………………………….

13

1.3

Quy trình mã hóa và giải mã video chuẩn H.264 ……………………………

16

1.4

Phân chia Macroblock trong video ………………………………………….

16

1.5

Cấu trúc dòng bit trong H.264 ………………………………………………


17

1.6

Sơ đồ bộ mã hóa của chuẩn H.264 ………………………………………….

18

1.7

Một số hình dạng Fractal cơ bản …………………………………………….

19

1.8

Đồ thị Mandelbrot …………………………………………………………...

20

1.9

Tam giác Sierpinski …………………………………………………………

26

1.10

Ảnh Sunset với các miền và vùng được tìm thấy ……………………………


34

1.11

Sơ đồ khối quá trình mã hóa của FIC ………………………………………

36

1.12

Sơ đồ khối quá trình giải mã của FIC ………………………………………

37

1.13

Hình ảnh Lena theo phân hoạch Quadtree …………………………………

38

1.14

Hình ảnh lena với phân hoạch HV …………………………………………

39

2.1

Xử lý hoạt động nén ảnh Fractal ……………………………………………


43

2.2

Module nén ảnh màu Fractal ………………………………………………

44

2.3

Các thành phần của ảnh màu …………………………………………………

45

2.4

Các chế độ lấy mẫu tín hiệu ………………………………………………….

45

2.5

Mô hình mã hóa Fractal triển khai trên FPGA ……………………………….

46

2.6

Ảnh chuẩn và ảnh giải nén Lena với ET = 6, RET = 16 ………………………


49

2.7

Ảnh chuẩn và ảnh giải nén Lena với ET = 6, RET = 20 ………………………

49

2.8

Định dạng ảnh PPM ………………………………………………………….

76

2.9

Phân phối trật tự hình ảnh vào vùng 16x16 …………………………………..

76

2.10

Thuật toán FCIC được đề xuất ……………………………………………….

77

2.11

Trình tự các bộ nhớ stack được đề xuất ………………………………………


78

2.12

Vị trí domain có thể có xung quanh range ……………………………………

79

2.13

Giảm dữ liệu bằng cách tạo trung bình cộng của bốn giá trị điểm ảnh ……….

79

2.14

Ví dụ về ánh xạ của miền vào vùng …………………………………………..

80

2.15

Định dạng của bộ nhớ vùng ………………………………………………….

81

10


2.16


Xác định offset của miền …………………………………………………….

81

2.17

Phân chia section …………………………………………………………….

82

2.18

Phân chia section của OPENMP ……………………………………………..

83

3.1

Các bước chính để mã hóa một frame trong X264 …………………………..

93

3.2

Sơ đồ nhúng mã hóa Fractal vào intra-block trong H.264 ……………………

94

3.3


Cải thiện tỉ lệ nén …………………………………………………………….

95

3.4

Nhúng wavelet và Fractal vào x264 ………………………………………….

96

3.5a

Sơ đồ khối nén ảnh sử dụng wavelet

97

3.5b

Nhúng wavelet và Fractal vào x264 …………………………………………

97

3.6

Ảnh chuẩn và ảnh giải nén Fractal của video Foreman ………………………

99

3.7


Ảnh chuẩn và ảnh giải nén Fractal của video Bridge ………………………

100

3.8

Ảnh chuẩn và ảnh giải mã Fracal của video Brigde Far ……………………. 100

3.9

Ảnh chuẩn và ảnh giải mã Fracal của video Grandma ………………………. 101

3.10

Ảnh chuẩn và ảnh giải mã Fractal của video Highway ……………………..

101

3.11

Quá trình giải mã H.264 trên FFMPEG ……………………………………

103

3.12

Quá trình giải mã đơn vị NAL trên FFMPEG ………………………………. 104

3.13


Giải mã các thành phần trong FFMPEG ……………………………………. 104

3.14

Nhúng giải mã Fractal cho FFMPEG ……………………………………….. 105

3.15

Cơ chế hoạt động của VLC …………………………………………………. 106

3.16

Luồng của VLC ……………………………………………………………... 107

3.17

Hình chụp khi chạy video Bridge …………………………………...

110

3.18

Hình chụp khi chạy video Bridge Far ……………………………….

110

3.19

Hình chụp khi chạy video Highway …………………………………


110

11


CHƯƠNG 1 - TỔNG QUAN

1.1

Một số phương pháp nén video phổ biến
Như đã trình bày trong phần mở đầu, hai phương pháp nén video phổ biến đang

được áp dụng hiện nay là phương pháp nén dư thừa về không gian và phương pháp
nén dư thừa về thời gian.

1.1.1 Nén dư thừa về không gian
Quy trình nén dư thừa về không gian được thể hiện qua Hình 1.1: Quy trình nén
dư thừa không gian, trong đó khối nén dư thừa không gian tính đến sự tương tự của
các pixel lân cận ngay trong một khung hình.

Hình 1.1: Quy trình nén dư thừa không gian

Nén dư thừa không gian bao gồm các bước sau:
Bước thứ nhất là chuyển qua không gian màu YUV. Quy trình này sẽ được đề
cập đến trong Luận án. Bước thứ hai là chia khung hình thành các vùng nhỏ có kích
thước 8x8 pixels. Bước thứ ba là biến đổi DCT đối với từng vùng nhằm giữ lại thông

12



tin chính. Bước thứ tư là tiến hành loại bỏ các hệ số không quan trọng. Bước thứ năm
là quét ziczag các bit trong khối 8x8 đồng thời mã hóa chúng theo độ dài.

1.1.2 Nén dư thừa thời gian

Hình 1.2: Nén dư thừa thời gian

Mã hóa dư thừa thời gian xem xét sự tương tự giữa các khung hình liên tiếp.
Một video được mã hóa bởi một nhóm các ảnh (Group of Picture-GOP). Một GOP
gồm có 3 dạng khung hình (frame) khác nhau:
Intra-frame (I frame): frame bắt đầu của GOP, lưu trữ toàn bộ hình ảnh “chính”
của GOP, khi nén, frame I chỉ loại bỏ các thông tin dư thừa về không gian, dùng các
điểm trong cùng một frame để dự báo cho các khung hình tiếp theo, không có bù
chuyển động, đồng thời yêu cầu nhiều bit nhất.
Predicted-frame (frame B): chỉ lưu trữ những gì khác biệt so với I frame để tham
chiếu, sử dụng bù chuyển động. Khi mã hóa, không cần lưu trữ những điểm ảnh không
thay đổi trong các frame P. Frame P còn được biết đến với cái tên delta-frames.
Bi-predictive-frame (B frame): tiết kiệm dung lượng bằng cách tham chiếu đến
frame cả trước và sau nó. Có thực hiện bù chuyển động.

1.2

Một số chuẩn lấy mẫu tín hiệu video
Kiểu lấy mẫu cho ảnh video cũng là một vấn đề quan trọng của kỹ thuật nén

ảnh. Dưới đây là một số kiểu lấy mẫu video phổ biến sẽ được áp dụng trong phạm vi
nghiên cứu của Luận án này[12].
Chuẩn lấy mẫu 4:1:1 – tần số lấy mẫu tín hiệu chói là 13,5MHz, và mỗi tín hiệu
màu là 3,375MHz.

13


Chuẩn lấy mẫu 4:2:2 – tần số lấy mẫu tín hiệu chói là 13,5MHz, và mỗi tín hiệu
màu là 6,75MHz.
Chuẩn lấy mẫu 4:4:4 - cả 3 thành phần đều có cùng độ phân giải 13,5Mhz.
Chuẩn lấy mẫu 4:2:0 – là kiểu phổ biến, tần số lấy mẫu tín hiệu chói là 13,5MHz,
mỗi tín hiệu màu là 6,75MHz theo cả 2 chiều.
Trong kỹ thuật nén video, tiêu chuẩn lấy mẫu là một lựa chọn quan trọng ảnh
hưởng tới kết quả thực nghiệm. Sự thay đổi tần số lấy mẫu và cách lựa chọn tiêu
chuẩn lấy mẫu sẽ quyết định dữ liệu đầu vào cho quá trình nén video, từ đó ảnh hưởng
đến các thông số quan trọng của quá trình nén video như tỷ số nén, thời gian nén và
chất lượng video sau giải nén so với video gốc.

1.3

Các tiêu chuẩn nén video với bit-rate thấp
Bit-rate là lượng dữ liệu được chuyển từ file video lên CPU trong thời gian một

giây để xử lý giải mã thành hình ảnh và âm thanh. Bit-rate càng cao chất lượng càng
cao, tuy nhiên, CPU sẽ càng phải xử lý nhiều công việc, đồng thời đòi hỏi đường
truyền có băng thông cao để đáp ứng. Một cách khái quát nhất, bit-rate thấp đồng
nghĩa với tỷ số nén cao. Do đó, trong phạm vi nghiên cứu của luận án này tập trung
phân tích và lựa chọn một trong các tiêu chuẩn nén video với bit-rate thấp làm đối
tượng nghiên cứu để can thiệp Fractal coding vào tiêu chuẩn này. Sau đây là một số
tiêu chuẩn nén video với bit-rate thấp sẽ có thể được lựa chọn.

1.3.1 Chuẩn H.263
H.263 là một chuẩn nén video bit-rate thấp, được thiết kế ban đầu dành cho các
hội nghị truyền hình. Chuẩn H.263 được phát triển bởi Video Coding Experts Group

và đã được công nhận vào khoảng năm 1995/1996. Một phiên bản thống nhất của
H.263 đã được sản xuất năm 2005.
H.263 là một trong những thành viên trong họ H.26x – một họ mã hóa tiêu chuẩn
được sử dụng phổ biến. H.263 được sử dụng trong rất nhiều ứng dụng Internet, trong
đó nổi bất nhất là Flash video, đã từng được sử dụng trên nhiều trang web như
Youtube, Google Video, MySpace …
14


H.263 đã được cải tiến từ H.261, MPEG-1 và MPEG-2. Đồng thời được phát
triển thành các phiên bản mới như H.263v2 (có thể gọi tên là H.263+ hoặc H.263
1998), MPEG-4 Part 2 và H.263v3. MPEG-4 Part 2 là chuẩn H.263 được tương thích
và có thể giải mã bởi các ứng dụng giải mã MPEG-4 [13].
Mặc dù H.263 là một chuẩn nén video với nhiều kỹ thuật tiên tiến, nhưng các
định dạng video tiếp theo, như H.264 và H.265, với các ưu điểm vượt trội, đang dần
dần thay thế chúng.

1.3.2 Chuẩn H.265/HEVC
H.265/HEVC [12] (High Efficiency Video Coding) là một định dạng nén video
kế thừa H.264/MPEG-4 AVC (Advanced Video Coding) được phát triển bởi ISO/IEC
Moving Picture Experts Group (MPEG) và ITU-T Video Coding Experts Group
(VCEG). MPEG và VCEG đã thành lập một nhóm cộng tác viên về mã hóa video để
phát triển chuẩn HEVC.
HEVC có tỷ lệ nén dữ liệu gấp đôi so với H.264/MPEG-4 AVC ở cùng một
mức độ chất lượng video. Nó có thể được sử dụng để cung cấp chất lượng hình ảnh
được cải thiện đáng kể tại cùng một bit-rate. Chuẩn nén hỗ trợ 8K UHD (Ultra High
Definition Television) và độ phân giải lên đến 8192x4320 (4320p).
Mặc dù có rất nhiều ưu điểm, tuy nhiên vẫn tồn tại nhiều hạn chế khiến chuẩn
H.265 chưa thể được áp dụng rộng rãi, trong đó hạn chế cơ bản nhất là giá thành vẫn
còn cao, yêu cầu các thiết bị đầu cuối phải trả tiền bản quyền thiết bị rất cao.


1.3.3 Chuẩn H.264/AVC
Chuẩn nén H.264 [24] được công bố chính thức vào năm 2003, hiện là chuẩn
hỗ trợ công nghệ nén tiên tiến và hiệu quả vào bậc nhất hiện nay, do kế thừa những
ưu điểm nổi trội của các chuẩn nén trước đây. Sử dụng các thuật toán nén và phương
thức truyền hình ảnh mới phức tạp, phương pháp nén và truyền hình ảnh chuẩn H.264
sử dụng đã làm giảm đáng kể dữ liệu và băng thông truyền tín hiệu video.
Với cách nén và truyền thông tin theo chuẩn H.264 làm giảm đến 50% băng
thông và kích thước file dữ liệu lưu trữ so với cách nén thông thường hiện nay (chuẩn
15


nén thông thường hiện nay đang được sử dụng rộng rãi là MPEG-4 Part 2) và giảm
tới hơn 80% băng thông và kích thước file dữ liệu lưu trữ so với nén bằng chuẩn
Motion JPEG. Điều đó cho thấy, với cùng một hệ thống nếu sử dụng chuẩn nén mới
có thời gian lưu trữ gấp đôi và băng thông mạng giảm đi một nửa, lợi ích có thể thấy
ngay đó là chi phí cho lưu trữ dữ liệu video giảm một nửa so với dùng hệ thống có
chuẩn nén thông thường. Ngoài ra việc truyền hình ảnh chiếm băng thông giảm một
nửa, vì vậy chi phí dành cho thuê băng thông mạng cũng giảm đáng kể.
Do đó, tiêu chuẩn H.264 là lựa chọn phù hợp với yêu cầu nghiên cứu của Luận
án bởi sự tối ưu giữa tỷ số nén, giá thành và mức độ phổ biến hiện nay. Các nội dung
chi tiết hơn về tiêu chuẩn nén H.264 sẽ được trình bày dưới đây.
1.3.3.1

Cấu trúc

Cấu trúc của H.264 gồm 2 phần chính: Network abstraction layer (NAL) và
Video Coding Layer (VCL). Quy trình mã hóa và giải mã H.264 được trình bày trong
Hình 1.3.
Quá trình mã hóa

Video nguồn

Dự đoán

Chuyển đổi

Mã hóa

Truyền phát hoặc lưu trữ
(định dạng H.264)

Quá trình giải mã
Video đầu ra

Tái xây dựng

Chuyển đổi
ngược

Giải mã

Hình 1.3: Quy trình mã hóa và giải mã video chuẩn H.264

1.3.3.2

Macroblock

Mỗi khung hình trong video đều được chia thành các Macroblock (MB) có kích
thước cố định như Hình 1.4, bao trùm một diện tích ảnh hình chữ nhật gồm 16 × 16
mẫu thành phần luma (thành phần tín hiệu chói) và 8 × 8 mẫu cho thành phần chroma

(thành phần tín hiệu màu).
Tất cả các mẫu luma và chroma được dự đoán theo không gian hoặc thời gian,
và được dự đoán tại chỗ.

16


Hình 1.4 : Phân chia Macroblock trong video

Các macroblock được tổ chức thành các slice, biểu diễn tập con của các ảnh đã
cho và có thể được giải mã độc lập. Thứ tự truyền các Macroblock trong dòng bit phụ
thuộc vào biểu đồ phân chia macroblock và không nhất thiết phải theo thứ tự quét.
1.3.3.3

Cấu trúc các chuỗi bit

Cấu trúc các chuỗi bit trong chuẩn H.264 được thể hiện như trong Hình 1.5.

Hình 1.5: Cấu trúc dòng bit trong H.264

Trong đó:
mb_type: loại macroblock
mb_pred: phương thức dự báo trong ảnh và xác định các list 0 hoặc list 1 để mã
hóa phần khác biệt của ảnh chuyển động so với ảnh tham chiếu.
17


sub_mb_pred: xác định kích thước các sub-macroblock cho mỗi phân vùng và
các list 0 hoặc list 1 để mã hóa phần khác biệt của ảnh chuyển động so với ảnh tham
chiếu.

coded_block_pattern: xác định khối chứa vector chuyển động được mã hóa.
mb_qp_delta: thay đổi các tham số.
residual: mã hóa chuyển đổi hệ số tương ứng với các mẫu ảnh còn sót lại sau
khi dự đoán.
1.3.3.4

Mã hóa

Sơ đồ mã hóa của chuẩn H.264 được biểu diễn như trong Hình 1.6.
Dn

+

Fn
(hiện tại)

F’n
(tái tạo)

Q

X

Reorder

Mã hóa
entropy

-


ME

NAL

inter

F’n-1
(tham
chiếu)
1 hoặc 2 frame
trước frame
được mã hóa

T

MC
P

Lựa chọn
intra
prediction

Intra
prediction

intra

uF’n

Bộ lọc


+
D’n
+

T-1

Q-1

Hình 1.6: Sơ đồ bộ mã hóa của chuẩn H.264

Trong đó:
Fn (hiện tại): Ảnh hiện tại.
F’n-1 (tham chiếu): Ảnh tham chiếu của một hoặc hai khung hình đã được mã
hóa trước đó.
F’n (tái tạo): Ảnh khôi phục.
Intra prediction: Dự đoán trong ảnh.
Lựa chọn Intra Prediction: Chọn dự đoán trong ảnh.
Filter: Bộ lọc tách khối.

18


T, Q và T-1, Q-1: Mã hóa biến đổi nguyên tách biệt, lượng tử hóa và giải mã T,
giải lượng tử hóa tương ứng.
Dn và D’n: Phần ảnh sai khác.
Reorder: Sắp xếp lại.
Mã hóa Entropy: Mã hóa entropy.
MC: Bù chuyển động.
ME: Đánh giá chuyển động.


1.4

Hình học Fractal

1.4.1 Giới thiệu hình học Fractal
Fractal [58] là một vật thể hình học thường có hình dạng gấp khúc trên mọi tỷ
lệ phóng đại, và có thể được tách ra thành từng phần, mỗi phần trông giống như hình
tổng thể, nhưng ở tỷ lệ phóng đại nhỏ hơn. Như vậy Fractal có vô tận các chi tiết, các
chi tiết này có thể có cấu trúc tự đồng dạng ở các tỷ lệ phóng đại khác nhau. Nhiều
trường hợp, có thể tạo ra Fractal bằng việc lặp lại một mẫu toán học, theo phép hồi
quy. Hình 1.7 mô tả một số dạng Fractal phổ biến, được hình thành bằng cách đệ quy
một thao tác nào đó với hình.

Hình 1.7 : Một số hình dạng Fractal cơ bản

19


Fractal ban đầu được nghiên cứu như một vật thể toán học. Hình học Fractal là
ngành toán học chuyên nghiên cứu các tính chất của Fractal; những tính chất không
dễ gì giải thích được bằng hình học thông thường. Ngành này có ứng dụng trong khoa
học, công nghệ, và nghệ thuật tạo từ máy tính. Ý niệm cơ bản của môn này là xây
dựng phép đo đạc mới về kích thước của vật thể, do các phép đo thông thường của
hình học Euclid và giải tích thất bại khi mô tả các Fractal.
Việc định nghĩa các đặc tính của Fractal, có vẻ dễ dàng với trực quan, lại cực
kỳ khó với đòi hỏi chính xác và cô đọng của toán học.
Mandelbrot đã định nghĩa Fractal là "một tập hợp mà trong đó số chiều
Hausdorff (hay chiều Hausdorff-Besicovitch) lớn hơn chiều tô pô học". Số chiều
Hausdorff là khái niệm sinh ra để đo kích thước của Fractal, thường không phải là

một số tự nhiên. Một hình vẽ Fractal trên tờ giấy 2 chiều có thể bắt đầu có những tính
chất của vật thể trong không gian 3 chiều, và có thể có chiều Hausdorff nằm giữa 2
và 3. Đối với một Fractal hoàn toàn tự đồng dạng, chiều Hausdorff sẽ đúng bằng
chiều Minkowski-Bouligand.

Hình 1.8: Đồ thị Mandelbrot

Hình 1.8 mô tả đồ thị Mandelbrot, được đặt tên theo nhà toán học tìm ra và phát
triển Fractal. Một Fractal thông thường sẽ có cách tính chất sau đây: Một là không có
ý nghĩa chính xác của "gấp khúc". Hai là không có định nghĩa duy nhất của "chiều".
Ba là có nhiều cách mà một vật thể có thể tự đồng dạng. Bốn là không phải tất cả mọi
Fractal đều tìm được bằng phép đệ quy.
20


1.4.2 Các ứng dụng của hình học Fractal
Ứng dụng trong y học và sinh học [58]: Các nhà khoa học đã tìm ra các mối
quan hệ giữa Fractal với hình thù của tế bào, quá trình trao đổi chất của cơ thể người,
ADN, nhịp tim,... Trước đây, các nhà sinh học quan niệm lượng chất trao đổi phụ
thuộc vào khối lượng cơ thể người, nghĩa là nó tỉ lệ bậc 3 khi xem xét con người là
một đối tượng 3 chiều. Nhưng với góc nhìn từ hình học Fractal, người ta cho rằng sẽ
chính xác hơn nếu xem con người là một mặt Fractal với số chiều xấp xỉ 2.5, như vậy
tỉ lệ đó không nguyên nữa mà là một số hữu tỷ.
Việc chuẩn đoán bệnh áp dụng hình học Fractal đã có những tiến bộ rõ rệt. Bằng
cách quan sát hình dạng của các tế bào theo quan điểm Fractal, người ta đã tìm ra các
bệnh lý của con người, tuy nhiên những lĩnh vực này vẫn còn mới mẻ, cần phải được
tiếp tục nghiên cứu.
Ứng dụng trong hóa học [70]; Hình học Fractal được sử dụng trong việc khảo
sát các hợp chất cao phân tử. Tính đa dạng về cấu trúc polyme thể hiện sự phong phú
về các đặc tính của hợp chất cao phân tử chính là các Fractal. Hình dáng vô định hình,

đường bẻ gảy, chuỗi, sự tiếp xúc của bề mặt polyme với không khí, sự chuyển tiếp
của các sol-gel,... đều có liên quan đến các Fractal.
Sự chuyển động của các phân tử, nguyên tử trong hợp chất, dung dịch, các quá
trình tương tác giữa các chất với nhau,... đều có thể xem như một hệ động lực hỗn
độn (chaos).
Ứng dụng trong vật lý [46]: Trong vật lý, khi nghiên cứu các hệ cơ học có năng
lượng tiêu hao (chẳng hạn như có lực ma sát) người ta cũng nhận thấy trạng thái của
các hệ đó khó xác định trước được và hình ảnh hình học của chúng là các đối tượng
Fractal.
Ứng dụng trong dự báo thời tiết [26]: Hệ thống dự báo thời tiết được coi là một
hệ động lực hỗn độn (chaos). Nó không có ý nghĩa dự đoán trong một thời gian dài
(một tháng, một năm) do đó quy luật biến đổi của nó tuân theo qui luật Fractal.
Ứng dụng trong thiên văn học [15]:

Các nhà khoa học đã tiến hành xem xét

lại các quỹ đạo của các hành tinh trong hệ mặt trời cũng như trong các hệ thiên hà
khác. Một số kết quả cho thấy không phải các hành tinh này quay theo một quỹ đạo

21


Ellipse như trong hình học Euclide mà nó chuyển động theo các đường Fractal. Quỹ
đạo của nó được mô phỏng bằng những quỹ đạo trong các tập hút “lạ”.
Ứng dụng trong kinh tế [50]: Mô tả sự biến động của giá cả trên thị trường
chứng khoán bằng các đồ hình Fractal sẽ cho phép theo dõi sự biến động của giá cả.
Trên cơ sở đó dự báo giá cả trên thị trường dựa theo các luật của hình học Fractal.
Ứng dụng trong khoa học máy tính [26]: Hình học Fractal có thể giúp thiết kế
các hình ảnh đẹp trên máy tính một cách đơn giản và trực quan. Đây là một trong
những lĩnh vực được nhiều người quan tâm, nhất là đối với những người yêu mến

nghệ thuật. Bằng chứng là triển lãm tranh mang tên “Frontiers of Chaos: Images of
Complex Dynamical System” của các nhà toán học người Đức H. Jurgens, H. O.
Peitgen, M. Prufer, P. H. Richter và D. Saupe đã thu hút hơn 140.000 lượt khách tới
tham dự. Từ năm 1985 đến nay triển lãm tranh đã đi qua hơn 150 thành phố của hơn
30 nước trên thế giới.
Cơ sở hình học Fractal cũng đã được ứng dụng trong công nghệ nén ảnh một
cách hiệu quả thông qua các hệ hàm lặp (IFS), đây là một trong những lĩnh vực được
các chuyên gia về khoa học máy tính đặc biệt quan tâm. Phương pháp nén ảnh sử
dụng Fractal dựa trên sự đồng dạng giữa các phần của ảnh so với ảnh gốc, từ đó đưa
ra thuật toán nhằm giảm bớt thông tin của ảnh để thực hiện quá trình nén ảnh. Nén
hình ảnh sử dụng Fractal là một phương pháp nén hình ảnh với ưu điểm và tỷ lệ nén
cao vượt trội. Tuy nhiên, đánh đổi lại là một khối lượng tính toán rất lớn trong quá
trình mã hóa ảnh dẫn tới thời gian mã hóa cũng rất lâu [49].
Các lĩnh vực khác [49]: Fractal được ứng dụng trong việc đo chiều dài đường
bờ biển chính xác hơn so với hình học Eulide bởi vì đường bờ biển là một hình Fractal.
Fractal còn được sử dụng để mô tả các hình ảnh nhấp nhô của đồi núi, khảo sát các
vết nứt chấn động địa chấn, các sự biến đổi trong lòng đất và dự báo sự biến động
của địa chất.
Trong âm nhạc hình học Fractal cũng được đưa vào ứng dụng, các điểm hút,
điểm đẩy là cơ sở cấu thành các nốt nhạc Fractal...

22


1.5

Cơ sở lý thuyết nén ảnh sử dụng Fractal

1.5.1 Hình học Fractal
− Không gian Metrix [61]

+ Không gian (X, d) là một không gian Metric nếu hàm d : 𝑋 × 𝑋 → 𝑅 thỏa
mãn các điều kiện sau với điều kiện d là khoảng cách giữa 2 điểm 𝑥, 𝑦 ∈ 𝑋:
𝑑 (𝑥, 𝑦) = 𝑑 (𝑦, 𝑥) ∀ 𝑥, 𝑦 ∈ 𝑋

(1-1)

0 < 𝑑 (𝑥, 𝑦) < ∞ ∀ 𝑥, 𝑦 ∈ 𝑋, 𝑥 ≠ 𝑦

(1-2)

+ Hai không gian metric được gọi là tương đương trên X nếu tồn tại các hằng
số 0 < 𝑐1 , 𝑐2 < ∞ sao cho:
𝑐1 𝑑1 (𝑥, 𝑦) ≤ 𝑑2 (𝑥, 𝑦) ≤ 𝑐2 𝑑1 (𝑥, 𝑦)

∀(𝑥, 𝑦) ∈ 𝑋 × 𝑋

(1-3)

+ Hai không gian Metric (X1, d1) và (X2, d2) là tương đương nếu tồn tại hàm
h : X1 → X2 là song ánh sao cho 𝑑̃1 trên X1 được định nghĩa bởi công thức:
𝑑̃1 (𝑥, 𝑦) = 𝑑2 (ℎ(𝑥), ℎ(𝑦)) ∀(𝑥, 𝑦) ∈ 𝑋1

(1-4)

+ Hàm f : X1 → X2 từ không gian Metric (X1, d1) và không gian Metric (X2,
d2) là hàm liên tục với mỗi 𝜀 > 0 và x ∈ X1 ∃𝛿 > 0 sao cho:
𝑑1 (𝑥, 𝑦) < 𝛿 ⇒ 𝑑2 (𝑓(𝑥), 𝑓 (𝑦)) < 𝜀

(1-5)


− Dãy Cauchy, tập đóng, không gian Metrix đầy đủ
+ Dãy {𝑥𝑛 }∞
𝑛=1 các điểm trên không gian Metric (X, d) được gọi là dãy Cauchy
nếu ∀𝜀 > 0, ∃𝑁 là số tự nhiên sao cho:
𝑑 (𝑥𝑛 , 𝑥𝑚 ) < 𝜀

∀𝑛, 𝑚 > 𝑁

(1-6)

+ Dãy
các điểm trên không gian Metric (X, d) được gọi là hội tụ tới
điểm x 𝑥 ∈ 𝑋 nếu với mọi 𝜀 > 0, ∃𝑁 là số tự nhiên sao cho:
{𝑥𝑛 }∞
𝑛=1

𝑑 (𝑥𝑛 , 𝑥) < 𝜀

∀𝑛 < 𝑁

(1-7)

x được gọi là giới hạn của dãy và : x = 𝑙𝑖𝑚𝑛 →∞ 𝑥𝑛
+ Không gian Metric (X, d) được gọi là đầy đủ nếu mọi dãy Cauchy {𝑥𝑛 }∞
𝑛=1
trong X có giới hạn 𝑥 ∈ 𝑋.
− Tập compact, tập giới nội, tập mở.
+ S ⊂ X là tập con của không gian Metric (X, d). Tập S là compact nếu mọi
dãy vô hạn {𝑥𝑛 }∞
𝑛=1 trong S đều chứa dãy hội tụ con trong S.

+ S ⊂ X là tập con của không gian Metric (X, d). S là tập giới nội nếu tồn tại
điểm a ∈ X và số R > 0 sao cho:

23


×