Tải bản đầy đủ (.docx) (64 trang)

Phương pháp nén ảnh tĩnh theo chuẩn JPEG

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (4.16 MB, 64 trang )

CÁC TỪ VIẾT TẮT
JPEG

Joint Photographic Experts Group

CCITT

Consultative Committee for
International Telephone and Telegraph

CIF

Common Intermediate Format

DCT

Discrete Cosine Transform

Biến đổi Cosine rời rạc

DPCM

Differized Pulse Code Modulation

Điều xung mã vi sai

GIF

Graphics Interchange Format

ISDN



Integrated Services Digital Network

Mạng kỹ thuật số các dịch vụ tổng hợp

ISO

International Organization for
Standardization

Tổ chức tiêu chuẩn hóa quốc tế

ITU

International Telecommunication Union

LZW

Lempel-Ziv-Welch

Tên của một tổ chức nghiên cứu về
các chuẩn nén ảnh

Mã hóa từ điển

Trang: 1


MPEG


The Moving Picture Experts Group

Tên viết tắt hội phim ảnh thế giới

MSE

Mean Square Error

Sai số bình phương trung bình

NTSC

National Television System Committee

Ủy ban hệ thống truyền hình quốc gia

PAL

Phase Alternative Line

PSNR

Peak Signal to Noise Ratio

Tỷ số tín hiệu đỉnh trên nhiễu

PSTN

Public Switched Telephone


Mạng chuyển mạch điên thoại công
cộng

QCIF

Quarter Common Intermediate Format

RLC

Run Length Coding

SECAM

Sequential Color with Memory

SQCIF

Sub Quarter Common Intermediate
Format

SSIM

The structural similarity

TIFF

Tagged Image File Format

Mã hoá loạt dài


Chỉ số tương quan cấu trúc

Trang: 2


CHƯƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH
1.1 Giới thiệu chương:

Nội dung chương đi vào tìm hiểu về lịch sử phát triển của xử lý ảnh, nghiên cứu giải
thích và giới thiệu những vấn đề cơ bản liên quan đến xử lý ảnh như: khử nhiễu, chỉnh
mức xám, trích chọn đặc trưng, nhận dạng, nén ảnh…. Đồng thời nêu ra một số ứng dụng
của xử lý ảnh phát triển trong đời sống của chúng ta.
Nội dung chương bao gồm các phần:
Lịch sử phát triển của xử lý ảnh.
Xử lý ảnh là gì.
Các vấn đề cơ bản trong xử lý ảnh.
Một số ứng dụng của xử lý ảnh.
1.2 Lịch sử phát triển của xử lý ảnh:





Do nhu cầu phát triển dẫn đến nảy sinh nhiều vấn đề như làm thế nào để chất lượng
ảnh được tốt hơn, giảm dung lượng ảnh làm khả năng truyền tải nhanh hơn, chỉnh biến
dạng ảnh, khử vét bẩn trên ảnh…. Vì vậy xử lý ảnh cần thiết phải ra đời nhằm giải quyết
cho các vấn đề đó.
Phương pháp xử lý ảnh bắt đầu từ hai ứng dụng chính: nâng cao chất lượng thông tin
ảnh và xử lý số liệu cho máy tính.
Ứng dụng đầu tiên được biết đến là việc nâng cao chất lượng ảnh báo truyền từ

London đến New York vào năm 1920 qua đường cáp Bartlane.



Mã hóa dữ liệu
khôi phục ảnh.
Thời gian truyền ảnh từ 1 tuần
3 tiếng.

Việc nâng cao chất lượng ảnh chính thức phát triển vào khoảng những năm 1955 vì
sau thế chiến II máy tính phát triển tạo điều kiện cho quá trình xử lý ảnh số được thuận
lợi.

Từ năm 1960 trở về sau các phương tiện xử lý, nâng cao chất lượng, nhận dạng ảnh
phát triển không ngừng và áp dụng rộng rãi trong đời sống thu được nhiều kết quả, đặc
biệt đầu những năm 1970 xử lý ảnh phục vụ vào các ứng dụng ảnh trong các lĩnh vực
Trang: 3


như y học, địa chất, thiên văn học, khí tượng học…. Đến nay xử lý ảnh đã có những bước
tiến dài trong nhiều ngành khoa học từ những ứng dụng đơn giản đến phức tạp, các
phương pháp và cách thức xử lý ảnh ngày càng được nghiên cứu, phát triển để phục vụ
cho nhu cầu phát triển của khoa học, cuộc sống của loài người.
Sau đây là 1 vài hình ảnh minh họa cho thấy quá trình phát triển của xử lý ảnh:

Hình 1.1: Ảnh số được tạo từ băng mã hóa của 1 máy in điện tín, năm 1921 [5]

Hình 1.2: Ảnh số được tạo ra từ card đục lỗ sau 2 lần truyền qua Đại Tây Dương,
năm 1922 [5]
Hệ thống đầu tiên có khả năng mã hóa hình ảnh với mức xám là 5 và tăng lên 15 vào

năm 1929.
Trang: 4


Hình 1.3: Ảnh 15 cấp độ xám được truyền từ London đến New Yord, năm 1929 [5]
Vào 32/07/1964, ảnh đầu tiên của mặt trăng đưa về Trái Đất thông qua các máy chụp
trên tàu vũ trụ Ranger 7 và được đưa đến phòng thí nghiệm Jet Pulsion ( Pasadena,
California ) cho máy tính xử lý chỉnh méo.

Hình 1.4: Ảnh mặt trăng đầu tiên, năm 1964 [5]
1.3 Xử lý ảnh là gì :

Mọi thông tin có trong môi trường sống của chúng ta được cảm nhận thông qua các
giác quan, trong đó thị giác giữ vai trò quan trọng nhất. Thị giác là cơ quan cảm nhận
hình ảnh quang học tương đối hoàn hảo, cho phép con người cảm nhận được hình ảnh
quang học trong thiên nhiên nhưng chỉ đối với sóng điện từ có bước sóng giới hạn nhất
định mà ảnh đưa vào xử lý có thể được tạo ra bởi các nguồn bức xạ có phổ rộng hơn.
Những năm trở lại đây với sự phát triển của phần cứng máy tính, xử lý ảnh và đồ hoạ đó
Trang: 5


phát triển một cách mạnh mẽ và có nhiều ứng dụng trong cuộc sống. Xử lý ảnh và đồ hoạ
đóng một vai trò quan trọng trong tương tác giữa người và máy.
Quá trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào qua khâu xử lý
nhằm cho ra kết quả mong muốn. Kết quả đầu ra của một quá trình xử lý ảnh có thể là
một ảnh “tốt hơn” hoặc một kết luận nào đó.

Ảnh “Tốt hơn”
Ảnh


Xử lý ảnh
Kết luận

Hình 1.5: Sơ đồ quá trình xử lý ảnh [2]

Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh được xem như là đặc trưng
cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của đối tượng trong không
gian và nó có thể xem như một hàm n biến P(c1, c2,..., cn). Do đó, ảnh trong xử lý ảnh có
thể xem như ảnh n chiều.
Sơ đồ tổng quát của một hệ thống xử lý ảnh:
Hệ quyết định

Thu nhận ảnh
(Camera, Senser, Scanner)

Tiền xử


Trích chọn
đặc trưng

Hậu xử

So sánh



Lưu trữ

Trang: 6


kết luận


Hình 1.6: Sơ đồ tổng quát của một hệ thống xử lý ảnh [2]
Các cấp độ trong xử lý ảnh:





Level 0: Thu nhận ảnh, lấy mẫu, lượng tử hóa, nén.
Level 1: Tăng cường ảnh, khôi phục ảnh, phân đoạn ảnh.
Level 2: Trích chọn đặc trưng (khai thác và lựa chọn tính năng).
Level 3: Tham số quyết định (công nhận và giải thích).

1.4 Các vấn đề cơ bản trong xử lý ảnh:

1.4.1 Một số khái niệm cơ bản:

Gốc của ảnh (trong tự nhiên) là ảnh liên tục về không gian và độ sáng. Để xử lý bằng
máy tính, ảnh cần phải được số hóa. Số hóa ảnh là sự biến đổi gần đúng 1 ảnh liên tục
thành 1 tập điểm phù hợp với ảnh thật về vị trí (không gian) và độ sáng.
Vì thế ta có:



Điểm ảnh và ảnh: Điểm ảnh được xem như là đặc trưng cường độ sáng hay
1 dấu hiệu nào đó tại 1 toạ độ nào đó trong không gian của đối tượng và


ảnh được xem như là 1 tập hợp các điểm ảnh.
• Mức xám và màu: Là số các giá trị có thể có (độ sáng ) của các điểm ảnh
của ảnh.
1.4.2 Nắn chỉnh biến dạng:

Ảnh được thu nhận thông qua các thiết bị quang học và điện tử thường xuất hiện
biến dạng, chính vì thế cần phải nén chỉnh ảnh thành ảnh tốt hơn.

Trang: 7


Hình 1.7: (a) Ảnh thu nhận - (b) Ảnh mong muốn [2]

Để khắc phục người ta sử dụng các phép chiếu và các phép chiếu thường được xây
dựng trên cơ sở tập hợp các điểm điều khiển.
Giả sử (Pi ,Pi’) i = 1 , n có n các tập điều khiển
Tìm hàm f: Pi và (Pi) sao cho:

|| f(Pi) – Pi’||2

min

[2]

(1.1)

Giả sử ảnh bị biến đổi chỉ bao gồm: Tịnh tiến, quay, tỷ lệ, biến dạng bậc nhất tuyến
tính. Khi đó hàm f có dạng:

f(x, y) = (a1x + b1y + c1, a2x + b2y + c2)


[2]

(1.2)

Ta có:

=

(f(Pi) – Pi’)= (a1xi + b1yi + c1 - xi’)2+(a2xi + b2yi + c2 - xi’)2 [2] (1.3)

Trang: 8


Để cho → min :

Giải hệ phương trình tuyến tính tìm được: a1,b1,c1
Tương tự như trên tìm được: a2, b2, c2
⇒ Xác định được hàm f
1.4.3 Khử nhiễu:
Trong quá trình thu nhận ảnh thường xuất hiện nhiễu gây ảnh hưởng đến chất lượng
ảnh.
Có 2 loại nhiễu cơ bản:


Nhiễu hệ thống: Là nhiễu xảy ra theo 1quy luật cụ thể do đó có thể khử bằng



các phép biến đổi.

Nhiễu ngẫu nhiên: Là những vết bẩn xuất hiện không rõ nguyên nhân do đó
chỉ có thể khử bằng các phép lọc.

1.4.4 Chỉnh mức xám:
Trong hệ thống thu nhận ảnh gây xuất hiện tính không đồng đều, để khắc phục thông
thường có 2 hướng tiếp cận:

Trang: 9




Giảm số mức xám: Thực hiện bằng cách nhóm các mức xám gần nhau thành
một bó, trường hợp chỉ có 2 mức xám thì chính là chuyển về ảnh đen trắng.

Ứng dụng: In ảnh màu ra máy in đen trắng.
• Tăng số mức xám: Thực hiện nội suy ra các mức xám trung gian bằng kỹ
thuật nội suy. Kỹ thuật này nhằm tăng cường độ mịn cho ảnh.
1.4.5 Trích chọn đặc trưng:
Các đặc trưng của đối tượng được trích chọn tuỳ theo mục đích của xử lý ảnh, có thể
nêu ra một số đặc trưng cơ bản của xử lý ảnh sau đây:


Đặc trưng về không gian: Phân bố mức xám, phân bố xác suất, biên độ, điểm
uốn v.v..



Đặc trưng về biến đổi: Các đặc điểm loại này được trích chọn bằng việc thực
hiện lọc vùng (zonal filtering). Các bộ vùng được gọi là “mặt nạ đặc điểm”

(feature mask) thường là các khe hẹp với hình dạng khác nhau (chữ nhật, tam
giác, cung tròn v.v..).



Đặc trưng về biên và đường biên: Rất hữu ích trong việc trích chọn các thuộc
tính bất biến được dùng khi nhận dạng đối tượng, các đặc trưng có thể được
trích chọn nhờ toán tử gradient, toán tử la bàn, toán tử Laplace, toán tử “chéo
không” (zero crossing) v.v.. Việc trích chọn hiệu quả các đặc trưng giúp cho
việc nhận dạng các đối tượng ảnh chính xác, với tốc độ tính toán cao và dung
lượng nhớ lưu trữ giảm xuống.

1.4.6 Nhận dạng:

Nhận dạng tự động (automatic recognition), mô tả đối tượng, phân loại và phân
nhóm các mẫu là những vấn đề quan trọng trong thị giác máy, được ứng dụng trong nhiều
ngành khoa học khác nhau. Tuy nhiên, một câu hỏi đặt ra là: mẫu (pattern) là gì?
Watanabe, một trong những người đi đầu trong lĩnh vực này đã định nghĩa: “Ngược lại
Trang: 10


với hỗn loạn (chaos), mẫu là một thực thể (entity), được định nghĩa một cách mơ hồ
(vaguely defined) và có thể gán cho nó một tên gọi nào đó”. Ví dụ mẫu có thể là ảnh của
vân tay, ảnh của một vật nào đó được chụp, một chữ viết, khuôn mặt người hoặc
một ký đồ tín hiệu tiếng nói. Khi biết một mẫu nào đó, để nhận dạng hoặc phân loại mẫu
đó có thể:
Hoặc phân loại có mẫu (supervised classification), chẳng hạn phân tích phân biệt
(discriminant analyis), trong đó mẫu đầu vào được định danh như một thành phần của
một lớp đã xác định.
Hoặc phân loại không có mẫu (unsupervised classification hay clustering) trong đó

các mẫu được gán vào các lớp khác nhau dựa trên một tiêu chuẩn đồng dạng nào đó. Các
lớp này cho đến thời điểm phân loại vẫn chưa biết hay chưa được định danh.
Hệ thống nhận dạng tự động bao gồm ba khâu tương ứng với ba giai đoạn chủ yếu
sau đây:
1. Thu nhận dữ liệu và tiền xử lý.
2. Biểu diễn dữ liệu.
3. Nhận dạng và ra quyết định.

Bốn cách tiếp cận khác nhau trong lý thuyết nhận dạng là:
1.
2.
3.
4.

Đối sánh mẫu dựa trên các đặc trưng được trích chọn.
Phân loại thống kê.
Đối sánh cấu trúc.
Phân loại dựa trên mạng nơ-ron nhân tạo.

Trong các ứng dụng rõ ràng là không thể chỉ dùng có một cách tiếp cận đơn lẻ để
phân loại “tối ưu” do vậy cần sử dụng cùng một lúc nhiều phương pháp và cách tiếp cận
khác nhau. Do vậy, các phương thức phân loại tổ hợp hay được sử dụng khi nhận dạng và
nay đã có những kết quả có triển vọng dựa trên thiết kế các hệ thống lai (hybrid system)
bao gồm nhiều mô hình kết hợp.
Việc giải quyết bài toán nhận dạng trong những ứng dụng mới, nảy sinh trong cuộc
sống không chỉ tạo ra những thách thức về thuật giải, mà còn đặt ra những yêu cầu về tốc
độ tính toán. Đặc điểm chung của tất cả những ứng dụng đó là những đặc điểm đặc trưng
Trang: 11



cần thiết thường là nhiều, không thể do chuyên gia đề xuất, mà phải được trích chọn dựa
trên các thủ tục phân tích dữ liệu.
1.4.7 Nén ảnh:
Nhằm giảm thiểu dung lượng của ảnh, thường được tiến hành theo cả hai khuynh
hướng là nén có tổn hao và không tổn hao thông tin. Nén tổn hao có khả năng nén cao
nhưng khả năng phục hồi thì kém hơn nén không tổn hao. Trên cơ sở hai khuynh hướng
trên, có 4 cách tiếp cận cơ bản trong nén ảnh:


Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần xuất xuất hiện
của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa thích hợp.

Một ví dụ điển hình cho kỹ thuật mã hóa này là *.TIF
• Nén ảnh không gian: Kỹ thuật này dựa vào vị trí không gian của các điểm
ảnh, lợi dụng sự giống nhau của các điểm ảnh trong các vùng gần nhau để tiến
hành mã hóa. Ví dụ cho kỹ thuật này là mã nén *.PCX
• Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng nén
không bảo toàn, do vậy kỹ thuật thường nén hiệu quả hơn. *.JPG chính là tiếp
cận theo kỹ thuật nén này.


Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng ảnh, thể hiện sự
lặp lại của các chi tiết. Kỹ thuật nén sẽ tính toán để chỉ cần lưu trữ phần gốc
ảnh và quy luật sinh ra ảnh theo nguyên lý Fractal.

1.5 Một số ứng dụng của xử lý ảnh:

Xử lý ảnh vệ tinh, ảnh viễn thám.
Thiên văn, nghiên cứu không gian, vũ trụ.
Thăm dò địa chất.

Robot, tự động hóa.
Lĩnh vực y tế.



Ảnh tia X quang
Trang: 12






Ảnh trong dãi cực tím



Ảnh Gamma

Lĩnh vực giám sát, an ninh, phát hiện chuyển động.


Nhận dạng dấu vân tay

Trang: 13




Nhận dạng chữ viết




Nhận dạng khuôn mặt

Trang: 14






Nhận dạng mắt

Lĩnh vực khí tượng.

Trang: 15


1.6 Kết luận chương:

Qua những kiến thức vừa nêu ở trên, chúng ta có thể khái quát phần nào về lĩnh vực
xử lý ảnh cũng như những vấn đề đặt ra xoay quanh nó. Đồng thời xử lý ảnh được ứng
dụng rất nhiều vào trong thực tế phục vụ cho nhu cầu phát triển của đời sống con người,
trong đó nén ảnh là một phần của quá trình xử lý ảnh nhưng cũng là yếu tố quan trọng
giúp giải quyết cho việc lưu trữ và truyền tải hình ảnh được thực hiện tốt hơn. Nén ảnh
còn có nhiều vấn đề cần được tìm hiểu, nên chương tiếp theo sẽ nêu lên một số phương
pháp nén ảnh cụ thể.

CHƯƠNG 2: CÁC KỸ THUẬT NÉN ẢNH

2.1 Giới thiệu chương:
Chương này chúng ta sẽ đi vào tìm hiểu về nén ảnh, phân loại nén ảnh, các phương
pháp nén, yếu tố liên quan và 1 vài tiêu chuẩn nén ảnh có mặt hiện nay.
Nội dung chương bao gồm các phần:
Trang: 16










Khái quát về kỹ thuật nén ảnh.
Cách phân loại các kỹ thuật nén ảnh.
Tiêu chí đánh giá chất lượng hình ảnh.
Mô hình hóa hệ thống nén ảnh.
Các phương pháp nén ảnh không tổn hao.
Các phương pháp nén ảnh có tổn hao.
Các chuẩn nén ảnh tĩnh và động hiện nay.

2.2 Khái quát về kỹ thuật nén ảnh:
2.2.1 Giới thiệu về nén ảnh:
Nén ảnh là một kỹ thuật mã hóa các ảnh số hóa nhằm mục đích giảm số lượng các bit
dữ liệu cần thiết để biểu diễn ảnh.
Mục đích là làm giảm đi những chi phí trong việc lưu trữ ảnh và thời gian để truyền
ảnh đi xa, nhanh trong truyền thông nhưng vẫn đảm bảo được chất lượng của hình ảnh.
Nén ảnh thực hiện được do thông tin trong bức ảnh không phải xuất hiện ngẫu nhiên

mà có trật tự, có tổ chức vì thế khi phân tách được tính trật tự, tính tổ chức đó thì sẽ biết
phân biệt được phần thông tin nào quan trọng nhất trong bức ảnh để biểu diễn và truyền
đi với số lượng ít bit hơn so với ảnh gốc. Còn ở bên nhận là quá trình ngược lại nó sẽ giải
mã, tổ chức, sắp xếp lại cho ra bức ảnh xấp xỉ chính xác gần với ảnh gốc nhưng vẫn thỏa
mãn yêu cầu về chất lượng.
Phương pháp nén hiệu quả nhất thông thường sử dụng các biến đổi toán học để biến
ma trận các điểm ảnh từ không gian hai chiều này sang một không gian hai chiều khác,
nơi mức độ tương quan giữa các hệ số biến đổi mới nhỏ hơn.
Nén ảnh có rất nhiều ứng dụng trong thực tế như: truyền các văn bản đồ họa qua
đường điện thoại (Fax), nén ảnh trong y tế và truyền hình cáp, nén ảnh để giảm không
gian lưu trữ, tăng tốc độ truyền tải…. Chính vì khả năng ứng dụng trong nhiều lĩnh vực
cùng với sự tiến bộ của lĩnh vực vi điện tử dẫn đến sự ra đời của các tiêu chuẩn nén ảnh.
Các kỹ thuật nén ảnh ra đời hướng tới giải quyết bài toán làm giảm thiểu khối lượng
thông tin mô tả ảnh số mà chất lượng vẫn tốt, nền tảng của quá trình nén là loại bỏ dư
thừa có trong tín hiệu. Độ dư thừa trong tín hiệu ảnh số phụ thuộc vào mức độ tương
quan giữa các điểm ảnh, độ tương quan lớn thì độ dư thừa cũng lớn.
Trang: 17


Các loại dư thừa :



Dư thừa thông tin về không gian: trong một bức ảnh luôn tồn tại sự tương



quan giữa các điểm ảnh cạnh nhau.
Dư thừa thông tin về cấp xám: là dư thừa dựa vào sự tương quan giữa các màu


sắc cạnh nhau.
• Dư thừa thông tin về thời gian: trong một chuỗi ảnh video, tồn tại sự tương
quan giữa các điểm ảnh của các frame khác nhau.
Nén ảnh là lĩnh vực nghiên cứu khá lâu đời. Thời gian đầu, các nghiên cứu đi theo
hướng xử lý tín hiệu video tương tự, nhằm nén "bề rộng phổ" của tín hiệu này. Nén video
trong những năm 1950 được thực hiện bằng công nghệ tương tự có tỷ số nén thấp. Các hệ
truyền hình tương tự NTSC, PAL, SECAM sử dụng kỹ thuật nén tín hiệu video bằng
cách giảm độ rộng băng tần thành phần màu so với thành phần chói. Ví dụ trong hệ
NTSC thành phần màu I và Q có bề rộng phổ 1.3 MHz và 0.6 MHz, bề rộng phổ thành
phần chói là 4.2 MHz.
Sự phát triển của kỹ thuật số và việc sử dụng công nghệ số vào kỹ thuật truyền hình
làm cho khái niệm “nén video” trở thành đề tài nóng hổi trong những năm gần đây. Như
chúng ta đã biết, tiêu chuẩn định dạng video thành phần 4:2:2 (CCIR-601) với quy định
bề rộng băng tần tín hiệu chói và màu là 5.75 MHz và 2.75 MHz (± 0.1 dB). Sau khi số
hóa với tần số lấy mẫu tiêu chuẩn 13.5 MHz (cho kênh chói), tốc độ bit tổng cộng của tín
hiệu chói và màu là 270 Mbps. Dòng dữ liệu video số có tốc độ cao như trên không thể
được truyền qua vệ tinh với độ rộng dải tần mỗi kênh 27 MHz hoặc qua hệ thống truyền
hình quảng bá trên mặt đất với quy định 7÷8 MHz cho một kênh truyền hình tiêu chuẩn.
Do vậy, nén tín hiệu video là công đoạn không thể thiếu để khắc phục được những khó
khăn trên. Từ những năm 1980, các nhà khoa học đã đạt được những thành tựu quan
trọng trong việc nén tín hiệu video và audio. Có rất nhiều hãng sản xuất thiết bị nén tín
hiệu video, chủ yếu các thiết bị này làm việc với hai định dạng nén được coi là tiêu chuẩn
là JPEG (Joint Photographic Experts Group) – áp dụng cho ảnh tĩnh và MPEG (Moving
Picture Experts Group) - áp dụng cho ảnh động.
2.2.2 Một số khái niệm cơ bản :

Trang: 18





Điểm ảnh (Picture Element): Điểm ảnh được xem như là đặc trưng cường độ sáng
hay 1 dấu hiệu tại 1 toạ độ nào đó trong không gian của đối tượng. Như vậy một
ảnh là một tập hợp các điểm ảnh, mỗi điểm ảnh gồm một cặp tọa độ (x,y) và

màu.Cặp tọa độ (x,y) tạo nên độ phân giải(resolution).
• Mức xám (Graylevel): Mức xám là kết quả của sự mã hóa tương ứng của mỗi
cường độ sáng của mỗi điểm ảnh với một giá trị số ( kết quả của quá trình lượng
tử hóa).
• Dữ liệu: Là 1 định nghĩa mơ hồ. Trong một bài toán, dữ liệu bao gồm một tập các
phần tử cơ sở mà ta gọi là dữ liệu nguyên tử. Nó có thể là một chữ số, một ký tự,
…. Nhưng cũng có thể là một con số, một từ,…. Điều đó phụ thuộc vào từng bài
toán cụ thể.
• Nén dữ liệu: Là quá trình làm giảm dung lượng thông tin “dư thừa” trong dữ liệu
gốc và làm cho lượng thông tin thu được sau khi nén thường nhỏ hơn dữ liệu gốc
rất nhiều. Do vậy, tiết kiệm được bộ nhớ và giảm thời gian trao đổi dữ liệu trên
mạng thông tin mà lại cho phép chúng ta khôi phục lại dữ liệu ban đầu.
• Tỷ lệ nén: Là 1trong các đặc trưng quan trọng của mọi phương pháp nén
Tỷ lệ nén =
Với r là tỷ số nén , r =
Như vậy hiệu suất nén = (1-Tỷ lệ nén)*100%

2.3 Phân loại các phương pháp nén ảnh:
Có 2 hình thức phân loại nén ảnh :


Phân loại theo nguyên lý nén:


Nén không tổn hao (lossless data reduction): Là phương pháp nén mà sau khi


giải nén thu được chính xác dữ liệu gốc nhưng tỷ lệ nén thấp
• Nén có tổn hao (loss data reduction): Là phương pháp nén mà sau khi giải nén
sẽ không thu được dữ liệu giống như bản gốc nhưng tỷ lệ nén cao


Phân loại theo cách thực hiện nén:
Trang: 19




Phương pháp không gian (Spatial Data Compression): Các phương pháp nén

bằng cách tác động trực tiếp lên điểm ảnh.
• Phương pháp sử dụng biến đổi (Transform Coding): Phương pháp nén sử dụng
các phép biến đổi không gian, quá trình nén được thực hiện bằng cách tác động
lên ảnh biến đổi.

2.4 Tiêu chí đánh giá chất lượng hình ảnh:

Quá trình nén ảnh thường đi đôi với việc ảnh nén bị biến dạng so với ảnh gốc. Vì
vậy, cần xác định tiêu chí và phương pháp đánh giá một cách khách quan lượng thông tin
về ảnh đã bị mất đi sau khi nén. Có thể đánh giá mức độ sai số giữa hai ảnh thông qua
mức sai lệch trung bình bình phương - RMS (Root Mean Square).
Cho f(x,y) là ảnh gốc, f(x,y) là ảnh khôi phục sau khi nén dẫn đến khác biệt tuyệt đối
giữa hai ảnh là:
e(x,y) = f(x,y) – f(x,y)

[1]


(2.1)

Sai số trung bình bình phương được tính theo công thức sau:

eRMS =

[1]

(2.2)

Thông thường, khi giá trị RMS thấp, chất lượng ảnh nén sẽ tốt. Tuy nhiên, trong một
số trường hợp chất lượng hình ảnh nén không nhất thiết phải tỷ lệ thuận với giá trị RMS.

Trang: 20


Một phương pháp đánh giá chất lượng ảnh nén khác dựa trên tỷ lệ tín hiệu/nhiễu
được tính theo công thức sau:

SNR =

[1]

(2.3)

SNR (Signal to Noise Ratio) - tỷ lệ tín hiệu/ nhiễu.
Trên thực tế chất lượng hình ảnh phụ thuộc rất nhiều vào cảm nhận tâm sinh lý của
con người. Các thông số nêu trên chỉ cho phép đánh giá chất lượng ảnh nén một cách gần
chính xác. Trong đồ án này sử dụng một thông số đánh giá dựa vào cấu trúc của ảnh nén

sao với ảnh gốc, là thông số SSIM.

SSIM(structural similarity) là phương pháp đo lường sự giống nhau giữa hai hình
ảnh. Chỉ số SSIM một số liệu tham khảo đầy đủ, nói cách khác việc đo đạc chất lượng
của hình ảnh dựa trên một hình ảnh không nén hay biến dạng ban đầu như một sự tham
khảo. SSIM được thiết kế để cải thiện những phương pháp so sánh truyền thống như
PSNR và MSE, những phương pháp đã được chứng minh là không phù hợp với nhận
định của mắt người.
Sự khác biệt đối với các kỹ thuật khác được đề cập trước đây như MSE hoặc PSNR
là phương pháp so sánh này ước tính các lỗi nhận thức, mặc khác SSIM xem xét sự suy
thoái hình ảnh qua việc thay đổi trong thông tin về cấu trúc của 2 hình ảnh.

Chỉ số SSIM được tính toán trên các cửa sổ khác nhau của hình ảnh. Tiêu chuẩn
đánh giá giữa hai cửa sổ x và y có chung kích thước NxN là:

[6]
Trang: 21

(2.4)


Trong đó:
µx là trung bình của x
µy là trung bình của y
là phương sai của x
là phương sai của y
là hiệu phương sai của x và y
c1 =(k1*L)2, c2=(k2*L)2 là 2 biến để làm ổn định sự phân chia với mẫu số yếu
k1 = 0.01 và k2 =0.03 được cho bởi định nghĩa


2.5 Mô hình hóa hệ thống nén ảnh:

2.5.1 Bộ mã hóa nguồn:
Sơ đồ khối:

Ảnh

Bộ chuyển

Bộ lượng

Bộ mã

Gốc

đổi

tử hóa

hóa

Hình 2.1: Sơ đồ khối bộ mã hóa nguồn [1]

Trang: 22

Ảnh
nén


Gồm các bộ phận chức năng sau:




Bộ chuyển đổi: thường dùng các phép biến đổi không gian để chuyển ảnh
trong không gian thực sang một không gian khác, nơi các hệ số chuyển đổi có
mức độ tương quan thấp hơn. Kết quả nhận được là ma trận các hệ số biến



đổi.
Bộ lượng tử hoá: sử dụng phương pháp lượng tử không đồng đều nhằm triệt
tiêu các hệ số biến đổi có năng lượng thấp hoặc đóng vai trò không quan trọng
khi khôi phục ảnh. Quá trình lượng tử không có tính thuận nghịch: ảnh khôi
phục sẽ bị biến dạng so với ảnh gốc.



Bộ mã hoá: gán một từ mã (một dòng bit nhị phân) cho một mức lượng tử.

2.5.2 Bộ giải mã nguồn:
Sơ đồ khối:

Ảnh

Bộ giải

nén

Bộ chuyển




đổi

Ảnh
giải nén

Hình 2.2: Sơ đồ khối giải mã nguồn [1]

Gồm các bộ phận chức năng sau:


Bộ giải mã thực hiện giải mã tín hiệu nhận được để cho ra ma trận các hệ số
của ảnh biến đổi.
Trang: 23




Bộ chuyển đổi thực hiện biến đổi nghịch (so với quá trình biến đổi ở bộ mã
hóa) để khôi phục lại ảnh số ban đầu.

2.6 Các phương pháp nén không tổn hao:
Có nhiều ứng dụng về nén ảnh tín hiệu cần phải được nén không làm mất mát thông
tin, ví dụ như khi nén các file chương trình trong máy tính hay nén những hình ảnh nhận
được từ các thiết bị khảo sát vũ trụ do vệ tinh gởi về ( những ảnh này thường có giá trị sử
dụng cao cần được giữ nguyên chất lượng ban đầu). Đồng thời còn có các phương pháp
nén tổn hao thường có hiệu quả nén cao hơn rất nhiều so với nén không tổn hao. Đặc
điểm của các phương pháp nén này là hiệu quả nén càng cao thì mức độ tổn hao càng lớn,
nói cách khác chất lượng ảnh nén sẽ giảm đi khi hệ số nén tăng lên. Một số phương pháp

nén ảnh có tổn hao có thể đạt hệ số nén tới 100 lần trong khi chất lượng ảnh nén vẫn còn
chấp nhận được. Cần chú ý rằng hệ số nén cũng như chất lượng ảnh nén trong trường hợp
nén tổn hao phụ thuộc tương đối nhiều vào tính chất của hình ảnh gốc.
Sau đây chúng ta phân tích một số phương pháp nén ảnh không tổn hao và tổn hao
tiêu biểu :

2.6.1 Phương pháp mã hóa Huffman:
Phương pháp mã hóa Huffman là phương pháp giảm dư thừa thống kê, dựa vào mô
hình thống kê của tín hiệu. Phân tích dữ liệu gốc, người ta tính tần suất xuất hiện của các
ký tự. Các ký tự có tần suất cao nhất sẽ được mã hóa bằng từ mã ngắn nhất và ngược lại.
Tóm lại, với cách mã hóa trên, chúng ta đã làm giảm chiều dài trung bình của từ mã được
dùng để mã hóa dữ liệu .
2.6.2 Phương pháp mã LZW (Lempel-Ziv-Welch):
Đây là phương pháp mã hóa từ điển, quá trình mã hóa được thực hiện bằng cách thay
chuỗi dữ liệu gốc có độ dài khác nhau bằng từ mã có độ dài cố định. Khác với mã
Huffman, kỹ thuật LZW không cần biết tần suất của các ký tự trong tín hiệu gốc.
Để mã hóa theo phương pháp LZW, chuỗi dữ liệu phải được đưa vào tra cứu trong
"từ điển" để tìm ra mã tương ứng với nó. "Từ điển" được hình thành ngay trong quá trình
Trang: 24


mã hóa. Ví dụ: khi nén ảnh đen-trắng được mã hóa bằng 8 bits/pixel, từ điển được khởi
tạo bao gồm 256 từ tương ứng với các mức chói 0,1,2…255. Sau đó, coder sẽ phân tích
lần lượt chuỗi ký tự (mức xám) liên tiếp trong dữ liệu nguồn, khi phát hiện trong từ điển
không có chuỗi ký tự tương đương, coder sẽ ghi chuỗi ký tự liên tiếp đó vào vị trí còn
trống của từ điển. Ví dụ: nếu hai điểm ảnh đầu tiên có giá trị 255, thì chuỗi 255-255 sẽ
được ghi vào vị trí thứ 256, sau đó tổ hợp 255-255 có thể được truyền đi với từ mã là
256. Như vậy thay vì truyền hai ký tự có 16 bits, ta chỉ cần truyền đi từ mã 9 bits. "Từ
điển" bao gồm các từ mã 9 bits có thể lưu được 512 từ mã. Có thể thấy rằng, khi "từ điển"
quá nhỏ, số lượng chuỗi ký tự được mã hóa sẽ ít, ngược lại khi "từ điển" quá lớn từ mã sẽ

có độ dài lớn do đó hiệu quả nén cũng bị giảm. Cần lưu ý rằng, "từ điển" sử dụng khi mã
hóa không cần phải chuyển sang phía giải mã, trong quá trình giải mã LZW, "từ điển"
này sẽ được khôi phục tự động. Giải thuật nén LZW thường được sử dụng cho các loại
ảnh nhị phân. Chuẩn nén này được sử dụng để tạo ra các dạng ảnh GIF và TIFF.

2.6.3 Phương pháp mã hóa RLC (Run Length Coding):
Kỹ thuật mã hóa RLC được pháp triển ban đầu để nén ảnh nhị phân như ảnh scan từ
văn bản, ảnh nhận được từ máy Fax. Kỹ thuật nén này dựa trên nguyên lý tìm trong tín
hiệu số nhị phân chuỗi bít "1" hoặc "0" liên tiếp, sau đó mã hóa chuỗi đó bằng hai thông
số: giá trị bit lặp và số lượng bít lặp (chiều dài chuỗi). Đôi khi, để nâng cao hiệu quả nén,
giá trị chiều dài các chuỗi có thể được mã hóa bằng mã có chiều dài thay đổi (ví dụ mã
Huffman). Chiều dài chuỗi bits trong ảnh nhị phân đôi khi có thể lớn hơn 255. Vì thế, để
có thể dùng 1 byte để mã hóa giá trị số bit lặp lại, người ta hạn chế chiều dài chuỗi bằng
255. Phương pháp nén RLC được sử dụng để lưu trữ các ảnh Bitmap theo dạng PCX,
BMP.
2.6.4 Phương pháp mã hóa theo vùng đồng trị:
Ảnh gốc được chia thành nhiều khối nhỏ có kích thước mxn pixel. Chúng ta phân
biệt ba loại khối ảnh: khối toàn màu trắng, toàn màu đen và khối có độ sáng hỗn hợp. Sau
đó, các khối ảnh có tần suất cao được mã hóa với từ mã ngắn nhất, ví dụ từ mã "0". Hai
khối còn lại được mã hóa bằng từ mã 2 bits: "01" và "10". Như vậy, thay vì phải truyền đi
giá trị mxn điểm ảnh trong mỗi khối, với khối toàn trắng và toàn đen ta chỉ cần truyền đi
các từ mã có độ dài 1 hoặc 2 bits.
Trang: 25


×