Tải bản đầy đủ (.pptx) (26 trang)

Cơ sở dữ liệu đa phương tiện _ Phương pháp biến đổi cosine rời rạc trong xử lí ảnh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.68 MB, 26 trang )

CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN
BÁO CÁO BÀI TẬP LỚN
Giảng viên: NGUYỄN ĐÌNH HÓA
Nhóm 3:
Thành viên:
Nguyễn Thị Hương

- B12DCCN172

Phạm Thị Diễm

- B12DCCN156

Lê Thị Hằng

- B12DCCN163


I. CÁC KĨ THUẬT XỬ LÍ ẢNH
1. Tổng quan về xử lý ảnh
.Quá trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào nhằm cho ra
kết quả mong muốn. Kết quả đầu ra của một quá trình xử lý ảnh có thể là một ảnh
“tốt hơn” hoặc một kết luận.

.Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh được xem như là đặc
trưng cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của đối tượng
trong không gian và nó có thể xem như một hàm n biến P(c1, c2,..., cn).


I. CÁC KĨ THUẬT XỬ LÍ ẢNH
 Do đó, ảnh trong xử lý ảnh có thể xem như ảnh n chiều.


 Sơ đồ tổng quát của một hệ thống xử lý ảnh:


I. CÁC KĨ THUẬT XỬ LÍ ẢNH
2. Các kĩ thuật xử lí ảnh
2.1. Một số khái niệm cơ bản
 Ảnh và điểm ảnh:
 Điểm ảnh được xem như là dấu hiệu hay cường độ sáng tại 1 toạ độ trong
không gian của đối tượng và ảnh được xem như là 1 tập hợp các điểm ảnh.

 Mức xám, màu
 Là số các giá trị có thể có của các điểm ảnh của ảnh


I. CÁC KĨ THUẬT XỬ LÍ ẢNH
2.2 Nắn chỉnh biến dạng
 Ảnh thu nhận thường bị biến dạng do các thiết bị quang học và điện tử.

 Để khắc phục người ta sử dụng các phép chiếu, các phép chiếu thường được xây
dựng trên tập các điểm điều khiển.


I. CÁC KĨ THUẬT XỬ LÍ ẢNH
2.3 Khử nhiễu
 Có 2 loại nhiễu cơ bản trong quá trình thu nhận ảnh:
 Nhiễu hệ thống: là nhiễu có quy luật có thể khử bằng các phép biến đổi.
 Nhiễu ngẫu nhiên: vết bẩn không rõ nguyên nhân → khắc phục bằng các
phép lọc
2.4 . Chỉnh mức xám
Nhằm khắc phục tính không đồng đều của hệ thống gây ra. Thông thường có 2

hướng tiếp cận:
 Giảm số mức xám: Thực hiện bằng cách nhóm các mức xám gần nhau
thành một bó. Trường hợp chỉ có 2 mức xám thì chính là chuyển về ảnh
đen trắng. Ứng dụng: In ảnh màu ra máy in đen trắng.


I. CÁC KĨ THUẬT XỬ LÍ ẢNH
 Tăng số mức xám: Thực hiện nội suy ra các mức xám trung gian bằng kỹ
thuật nội suy. Kỹ thuật này nhằm tăng cường độ mịn cho ảnh
2.5 Trích chọn đặc điểm
 Các đặc điểm của đối tượng được trích chọn tuỳ theo mục đích nhận dạng
trong quá trình xử lý ảnh. Có thể nêu ra một số đặc điểm của ảnh sau đây:
 Đặc điểm không gian: Phân bố mức xám, phân bố xác suất, biên độ, điểm
uốn v.v..
 Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc thực
hiện lọc vùng (zonal filtering).
 Đặc điểm biên và đường biên: Đặc trưng cho đường biên của đối tượng =>
hữu ích trong việc trích trọn các thuộc tính bất biến được dùng khi nhận
dạng đối tượng.


I. CÁC KĨ THUẬT XỬ LÍ ẢNH
2.6 Nhận dạng
 Nhận dạng ảnh là quá trình liên quan đến mô tả đối tượng mà người ta muốn đặc tả nó.
Thường đi sau quá trình trích chọn các đặc tính của đối tượng.
 Có 2 kiểu mô tả đối tượng:
 mô tả theo tham số ( nhận dạng theo tham số)
 mô tả theo cấu trúc ( nhận dạng theo cấu trúc)

2.7 Nén ảnh

 Mục đích: giảm không gian lưu trữ, thuận tiện truyền thông trên mạng.
 Phương pháp:
 Nén không mất thông tin: khai thác các thông tin dư thừa.
 Nén mất thông tin: khai thác các thông tin dư thừa và các thông tin không liên quan.
 Hiện nay có một số chuẩn nén hay dùng: JPEG, MPEG (JPEG -2000, MPEG-4)


II. PHƯƠNG PHÁP CHUYỂN ĐỔI COSINE RỜI RẠC
1. Tổng quan
2. Biến đổi DCT
a. Biến đổi DCT 1 chiều
b. Biến đổi DCT 2 chiều

3. Vai trò của biến đổi DCT


II. PHƯƠNG PHÁP BIẾN ĐỔI COSINE RỜI RẠC
1.Tổng quan

 DCT biến đổi thông tin ảnh từ miền không gian sang miền tần số để có thể
biểu diễn dưới dạng gọn hơn.
 DCT đã trở thành tiêu chuẩn quốc tế cho các hệ thống mã chuyển vị bởi nó
có đặc tính gói năng lượng tốt, cho kết quả là số thực và có các thuật toán
nhanh để thể hiện chúng.
 Khai triển DCT được chọn là kỹ thuật then chốt trong JPEG vì nó cho ảnh nén
chất lượng tốt nhất tại tốc độ bit thấp và giải thuật chuyển đổi nhanh và dễ dàng
thực hiện bằng phần cứng.


II. PHƯƠNG PHÁP BIẾN ĐỔI COSINE RỜI RẠC

 Vậy JPEG là gì ?
 JPEG (Joint Photographic Experts Group) là chuẩn nén số quốc tế đầu tiên
được định ra cho nén ảnh tĩnh có tông màu liên tục gồm cả ảnh đơn sắc và
ảnh màu. Trong kỹ thuật này các khối ảnh kích thước 8x8 được áp dụng để
thực hiện DCT, sau đó lượng tử hóa các hệ số rồi mã hóa entropy sau lượng
tử.
 Công nghệ nén ảnh JPEG là một trong những công nghệ nén ảnh hiệu quả,
cho phép làm việc với các ảnh có nhiều màu và kích cỡ lớn.


II. PHƯƠNG PHÁP BIẾN ĐỔI COSINE RỜI RẠC

Sơ đồ mã hóa và giải mã dùng biến đổi DCT


II. PHƯƠNG PHÁP BIẾN ĐỔI COSINE RỜI RẠC
2. Biến đổi DCT
a. Biến đổi DCT 1 chiều

.DCT một chiều biến đổi biên độ tín hiệu tại các điểm rời rạc theo thời gian hoặc
không gian thành chuỗi các hệ số rời rạc, mỗi hệ số biểu diễn biên độ của một
thành phần tần số nhất định có trong tín hiệu gốc.
.Hệ số đầu tiên biểu diễn mức DC trung bình của tín hiệu. Từ trái sang phải, các
hệ số thể hiện các thành phần tần số không gian cao hơn của tín hiệu và được gọi
là các hệ số AC. Thông thường, nhiều hệ số AC có giá trị sẽ gần hoặc bằng 0.
.Quá trình biến đổi DCT thuận (FDCT) dùng trong tiêu chuẩn JPEG được định
nghĩa như sau:


II. PHƯƠNG PHÁP BIẾN ĐỔI COSINE RỜI RẠC

 Hàm biến đổi DCT ngược (1 chiều ):

Trong đó:

X(k) là chuỗi kết quả.
x(m) là giá trị của mẫu m.
k-chỉ số của hệ số khai triển.
m-chỉ số của mẫu.
N- số mẫu có trong tín hiệu




II. PHƯƠNG PHÁP BIẾN ĐỔI COSINE RỜI RẠC
b. Biến đổi DCT 2 chiều
 Vì ảnh gốc có kích thước rất lớn cho nên trước khi đưa vào biến đổi DCT, ảnh được
phân chia thành các khối vuông, mỗi khối này thường có kích thước 8 x 8 pixel và
biểu diễn các mức xám của 64 điểm ảnh, các mức xám này là các số nguyên dương
có giá trị từ 0 đến 255. Việc phân khối này sẽ làm giảm được phần thời gian tính
toán các hệ số chung, mặt khác biến đổi cosin đối với các khối nhỏ sẽ làm tăng độ
chính xác khi tính toán với dấu phẩy tĩnh, giảm thiểu sai số do làm tròn sinh ra.
 Biến đổi DCT là một công đoạn chính trong các phương pháp nén sử dụng biến đổi.
2 công thức ở đây minh hoạ cho 2 phép biến đổi DCT thuận nghịch đối với mỗi khối
ảnh có kích thước 8 x 8. Giá trị f(i, j) biểu diễn các mức xám của ảnh trong miền
không gian, F(u, v) là các hệ số sau biến đổi DCT trong miền tần số.


II. PHƯƠNG PHÁP BIẾN ĐỔI COSINE RỜI RẠC

trong đó:

f(j,k)- các mẫu gốc trong khối 8×8 pixel.
F(u,v)-các hệ số của khối DCT 8×8.
 Phương trình trên là một liên kết của hai phương trình DCT một chiều, một cho
tần số ngang và một cho tần số đứng. Giá trị trung bình của block 8x8 chính là
hệ số thứ nhất (khi u,v= 0)


II. PHƯƠNG PHÁP BIẾN ĐỔI COSINE RỜI RẠC

 Các bước của quá trình mã hóa biến đổi DCT đối với 1 khối.


II. PHƯƠNG PHÁP BIẾN ĐỔI COSINE RỜI RẠC
 Lượng tử hóa


Bước tiếp theo của quá trình nén trong ảnh là lượng tử hóa các hệ số
F(u,v) sao cho làm giảm được số lượng bit cần thiết.



Các hệ số tương ứng với tần số thấp có các giá trị lớn hơn, và như vậy
nó chứa phần năng lượng chính của tín hiệu, do đó phải lượng tử hóa
với độ chính xác cao. Riêng hệ số một chiều đòi hỏi độ chính xác cao
nhất, bởi lẽ nó biểu thị giá trị độ chói trung bình của từng khối phần tử
ảnh.



Sau quá trình này giá trị các thành phần tần số cao được làm tròn tới giá

trị 0 trong khi đó các thành phần tần thấp cũng nhỏ đi chính vì thế làm
giảm số bit cho mỗi giá trị của các thành phần tần số thấp.


II. PHƯƠNG PHÁP BIẾN ĐỔI COSINE RỜI RẠC
 Ma trận lượng tử

 Tại mỗi vị trí của X người ta chia giá trị tại đó cho các hằng số tại vị trí tương
ứng sau đó làm tròn với số nguyên gần nhất


II. PHƯƠNG PHÁP BIẾN ĐỔI COSINE RỜI RẠC

  .

B(u,v) =

B(0,0)=== 40
Kết quả của ma trận sau khi nhân với Q(u,v)


II. PHƯƠNG PHÁP BIẾN ĐỔI COSINE RỜI RẠC
 Chú ý : hệ số chia trong bảng lượng tử hóa là nhỏ đối với các hệ số có tần
số thấp và tăng từ từ đối với các hệ số có tần số cao hơn.Việc biến đổi sao
cho chất lượng hình ảnh do mắt người cảm nhận tốt, phụ thuộc vào các
thành phần tần số và sự biến đổi chi tiết ảnh từng vùng trong miền không
gian. Các ảnh càng chi tiết thì hệ số thành phần tần số cao càng lớn.
 Qúa trình mã hóa hay nén
 Để mã hóa entropy các hệ số được lượng tử hóa Fq(u,v), trước hết, cần biến
đổi mảng hai chiều của các hệ số Fq(u,v) thành chuỗi số một chiều bằng các

phương pháp quét toàn bộ các điểm ảnh của tệp ảnh đó.


II. PHƯƠNG PHÁP BIẾN ĐỔI COSINE RỜI RẠC
Có một số phương pháp quét như:


II. PHƯƠNG PHÁP BIẾN ĐỔI COSINE RỜI RẠC
 Để nâng cao hiệu quả nén cho mỗi bộ hệ số người ta thường xếp chúng lại theo thứ tự
Zigzac. Tác dụng sắp xếp lại theo thứ tự Zigzac là tạo ra nhiều loạt hệ số giống nhau. Ta
biết rằng năng lượng của khối hệ số sẽ giảm dần từ góc trên bên trái xuống góc dưới
bên phải vì vậy việc lấy Zigzac sẽ tạo điều kiện cho các hệ số sấp xỉ nhau.

 Việc xử lý 64 hệ số của khối 8x8 pixel bằng cách quét zig-zag làm tăng tối đa chuỗi các
giá trị 0 và do vậy làm tăng hiệu quả nén khi dùng RLC.


VI. PHÂN MẢNH, ĐỊNH VỊ CỞ SỞ DỮ LIỆU
 Mã hóa entropy: mã hóa RLC
 Nén bằng mã RLC là quá trình nén không tổn hao.
 Sau quá trình quét zig-zag ở trên, RLC sẽ được thực thi. Một hệ số khác 0 sau
giá trị DC được mã hóa bằng 1 từ mã bao gồm 2 thông số: số lượng 0 chạy trước
1 hệ số riêng khác 0 và mức của nó sau khi lượng tử hóa. RLC thực chất là việc
thay thế các hệ số có giá trị 0 bằng số lượng các chữ số 0 xuất hiện.
 Ở đây, giá trị 10 không có giá trị 0 nào trước đó được biễu diễn bằng <0,10>;
giá trị –2 có hai giá trị 0 đứng trước được biễu diễn bằng <2,-2>v.v...


VI. PHÂN MẢNH, ĐỊNH VỊ CỞ SỞ DỮ LIỆU



×