Nhận Dạng Số Qua Camera Đồ Án Xử Lý Ảnh.doc

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (526.81 KB, 30 trang )

NHẬN DẠNG SỐ QUA CAMERA

GVHD:NHỮ QUÝ THƠ

MỤC LỤC
Lời nói đầu……………………………………………………………….……….…2
Phần một:LÝ THUYẾT XỬ LÝ ẢNH……………………………….……………..3
Chương 1:Giới thiệu hệ thống xử lý ảnh……………………………………………3
Chương 2:Thu nhận ảnh…………………………………………………………….4
Chương 3:Phân tích ảnh………………………………………..….……….…....….6
Chương 4:Nhận dạng ảnh ……………………………………………………...…..21
Phần hai:THỰC NGHIỆM…………………………………………………………24
Kết luận…………………………………………………………………………….30
Tài liệu tham khảo………………………………………………………………….30

NHÓM 08

1

NHẬN DẠNG SỐ QUA CAMERA

GVHD:NHỮ QUÝ THƠ

LỜI MỞ ĐẦU
Trong mấy thập kỷ gần đây xử lý ảnh được nghiên cứu mạnh mẽ và có nhiều ứng dụng thực tế. Như
trong y học xử lý ảnh được dùng để phát hiện và nhận dạng khối u, cải thiện ảnh X quang, nhận dạng
đường biên mạch máu từ ảnh chụp bằng tia X. Trong truyền thông và trong nghiên cứu vũ trụ xử lý ảnh
được dùng để phân tích ảnh của những hành tinh , thiên hà thu được từ tàu vũ trụ hay kính thiên văn.
Đặc biệt trong Robot ngày nay không thể thiếu yếu tố xử lý ảnh , nhờ xử lý ảnh robot có thể phát hiện và
nhận dạng đối tượng ngồi mơi trường . Từ đó giải quyết các bài tốn tránh vật cản ,tìm đường, nhận

dạng đối tượng …
Quá trính xử lý ảnh được chia làm 3 bước chính sau đây: thu nhận ảnh , phân tích ảnh và quyết định.
Nội dung của đồ án :Nhận dạng các chữ số qua camera kết nối với máy tính. Có thể tóm tắt nội dung
đồ án qua lược đồ cơ bản sau đây:

Thu thập ảnh

Xử lý kết quả

Ảnh đầu vào nguyên gốc

Nhận dạng ký
tự

Xử lý mức xám

Trích lấy biên ảnh

Giới hạn thiết kế đồ án :Do xử lý ảnh là một lĩnh vực mới và khó, khơng có nhiều tài liệu trong
nước tham khảo nên chúng em thiết kế đồ án này chỉ gồm 1 webcam kết nối máy tính thơng qua toolbox
xử lý ảnh của Matlab để thực hiện.
Mục đích của đồ án:Tìm hiểu về q trình xử lý ảnh từ quá trình thu thập ảnh , lọc nhiễu , phân đoạn
ảnh , tách biên , đến quá trình nhận dạng ảnh . Sản phẩm của đồ án trước hết được ứng dụng vào mục
đích nghiên cứu và giảng dạy tại trường , nếu được nghiên cứu và đi sâu có thể được ứng dụng vào thực
tế như hệ thống nhận dạng số chứng minh thư nhân dân , biển số xe …

NHÓM 08

2

NHẬN DẠNG SỐ QUA CAMERA

GVHD:NHỮ QUÝ THƠ

PHẦN MỘT:LÝ THUYẾT XỬ LÝ ẢNH
CHƯƠNG MỘT:GIỚI THIỆU HỆ THỐNG XỬ LÝ ẢNH
Một hệ thống xử lý ảnh cơ bản bao gồm ba bước chính : thu thập ảnh , phân tích và xử lý ảnh , xử lý
kết quả , có thể tóm tắt bằng sơ đồ cơ bản sau :

Thiết bị thu nhận ảnh
(camera , sensor )

Xử lý kết quả và
đưa ra quyết định

Ảnh thu nhận được

Nhận
dạng

Số hóa

Phân tích ảnh ( lọc nhiễu ,
phân đoạn ảnh , trích biên)

1.1 Thu nhận ảnh:
Việc thu nhận ảnh có thể thơng qua camera . Camera có thể là loại tương tự hoặc là loại số . Nếu ảnh
thu được là loại tương tự thì nó phải được lấy mẫu và lượng tử hóa trước khi phân tích , xử lý .

1.2 Phân tích ảnh:
Ở giai đoạn này ảnh được xử lý qua nhiều công đoạn nhỏ như lọc nhiễu , cải thiện ảnh , khôi phục
ảnh để làm nổi một số đặc tính chính của ảnh hay làm cho ảnh gần với ảnh gốc , tiếp theo là phát hiện
các đặc tính biên cạnh góc ,phân vùng.

1.3 Nhận dạng ảnh:
Nhận dạng là quá trình xác định ảnh . Quá trình này thường được xác định bằng việc so sánh với
mẫu có từ trước . Theo lý thuyết về nhận dạng ảnh có hai loại nhân dạng sau:
-Nhận dạng theo tham số.
-Nhận dạng theo cấu trúc.
Một số đối tượng nhận dạng khá phổ biến hiện nay được áp dụng trong khoa học và công nghệ là :
nhận dạng ký tự , nhận dạng vân tay , nhận dạng văn bản , nhận dạng mặt người …

NHÓM 08

3

NHẬN DẠNG SỐ QUA CAMERA

GVHD:NHỮ QUÝ THƠ

CHƯƠNG HAI: THU NHẬN ẢNH
2.1 Thiết bị thu nhận ảnh:
Chức năng của thiết bị này là số hóa một băng tần số cơ bản của tín hiệu của tín hiệu vào từ một
camera hay một đầu máy thu tín hiệu ảnh .
Ảnh thu được có thể là một ảnh đen trắng hoặc ảnh màu , ảnh thu được thường là loại tương tự cũng
có loại camera đã được số hóa là loại photodiot tạo cường độ sáng tại mỗi điểm ảnh.
Chất lượng ảnh thu được phụ thuộc vào chất lượng thiết bị thu và môi trường (ánh sáng ,phong
cảnh).

2.2 Hệ tọa độ màu:
Tổ chức quốc tế về chuẩn hóa CIE đưa ra một số các chuẩn để biểu diễn màu . Các hệ này có các
chuẩn riêng ở đây đề cập hệ tọa độ màu CIE-RGB ( hệ tọa độ dùng 3 màu cơ bản là red , green , blue )
mỗi pixel Px được viết:
Px =

 red

 green 




 blue


Người ta dùng hệ tọa độ 3 màu R-G-B (tương ứng với 3 trục tọa độ x,y,z) để biểu diễn màu như sau:
Blue(lơ)
(0,0,1) lơ

tím (1,0,1)

(0,0,1) tím xanh

(1,1,1) vàng đậm
(0,0,0) đen

(1,0,0) đỏ

(0,1,0) lục

Green (lục)

(1,1,0) vàng

Red(đỏ)

Trong cách biểu diễn trên đỏ +lục + lơ =1 , công thức này gọi là công thức Maxell , trong hình vẽ
trên tam giác tạo bởi ba đường đứt đoạn là tam giác Maxell.

2.3 Lấy mẫu và lượng tử hóa:
2.3.1 Lấy mẫu:
Lấy mẫu là một q trình trong đó ảnh được tạo nên bởi một vùng liên tục được chuyển thành các
giá trị rời rạc nguyên . Quá trình này gồm 2 bước là:
-Khoảng lấy mẫu.
-Cách thể hiện dạng lấy mẫu.

NHÓM 08

4

NHẬN DẠNG SỐ QUA CAMERA

GVHD:NHỮ QUÝ THƠ

Khoảng lấy mẫu càng nhỏ thì ảnh thu được càng giống với ảnh nguyên gốc .
Dạng lấy mẫu là cách bài trí các điểm lấy mẫu trong không gian 2 chiều . Một số dạng lấy mẫu điểm
ảnh được cho là dạng tam giác , chữ nhật , lục giác.

2.3.2 Lượng tử hóa:
Lượng tử hóa là ánh xạ từ các số thực mơ tả giá trị lấy mẫu thành dải các số thực , nói cách khác là
q trình số hóa biên độ.

2.4 Biểu diễn ảnh:
Ảnh thường được biểu diễn bằng một số phương pháp sau đây:
-

Biểu diễn mã loạt dài (Run length code) .

-

Biểu diễn mã xích ( Chain code ).

-

Biểu diễn mã tứ phân (Quad tree code ).

2.4.1 Biểu diễn mã loạt dài:
Thường dùng biểu diễn ảnh nhị phân , một vùng ảnh R có thể biểu diễn đơn giản nhờ một ma trận
nhị phân :
u(m,n) =

1 nếu (m,n)  R
0 nếu khác

2.4.2 Biểu diễn mã xích:
Thường biểu diễn biên của ảnh . Thay vì lưu trữ tồn bộ người ta lưu trữ các dãy điểm ảnh A, B,
….M .

2.4.3 Biểu diễn mã tứ phân:
Theo phương pháp này một vùng ảnh coi như bao kín một hình chữ nhật . Vùng này được chia làm 4
vùng con nếu một vùng con này gồm tồn điểm đen (1) hoặc điểm trắng (0) thì khơng cần chia tiếp
ngược lại thì lại chia vùng đó ra làm 4 vùng nhỏ , cứ tiếp tục chia đến khi nào vùng đó đồng nhất chỉ
gồm điểm đen hoặc điểm trắng thì thơi . Q trình đó tạo thành một cây chia theo 4 phần gọi là cây tứ
diện .

NHÓM 08

5

NHẬN DẠNG SỐ QUA CAMERA

GVHD:NHỮ QUÝ THƠ

CHƯƠNG 3 : PHÂN TÍCH ẢNH
3.1 Khái niệm pixel và pixel lân cận :
Pixel là phần tử nhỏ nhất của ảnh cấu tạo nên ảnh . Mỗi pixel có tọa độ p(x,y) và có màu xác định.

P1(x-1,y-1)

P2(x-1,y)

P4(x,y-1)

P6(x+1y-1)

P3(x-1,y+1)

P(x,y)

P5(x,y+1)

P7(x+1,y)

P8(x+1,y+1)

Hình minh họa :Pixel P và các lân cận của P
Một pixel P(x,y) có 4 pixel lân cận theo chiều dọc và chiều ngang là P2(x-1,y) ; P4(x,y-1) ;
P5(x,y+1) ; P7(x+1,y); chúng ký hiệu là N4(p).
Ngoài 4 pixel này cịn 4 pixel lân cận chéo góc là P1(x-1,y-1) ; P3(x-1,y+1) ; P6(x+1,y-1) ;
P8(x+1,y+1) ; chúng ký hiệu là ND(p)
Tập 8 pixel trên tạo thành lân cận của P(x,y) ký hiệu là N8(p).

3.2 Một số công cụ trợ giúp xử lý ảnh:
3.2.1 Tích chập:
Tốn tử chập được định nghĩa như sau:
+ trường liên tục
 

g(x,y) = h(x,y)  f(x,y) =

h( x 

x ' , y  y ' ) f ( x ' , y ' )dx ' dy '

  

+ trường rời rạc


y(m,n) = h(m,n)  x(m,n) =



  h(m 

m' , n  n' ) x (m' , n' )

 

3.2.2 Kỹ thuật lọc số:
Chất lượng hình ảnh kém do nhiều nguyên nhân gây ra như do nhiễu điện tử của máy thu hoặc do
chất lượng bộ số hóa kém . Phần này tìm hiểu về các bộ lọc được dùng trong xử lý ảnh để khắc phục sự
nhiễu của ảnh thu được.
Có nhiều bộ lọc được thiết kế để xử lý ảnh nhiễu nhưng do giới hạn của đồ án môn học nên phần
này không được giới thiệu ở đây.

3.3 Các phép biến đổi ảnh:

NHÓM 08

6

NHẬN DẠNG SỐ QUA CAMERA

GVHD:NHỮ QUÝ THƠ

- Sự biểu diễn toán học cho một ảnh thường là một hàm với hai biến không gian f(x,y) . Giá trị của
hàm tại một vị trí ( x,y ) đại diện cho cường độ của ảnh tại vị trí đó . Thuật ngữ biến đổi ( transform )
nhằm nói đến một sự biểu diễn toán học tương tự của ảnh .

3.3.1 Phép biến đổi Fourier ( phần này dịch từ matlab )
- Phép biến đổi Fourier là một biểu diễn của ảnh như là tổng của các hàm mũ phức của biên độ , tần
số và pha biến đổi . Biến đổi Fourier chiếm một vai trò quan trọng trong các ứng dụng xử lý ảnh bao
gồm : làm giàu ảnh ( hay cải thiện chất lượng ảnh – enhancement ) , phân tích , phục hồi và nén ảnh .
a - Định nghĩa phép biến đổi Fourier
- Nếu f(m,n) là một hàm với hai biến không gian độc lập m và n , thì biến đổi Fourier hai chiều của
hàm f(m,n ) đượcđịnh nghĩa bởi quan hệ :
F (1 , 2 )    f (m, n)e  j1m e  j2n
m   n  

Biến 1 và 2 là các biến tần số . Hàm F (1 , 2 ) được gọi là biểu diễn trong miền tần số của hàm
f(m,n) . Nó là một hàm phức tuần hồn với chu kì 2 . Do tính tuần hồn , nên 1 và 2 thường được
chọn trong khoảng -  đến  . Chú ý rằng F(0,0) là tổng của tất cả các giá trị của f(m,n) .Vì lý do này
F(0,0) thường được gọi là thành phần không đổi hoặc thành phần một chiều DC của biến đổi Fourier .
- Biến đổi Fourier ngược được cho bởi công thức :




1
f (m, n)  2   F (1 , 2 )e j1me j2n d12
4 1   2  

Nói chung , phương trình này có nghĩa rằng f(m,n) có thể được đại diện như là tổng vô hạn của các
hàm mũ phức với các tần số khác nhau . Biên độ và pha của thành phần ở tần số (1 , 2 ) được lưu trong

F (1 , 2 )
Biểu diễn trực quan biến đổi Fourier
- Để minh hoạ , ta hãy xem hàm f(m,n) nhận giá trị bằng 1 trong khoảng hình chữ nhật ( xem hình )
và bằng 0 tại mọi điểm khác . Để đơn giản sơ đồ f(m,n) được coi như một hàm liên tục mặc dù m, n là
các biến rời rạc.

NHÓM 08

7

NHẬN DẠNG SỐ QUA CAMERA

GVHD:NHỮ QUÝ THƠ

- Hình biểu diễn sau đây biểu diễn biên độ của biến đổi Fourier | F (1 , 2 ) | của hàm chữ nhật như
trên .

- Giá trị đỉnh ở tâm của đồ thị là F(0,0) , đó là tổng của tất cả các giá trị của hàm f(m,n) . Đồ thị cũng
chỉ ra rằng F (1 , 2 ) có nhiều năng lượng hơn ở vùng tần số ngang so với tần số đứng . Điều này phản
ánh sự thực rằng các vùng giao ngang của hàm f(m,n) ( horizontal cross sections ) là các xung hẹp trong
khi các vùng giao đứng của hàm này là các xung rộng . Xung hẹp mang nhiều nội dung tần số hơn xung
hẹp .
Một cách khác để biểu diễn trực quan biến đổi Fourier là hiển thị hàm log | F (1 , 2 ) | như một ảnh :

NHÓM 08

8

NHẬN DẠNG SỐ QUA CAMERA

GVHD:NHỮ QUÝ THƠ

- Sử dụng hàm lơgarit giúp cho việc nhận rõ đặc tính của biến đổi Fourier ở các vùng mà giá trị
F (1 , 2 ) gần bằng 0 . Để minh hoạ , hãy xem biểu diễn trực quan các biến đổi Fourier sau :

b-

Biến đổi
Fourier

rời

rạc
-

Biến đổi
Fourier

trên

máy tính

là

biến đổi
Fourier

rời

rạc
( DFT ) .

Có

hai lý do

chính

để

dụng

loại biến

đổi

Fourier

sử

này :
+

Hàm vào

và ra

của biến

đổi

Fourier

là

các hàm

rời

rạc

điều

này

thích

hợp cho

các

thao tác

biến

đổi trên

máy tính .

NHĨM 08

9

,

NHẬN DẠNG SỐ QUA CAMERA

GVHD:NHỮ QUÝ THƠ

+ Có một giải thuật nhanh cho việc tính tốn DFT được gọi là biến đổi Fourier nhanh ( FFT )
- DFT thường được định nghĩa cho các hàm rời rạc f(m,n) khác 0 và m , n lần lượt nhận các giá trị
0 m M  1 , 0 n  N  1
Matlab
sử

dụng

các

hàm fft

,

fft2 và

fftn

sử
dụng

thuật toán biến đổi Fourier nhanh cho việc tính tốn DFT một chiều , hai chiều và N chiều tương ứng .
Các hàm ifft, ifft2 và ifftn tính toán DFT ngược .
Quan hệ với biến đổi Fourier
- Ta có quan hệ biểu diễn bằng cơng thức sau :

Ví dụ :
1. Tạo ma trận f tương tự như hàm f(m,n) chữ nhật đã xét trước đây . Hàm f(m,n) bằng 1 trong vùng
chữ nhật và bằng 0 trong vùng khác . Sử dụng một ảnh nhị phân để thay thế cho f(m,n)
f = zeros(30,30);
f(5:24,13:17) = 1;
imshow(f,'notruesize')

NHÓM 08

10

NHẬN DẠNG SỐ QUA CAMERA

GVHD:NHỮ Q THƠ

2. Tính tốn và

biểu diễn trực quan

biến đổi Fourier

bởi những lệnh sau đây

:
F = fft2(f);
F2 = log(abs(F));
imshow(F2,[-1 5],'notruesize'); colormap(jet); colorbar

3 . Để thu được kết

quả tốt hơn ,

ta sử

dụng các lệnh sau đây :
F = fft2(f,256,256);
imshow(log(abs(F)),[-1
5]);

colormap(jet);

NHÓM 08

colorbar

11

NHẬN DẠNG SỐ QUA CAMERA

GVHD:NHỮ QUÝ THƠ

c- Các ứng dụng sử dụng phép biến đổi Fourier
Đáp ứng tần số của bộ lọc tuyến tính
- Biến đổi Fourier của đáp ứng xung của bộ lọc tuyến tính cho phép nhận được đáp ứng tần số của
bộ lọc . Hàm freqz2 tính toán và hiển thị đáp ứng tần số của một bộ lọc . Đáp ứng tần số của bộ lọc
Gauss chỉ ra rằng bộ lọc này là một bộ lọc thơng thấp .
h = fspecial('gaussian');
freqz2(h)

Nhân

chập

nhanh

- Một tính chất

quan trọng của

biến đổi Fourier là

nhân hai biến

đổi Fourier tương ứng với nhân chập (convolution ) của hai hàm kết hợp trong không gian . Tính chất
này kết hợp với biến đổi Fourier nhanh làm cơ sở cho giải thuật nhân chập nhanh .

NHÓM 08

12

NHẬN DẠNG SỐ QUA CAMERA

GVHD:NHỮ QUÝ THƠ

Chú ý : FFT dựa trên phương pháp nhân chập thường được sử dụng với đầu vào lớn . Với các đầu
vào nhỏ , nhìn chung sử dụng hàm imfiler sẽ nhanh hơn .
- Để minh hoạ , ví dụ sau thực hiện nhân chập của A và B trong đó A là một ma trận MxN và B là
ma trận PxQ
1. Tạo ra hai ma trận
A = magic(3);
B = ones(3);
2. Thêm các giá trị 0 vào A và B để chúng có chiều ít nhất là (M+P-1)x(N+Q-1) ( chú ý rằng : hàm
fft2 sẽ nhanh hơn nếu các kích thước của A và B là luỹ thừa của 2 ) .Ví dụ sau chèn thêm các phần tử 0
để hai ma trận có kích thước 8x8
A(8,8)=0;
B(8,8)=0;
3. Tính biến đổi Fourier hai chiều của A và B sử dụng hàm fft2
4. Nhân hai biến đổi Fourier lại với nhau
5. Tính biến đổi Fourier ngược của kết quả trên bằng hàm ifft2
C = ifft2(fft2(A).*fft2(B));
6. Trích ra thành phần khác 0 của kết quả và loại bỏ phần ảo do sai số làm tròn
C = C(1:5,1:5);
C = real(C)
C=
8.0000

9.0000 15.0000

7.0000

6.0000

11.0000 17.0000 30.0000 19.0000 13.0000
15.0000 30.0000 45.0000 30.0000 15.0000
7.0000 21.0000 30.0000 23.0000

9.0000

4.0000 13.0000 15.0000 11.0000

2.000

Phát hiện chi tiết của ảnh
- Biến đổi Fourier có thể được sử dụng để thực thi tương quan – có liên hệ gần với nhân chập
( convolution ) . Tương quan có thể được sử dụng để phát hiện chi tiết trong một ảnh , trong trường hợp
này , tương quan thường được gọi là hợp mẫu ( template matching )

NHÓM 08

13

NHẬN DẠNG SỐ QUA CAMERA

GVHD:NHỮ QUÝ THƠ

- Ví dụ sau minh hoạ việc sử dụng tương quan để phát hiện sự có mặt của kí tự “a” trong một ảnh có
chữ :
1. Đọc vào ảnh mẫu :

bw=imread(‘text.png’);
2. Tạo một mẫu ( template ) để làm hợp bằng cách trích kí tự “a” từ ảnh :
a=bw(32:45,88:98);
Ta có thể tạo ảnh mẫu bằng cách sử dụng phiên bản tương tác của hàm imcrop , sử dụng hàm pixval
để tính toạ độ của một chi tiết trong ảnh . Hình sau đây chỉ ra ảnh gốc và ảnh mẫu :

3. Tính tốn tương quan của ảnh mẫu a với ảnh gốc bw bằng cách quay ảnh mẫu 180 độ và sau đó
dùng biến đổi Fourier nhanh trên cơ sở phép nhân chập như đã đề cập trước đây ( Nhân chập sẽ tương
đương với tương quan nếu ta quay nhân chập 180 độ ) . Để hợp với ảnh mẫu , dùng hàm fft2 và ifft2 .
C = real(ifft2(fft2(bw) .* fft2(rot90(a,2),256,256)));
Ảnh sau đây minh hoạ kết
sáng trong ảnh tương ứng với
figure, imshow(C,[]) %

quả của tương quan . Đốm
sự xuất hiện của kí tự :
Scale image to appropriate

display range.

NHÓM 08

14

NHẬN DẠNG SỐ QUA CAMERA

GVHD:NHỮ QUÝ THƠ

4. Để quan sát vị trí của mẫu trong ảnh , tìm giá trị pixel lớn nhất sau đó định nghĩa một giá trị

ngưỡng nhỏ hơn giá trị này . Vị trí của đỉnh được chỉ ra bằng một điểm trắng trong ảnh tương quan mẫu
( để xác định chúng dễ hơn , ảnh ngưỡng đã được mở rộng kích thước điểm )
max(C(:))
ans =
68.0000
thresh = 60; % Use a threshold that's a little less than max.
figure, imshow(C > thresh)% Display showing pixels over threshold.

3.3.2 Biến đổi cô-sin rời rạc
- Biến đổi cô-sin rời rạc ( DCT ) biểu diễn một ảnh như là tổng của các hàm sin với biên độ và tần số
biến đổi . Hàm dct2 tính DCT hai chiều của một ảnh . DCT có tính chất mà với các ảnh điển hình , hầu
hết các thơng tin có ý nghĩa về ảnh được tập trung vào các hệ số của DCT . Vì lý do này , DCT thường
được sử dụng trong các ứng dụng nén ảnh . Chẳng hạn ,DCT là trung tâm của giải thuật nén ảnh theo

NHÓM 08

15

NHẬN DẠNG SỐ QUA CAMERA

GVHD:NHỮ QUÝ THƠ

chuẩn quốc tế thường được biết với tên JPEG ( tên này do nhóm phát triển đặt ra : Joint Photographic
Experts Group )
- DCT hai chiều của ma trận A có kích thước MxN được định nghĩa như sau :

-

Các

giá
B

pq

trị
được

gọi là hệ
số DCT
của A . DCT có thể biến đổi ngược được và biến đổi ngược của nó cho bởi cơng thức :

- Biểu
thức
DCT
ngược
có thể được xem xét khi coi rằng mọi ma trận A kích thước MxN như là tổng của MN hàm có dạng :

- Những hàm này đựơc gọi là những hàm cơ sở của DCT . Hệ số DCT B pq có thể được xem như
trọng số cho mỗi hàm cơ sở . Với các ma trận 8x8 , 64 hàm cơ sở được minh hoạ bởi ảnh sau :

NHÓM 08

16

NHẬN DẠNG SỐ QUA CAMERA

GVHD:NHỮ QUÝ THƠ

Ma trận biến đổi DCT
- Toolbox xử lý ảnh sử dụng 2 cách để tính DCT . Cách thứ nhất là dùng hàm dct2 . Hàm dct2 sử
dụng giải thuật dựa trên FFT để tăng tốc tính tốn với các ảnh có kích thước lớn . Cách thứ hai là sử
dụng ma trận biến đổi DCT . Ma trận này được trả về từ hàm dctmtx và được sử dụng hiệu quả hơn với
các ảnh có kích thước nhỏ như 8x8 , 16x16 . Ma trận biến đổi MxM – T được cho bởi :

Với ma trận A có kích thước MxM , T*A là một ma trận MxM mà các cột của nó là DCT một chiều
của các cột trong A . DCT hai chiều của A có thể thu được từ biểu thức : B=T*A*T’ . Do T là ma trận
trực giao nên ma trận nghịch đảo của nó cũng là ma trận chuyển vị nên DCT hai chiều của B là T’*B*T
DCT và nén ảnh
- Trong giải thuật nén ảnh JPEG , ảnh vào được chia làm các khối có kích thước 8x8 hoặc 16x16 và
DCT hai chiều được tính cho mỗi khối . Hệ số DCT sau đó được lượng tử hoá , mã hoá và truyền tải .
Bộ nhận JPEG ( hoặc chương đọc file JPEG ) sẽ giải mã hệ số đã được lượng tử của DCT , tính DCT
ngược cho mỗi khối và sau đó đặt các khối lại với nhau trong một ảnh duy nhất . Với các ảnh điển hình ,

NHĨM 08

17

NHẬN DẠNG SỐ QUA CAMERA

GVHD:NHỮ QUÝ THƠ

nhiều hệ số DCT có giá trị gần 0 , những hệ số này có thể bị bỏ qua mà khơng ảnh hưởng nhiều đến chất
lượng của ảnh nén
- Ví dụ sau tính DCT hai chiều của các khối 8x8 trong một ảnh , bỏ qua ( đặt bằng 0 ) tất cả ngoại
trừ 10 trong số 64 hệ số DCT của mỗi khối và sau đó xây dựng lại ảnh bằng DCT hai chiều ngược của
mỗi khối . Phương pháp ma trận chuyển đổi DCT được sử dụng :

I = imread('cameraman.tif');
I = im2double(I);
T = dctmtx(8);
B = blkproc(I,[8 8],'P1*x*P2',T,T');
mask = [1 1 1 1 0 0 0 0
1 1 1 0 0 0 0 0
1 1 0 0 0 0 0 0
1 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0];
B2 = blkproc(B,[8 8],'P1.*x',mask);
I2 = blkproc(B2,[8 8],'P1*x*P2',T',T);
imshow(I), figure, imshow(I2)

- Mặc dù chất lượng của ảnh nén bị suy giảm , nó vẫn rõ nét thậm chí gần 85% hệ số DCT bị bỏ qua

3.4 Xử lý và nâng cao chất lượng ảnh:
Nâng cao chất lượng ảnh là một bước quan trọng , tạo tiền đề cho xử lý ảnh . Mục đích chính là
nhằm làm nổi bật một số đặc tính chính của ảnh như thay đổi độ tương phản , lọc nhiễu , nổi biên ,
khuyếch đại ảnh ,…Khôi phục ảnh là nhằm làm cho ảnh gần với ảnh gốc trước khi bị biến dạng do nhiều
nguyên nhân khác nhau.

NHÓM 08

18

NHẬN DẠNG SỐ QUA CAMERA

GVHD:NHỮ QUÝ THƠ

3.4.1 Các kỹ thuật tăng cường ảnh:
Tăng cường ảnh là làm nổi bật các đặc trưng đã chọn , làm sao có thể phát hiện sớm hơn , bao gồm
các bước : điều khiển mức xám , dãn độ tương phản , giảm nhiễu , làm trơn ảnh , nổi biên ,…
3.4.1.1 Cải thiện ảnh dùng toán tử điểm:
-Tăng độ tương phản
-Tách nhiễu và phân ngưỡng
-Biến đổi âm bản
-Cắt theo mức
-Trích chọn bít
-Trừ ảnh
-Nén dải độ sáng
-Mơ hình hóa và biến đổi lược đồ xám
3.4.1.2 Cải thiện ảnh dùng tốn tử khơng gian:
-Làm trơn ảnh bằng lọc tuyến tính
-Làm trơn nhiễu bằng lọc phi tuyến
-Mặt nạ gờ sai phân và làm nhám
-Lọc thông thấp lọc thông cao và lọc dải thông
-Khuếch đại và nội suy ảnh
-Cải thiện ảnh nhị phân
-Co , dãn ảnh

3.4.2 Khôi phục ảnh:
3.5 Phát hiện biên:
3.5.1 Khái niệm:
-Điểm biên : Một điểm ảnh được coi là điểm biên nếu có sự thay đổi nhanh hoặc đột ngột về mức
xám.
- Đường biên : Là tập hợp liên tiếp của các điểm biên tạo thành một đường bao

3.5.2 Các phương

pháp phát hiện biên

ảnh:

NHÓM 08

19

NHẬN DẠNG SỐ QUA CAMERA

GVHD:NHỮ QUÝ THƠ

Ảnh gốc

-

Phương

pháp

phát

hiện

trực

tiếp

:

dựa chủ

yếu

vào

sự

biến

thiên độ

sáng

của điểm

ảnh để làm nổi biên bằng cách lấy đạo hàm

Ảnh biên
+ Lấy đạo hàm bậc nhất ta có phương pháp Gradient
+ Lấy đạo hàm bậc hai có phương pháp Laplace

Cả 2 phương pháp này gọi chung là phương pháp dò biên cục bộ
- Phương pháp phát hiện gián tiếp : Bằng cách nào đấy chúng ta thu được các vùng ảnh khác nhau
thì đường phân cách các vùng ảnh chính là biên . Phương pháp này khó thực hiện nhưng cho kết quả tốt
khi sự biến thiên mức xám nhỏ .

3.5.2.1 Phương pháp phát hiện biên cục bộ:
a. Phương pháp Gradient:
b. Phương pháp Laplace:

CHƯƠNG BỐN : NHẬN DẠNG ẢNH
4.1 Giới thiệu:
Nhận dạng là giai đoạn cuối của hệ thống xử lý ảnh . Nhận dạng dựa trên lý thuyết về nhận dạng , lý
thuyết này và lý thuyết về nhận dạng ảnh nói riêng đề cập đến 3 phương pháp nhận dạng chính:
-

Nhận dạng dựa vào phân hoạch khơng gian

-

Nhận dạng dựa vào cấu trúc

-

Nhận dạng dựa vào mạng nơron

NHÓM 08

20

Nhận Dạng Số Qua Camera Đồ Án Xử Lý Ảnh.doc

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về