Phát hiện biên biểu diễn fourier elliptic và ứng dụng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.49 MB, 42 trang )

ĐẠI HỌC THÁI NGUYÊN
KHOA CÔNG NGHỆ THÔNG TIN

ĐẠI HỌC THÁI NGUYÊN
KHOA CÔNG NGHỆ THÔNG TIN

PHẠM NGỌC QUÝ

PHẠM NGỌC QUÝ

PHÁT HIỆN BIÊN, BIỂU DIỄN FOURIER ELLIPTIC
VÀ ỨNG DỤNG

PHÁT HIỆN BIÊN, BIỂU DIỄN FOURIER ELLIPTIC
VÀ ỨNG DỤNG

Chuyên ngành: Khoa học máy tính
Mã số:

604801

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

`

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
Ngƣời hƣớng dẫn khoa học: TS. Phạm Việt Bình

`
Thái Nguyên - 2009

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Thái Nguyên - 2009

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

i

MỤC LỤC

2.1.1. Phương pháp phát hiện biện trực tiếp ....................................... 22

Lời cảm ơn .................................................................................................... i

2.1.2 Phương pháp phát hiện biên gián tiếp ........................................ 31

Danh mục các ký hiệu, các chữ viết tắt ......................................................... ii
Danh mục các hình ...................................................................................... iii
MỞ ĐẦU ..................................................................................................... 1

2.1.3 Phương pháp phát hiện biên kết hợp.......................................... 32
2.1.4 Phát hiện biên dựa vào trung bình cục bộ .................................. 38

CHƢƠNG 1. TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ BIÊN ..................................... 3

2.1.5 Cải thiện và nâng cao chất lượng biên ảnh ................................ 40

1.1. Một số khái niệm cơ bản trong xử lý ảnh ............................................... 3

2.2 Phép biến đổi Fourier ........................................................................... 49

1.1.1. Xử lý ảnh. .................................................................................. 3

2.2.1 Định nghĩa ................................................................................ 49

1.1.2 Quá trình thu nhận, biểu diễn và lưu giữ ảnh ............................... 3

2.2.1 Elliptic Fourier .......................................................................... 50

1.1.3 Histogram của ảnh ...................................................................... 7

2.2.3 Biến đổi Fourier rời rạc ............................................................. 55

1.1.4 Nhận dạng ảnh ............................................................................ 8

2.2.4 Các thuộc tính khác của biến đổi Fourier .................................. 61

1.2 Biên ảnh và vai trò trong nhận dạng ảnh ................................................. 9

CHƢƠNG 3: CHƢƠNG TRÌNH THỬ NGHIỆM ..................................................... 62

1.2.1 Khái niệm về biên ảnh và các phương pháp phát hiện

3.1 Giới thiệu ............................................................................................. 62

biên cơ bản........................................................................................... 9

3.2 Số hóa biên đối tượng ảnh .................................................................... 62

1.2.2 Vai trò của biên trong nhận dạng ảnh ........................................ 14

3.2 Chương trình thử nghiệm ..................................................................... 66
KẾT LUẬN ................................................................................................................. 70

1.2.3 Biểu diễn biên dựa trên mô tả Fourier ....................................... 14
TÀI LIỆU THAM KHẢO ............................................................................................ 72

1.2.3.1 Phương pháp dựa trên mô tả Fourier................................. 16
1.2.3.2 Phương pháp góc quay ............................................... 19

Tiếng Việt .................................................................................................. 72
Tiếng Anh .................................................................................................. 72

CHƢƠNG 2: MỘT SỐ PHƢƠNG PHÁP PHÁT HIỆN BIÊN
VÀ PHÉP BIỂU DIỄN FORIER ELLIPTIC ............................................................. 22

2.1 Một số phương pháp phát hiện biên ...................................................... 22

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

i

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

ii

LỜI CẢM ƠN

Danh mục các ký hiệu, các chữ viết tắt
CSDL

Cơ sở dữ liệu

diễn Fourier Elliptic và ứng dụng”, em đã nhận được nhiều đóng góp và

FD

(Fourier descriptors) - Mô tả Fourier

tạo điều kiện của các thầy cô và đồng nghiệp. Lời đầu tiên em xin chân thành

Pixel

Điểm ảnh

cảm ơn tới toàn thể các thầy cô, những người đã giảng dạy em.

Radius

Bán kính

RGB

Không gian màu RGB

Trong quá trình làm luận văn thạc sĩ với đề tài “Phát hiện biên, biểu

Đặc biệt, em xin tỏ lòng cảm ơn chân thành và sâu sắc tới thầy thầy
Phạm Việt Bình, người đã luôn tận tình hướng dẫn, định hướng, và có những
chỉ bảo cặn kẽ em trong thời suốt thời gian qua.
Em rất cảm ơn các bạn, các đồng nghiệp đã động viên, khích lệ, cũng
như trao đổi tài liệu cho em trong thời gian làm luận văn.
Em cũng chân thành mong được sự đóng góp ý kiến của các thầy, các cô
và các đồng nghiệp để em có phát triển đề tài trong thời gian tới.
Xin chân thành cảm ơn !
Thái Nguyên, ngày 12 tháng 11 năm 2009
Học viên
Phạm Ngọc Quý

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

i

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

ii

Danh mục các hình

Hình 2.16 Ảnh biên kết hợp phương pháp kết hợp với N =5 ...................... 37

Hình 1.1 Các giai đoạn chính trong quá trình xử lý ảnh ................................ 3

Hình 2.17 Ma trận điểm ảnh trước và sau lọc ............................................. 39

Hình 1.2 Điểm 8 láng giềng và điểm 4 láng giềng ........................................ 6

Hình 2.18 Các ảnh biên kết quả thu được theo thuật toán đề xuất ............... 39

Hình 1.3(a) Đồ thị biểu diễn Histogram ảnh ................................................. 8

Hình 2.19 Lấy tổ hợp các điểm ảnh lân cận ................................................ 41

Hình 1.3(b) Ảnh gốc..................................................................................... 8

Hình 2.20 Một số kiểu mặt nạ sử dụng cho kỹ thuật lọc phi tuyến.............. 41

Hình 1.3(c) Histogram của ảnh gốc theo RGB và Gray ................................ 8

Hình 2.21 Minh họa thuật toán hậu xử lý ................................................... 46

Hình 1.4 Ví dụ chu tuyến của đối tượng ảnh .............................................. 12

Hình 2.22 Ví dụ về chain code ................................................................... 51

Hình 1.5 Phân loại biểu diễn hình dạng và các kỹ thuật biểu diễn .............. 15

Hình 2.23 Minh họa sự kết hợp của chuỗi mã 4, 8-láng giềng ................... 52

Hình 1.6 Biểu diễn góc quay ...................................................................... 20

Hình 2.24 Minh họa chuỗi mã .................................................................... 54

Hình 1.7 Biểu diễn góc quay trong trường hợp có thay đổi nhỏ .................. 21

Hình 2.25 Biển đổi xung mẫu ..................................................................... 57

Hình 2.1 Mô hình 8 hướng ......................................................................... 23

Hình 2.26 Ảnh dùng biến đổi Fourier rời rạc 2D ........................................ 58

Hình 2.2 Ảnh trước khi dò biên .................................................................. 24

Hình 2.27 (a) Ảnh mặt (b) Biển đổi ảnh mặt .............................................. 60

Hình 2.3 Ảnh sau khi dò biên ..................................................................... 25

Hình 2.28 Biến đổi Fourier 2D ................................................................... 61

Hình 2.4 (a) Ảnh gốc (b) Đạo hàm bậc nhất (c) Đạo hàm bậc hai ............... 25

Hình 3.1 Thuật toán số hóa biên ảnh của đối tượng ảnh ............................. 63

Hình 2.5(a) Ảnh gốc (b) Ảnh biên dùng Laplace H1 (a) Ảnh biên H2 ......... 27

Hình 3.2 Thuật toán chaincodeal ................................................................ 64

Hình 2.6 Minh họa biểu diễn biên nhờ các phép hình thái .......................... 30

Hình 3.3 Lá gấc ban đầu ............................................................................. 66

Hình 2.7 Ảnh gốc ....................................................................................... 33

Hình 3.4 Lá gấc sau khi Histogram ............................................................ 67

Hình 2.8 Ảnh đen trắng .............................................................................. 33

Hình 3.5 Lá gấc sau khi chain code ............................................................ 67

Hình 2.9 Ảnh đen trắng dùng hàm ConvertRGB ........................................ 34

Hình 3.6 (a) Lá gấc trước khi được xử lý .................................................... 68

Hình 2.10 Ảnh đen trắng ............................................................................ 34

Hình 3.6 (b) Lá gấc sau khi được xử lý ...................................................... 68

Hình 2.11 Biên của ảnh đen trắng............................................................... 35
Hình 2.12 Ảnh gốc ..................................................................................... 36
Hình 2.13 Ảnh biên với cách đánh giá độ chênh lệch mức xám của
điểm ảnh..................................................................................................... 36
Hình 2.14 So sánh với mức xám trung bình của cửa sổ ảnh trong
trường hợp N=5 .......................................................................................... 36
Hình 2.15 Xác định điểm biên thực sự ....................................................... 37

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

iii

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

iv

PHẦN MỞ ĐẦU
Xử lý ảnh là một lĩnh vực đã và đang được quan tâm của nhiều nhà khoa
học trong và ngoài nước bởi tính phong phú và lợi ích của nó được ứng dụng
trong khoa học kỹ thuật, kinh tế, xã hội và đời sống con người. Lĩnh vực xử lý
ảnh liên quan tới nhiều ngành khác như: hệ thống tin học, trí tuệ nhân tạo,
nhận dạng, viễn thám, y học, nông học...
Hiện nay, thông tin hình ảnh đóng vai trò rất quan trọng trong trao đổi
thông tin, bởi phần lớn thông tin mà con người thu được thông qua thị giác.
Do vậy, vấn đề nhận dạng trong xử lý ảnh, đặc biệt là nhận dạng biên ảnh
đang được quan tâm bởi yêu cầu ứng dụng đa dạng của chúng trong thực tiễn.
Mục đích đặt ra cho xử lý ảnh được chia thành hai phần chính: phần
thứ nhất liên quan đến những khả năng từ các ảnh thu lại các ảnh để rồi từ các
ảnh đã được cải biến nhận được nhiều thông tin để quan sát và đánh giá bằng
mắt, chúng ta coi như là sự biến đổi ảnh (image transformation) hay sự làm
đẹp ảnh (image enhancement). Phần hai nhằm vào nhận dạng hoặc đoán nhận
ảnh một cách tự động, đánh giá nội dung các ảnh.
Quá trình nhận dạng ảnh nhằm phân loại các đối tượng thành các lớp

đối tượng đã biết (supervised learning) hoặc thành những lớp đối tượng chưa
biết (unsupervised learning). Sau quá trình tăng cường và khôi phục (đối với
những ảnh có nhiễu), giai đoạn tiếp theo, người ta phải trích rút các đặc tính
quan trọng, quyết định của ảnh cần nhận dạng. Các đặc tính đó có thể là đặc
tính hình học, đặc tính ngữ cảnh.
Các đặc tính hình học chứa những thông tin về vị trí, kích thước hình
học, hình dạng của các đối tượng trong ảnh, là đặc tính rất quan trọng trong
xử lý nhận dạng ảnh. Các đặc tính này thường được trích rút ra thông qua việc
xác định các đường biên các đối tượng trong ảnh. Biên chứa các thông tin về

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

v

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

1

hỡnh dng ngoi ca i tng nh. Cú th núi xỏc nh biờn l mt trong
nhng vn quan trng v hp dn trong lnh vc nghiờn cu x lý nh bi
kh nng biu t cu trỳc i tng v tớnh ng dng rng rói ca nú vo
vic gii quyt nhiu bi toỏn khú nh: nhn dng t ng, th thc mỏy tớnh,
hot hỡnh

CHNG 1: TNG QUAN V X Lí NH V BIấN

1.1. Mt s khỏi nim c bn trong x lý nh
1.1.1. X lý nh
X lý nh(Image processing) l i tng nghiờn cu ca lnh vc th
giỏc mỏy, l quỏ trỡnh bin i t mt nh ban u sang mt nh mi vi cỏc

Bờn cnh ú, trong nhng nm gn õy cỏc nghiờn cu v biờn nh v

c tớnh m tuõn theo ý mun ca vic x lý. X lý nh cú th l quỏ trỡnh

phộp bin i Fourier ó v ang c ng dng rng rói. Thc t ny t ra

phõn tớch, phõn lp cỏc i tng, lm tng cht lng, phõn on v tỡm

cỏc bi toỏn nh: a nhng ng dng ú vo xó hi v i sng con ngi.

biờn, gỏn nhón cho vựng hay quỏ trỡnh biờn dch cỏc thụng tin hỡnh nh ca

Mt s nhúm nghiờn cu trong v ngoi nc ó a ra cỏc phng phỏp gii

nh. Hỡnh di s minh ha cỏc giai on chớnh trong quỏ trỡnh x lý nh.

quyt kt hp cỏc phng phỏp phỏt hin biờn v phộp bin i Fourier

L-u
trữ

hon thnh nhng ng dng gúp phn vo s phỏt trin trong xó hi.
Chỡnh vỡ nhng ng dng thc tin ú em ó nghiờn cu lun vn thc

camera

Thu nhận
ảnh

s vi ti Phỏt hin biờn, biu din Forier Elliptic v ng dng. Lun vn
gm phn m u, phn kt lun, v 3 chng ni dung:

Số hoá

Phân tích
ảnh

Nhận
dạng

SENSOR

Chng 1: Tng quan v x lý nh v biờn.

Hệ
Q.định

L-u
trữ

Chng 2: Mt s phng phỏp phỏt hin biờn v phộp biu din
Fourier Elliptic.

Hỡnh 1.1. Cỏc giai on chớnh trong quỏ trỡnh x lý nh

Chng 3: Chng trỡnh th nghim.

1.1.2. Quỏ trỡnh thu nhn, biu din v lu gi nh
1.1.2.1.Quỏ trỡnh thu nhn nh
nh tn ti trong thc t l mt nh liờn tc c v khụng gian cng nh
v giỏ tr sỏng, v vic thu nhn nh cú th dựng Scanner, camera... Mun
a nh liờn tc trong thc t vo mỏy tớnh x lý cn phi qua mt khõu
trung gian ú l quỏ trỡnh s hoỏ. S hoỏ l quỏ trỡnh ri rc hoỏ v khụng
gian v lng t hoỏ v giỏ tr.Quỏ trỡnh ri rc hoỏ v khụng gian l quỏ
trỡnh thu nhn nhng im ri rc t mt nh liờn tc, nhng phi m bo
bng mt thng khụng phõn bit c hai im k nhau. Quỏ trỡnh ny cng

S húa bi Trung tõm Hc liu i hc Thỏi Nguyờn

2

S húa bi Trung tõm Hc liu i hc Thỏi Nguyờn

3

chính là việc tìm cách biểu diễn cả một ảnh lớn có vô số điểm, bởi một số hữu

thực tế đều có thể biểu diễn bởi toạ độ của chúng trong hệ toạ độ này, tức là

hạn điểm, sao cho không làm mất đi hay thay đổi tính chất của ảnh, để việc

từ ba màu này chúng ta có thể tổng hợp được nhiều màu trong thực tế. Xét

lưu trữ và xử lý ảnh được dễ dàng. Còn quá trình lượng tử hoá về giá trị là

một số trường hợp đặc biệt sau:

quá trình rời rạc hoá về mặt giá trị để có thể đơn giản hoá việc tính toán và

 Màu đen (Black) tạo bởi R=B=G=0

đưa vào máy để xử lý. Tuỳ theo từng loại ảnh, độ chính xác yêu cầu và khả

 Màu vàng (Yellow) tạo bởi R=G=1, B=0

năng xử lý của máy tính mà ta có các mức lượng tử thích hợp. Ví dụ với ảnh

 Màu tím (Magenta) tạo bởi R=B=1, G=0

256 cấp xám, ta phải dùng 256 mức lượng tử và biểu diễn trong máy tính

 Màu xanh (Cyan) tạo bởi R=0, G=B=1

bằng 8 bits.

 Màu trắng (White) tạo bởi R=G=B=1

1.1.2.2. Quá trình biểu diễn ảnh

Từ đó ta có thể thấy rằng, ảnh đa cấp sáng là trường hợp đặc biệt của ảnh

Sau quá trình số hoá sẽ thu được một ma trận tương ứng với ảnh cần xét,

màu, trong đó các thành phần tọa độ màu tương ứng bằng nhau (R=G=B=1).

mỗi phần tử của ma trận tương ứng với một điểm ảnh. Ảnh thường được biểu
diễn bởi một mảng hai chiều I(n,p) gồm n dòng và p cột. Như vậy, ảnh gồm
nxp pixels và người ta thường kí hiệu I(x,y) để chỉ một pixel cụ thể trong ảnh.
Các điểm này được đặc trưng bằng toạ độ màu (R,G,B) tương ứng với nó trên

Về mặt toán học có thể xem ảnh là một hàm hai biến f(x,y) với x,y là các
biến tọa độ. Giá trị số ở điểm (x,y) tương ứng với giá trị xám hoặc độ sáng
của ảnh (x là các cột còn y là các hàng). Giá trị của hàm ảnh f(x,y) được hạn
chế trong phạm vi của các số nguyên dương.

hệ toạ độ màu cơ bản sau:

0 = f(x,y) = fmax
Thông thường đối với ảnh xám, giá trị fmax là 255 ( 28=256) và mỗi phần

Blue
Cyan
Mag

tử ảnh được mã hóa bởi một byte. Ảnh có thể được biểu diễn theo một trong
hai mô hình: mô hình Vector hoặc mô hình Raster.

White

 Mô hình Raster: là mô hình biểu diễn ảnh thông dụng nhất hiện nay.

Ảnh được biểu diễn dưới dạng ma trận các điểm ảnh. Tùy theo nhu cầu
Black

Green

thực tế mà mỗi điểm ảnh có thể được biểu diễn bởi một hay nhiều bit.
Mô hình Raster thuận lợi cho việc thu nhận, hiển thị và in ấn.

Yellow
Red



Mô hình Vector: Bên cạnh mục đích tiết kiệm không gian lưu trữ, dễ
dàng hiển thị và in ấn, các ảnh biểu diễn theo mô hình vector còn có ưu

Trong đó R = Red, G = Green, B = Blue

điểm cho phép dễ dàng lựa chọn, sao chép, di chuyển, tìm kiếm …

Hệ toạ độ (R,G,B ) là hệ cơ bản nhất, người ta đã chứng minh được
R,G,B là ba màu độc lập, là một hệ cơ sở. Hầu như các màu khác nhau trong

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

4

Theo những yêu cầu này thì kỹ thuật biểu diễn vector tỏ ra ưu việt hơn.

Trong mô hình này, người ta sử dụng hướng vector của các điểm ảnh

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

5

lân cận để mã hóa và tái tạo lại hình ảnh ban đầu. Các ảnh vector được

lưu trữ trong máy tính dưới dạnh các files và thường thì các files này được

thu nhận trực tiếp từ các thiết bị số hóa như Digitalize hoặc được

nén để tiết kiệm bộ nhớ .

chuyển đổi từ các ảnh Raster thông qua các chương trình vector hóa.

Hầu hết các files ảnh đều có phần đề ở đầu files để ghi những thông tin

Khi xử lý các ảnh Raster chúng ta có thể quan tâm đến mối quan hệ

cơ bản về ảnh như: Kích thước ảnh, số planes, số bits cho một điểm ảnh ...

trong vùng lân cận của các điểm ảnh. Các điểm ảnh có thể xếp hàng trên một

Trong thực tế, ta hay gặp và xử lý đầu vào là các ảnh bitmap đó là ảnh được

lưới (raster) hình vuông, lưới hình lục giác hoặc theo một cách hoàn toàn

tạo ra từ các điểm ảnh. Ngoài ra trong quá trình thực hiện, sau một số phép

ngẫu nhiên với nhau. Cách sắp xếp theo hình vuông là được quan tâm đến

biến đổi có thể chuyển nó về dạng vectơ có đơn vị là các đường để tiện cho

nhiều nhất và có hai loại: điểm 4 láng giềng (4 liền kề) hoặc 8 láng giềng (8

việc lưu giữ.

liền kề). Hình dưới đây minh họa điểm 4 láng giềng và điêm 8 láng giềng.

1.1.3. Histogram của ảnh
Như ta đã biết, mỗi điểm có một giá trị độ sáng nào đó. Histogram của
ảnh là đồ thị cho biết tần suất hiện các điểm ảnh với các mức biến thiên
độ sáng.
Thí dụ: Có một ảnh 100 điểm , độ sáng của ảnh được phân thành 5 mức
sáng: level1, level2,..., level 5.
Số điểm ảnh của các mức tương ứng là 20, 25, 10, 30, 15. Như vậy tần

H×nh 1.2 : §iÓm 8 l¸ng giÒng vµ ®iÓm 4 l¸ng giÒng

suất hiện của các điểm ảnh ở mức tương ứng là 20%, 25%, 10%, 30%, 15%,
với ảnh này ta có histogram của ảnh như hình 1.3.

1.1.2.3. Lưu giữ ảnh
Trong sự phát triển công nghệ thông tin nói chung, một vấn đề lớn chi

Từ kết quả histogram của ảnh, chỉ cho ta nhìn nhận tổng quát quá trình

phối các hoạt động thuộc lĩnh vực này là vấn đề bộ nhớ. Cần thiết phát triển

phân bố giải độ sáng trên ảnh, chứ không cho ta biết kết cấu chi tiết của ảnh.

quá trình xử lý thông tin sao cho nhanh chóng và chính xác, song cũng cần

Ngoài ra, căn cứ vào số đỉnh trên histogram của ảnh sẽ có sự nhìn nhận ban

phát triển khả năng lưu trữ, bảo toàn các thông tin này. Các thế hệ máy tính

đầu về số vùng của ảnh. Đó là cơ sở cho việc phân vùng ảnh và tìm biên sau

ngày nay đã có bộ nhớ rất lớn, song bao giờ nó cũng ít đối với những gì

này, đặc biệt là phương pháp tìm biên gián tiếp.

chúng ta muốn lưu trữ và xử lý. Trong kĩ thuật xử lý ảnh cũng vậy, vì lượng
thông tin chứa trong một bức ảnh là khá lớn, lên việc lưu giữ nó là vấn đề cần
quan tâm. Trong thực tế ma trận điểm ảnh tạo ra bởi quá trình số hoá, được

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

6

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

7

Trên thực tế, người ta đã áp dụng kỹ thuật nhận dạng khá thành công
với nhiều đối tượng khác nhau như: nhận dạng ảnh vân tay, nhận dạng chữ
30%

0.3

(chữ cái, chữ số, chữ có dấu).

25%
20%

Nhận dạng chữ in hoặc đánh máy phục vụ cho việc tự động hoá quá

0.2

trình đọc tài liệu, tăng nhanh tốc độ và chất lượng thu nhận thông tin

15%

0.1

từ máy tính.

10%

Nhận dạng chữ viết tay (với mức độ ràng buộc khác nhau về cách viết,

1

2

3

4

level

5

H×nh 1.3a Đå thÞ biÓu diÔn Histogram ¶nh

kiểu chữ, v.v.. ) phục vụ cho nhiều lĩnh vực.
Ngoài hai kỹ thuật nhận dạng trên, hiện nay một số kỹ thuật nhận
dạng mới dựa vào kỹ thuật mạng nơron và fourier đang được áp dụng và
cho kết quả khả quan.
1.2 Biên ảnh và vai trò trong nhận dạng ảnh
1.2.1 Khái niệm về biên ảnh và các phương pháp phát hiện biên

cơ bản
1.2.1.1 Khái niệm biên ảnh
b)
Hình 1.3. b) Ảnh gốc;

c)



Các phương pháp phát hiện biên là các phương pháp xử lý cục bộ rất



quan trọng trong việc xác định sự thay đổi độ sáng của hàm ảnh.
Một điểm ảnh được coi là biên nếu ở đó có sự thay đổi đột ngột về mức

c) Histogram của ảnh gốc theo RGB và Gray

1.1.4. Nhận dạng ảnh
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà



người ta muốn đặc tả nó. Quá trình nhận dạng thường đi sau quá trình trích

hiện biên. Nếu lấy đạo hàm bậc nhất của ảnh ta có phương pháp

chọn các đặc tính chủ yếu của đối tượng. Có hai kiểu mô tả đối tượng:
- Mô tả tham số (nhận dạng theo tham số).



- Mô tả theo cấu trúc ( nhận dạng theo cấu trúc).


Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

8

xám. Tập hợp các điểm biên tạo thành biên hay đường bao của ảnh.
Phương pháp phát hiện biên trực tiếp nhằm làm nổi biên dựa vào sự
biến thiên về độ sáng của điểm ảnh. Sử dụng kỹ thuật đạo hàm để phát
gradient, nếu lấy đạo hàm bậc hai ta có kỹ thuật Laplace.
Một hàm ảnh phụ thuộc vào 2 biến đó là toạ độ của điểm ảnh, vì vậy
các toán tử mô tả biên ảnh được biểu diễn bởi các đạo hàm riêng (theo
2 hướng x,y).
Phương pháp gradient là phương pháp dò biên cục bộ dựa vào cực đại
của đạo hàm.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

9



Biên ảnh được biểu diễn bởi 1 véc tơ với 2 thành phần:
o

Biên độ của gradient

o

Và hướng của biên với góc , hướng của biên lệch so với hướng
của gradient  một góc -900



Hướng gradient là hướng của sự gia tăng lớn nhất của hàm ảnh.



Như mô tả trong hình dưới, các đường biên khép kín là các đường có
cùng độ sáng; quy ước hướng

là chỉ hướng đông.

Roof là dạng điển hình cho các đối tượng có đường biên mảnh.


Các kỹ thuật phát hiện biên thường được điều chỉnh để phù hợp với
dạng của biên ảnh.



Đôi khi chúng ta chỉ chú ý đến sự thay đổi biên độ mà không quan tâm
đến sự thay đổi về hướng; khi đó chúng ta sử dụng toán tử tuyến tính
Laplace để phát hện biên.



Toán tử Laplace có cùng tính chất ở mọi hướng, và do đó nó là thành
phần bất biến quay trong các ảnh.

1.2.1.2 Các phương pháp phát hiện biên cơ bản

Phát hiện biên trực tiếp: Phương pháp này làm nổi biên dựa vào sự
biến thiên mức xám của ảnh. Kỹ thuật chủ yếu dùng để phát hiện biên ở đây là
dựa vào sự biến đổi theo hướng. Nếu lấy đạo hàm bậc nhất của ảnh ta có kỹ






Biên thường được sử dụng trong phân tích ảnh để xác định đường bao
của các vùng trong ảnh.
Đường bao và các thành phần của nó (các điểm biên) vuông góc với
hướng của gradient
Một số dạng của đường bao ảnh

thuật Gradient, nếu lấy đạo hàm bậc hai của ảnh ta có kỹ thuật Laplace.
Phát hiện biên gián tiếp: Nếu bằng cách nào đó ta phân được ảnh thành
các vùng thì ranh giới giữa các vùng đó gọi là biên. Kỹ thuật dò biên và phân
vùng ảnh là hai bài toán đối ngẫu nhau vì dò biên để thực hiện phân lớp đối
tượng mà khi đã phân lớp xong nghĩa là đã phân vùng được ảnh và ngược lại,
khi đã phân vùng ảnh đã được phân lớp thành các đối tượng, do đó có thể phát
hiện được biên.
1.2.1.2.1. Phương pháp phát hiện biên trực tiếp
a) Kỹ thuật phát hiện biên Gradient
Theo định nghĩa gradient là một véctơ có các thành phần biểu thị tốc độ
thay đổi giá trị của điểm ảnh.
b) Kỹ thuật phát hiện biên Laplace

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

10

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

11

Các phương pháp đánh giá gradient ở trên làm việc khá tốt khi mà độ
sáng thay đổi rõ nét. Khi mức xám thay đổi chậm, miền chuyển tiếp trải rộng,
phương pháp cho hiệu quả hơn đó là phương pháp sử dụng đạo hàm bậc
hai Laplace.

Định nghĩa 2: [Chu tuyến đối ngẫu]
Hai chu tuyến C= <P1P2..Pn> và C= <Q1Q2..Qm> được gọi là đối ngẫu
của nhau nếu và chỉ nếu i j sao cho:
1. Pi và Qj là 4-láng giềng của nhau.
2. Các điểm Pi là vùng thì Qj là nền và ngược lại.

1.2.1.2.2. Phương pháp phát hiện biên gián tiếp

Định nghĩa 3: [Chu tuyến ngoài]

a) Một số khái niệm cơ bản

Chu tuyến C được gọi là chu tuyến ngoài nếu và chỉ nếu:

*Ảnh và điểm ảnh:

1. Chu tuyến đối ngẫu C là chu tuyến của các điểm nền

Ảnh là một mảng số thực 2 chiều (Iij) có kích thước (mn), trong đó
mỗi phần tử Iij(i = 1,...,m; j = 1,...,n) biểu thị mức xám của ảnh tại (i,j)
tương ứng.
*Các điểm 4 và 8-láng giềng
Giả sử (i,j) là một điểm ảnh, các điểm 4 và 8 láng giềng là: N4= {(i’,j’) : |ii’|+|j-j’| = 1}, N8 = {(i’,j’) : max(|i-i’|,|j-j’|) =1}.

2. Độ dài của C nhỏ hơn độ dài C

b) Chu tuyến của một đối tượng ảnh
Định nghĩa 1: [Chu tuyến]
Chu tuyến của một đối tượng ảnh là dãy các điểm của đối tượng ảnh
P1,,Pn sao cho Pi và Pi+1 là các 8-láng giềng của nhau (i=1,...,n-1) và P1
là 8-láng giềng của Pn, i Q không thuộc đối tượng ảnh và Q là 4-láng
giềng của Pi (hay nói cách khác i thì Pi là biên 4). Kí hiệu
<P1P2..Pn>.Hình 1.4 biểu diễn chu tuyến của ảnh, P là điểm khởi đầu
chu tuyến.

2. Độ dài của C lớn hơn độ dài C

Định nghĩa 4: [Chu tuyến trong]
Chu tuyến C được gọi là chu tuyến trong nếu và chỉ nếu:
1. Chu tuyến đối ngẫu C là chu tuyến của các điểm nền

c) Thuật toán dò biên tổng quát
Về cơ bản, các thuật toán dò biên trên một vùng đều bao gồm
các bước sau:

 Xác định điểm biên xuất phát
 Dự báo và xác định điểm biên tiếp theo
Lặp bước 2 cho đến khi gặp điểm xuất phát

P

Thuật toán dò biên tổng quát
Bước 1: Xác định cặp nền-vùng xuất phát
Bước 2: Xác định cặp nền-vùng tiếp theo
Bước 3: Lựa chọn điểm biên

Hình 1.4 Ví dụ về chu tuyến của đối tượng ảnh

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

12

Bước 4: Nếu gặp lại cặp xuất phát thì dừng, nếu không quay lại bước 2

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

13

1.2.2. Vai trò của biên trong nhận dạng

Phương pháp chung nhất và tổng quát nhất là dựa trên việc sử dụng

Như đã đề cập tới ở phần tổng quan về một hệ thống nhận dạng và xử lý

điểm nằm trên đường bao hình dạng trái ngược với các điểm bên trong hình

ảnh, quá trình nhận dạng có hai giai đoạn cần thực hiện:

dạng. Các kỹ thuật biểu diễn hình dạng có thể nhận ra giữa vùng không gian

Giai đoạn học: Các đặc điểm của đối tượng mẫu được lưu trữ (gọi là học

và vùng đặc trưng. Các phương pháp trong vùng không gian tương xứng với

mẫu) và tập các phần tử mẫu được chia thành các lớp.

hình dạng trên các điểm cơ sở (hoặc đặc trưng điểm), trong khi kỹ thuật vùng

Giai đoạn nhận dạng: Khi có đối tượng cần nhận dạng, các đặc điểm của đối

đặc trưng tương xứng với hình dạng trên các đặc trưng cơ sở (véc tơ). Sự

tượng sẽ được trích chọn và sử dụng hàm quyết định để xác định đối tượng

phân loại khác của các kỹ thuật biểu diễn hình dạng được dựa trên sự bảo toàn

cần nhận dạng thuộc lớp nào.

thông tin gốc. Các phương pháp cho phép xây dựng lại hình dạng từ các mô tả
gọi là bảo toàn thông tin, trong khi các phương pháp khác chỉ có thể xây dựng

1.2.3 Biểu diễn biên dựa trên mô tả Fourier
Hình dạng mà một đặc trưng trực quan quan trọng và nó là một trong

lại một phần hoặc mô tả không rõ ràng gọi là không bảo toàn thông tin.

những đặc trưng gốc của việc mô tả nội dung ảnh. Tuy nhiên, mô tả nội dung
hình dạng là một công việc khó. Bởi vì khó xác định được các đặc trưng hình
dạng và phép đo sự tương tự giữa các hình dạng. Để tạo vấn đề phức tạp hơn,
hình dạng thường không rõ ràng cùng với các nhiễu không rõ ràng.
Trong phần này mục tiêu chính nghiên cứu về hình dạng để nhận dạng
đối tượng. Mỗi một kỹ thuật biểu diễn hình dạng nhằm vào các ứng dụng
riêng biệt. Sự chính xác là mối quan tâm chính trong các kỹ thuật biểu diễn.
Các yêu cầu được đưa ra để đo hiệu quả biểu diễn hình dạng gồm: truy vấn
chính xác, các đặc trưng cô đọng, ứng dụng tổng quát, độ phức tạp tính toán
thấp, thao tác truy vấn đơn giản.
Biểu diễn biên dựa trên mô tả Fourier: là mô tả hình dạng của đối tượng ảnh
bằng một biến đổi Fourier của đường biên của đối tượng.
Ba loại biểu diễn đường biên: bằng độ cong, bằng khoảng cách trọng tâm,
bằng hàm toạ độ phức.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Hình 1.5 Phân loại biểu diễn hình dạng và các kỹ thuật biểu diễn

14

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

15

Một khi đối tượng trong ảnh đã được xác định, chúng sẽ được đặc

Nếu ta xem xét hình dạng trên một mặt phẳng phức, ta có thể thu được

trưng hóa thông qua các phương pháp như: miền, độ lệch tâm - eccentricity

hàm phức một chiều f (t ) bằng cách lần theo biên của nó. f (t ) đơn giản là

(chẳng hạn như tỷ lệ giữa trục chính và trục phụ), vòng tròn - circularity (sự

một số phức được tổng quát hóa từ hệ tọa độ đường bao.

tương đồng với vòng tròn bao quanh vùng có kích thước tương tự), dấu hiệu
hình dạng (một dãy các số chỉ khoảng cách từ biên tới tâm của hình dạng), mô
men hình dạng (shape moments), sự uốn cong - curvature (xác định mức độ

f (t )  x(t )  xc   j y (t )  yc 

Với xc , yc  là trọng tâm của hình dạng, được tính theo công thức sau:

đường biên đổi hướng), chiều fractal – fractal dimension (mức độ tự tương

xc 

tự), .v.v.

1
N

N 1

 x(t ) ,
t 0

yc 

1 N 1
 y(t )
N t 0

f (t ) miêu tả đường bao của hình dạng, f (t ) là dấu hiệu hình dạng bất

Một số tiêu chuẩn biểu diễn hình dạng:


Bất biến đối với phép quay, co giãn và tịnh tiến.



Nhỏ gọn, dễ thao tác.



Tương tự với cảm nhận của con người.

biến đối với phép dịch chuyển.
Biến đổi Fourier rời rạc của dấu hiệu hình dạng f (t ) được cho bởi:



Bền vững với phép biến đổi hình dạng.



Độc lập với các ứng dụng.

Fu 

1
N

N 1

  j 2ut 
N 

 f (t ).exp
t 0

với u=0 đến M-1, trong đó M là tổng số mẫu f(t).
Có nhiều loại dấu hiệu hình dạng. Các loại dấu hiệu hình dạng hay sử

Sau đây sẽ trình bày một số phương pháp biểu diễn hình dạng

dụng là trên cơ sở độ cong, trên cơ sở bán kính và trên cơ sở tọa độ biên hình
dạng. Hiệu năng phân lớp hình dạng trên cơ sở ba loại dấu hiệu này không

1.2.3.1 Phƣơng pháp dựa trên mô tả Fourier
Năm 1977, Persoon và Fu lần đầu tiên đã đưa ra kỹ thuật sử dụng ký

khác nhau nhiều. Dấu hiệu trên cơ sở bán kính là đơn giản và dễ cài đặt nhất.

hiệu mô tả Fourier để biểu diễn hình dạng. Rất nhiều nghiên cứu đã được thực

Dấu hiệu trên cơ sở bán kính bao gồm một số khoảng cách theo thứ tự

hiện theo sau ý tưởng này. Trong số đó, Refiei và Mendlzon đã đưa ra phương

từ tâm hình dạng đến các điểm trên biên (gọi là radius - các bán kính). Radius

pháp biểu diễn hình dạng của họ sử dụng các dấu hiệu mô tả Fourier để mô tả

được định nghĩa như sau:

hình dạng của một đối tượng.

ri  ( xc  xi ) 2  ( y c  y i ) 2

Giả sử biên hình dạng được trích chọn trong quá trình tiền xử lý là:
( x(t ), y(t )), t  0,1,..., N 1.

trong đó, (x c , y c ) là tọa độ tâm hình dạng, ( xi , yi ) với i=0 đến 63 là tọa độ của
64 điểm mẫu theo biên hình dạng. Các điểm biên được lấy mẫu sao cho tổng
số điểm ảnh theo biên giữa hai điểm láng giềng là như nhau.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

16

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

17

Radius hình dạng và biến đổi giữa chúng là bất biến dịch chuyển. Chú
ý rằng các hình dạng không chuẩn hóa hướng trước khi sử dụng radius hình
dạng. Thực hiện chuẩn hóa bằng cách bỏ qua các giá trị pha của Fourier (FD).
Xoay hình dạng được phản ánh trong thông tin pha của Fu và độ lớn của Fu ,

là chuyển đổi độ dài bán kính nhạy cảm vào miền tần số nơi dữ liệu bền vững
hơn đối với thay đổi nhỏ và nhiễu.
1.2.3.2 Phƣơng pháp góc quay
Arkin và các đồng nghiệp đề xuất một phương pháp hiệu quả để biểu

hay | Fu | là bất biến với xoay. | F0 | phản ánh năng lượng của radius hình dạng,

diễn các hình đa giác gọi là phương pháp góc quay. Tổng quát, phương pháp

vậy | Fu | / | Fo | sẽ bất biến co dãn. Do vậy, ta sử dụng véc tơ đặc trưng sau (nó

biểu diễn một hình đa giác A đơn giản sẽ mô tả biên của A bằng cách liệt kê

bất biến với dịch chuyển, xoay, và co dãn) để chỉ mục hình dạng:

dãy các đỉnh (vertex) trong đó mối đỉnh được mô tả bởi cặp tọa độ (x,y). Tuy
nhiên, Arkin đưa ra một cách biểu diễn khác cho biên của một hình đa giác.

 F1
F63 
x
,...,

F0 
 F0

Theo phương pháp của ông, biên có thể được mô tả bởi hàm quay  A S  . Hàm

Khoảng cách giữa các hình dạng được tính toán bằng khoảng cách

 A S  đo góc của tiếp tuyến của cung (arc-length) theo chiều ngược chiều

quay đồng hồ. Cung S được tính từ điểm tham chiếu bắt đầu O trên biên của

Euclidean giữa các véc tơ đặc trưng của chúng.
Chỉ mục mỗi hình dạng trong CSDL cùng với mô tả Fourier. Sự tương
tự giữa hai hình dạng truy vấn và mỗi hình dạng trong CSDL với
f q  ( f q1 , f q2 ,..., f qm ) và ft  ( ft1 , ft 2 ,..., ft m ) lần lượt là các véc tơ đặc trưng của hai

đa giác. Khi đó  A O  là góc tạo bởi tiếp tuyến tại O và trục tham chiếu nào
đó, chẳng hạn là trục x. Theo cách này, hàm quay  A S  sẽ đi dọc theo biên,

tăng khi quay sang bên trái và giảm khi quay sang bên phải.
Không mất tính tổng quát, Arkin giả thiết rằng mọi đa giác được thay

hình dạng.
m

d  ( ( f i q  f i t ) 2 )

đổi kích thước hay chuẩn hóa sao cho chu vi của nó bằng 1. Khi đó  A S  là
1

2

một hàm với đối số nằm trong khoảng [0,1]. Hình mô tả việc biểu diễn góc

i 1

Tại sao ta sử dụng FD để chỉ mục hình dạng thay cho trực tiếp radius?

quay của một đa giác.

Lý do chính là biểu diễn trực tiếp là rất nhạy với thay đổi nhỏ và nhiễu, dẫn
tới hiệu năng truy tìm rất thấp. Nếu 64 độ dài bán kính sử dụng trực tiếp làm
chỉ mục, có thể sẽ rất khó co dãn và chuẩn hóa xoay. Có thể thực hiện chuẩn
hóa xoay bằng nhận ra bán kính ngắn nhất (hay dài nhất) và thực hiện chuẩn
hóa co dãn bằng cố định độ dài của bán kính ngắn nhất. Nhưng chuẩn hóa này
không ổn định vì với thay đổi nhỏ trên đường biên sẽ ảnh hưởng đến vị trí bán
kính nhỏ nhất và các vị trí của điểm mẫu, dẫn tới chỉ mục rất khác nhau và
khoảng cách rất lớn giữa các hình dạng do thay đổi nhỏ. Mục tiêu sử dụng FD

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

18

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

19

Hình 1.7 Biểu diễn góc quay trong trường hợp có thay đổi nhỏ

Hình 1.6 Biểu diễn theo góc quay
Trong Hình 1.6a, O là điểm bắt đầu và góc quay tương ứng với nó là
v1. Mọi góc quay được biểu diễn trong Hình 1.6b có thể tính được bằng cách
di chuyển ngược chiều quay đồng hồ dọc theo biên của đa giác. Chú ý rằng
với đa giác lồi A, hàm quay của nó  A S  sẽ tăng đơn điệu từ v đến v  2 .

Trong Hình 1.7 đa giác Q chỉ có một chút thay đổi nhỏ so với P. Tuy
nhiên, khi ta sử dụng các hàm quay của chúng để so sánh, sự khác biệt do
phần mờ trong đồ thị sẽ không đủ nhỏ để cho biết hai hình này là rất tương tự
nhau.

Cho trước hai đa giác A và B với các hàm quay tương ứng là  A S  và
 B S  , sự khác biệt giữa chúng được định nghĩa là:
D( A, B)  min r , (

 (

A

(i)   B (i)) 2 )

i

trong đó, min r , đại diện cho giá trị nhỏ nhất của mọi trường hợp dịch
chuyển và xoay của đa giác B.
Việc biểu diễn hình dạng này là bất biến với việc dịch chuyển, thay đổi
kích thước và việc xoay. Mặc dù cách biểu diễn này có nhiều ưu điểm, nó vẫn
nhạy cảm với các thay đổi nhỏ của hình ảnh. Điều này được mô tả trong Hình.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

20

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

21

CHƢƠNG 2: MỘT SỐ PHƢƠNG PHÁP PHÁT HIỆN BIÊN

còn kỹ thuật la bàn dùng toán tử la bàn lấy đạo hàm theo 8 hướng của tất cả

VÀ PHÉP BIỂU DIỄN FOURIER ELLIPTIC

các điểm ảnh cạnh nó. Hình 2.1 minh họa mô hình 8 hướng. Có khá nhiều
toán tử đạo hàm đã được áp dụng. Các toán tử sử dụng kỹ thuật Gradient đáng

2.1 Một số phƣơng pháp phát hiện biên

kể nhất là toán tử Robert, Sobel và Prewitt. Còn toán tử la bàn hay được sử

2.1.1. Phƣơng pháp phát hiện biện trực tiếp

dụng là toán tử Krish.

2.1.1.1 Kỹ thuật Gradient
Đây là phương pháp dò biên cục bộ dựa vào cực đại của đạo hàm. Theo

N

định nghĩa Gradient là một vector biểu thị tốc độ thay đổi giá trị của một đại
lượng. Vì ảnh là một mảng hai chiều nên ta tính vi sai giữa hai điểm ảnh cạnh
nhau theo hai hướng x và y.
fx 
fy 

f ( x, y) f ( x  dx, y)  f ( x, y)

x
dx

NW

3

W

4

E

0

5

6

7

S

Với dx, dy là khoảng cách giữa các điểm theo hướng x và y (được tính
bằng số điểm ảnh) và fx, fy là các đạo hàm gián đoạn hay các Gradient theo

Hình 2.1: Mô hình 8 hướng

Dưới đây là các mặt nạ tương ứng với các kỹ thuật nêu trên:

các hướng x và hướng y.

0

Đạo hàm theo hướng r và góc  bất kỳ được tính theo công thức:

f
f x f y


 rfxsin + rfycos.
 x  y 

Thực tế, ảnh số là tín hiệu rời rạc nên không có đạo hàm thực mà người
ta chỉ mô phỏng và xấp xỉ đạo hàm bằng các kỹ thuật nhân chập (phép cuộn).
Trong kỹ thuật Gradient người ta chia nhỏ thành hai kỹ thuật (do sử
dụng các toán tử nhân chập khác nhau) là kỹ thuật Gradient và kỹ thuật la
bàn. Kỹ thuật Gradient dùng toán tử Gradient lấy đạo hàm theo một hướng,

1

H1 =

-1

0

0

-1

H2 =
-1

f f x f y


 fxcos + fysin.
r x r y r

22

NE

1

SE

SW

f ( x, y ) f ( x, y  dy)  f ( x, y )

y
dy

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

2

0
(a) Mặt nạ Robert

-1 0 1

Hx =

-1 -2 -1

-2 0 2
-1 0 1

Hy =

0 0 0
1 2 1

Ngang (hướng x)
Dọc (hướng y)
(b) Mặt nạ Sobel
Hx =

-1 0 1
-1 0 1
-1 0 1

Hy =

-1 -1 -1
0 0 0
1 1 1

Dọc (hướng y)

Ngang (hướng x)

(c) Mặt nạ Prewitt

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

23

(d) Các mặt nạ toán tử Krish theo các hướng 00, 450, 900,
1350, 1800, 2250, 2700, 3150

Tiếp theo là một số kết quả minh họa của sử dụng các mặt nạ Robert,
Hình 2.3 Ảnh sau khi dò biên

Sobel.

Các kỹ thuật đánh giá Gradient ở trên làm việc khá tốt khi mà độ sáng
thay đổi rõ nét. Nhưng khi mức xám thay đổi chậm miền chuyển tiếp trải rộng
thì phương pháp Laplace (sử dụng đạo hàm bậc hai) tỏ ra hiệu quả hơn.
2.1.1.2. Kỹ thuật Laplace

Toán tử Laplace được định nghĩa như sau:
2
Trong đó f(x,y) là hàm cường độ của ảnh.  f ( x, y ) 

 2 f ( x, y )  2 f ( x, y )


2x
2 y

Để hiểu hoạt động của phương pháp Laplace trong việc trích ra đường
biên chúng ta có thể xem các sơ đồ dưới đây.
f(x)
a

fx
x

Hình 2.2 Ảnh trước khi dò biên

 2 fx
2x

b

c
Hình 2.4. (a) ảnh gốc (b) Đạo hàm bậc nhất

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

24

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

25

(c) Đạo hàm bậc hai

Như vậy, đạo hàm bậc hai có thể dùng để phát hiện đường biên ảnh.
Thông thường các điểm không (cross-zero) của đạo hàm bậc hai là nơi có
đường biên, tuy nhiên phải chú ý là đạo hàm của một hàm hai biến tại bất kỳ
điểm nào cũng phụ thuộc vào hướng lấy đạo hàm.
Toán tử Laplace dùng nhiều kiểu mặt nạ khác nhau để xấp xỉ cho đạo
hàm bậc hai. Có ba kiểu mặt nạ hay dùng

H1 =

0
-1
0

-1
4
-1

0
-1
0

-1
H2 = -1

-1

-1
8
-1

-1
-1
-1

1 -2
-2 5
1 -2

H3 =

1
-2
1

a)

Các kết quả nhiên cứu cho thấy trong phương pháp đạo hàm bậc hai,

b)

toán tử Laplace rất nhậy cảm với nhiễu và tạo thành biên kép. Để khắc phục
nhược điểm này người ta mở rộng toán tử Laplace và dùng xấp xỉ LaplaceGauss để phát hiện các điểm không:
h(m,n)=c[1-(m2+n2)/ σ 2]exp(-(m2+n2)/2 σ 2)

Với σ là tham số điều khiển độ rộng, và c là chuẩn tổng các phần tử có
kích thước mặt nạ là đơn vị. Cắt điểm không của ảnh cho trước chập với
h(m,n) sẽ cung cấp cho ta vị trí biên của ảnh. Các điểm biên của ảnh được xác
định bởi các điểm cắt điểm không (cross-zero) và các điểm không là duy nhất.
Do vậy kỹ thuật này cho đường biên mảnh. Tuy nhiên như đã nói ở trên, kỹ

c)

thuật Laplace rất nhạy cảm với nhiễu do đạo hàm bậc hai thường không ổn
Hình 2.5 a) Ảnh gốc; b) Ảnh biên dùng Laplace H1; c) Ảnh biên dùng

định.

Laplace H2;

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

26

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

27

Ngoài hai kỹ thuật dò biên kể trên, trong các phương pháp phát hiện biên

phân tích, nhận dạng ảnh người ta thường muốn xử lý trên các ảnh biên chỉ có

trực tiếp người ta còn sử dụng một số kỹ thuật khác nữa đó là: phương pháp

hai màu (màu biên và màu nền) để cho đơn giản. Các ảnh qua lọc lấy biên

dò biên theo quy hoạch động, phương pháp tiếp cận bởi mô hình mặt, phương

không cho ra ảnh biên (hai màu) mà cần phải thông qua một vài phép xử lý

pháp tiếp cận tối ưu hóa.

trung gian nữa (chẳng hạn phân ngưỡng) thì mới thu được ảnh biên thực sự.

 Phương pháp dò biên theo quy hoạch động là phương pháp tìm cực trị
của các quá trình nhiều bước dựa vào nguyên lý tối ưu của Bellman.
Thuật toán xác định một đường bao tối ưu của ảnh trên cơ sở đánh giá
khoảng cách, gradient biên độ và gradient hướng của các đỉnh.

Bản thân quá trình xử lý này cũng có thể lại làm mất đi các chi tiết của ảnh
biên sau phép lọc.
Ngoài ra, các kỹ thuật tìm biên sử dụng đạo hàm còn có một hạn chế
nữa là không cho phép điều chỉnh độ chi tiết của ảnh biên thu được. Trong

 Phương pháp tiếp cận bởi mô hình mặt dựa vào việc thực hiện xấp xỉ

các ảnh chụp thế giới thực, sẽ có rất nhiều các đối tượng trong ảnh có độ chi

đa thức trên ảnh gốc hay ảnh đã thực hiện phép lọc Laplace. Cách tiếp

tiết (mờ, rõ) khác nhau. Khi nhận dạng, không hẳn là chúng ta sẽ quan tâm

cận tối ưu nhằm xác định một hàm (một bộ lọc), làm giảm phương sai

đến tất cả các đối tượng mà chủ yếu là chỉ quan tâm đến các đối tượng chính

2

σ hoặc giảm một số điểm cực trị cục bộ.

trong ảnh. Các đối tượng này thường có độ chi tiết và độ rõ cao. Sử dụng các

 Phương pháp tiếp cận tối ưu hóa định vị đúng vị trí bằng cách cực tiểu
2

mặt nạ nhân chập không cho phép chúng ta điều chỉnh độ chi tiết của các ảnh

hóa phương sai σ của vị trí các điểm cắt không (cross-zero) hoặc hạn

biên thu được một cách dễ dàng, rõ ràng buộc tổng các hệ số của bộ lọc phải

chế số điểm cực trị cục bộ để chỉ tạo ra một đường bao.

bằng 1; nhằm ngăn cản sự tăng quá giới hạn của các giá trị mức xám (các giá

Nhìn chung các phương pháp phát hiện biên như đã trình bày ở trên đều

trị điểm ảnh phải giữ được giá trị của nó một cách gần đúng không thay đổi

có ít nhiều sử dụng đến các kỹ thuật đạo hàm. Ý tưởng chung của các kỹ thuật

quá nhiều so với giá trị thực). Phần dưới đây, tôi xin giới thiệu tổng quan kỹ

tìm biên sử dụng đạo hàm đó là sử dụng các bộ lọc thông cao để làm nổi biên.

thuật phát hiện biên thuộc loại phát hiện biên trực tiếp nhưng không dựa và

Bởi vì các điểm biên là các chi tiết có tần số không gian cao nên khi ảnh được

đạo hàm mà dựa vào phép toán hình thái [29] đang được nhiều nhà khoa học

lọc thông cao, các phần tử có tần số không gian cao sẽ sáng hơn còn các phần

quan tâm.

tử có tần số không gian thấp sẽ tối đi. Kỹ thuật lọc thông cao được thực hiện

2.1.1.3. Tìm biên bằng phép toán hình thái

nhờ thao tác nhân chập.
Việc sử dụng các mặt nạ nhân chập có một nhược điểm chung đó là bản
thân phép lọc không tự động loại bỏ hoặc hạn chế được nhiễu. Bởi vì đặc tính
của nhiễu, nếu xem xét một cách tương đương trong không gian tần số, nhiễu
ứng với các thành phần tần số cao trong ảnh. Các phép lọc thông cao tuy làm
nổi các điểm biên nhưng đồng thời cũng làm nổi các nhiễu. Hơn thế nữa để

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

28

Ở phần này, em chỉ xin được giới thiệu tổng quan phép toán hình thái để làm
định hướng cho quá trình nghiên cứu sau này. Phép toán hình thái thực hiện
trên cơ sở ảnh ban đầu đã được làm trơn bằng phép lọc trung vị. Giả sử P là
một điểm của ảnh đã được làm trơn, tính hai độ lệch của điểm đó với các giá
trị lớn nhất và nhỏ nhất của cửa sổ xung quanh P, (cửa sổ 33). Giá trị nhỏ

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

29

hơn trong hai giá trị đó sẽ được chọn làm giá trị điểm ảnh đầu ra. Quá trình

2.1.2. Phƣơng pháp phát hiện biên gián tiếp

này sẽ được mô tả mhư sau:

2.1.2.1. Phân vùng ảnh dựa theo ngưỡng biên độ

Giả sử ảnh gốc I(m,n) được làm trơn bằng bộ lọc trung bình tạo ra ảnh

Ảnh khi được miêu tả thông qua hàm f(x,y) có thể được quan niệm như
một môi trường vật lý. Trong đó, các hiện tượng như phản xạ, truyền sáng,

O1(m,n):

1
O1 (m, n) 
Nw

 I (m  k , n  l )

k ,lW ( m , n )

W(m,n) là cửa sổ của (m,n) nhận điểm này làm trung tâm (phép xếp
chồng tại trung tâm) được chọn thích hợp. N w là số điểm của cửa sổ này. Một
điểm ảnh đầu ra O2(m,n) được tính từ ảnh O1(m,n) thông qua phép so sánh và

màu sắc hoặc đáp ứng đa phổ đều có thể mô tả được. Các hàm f(x,y) có thể
đặc trưng cho biên độ của các tính chất vật lý của ảnh, còn các biến (x,y)
ngoài ý nghĩa vị trí có thể được sử dụng như là điện áp, nhiệt độ,
hoặc vận tốc.
Chúng ta có thể dùng ngưỡng biên độ để phân vùng ảnh khi mà biên độ
là đủ lớn để đặc trưng cho ảnh. Kỹ thuật phân ngưỡng theo biên độ được tiến

lựa chọn bởi:




O2 (m, n)  min O1 (m, n)  minO1 (q), maxO1 (q)  O1 (m, n) 
qF ( mn )
qF ( m , n )




Trong đó F(m,n) là cửa sổ lân cận của điểm (m,n) cũng được

hành theo các bước như sau:
 Xem xét lược đồ xám của ảnh để xác định các đỉnh và các khe. Nếu ảnh
có dạng rắn lượn (nhiều đỉnh và khe), các khe có thể sử dụng để
chọn ngưỡng.
 Chọn ngưỡng t sao cho một phần xác định trước của toàn bộ số mẫu là

chọn thích hợp
Như vậy, các điểm biên được làm nổi lên, nhờ phép so sánh, chọn ra độ

thấp hơn t.

sai khác nhỏ nhất giữa nó và giá trị độ sáng của các điểm ảnh thuộc lân cận.

 Điều chỉnh ngưỡng dựa trên xem xét lược đồ xám của các điểm lân cận.

Sai khác này càng lớn thì điểm biên càng được làm nổi.

 Chọn ngưỡng như xem xét lược đồ xám của những điểm thỏa mãn tiêu
chuẩn chọn. Thí dụ, với ảnh có độ tương phản thấp, lược đồ của những

XTB = ((XB)B)
Xấp xỉ trên của X (chứa X)

điểm có biên độ Laplace g(m,n) lớn hơn giá trị t định trước (sao cho từ
5% đến 10% số điểm ảnh với Gradient lớn nhất sẽ coi như biên) sẽ cho
phép xác định các đặc tính của ảnh lưỡng cực tốt hơn ảnh gốc.

X B = XTB\XDB

Xấp xỉ biên của X theo mẫu B

Khi có một mô hình phân lớp xác suất, việc xác định ngưỡng dựa vào
tiêu chuẩn nhằm cực tiểu xác suất của sai số hoặc một số tính chất khác theo
luật của Bayes.

XDB = ((XB)B)
Xấp xỉ dưới của X (thuộc X)

2.1.2.2. Phân vùng dựa theo miền đồng nhất

Hình 2.6. Minh hoạ biểu diễn biên nhờ các phép toán hình thái

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

30

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

31

Kỹ thuật phân vùng ảnh thành các vùng đồng nhất dựa vào các tính
chất quan trọng nào đó của miền. Việc lựa chọn các tính chất của miền sẽ xác

đó, khi chuyển sang ảnh đen trắng sẽ làm mất rất nhiều thông tin. Hình 2.7,

2.8 và hình 2.9 dưới đây sẽ minh họa điều này.

định các tính chất phân vùng. Các tiêu chuẩn hay được dùng là sự thuần nhất
về mức xám, màu sắc đối với ảnh màu, kết cấu sợi và chuyển động.
Có 3 cách tiếp cận chủ yếu trong phân vùng ảnh theo miền đồng nhất
và độc lập với tiêu chuẩn chọn lựa tính đồng nhất đó là:
 Phương pháp phân tách - cây tứ phân (split-quad stress)
 Phương pháp hợp (merge)
 Phương pháp tách hợp (split-merge)
Mức độ hiệu quả của các phương pháp là tùy thuộc vào việc chọn tiêu
chuẩn đánh giá độ thuần nhất. Nhìn chung các kỹ thuật phân vùng ảnh cho
phép chúng ta phát hiện biên một cách chính xác hơn các kỹ thuật đạo hàm do
ít chịu ảnh hưởng của nhiễu, nhưng hầu hết các kỹ thuật phân vùng này đều

Hình 2.7 Ảnh gốc

có cài đặt khá phức tạp và thường làm mất nhiều chi tiết của các đối tượng
trong ảnh nên thường không được sử dụng để tìm biên.
2.1.3. Phƣơng pháp phát hiện biên kết hợp
Để phát hiện biên của đối tượng trong frame ảnh. Phương pháp này
được áp dụng để tìm biên cho ảnh 256 cấp xám đã thử nghiệm và được đánh
giá khá hiệu quả. Việc xử lý và thao tác trên các ảnh xám có một ưu điểm là
dễ xử lý hơn các ảnh màu mà vẫn giữ được nhiều đặc tính của ảnh. Khi muốn
nhận dạng biên cho các ảnh màu, chúng ta có thể dễ dàng chuyển đổi về
khuôn dạng ảnh 256 cấp xám bằng hàm ConvertRGB được cài đặt trong
chương trình Demo. Việc không xử lý ở ảnh đen trắng, bởi các frames ảnh
được quay hoặc thu trực tiếp từ Camera là ảnh màu 16 bits hoặc 24 bits. Do

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

32

Hình 2.8 Ảnh đen trắng

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

33

Hình 2.11. biên của ảnh đen trắng
PCX
Hình 2.11 Biên ảnh đen trắng
Thủ tục phát hiện biên của ảnh đen trắng PCX có thể được viết ngắn
gọn như sau:
LPSTR Detect_Edge_BW_Image(LPSTR pOrgImg, LPSTR pEdgImg)
{

int i,j,k
struct Point { int x,y; };

Hình 2.9 Ảnh đen trắng dùng hàm ConvertRGB

Point Orient[8] = {(0,1), (-1,1), (-1,0), (-1,-1), (0,-1), (1,-1),(1,0),(1,1) };
for (i=0; ifor (j=0; j

Để xây dựng thuật toán tìm biên cho ảnh đa cấp xám, trước hết chúng

if ( GetPoint(pOrgImg,i,j)==BLACK )

ta nhắc lại một thuật toán tìm biên cho ảnh trắng đen rất đơn giản và hiệu quả.

for (k=0; k<8; k++)

Ý tưởng của thuật toán này là dựa vào định nghĩa: trong ảnh trắng đen, một

if (GetPoint(pOrgImg,i+Orient[k].x,j+Orient[k].y)==WHITE)
{

điểm có thể gọi là biên nếu nó là điểm đen và có ít nhất một điểm trắng lân

break;

cận. Ảnh sẽ được quét từ trái sang phải, từ trên xuống dưới, khi gặp điểm đen

}
return pEdgImg;

đầu tiên sẽ thực hiện quay theo 8 láng giềng để tìm điểm biên tiếp theo, cứ thế
cho đến khi quay được về điểm biên được xác định đầu tiên thì dừng. Kết quả
chúng ta sẽ được biên của ảnh. Hình dưới đây minh họa kết quả dò biên ảnh
đen trắng PCX

SetPoint(pEdgImg,i,j,BLACK);

}

Trong đó:
 biWidth, biHeight lần lượt là chiều rộng và chiều cao của ảnh (tính theo
đơn vị pixel) .
 GetPoint() và SetPoint() là các hàm đọc, ghi điểm ảnh.
 pOrgImg, pEdgImg là các con trỏ lần lượt trỏ tới các vùng dữ liệu của
ảnh gốc và ảnh biên.

Hình 2.10 Ảnh đen trắng

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

34

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

35

Như vậy, việc tìm biên cho các ảnh trắng đen theo cách dựa vào định

Cơ sở đúng đắn của thuật toán là dựa trên lý thuyết về tính dư thừa thông

nghĩa là khá dễ dàng (dựa vào 2 mức 0, 1). Chúng ta sẽ dựa theo ý tưởng đó

tin không gian: các điểm ảnh lân cận có thể có cùng hoặc gần cùng một số đặc

để tìm biên cho các ảnh đa cấp xám. Tuy nhiên có một khó khăn mắc phải là

tính. Thực nghiệm cho thấy sử dụng các cửa sổ vuông kích thước 5x5 để tìm

ảnh đa cấp xám có 256 màu. Sự biến thiên về giá trị độ xám của điểm ảnh

biên hạn chế được nhiều nhiễu là hơn các cửa sổ 3x3 nhưng các đường biên

theo các hướng khác nhau cũng là khác nhau. Do đó nếu đánh giá một điểm là

thu được cũng sẽ dày hơn. Việc tăng kích thước của cửa sổ lên nữa không làm

điểm biên hay không nếu chỉ dựa vào việc đánh giá độ chênh lệch mức xám

tăng độ chính xác lên nhiều mà lại làm cho độ phức tạp tính toán tăng lên rất

của điểm đó với từng điểm láng giềng lân cận sẽ cho kết quả chưa tốt và ảnh

nhanh. Chúng ta sẽ sử dụng các mặt nạ 5x5 để tìm biên nhưng để thu được

biên thu được vẫn còn khá nhiều nhiễu.

các đường biên mảnh cần vận dụng lại ý tưởng sử dụng định nghĩa. Tức là các
điểm ảnh được lọc ra sau khi so sánh với giá trị xám trung bình của cửa sổ
(tạm gọi là các điểm thuộc lân cận biên) lại được so sánh một lần nữa với các
điểm kế cận (thuộc 8 láng giềng của nó) cộng với một giá trị 2 xác định
trước. Và các điểm biên thu được lần này mới được coi là các điểm
biên thực sự.
Pi + 2 < P

Hình 2.13 Ảnh biên với cách đánh giá
độ chênh lệch mức xám của điểm ảnh
với từng điểm láng giềng kế
Để cho kết quả chính xác hơn (để hạn chế nhiễu) thay vì so sánh giá trị
Hình 2.12 Ảnh gốc

xám của điểm ảnh đang xét với từng điểm ảnh lân cận chúng ta sẽ so sánh với
mức xám trung bình của vùng cửa sổ NxN bao quanh điểm đó cộng với một
giá trị 1 cho trước.

Hình 2.15 Xác định điểm biên thực sự
Hình dưới đây minh họa kết quả của phương pháp tìm biên kết
hợp với N=5.

PTB+ ä1< P

Hình 2.14 So sánh với mức xám trung bình của cửa sổ trong
trường hợp N=5
Hình 2.16. ảnh biên áp dụng phương pháp kết hợp với N=5

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

36

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

37

đánh giá độ chênh lệch về giá trị mức xám của điểm ảnh so với các điểm lân
Dưới đây là thủ tục tìm biên của chương trình:

cận do đó kết hợp được ưu điểm của cả 2 khuynh hướng phát hiện biên trực

LPSTR DetectEdgeGrayImage(LPSTR pOrgImg,LPSTR pEdgImg,int 1,int
2)

tiếp và gián tiếp.

{

nằm trên biên không theo hướng tìm kiếm và sử dụng các ma trận lọc mà sẽ

Ý tưởng chính của thuật toán được đề xuất là xác định tất cả các điểm

int i,j,k,ii,jj,P0;

thông qua việc so sánh độ chênh lệch về mức xám của nó so với mức xám

struct Point { int x,y; };

chung của các điểm ảnh lân cận (mức xám nền). Trước hết tính giá trị xám

Point Orient[8] = {(0,1), (-1,1), (-1,0), (-1,-1), (0,-1), (1,-1),(1,0),(1,1) };
for (i=2; i

trung bình của các điểm ảnh nằm trong phạm vi của ma trận 3×3 hoặc 5×5

for (j=2; j
có tâm là điểm ảnh đang xét. Nếu như độ chênh lệch mức xám giữa điểm

{

đang xét với giá trị xám trung bình thỏa mãn lớn hơn một mức tối thiểu δ1
// tinh gia tri xam trung binh cua cac diem anh thuoc cua so 5x5

nào đó (PTB+ δ1< P) thì chúng ta sẽ coi nó là điểm biên và ghi nhận lại, còn

for (ii=i-2;ii<=i+2;ii++)

các điểm không thỏa mãn điều kiện trên sẽ được coi là điểm nền.

for (jj=j-2;jj<=j+2;jj++)

δ1

TG+=GetPoint(pOrgImg,ii,jj);
TG=int(TG/25);

N=5

P0=GetPoint(pOrgImg,i,j);
if (P0+1for (k=0;k<8;k++)

// so sanh voi cac diem thuoc 8 lang gieng

Hình 2.17 Ma trận điểm ảnh trước và sau lọc

if (P0+2{
SetPoint(pEdgImg,i,j,BLACK); break;
}
}

Ảnh biên thu được với δ1= 25

return pEdgImg;

Hình 2.18 Các ảnh biên kết quả thu được theo thuật toán đề xuất

}

Ảnh biên thu được với δ1= 250

*Nhận xét:
Thuật toán dò biên sử dụng trong chương trình tuy đã hạn chế được

2.1.4 Phát hiện biên dựa vào trung bình cục bộ

nhiều nhiễu so với việc sử dụng các bộ lọc và làm nổi rõ các đường biên

Phần này đề cập đến kỹ thuật mới dựa vào trung bình cục bộ trên cơ sở

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

38

nhưng vẫn không loại bỏ được hầu hết các nhiễu. Khi áp dụng thuật toán

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

39

trên chúng ta vẫn có thể làm giảm bớt nhiễu đi nhiều hơn nữa bằng cách
tăng giá trị của hệ số delta lên. Nhưng khi đó các đường biên thu được cũng
bị đứt đoạn và mờ đi nhiều.

2.1.5.1.1. Kỹ thuật lọc tuyến tính
Với kỹ thuật lọc tuyến tính, ảnh thu được sẽ là tổng trọng số hay là
trung bình trọng số các điểm lân cận với nhân cuộn hay mặt nạ. Nguyên tắc
lọc theo tổng trọng số được minh họa như hình dưới đây:

2.1.5. Cải thiện và nâng cao chất lƣợng biên ảnh

Tức là: P = P1K1 + P2K2 + P3K3 + P4K4 + P5K5 + P6K6 + P7K7 + P8K8

2.1.5.1. Các kỹ thuật tiền xử lý
Trong giai đoạn tiền xử lý, vấn đề mà chúng ta phải quan tâm đến
nhiều nhất đó là vấn đề nhiễu. Nhiễu là nguyên nhân chủ yếu gây nên những

P1

P2

P3

P4

P5

P6

K1

K2

K3

K4

K5

K6

K7

K8

K9

khó khăn cho phân tích ảnh. Nguyên nhân gây ra nhiễu có thể là do nhiễu
P

điện tử của máy thu hoặc chất lượng kém của bộ số hóa. Chúng ta hãy xem

=

X

xét thể hiện của nhiễu trên ảnh thế nào. Giả sử ảnh là một miền có mức xám

P7

đồng nhất. Như vậy, các phần tử của ma trận biểu diễn ảnh sau quá trình số

nhân cuộn 3x3

Hình 2.19 Lấy tổ hợp các điểm ảnh lân cận.

bình của mức xám có những phần tử trội lên khá nhiều. Đó chính là hiện
của tín hiệu thu nhận (tín hiệu ảnh) trên một khoảng cách ngắn. Xem xét một

P9

8 lân cận của P5

hóa phải có cùng giá trị. Nhưng thực tế quan sát kỹ, ta thấy: gần giá trị trung
tượng nhiễu. Như vậy, nhiễu trong ảnh số được xem là sự dịch chuyển nhanh

P8

Các mặt nạ thường dùng là :

cách tương đương trong không gian tần số, nhiễu ứng với các thành phần tần
số cao trong ảnh.
Phần dưới đây, em sẽ trình bày các kỹ thuật khử nhiễu. Trước hết
chúng ta tìm hiểu một số kỹ thuật lọc nhiễu đang được sử dụng phổ biến hiện
nay. Để khử nhiễu, thông thường người ta lấy “tổ hợp” các điểm lân cận

H1=1/9

1

1

1

1

1

1

1

1

1

H2=1/10

1 1

1

1

2

1

1

2

1

H3=1/16 2

4

2

1 1

1

1

2

1

Hình 2.20 Một số kiểu mặt nạ sử dụng cho kỹ thuật lọc phi tuyến.

(trong không gian thực) hay lọc các thành phần tần số cao (trong không gian
tần số). Cơ sở lý thuyết của kỹ thuật lọc số cũng dựa trên tính dư thừa thông

Mặt nạ H1 là mặt nạ dùng để tính trung bình không trọng số (không ưu

tin không gian: các pixel lân cận có thể có cùng hoặc gần cùng một số đặc

tiên theo hướng nào cả). Mặt nạ H2 cho trọng số lớn nhất với điểm ở tâm. Còn

tính. Hơn nữa nhiễu cũng có thể coi như sự đột biến của một số điểm ảnh so

mặt nạ H3 ưu tiên cho hướng x,y. Các mặt nạ lọc nói trên, nhìn chung làm

với các điểm ảnh lân cận. Tùy theo cách tổ hợp điểm đang xét mà ta có kỹ

giảm mức nhiễu trắng đi Nw lần, với Nw là số phần tử của mặt nạ. Tuy nhiên,

thuật lọc tuyến tính hay phi tuyến.

nếu kích thước của mặt nạ càng lớn thì ảnh càng bị nhòe.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

40

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

41

Phát hiện biên biểu diễn fourier elliptic và ứng dụng

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về