Tải bản đầy đủ (.pdf) (52 trang)

phát hiện khuôn mặt người từ webcam

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (4.39 MB, 52 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT
THÀNH PHỐ HỒ CHÍ MINH

ĐỀ TÀI NGHIÊN CỨU KHOA HỌC CẤP SINH VIÊN

PHÁT HIỆN KHUÔN MẶT NGƯỜI TỪ WEBCAM

S

K

C

0

0

3

9

5

9

MÃ SỐ: SV2010 - 108

S KC 0 0 2 8 4 3

Tp. Hồ Chí Minh, 2010




BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP. HỒ CHÍ MINH
KHOA ĐIỆN – ĐIỆN TỬ
----------------♦♦♦----------------

ĐỀ TÀI NGHIÊN CỨU KHOA HỌC CẤP SINH VIÊN
ĐỀ TÀI:

PHÁT HIỆN KHUÔN MẶT NGƯỜI TỪ WEBCAM
MÃ SỐ: SV2010-108

GVHD : ĐẬU TRỌNG HIỂN
SVTH : VÕ HOÀI DANH
MSSV : 07101011
SVTH : TRẦN VĂN HIẾU
MSSV : 07101037

TP.HỒ CHÍ MINH - 2/2011


GVHD Đậu Trọng Hiển

LỜI CẢM ƠN
Trƣớc tiên em xin gởi lời cảm ơn chân thành đến thầy Đậu Trọng Hiển đã hƣớng dẫn,
gợi mở, giúp đỡ em trong suốt thời gian thực hiện đề tài nghiên cứu khoa học này.
Bên cạnh đó, em xin cảm ơn đến các thầy cô trong khoa Điện-Điện Tử đã tạo điều kiện
cho em thực hiện đề tài thành công.
Cảm ơn các thầy cô làm việc tại Phòng Nghiên cứu khoa học đã hƣớng dẫn em các thủ

tục trong quá trình thực hiện đề tài.
Cảm ơn nhà trƣờng đã hổ trợ kinh phí tạo điều kiện cho em hoàn thành đề tài nghiên
cứu khoa học của mình.
Sau cùng em xin gởi lời chúc sức khỏe, hạnh phúc đến quý thầy cô.
Trƣờng Đại học Sƣ Phạm Kỹ Thuật Tp.HCM
Tháng 2 năm 2011
Sinh viên thực hiện

Võ Hoài Danh


GVHD Đậu Trọng Hiển

LỜI NÓI ĐẦU

Ngày nay, với sự phát triển nhanh chóng của khoa học kĩ thuật, đặc biệt trong lĩnh vực
công nghệ thông tin thì máy tính và ảnh số đã trở nên quen thuộc với mọi ngƣời. Và ảnh
số và máy tính đã góp phần không nhỏ trong việc làm cho cuộc sống con ngƣời trở nên
tiện lợi hơn thông qua một ngành khoa học mới mẻ đó là xử lý ảnh. Tuy ra đời muộn hơn
so với những ngành khoa học khác nhƣng tốc độ phát triển của nó rất nhanh, và những
ứng dụng của nó là hết sức rộng rãi trong cuộc sống nhƣ trong y học, giải trí, và đặc biệt là
trong lĩnh vực an ninh nhƣ nhận dạng dấu vân tay, hay chữ viết,.... Nền tảng của xử lý ảnh
cũng dựa vào những lý thuyết xử lý tín hiệu cơ bản và từ đó các nhà khoa học đi trƣớc đã
đề ra các thuật toán cho riêng ngành xử lý ảnh, và trong đề tài “phát hiện khuôn mặt người
từ webcam” sẽ nghiên cứu các thuật toán cơ bản trong quá trình xử lý ảnh, và từ đó xây
dựng một chƣơng trình phát hiện khuôn mặt.
Trên thế giới, ứng dụng đầu tiên đƣợc biết đến là nâng cao chất lƣợng ảnh báo đƣợc
truyền qua cáp từ Luân đôn đến New York từ những năm 1920. Năm 1964, máy tính đã có
khả năng xử lý và nâng cao chất lƣợng ảnh từ mặt trăng và vệ tinh Ranger 7 của Mỹ bao
gồm: làm nổi đƣờng biên, lƣu ảnh. Từ năm 1964 đến nay, các phƣơng tiện xử lý, nâng cao

chất lƣợng, nhận dạng ảnh phát triển không ngừng. Các phƣơng pháp tri thức nhân tạo nhƣ
mạng nơ ron nhân tạo, các thuật toán xử lý hiện đại và cải tiến, các công cụ nén ảnh ngày
càng đƣợc áp dụng rộng rãi và thu nhiều kết quả khả quan. Còn ở nƣớc ta, xử lý ảnh vẫn
còn là một môn học khá mới mẻ tại các trƣờng đại học và có khá ít các giáo trình xử lý
ảnh đƣợc viết bằng tiếng việt nên cũng phần nào làm hạn chế khả năng nghiên cứu của
sinh viên không giỏi ngoại ngữ đối với môn học này. Ở nƣớc ta phần lớn là các đề tài ứng
dụng các thƣ viện và thuật toán xử lý ảnh đã đƣợc phát triển bởi các công ty lớn nhƣ thƣ
viện Opencv của intel,... với độ tin cậy cao, có thể kể đến một số đề tài ở nƣớc ta nhƣ nhận
dạng chữ viết tay, nhận dạng khuôn mặt, nhận dạng dấu vân tay và gần đây nhất là đề tài
“bãi giữ xe thông minh” của học viện kỹ thuật quân sự....


GVHD Đậu Trọng Hiển

NHẬN XÉT CỦA GIÁO VIÊN
...................................................................................................................................................
...................................................................................................................................................
...................................................................................................................................................
...................................................................................................................................................
...................................................................................................................................................
...................................................................................................................................................
...................................................................................................................................................
...................................................................................................................................................
...................................................................................................................................................
...................................................................................................................................................
...................................................................................................................................................
...................................................................................................................................................
...................................................................................................................................................
...................................................................................................................................................
...................................................................................................................................................

...................................................................................................................................................
...................................................................................................................................................
...................................................................................................................................................
...................................................................................................................................................
...................................................................................................................................................
...................................................................................................................................................
...................................................................................................................................................
...................................................................................................................................................
...................................................................................................................................................


GVHD Đậu Trọng Hiển

MỤC LỤC
LỜI CẢM ƠN ..........................................................................................................................
NHẬN XÉT CỦA GIÁO VIÊN ...............................................................................................
Phần I ĐẶT VẤN ĐỀ...............................................................................................................
II.

Mục tiêu đề tài .........................................................................................................

III.

Nhiệm vụ đề tài ........................................................................................................

IV.

Giới hạn đề tài ..........................................................................................................

Phần II GIẢI QUYẾT VẤN ĐỀ ...............................................................................................

CHƢƠNG I : KIẾN THỨC CƠ BẢN VỀ XỬ LÝ ẢNH ..................................................... 1
I.

Tổng quan về một hệ thống xử lý ảnh ....................................................................... 1
1. Thu nhận ảnh: ....................................................................................................... 1
2. Tiền xử lý ảnh:...................................................................................................... 1
3. Phân tích ảnh: ....................................................................................................... 1
4. Nhận dạng, nội suy: .............................................................................................. 2
5. Lƣu trữ: ................................................................................................................ 2

II. Một số khái niệm cơ bản .......................................................................................... 2
1. Điểm ảnh (picture element) ................................................................................... 2
2. Độ phân giải (resolution) ...................................................................................... 2
3. Mức xám của ảnh (grey level) ............................................................................... 2
4. Ảnh số .................................................................................................................. 3
5. Lƣợc đồ mức xám(histogram) ............................................................................... 3
III. Các kỹ thuật tăng cƣờng ảnh và phát hiện biên ......................................................... 4
1. Cải thiện ảnh dùng toán tử điểm............................................................................ 4
2. Cải thiện ảnh dùng toán tử không gian .................................................................. 4
3.

Một số phƣơng pháp phát hiện biên ...................................................................... 8

CHƢƠNG II : GIỚI THIỆU HỆ THỐNG NHẬN DẠNG KHUÔN MẶT ........................ 17
CHƢƠNG III: CƠ SỞ LÝ THUYẾT ................................................................................ 18
I.

Tiếp cận boosting ................................................................................................... 18

II. Adaboost ................................................................................................................ 19

III. Haar feature............................................................................................................ 20
IV. Cascade of classifiers ............................................................................................. 22
V. Cascade of Boosted Classifiers .............................................................................. 22
VI. Phát hiện khuôn mặt với Cascade of Boosted Classifiers ........................................ 23


GVHD Đậu Trọng Hiển
1. Tập huấn luyện ................................................................................................... 23
2. Xây dựng bộ nhận dạng Adaboost ...................................................................... 23
CHƢƠNG IV: Thƣ viện OpenCV ..................................................................................... 28
I.

Giới thiệu ............................................................................................................... 28

II. Cách cài đặt thƣ viện OpenCV trong bộ Visual Studio 2008 ................................... 28
Cấu hình cho Visual Studio ....................................................................................... 28
Cấu hình trong Project của bạn ................................................................................. 29
CHƢƠNG V: TẠO CƠ SỞ DỮ LIỆU ĐỂ NHẬN DẠNG BẰNG OPENCV .................... 31
Các bƣớc chuẩn bị .................................................................................................. 31

I.

1. Thu thập ảnh khuôn mặt ..................................................................................... 31
2. Các mẫu negative................................................................................................ 31
3. Các mẫu positive ................................................................................................ 31
II. Tiến hành học huấn luyện cho máy tính .................................................................. 32
III.

Thử nghiệm cơ sở dữ liệu vừa tạo ......................................................................... 34


CHƢƠNG VI: XÂY DỰNG CHƢƠNG TRÌNH PHÁT HIỆN KHUÔN MẶT ................. 35
I.

Chuẩn bị các công cụ lập trình và thiết bị cần thiết ................................................. 35

II. Sơ đồ khối chƣơng trình ......................................................................................... 36
III.

Tổ chức chƣơng trình............................................................................................ 36

Phần III KẾT LUẬN ............................................................................................................ 39
I.

Kết Luận ................................................................................................................ 39

II.

Hƣớng phát triển đề tài .......................................................................................... 39

Phần IV TÀI LIỆU THAM KHẢO....................................................................................... 40


GVHD Đậu Trọng Hiển

Phần I
ĐẶT VẤN ĐỀ


GVHD Đậu Trọng Hiển


Lý do chọn đề tài

I.

Ảnh số và máy tính đã góp phần không nhỏ trong việc làm cho cuộc sống con ngƣời trở
nên tiện lợi hơn, nó có thể giúp ta kiểm soát vấn đề an ninh đƣợc tốt hơn thông qua các hệ
thống nhận diện mở khóa bằng gƣơng mặt hay vân tay, giúp cho việc giữ xe nhanh chóng hơn
thông qua các hệ thống giữ xe tự động,…. Tất cả các hệ thống đó đều có chung một cơ sở lý
thuyết đó là xử lý ảnh. Đây là một ngành khoa học mới mẻ, và ra đời tuy có muộn hơn các
ngành khoa học khác nhƣng tốc độ phát triển của nó rất nhanh, và những ứng dụng của nó là
hết sức rộng rãi trong cuộc sống nhƣ trong y học, giải trí, và đặc biệt là trong lĩnh vực an ninh
nhƣ nhận dạng dấu vân tay, hay chữ viết,.... Những môn học liên quan đến xử lý ảnh đã đƣợc
đƣa vào giảng dạy tại các trƣờng đại học tại nƣớc ta trong vài năm gần đây, vì thế đây vẫn là
một môn học khá xa lạ với sinh viên nƣớc ta cũng nhƣ sinh viên trƣờng ta và tài liệu tham
khảo bằng tiếng việt vẫn còn rất hạn chế.
Bản thân nhóm nghiên cứu cũng là những sinh viên thuộc khoa Điện-Điện Tử, nên cũng
quan tâm và muốn tìm hiểu về ảnh số và những ứng dụng của xử lý ảnh trong đời sống hằng
ngày để thấy đƣợc sự gần gũi cũng nhƣ vai trò của xử lý ảnh trong đời sống hằng ngày. Chính
vì những lý do đó nhóm nghiên cứu đã chọn đề tài “phát hiện khuôn mặt ngƣời từ webcam”.

Mục tiêu đề tài

II.

Môn học xử lý ảnh vẫn là một môn học tƣơng đối mới mẻ và còn hạn chế về giáo trình và
tài liệu tham khảo bằng tiếng việt, chính vì vậy mà đề tài này sẽ trình bày một cách ngắn gọn
và tổng quát quá trình xử lý ảnh cơ bản, bên cạnh đó đi sâu vào một số bƣớc cốt lõi trong quá
trình xử lý ảnh nhƣ tăng cƣờng ảnh, kỹ thuật phát hiện biên để cho ngƣời đọc có thể hiểu rõ
hơn về quá trình xử lý ảnh, đồng thời làm cơ sở lý thuyết cho việc xây dựng chƣơng trình
nhận dạng khuôn mặt trong camera ( trong đề tài này sử dụng webcam máy tính để làm

camera) ở phần sau của đề tài.

Nhiệm vụ đề tài

III.





Tìm hiểu một cách cơ bản về xử lý ảnh
Tìm hiểu về phƣơng pháp nhận dạng ảnh bằng thuật toán adaboost
Tìm hiểu ứng dụng và cách xử dụng thƣ viện OpenCV
Xây dựng hoàn chỉnh một chƣơng trình phát hiện khuôn mặt bằng OpenCV

Giới hạn đề tài

IV.


Đề tài không đi sâu về các kiến thức xử lý ảnh, chỉ dừng lại ở kiến thức cơ bản nhằm
xây dựng nền tản đầu tiên cho ngƣời mới bắt đầu nghiên cứu về xử lý ảnh.



Phần mềm xây dựng có chức năng đơn giản với mục đích hƣớng dẫn cho ngƣời
học khai thác thƣ viện mã nguồn mới OpenCV, từ đó phát triển thành những
ứng dụng có tính hữu dụng và chuyên nghiệp hơn.



GVHD Đậu Trọng Hiển

Phần II
GIẢI QUYẾT VẤN ĐỀ


GVHD Đậu Trọng Hiển

CHƢƠNG I : KIẾN THỨC CƠ BẢN VỀ XỬ LÝ ẢNH
I.

Tổng quan về một hệ thống xử lý ảnh
Trƣớc hết, chúng ta sẽ xem xét các bƣớc cần thiết trong quá trình xử lý ảnh. Đầu tiên ảnh
tự nhiên từ thế giới bên ngoài sẽ đƣợc đƣa vào máy tính để xử lý thông qua các thiết bị thu
nhƣ camera, máy chụp hình. Trƣớc đây, ảnh thu qua Camera là các ảnh tƣơng tự (loại Camera
ống kiểu CCIR). Gần đây, với sự phát triển của công nghệ, ảnh màu hoặc đen trắng đƣợc lấy
ra từ Camera, sau đó nó đƣợc chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử lý tiếp theo.
(Máy ảnh số hiện nay là một thí dụ gần gũi). Mặt khác, ảnh cũng có thể tiếp nhận từ vệ tinh;
có thể quét từ ảnh chụp bằng máy quét ảnh. Hình 1.1 dƣới đây mô tả các bƣớc cơ bản trong
một quá trình xử lý ảnh.
Thu nhận
ảnh

Tiền xử
lý ảnh

Phân
tích ảnh

Nhận

dạng, nội
suy

Lƣu
trữ
Hình 1.1: Các bƣớc cơ bản trong một quá trình xử lý ảnh
Sơ đồ này gồm có các phần nhƣ sau:
1. Thu nhận ảnh:
Ảnh có thể nhận qua camera màu hay trắng đen, camera cho ta ảnh tƣơng tự hay cho ta
ảnh đã đƣợc số hóa. Camera thƣờng dùng là loại quét dòng ; ảnh tạo ra có dạng hai chiều.
Chất lƣợng một ảnh thu nhận đƣợc phụ thuộc vào thiết bị thu, vào môi trƣờng (ánh sáng,
phong cảnh).
2. Tiền xử lý ảnh:
Sau bộ thu nhận, ảnh có thể nhiễu độ tƣơng phản thấp nên cần đƣa vào bộ tiền xử lý để
nâng cao chất lƣợng hay đối với những ảnh chƣa đƣợc số hóa thì bƣớc này sẽ thực hiện quá
trình đó. Chức năng chính của bộ tiền xử lý là lọc nhiễu, nâng độ tƣơng phản để làm ảnh rõ
hơn, nét hơn.
3. Phân tích ảnh:

Chương I: Kiến thức cơ bản về xử lý ảnh

1


GVHD Đậu Trọng Hiển
Tới giai đoạn này thì ảnh đã đƣợc khôi phục và trạng thái của ảnh đã gần giống nhƣ ảnh
gốc, nên ta sẽ tiến hành phát hiện các đặc tính tiêu biểu của ảnh nhƣ biên, phân vùng ảnh,
trích chọn đặc tính.... để làm cơ sở cho bƣớc tiếp theo.
4. Nhận dạng, nội suy:
Tuy theo mục đích của ứng dụng sẽ là giai đoạn nhận dạng, phân lớp hay các quyết định

khác.
5. Lƣu trữ:
Trong quá trình xử lý ảnh các dữ liệu của ảnh không đƣợc lƣu trữ dƣới dạng dữ liệu thô vì
đòi hỏi dung lƣợng lớn và không hiệu quả theo quan điểm ứng dụng. Thông thƣờng, ảnh đƣợc
lƣu trữ dƣới dạng những đặc trƣng của ảnh nhƣ biên, vùng ảnh....

II.

Một số khái niệm cơ bản
1. Điểm ảnh (picture element)
Gốc của ảnh (ảnh tự nhiên) là ảnh liên tục về không gian và độ sáng. Để xử lý bằng máy
tính (số), ảnh cần phải đƣợc số hoá. Số hoá ảnh là sự biến đổi gần đúng một ảnh liên tục thành
một tập điểm phù hợp với ảnh thật về vị trí (không gian) và độ sáng (mức xám). Khoảng cách
giữa các điểm ảnh đó đƣợc thiết lập sao cho mắt ngƣời không phân biệt đƣợc ranh giới giữa
chúng. Mỗi một điểm nhƣ vậy gọi là điểm ảnh (PEL: Picture Element) hay gọi tắt là Pixel.
Trong ảnh hai chiều, mỗi pixel ứng với cặp tọa độ (x, y).

2. Độ phân giải (resolution)
Độ phân giải của ảnh là mật độ điểm ảnh đƣợc ấn định trên một ảnh số đƣợc hiển thị.
Theo định nghĩa, khoảng cách giữa các điểm ảnh phải đƣợc chọn sao cho mắt ngƣời vẫn thấy
đƣợc sự liên tục của ảnh. Việc lựa chọn khoảng cách thích hợp tạo nên một mật độ phân bổ,
đó chính là độ phân giải và đƣợc phân bố theo trục x và y trong không gian hai chiều.
Ví dụ: Độ phân giải của ảnh trên màn hình CGA (Color Graphic Adaptor) là một lƣới
điểm theo chiều ngang màn hình: 320 điểm chiều dọc * 200 điểm ảnh (320*200). Rõ ràng,
cùng màn hình CGA 12” ta nhận thấy mịn hơn màn hình CGA 17” độ phân giải 320*200. Lý
do: cùng một mật độ (độ phân giải) nhƣng diện tích màn hình rộng hơn thì độ mịn (liên tục
của các điểm) kém hơn.

3. Mức xám của ảnh (grey level)
Một điểm ảnh có hai đặc trƣng cơ bản là vị trí (x, y) của điểm ảnh và độ xám của nó.

Mức xám: Là kết quả của sự biến đổi tƣơng ứng giá trị độ sáng của một điểm ảnh với một
giá trị số nguyên dƣơng. Tùy thuộc vào số giá trị biểu diễn mức xám mà mỗi điểm ảnh sẽ
đƣợc biểu diễn trên 1, 4, 8, 24 hay 32 bit. Số lƣợng bit biểu diễn mức xám càng lớn thì chất
Chương I: Kiến thức cơ bản về xử lý ảnh

2


GVHD Đậu Trọng Hiển
lƣợng ảnh càng cao nhƣng sẽ tốn dung lƣợng bộ nhớ nhiều hơn để lƣu trữ và cần một hệ
thống mạnh hơn để xử lý.

4. Ảnh số
Là một tập hợp hữu hạn các điểm ảnh kề nhau. Ảnh thƣờng đƣợc biểu diễn bằng một ma
trận hai chiều, mỗi phần tử của ma trận tƣơng ứng với một điểm ảnh.
o Ảnh nhị phân (đen trắng): là ảnh có giá trị mức xám của các điểm ảnh đƣợc
biểu diễn bằng 1 bit (giá trị 0 hoặc 1).
o Ảnh xám: giá trị mức xám của các điểm ảnh đƣợc biểu diễn bằng 8 bit (giá trị
từ 0 đến 255).
o Ảnh màu: trong khuôn khổ lý thuyết ba màu (Red, Blue, Green) để tạo nên
thế giới màu, ngƣời ta thƣờng dùng 3 byte để mô tả mức xám, khi đó các giá
trị màu: 28*3=224≈ 16,7 triệu màu.
o

5. Lƣợc đồ mức xám(histogram)
Lƣợc đồ mức xám hay còn gọi vắng tắt là lƣợc đồ xám, là một hàm cung cấp tần suất
xuất hiện của mỗi mức xám (grey level).
Lƣợc đồ xám đƣợc biểu diễn trong một hệ trục tọa độ vuông góc x,y. Trong hệ tọa độ
này, trục tung biểu diễn số điểm ảnh có chung một mức xám, trục hoành biểu diễn số mức
xám từ 0 đến N. Cũng có thể biểu diễn khác một chút, trục tung là tỷ lệ số điểm ảnh có cùng

mức xám trên tổng số điểm ảnh.
số điểm ảnh

số điểm ảnh

mức xám
a) ảnh đậm

mức xám
b) ảnh nhạt

hình 1.2: Lƣợc đồ xám của ảnh
Lƣợc đồ xám cung cấp rất nhiều thông tin về phân bố mức xám của ảnh. Theo thuật ngữ
xử lý ảnh còn gọi là tính động của ảnh. Từ lƣợc đồ xám chúng ta có thể xem xét một ảnh là
sáng hay đậm. Nếu ảnh sáng lƣợc đồ xám nằm bên phải (mức xám cao), còn ảnh đậm lƣợc
đồ xám nằm bên trái (mức xám thấp).

Chương I: Kiến thức cơ bản về xử lý ảnh

3


GVHD Đậu Trọng Hiển

III.

Các kỹ thuật tăng cƣờng ảnh
Tăng cƣờng ảnh là 1 công đoạn trong quá trình tiền xử lý ảnh, và tăng cƣờng ảnh nhằm
hoàn thiện các đặc tính của ảnh nhƣ :
 Lọc nhiễu, hay làm trơn ảnh

 Tăng độ tƣơng phản, điều chỉnh mức xám của ảnh
 Làm nổi biên ảnh.
Các thuật toán triển khai việc nâng cao chất lƣợng ảnh hầu hết dựa trên các kỹ thuật trong
miền điểm, không gian và tần số. Toán tử điểm là phép biến đổi đối với từng điểm ảnh đang
xét, không liên quan đến các điểm lân cận khác, trong khi đó, toán tử không gian sử dụng các
điểm lân cận để quy chiếu tới điểm ảnh đang xét. Một số phép biến đổi có tính toán phức tạp
đƣợc chuyển sang miền tần số để thực hiện, kết quả cuối cùng đƣợc chuyển trở lại miền
không gian nhờ các biến đổi ngƣợc. Và trong đề tài này sẽ tập trung nghiên cứu các kỹ thuật
dùng toán tử không gian.

1. Cải thiện ảnh dùng toán tử điểm
Toán tử điểm là toán tử không bộ nhớ, ở đó một mức xám u  [0,N] đƣợc ánh xạ sang
một mức xám v  [0,N]: v = f(u). Ánh xạ f tùy theo các ứng dụng khác nhau có các dạng khác
nhau và đƣợc liệt kê trong bảng sau:

a. Tách nhiễu và phân ngƣỡng:
f(u) =

0
u
L

0 ua ub
ub

Khi a = b = t gọi là phân ngƣỡng.

b. Biến đổi âm bản:
f(u) = L – u


tạo âm bản

c. Cắt theo mức:
f(u) =

L
0

a ub
khác đi

2. Cải thiện ảnh dùng toán tử không gian
Cải thiện ảnh là làm cho ảnh có chất lƣợng tốt hơn theo ý đồ sử dụng. Thƣờng là ảnh thu
nhận có nhiễu cần phải loại bỏ nhiễu hay ảnh không sắc nét bị mờ hoặc cần làm rõ các chi
tiết nhƣ đƣờng biên ảnh. Các toán tử không gian dùng trong kỹ thuật tăng cƣờng ảnh đƣợc
phân nhóm theo công dụng: làm trơn nhiễu, nổi biên. Để làm trơn nhiễu hay tách nhiễu,
Chương I: Kiến thức cơ bản về xử lý ảnh

4


GVHD Đậu Trọng Hiển
ngƣời ta sử dụng các bộ lọc tuyến tính (lọc trung bình, thông thấp) hay lọc phi tuyến (trung
vị, giả trung vị, lọc đồng hình). Từ bản chất của nhiễu (thƣờng tƣơng ứng với tần số cao) và
từ cơ sở lý thuyết lọc là: bộ lọc chỉ cho tín hiệu có tần số nào đó thông qua do đó, để lọc
nhiễu ngƣời ta thƣờng dùng lọc thông thấp (theo quan điểm tần số không gian) hay lấy tổ
hợp tuyến tính để san bằng (lọc trung bình). Để làm nổi cạnh (ứng với tần số cao), ngƣời ta
dùng các bộ lọc thông cao, lọc Laplace.
Trƣớc khi xem xét chi tiết các kỹ thuật áp dụng, cần phân biệt các loại nhiễu hay can thiệp

trong quá trình xử lý ảnh. Trên thực tế tồn tại nhiều loại nhiễu; tuy nhiên ngƣời ta thƣờng xem
xét 3 loại nhiễu chính: nhiễu cộng, nhiễu nhân và nhiễu xung:
o Nhiễu cộng
Nhiễu cộng thƣờng phân bố khắp ảnh. Nếu gọi ảnh quan sát (ảnh thu đƣợc) là Xqs,
ảnh gốc là Xgốc, nhiễu là η, ảnh thu đƣợc có thể biểu diễn bởi:
Xqs = Xgốc + η
o Nhiễu nhân
Nhiễu nhân thƣờng phân bố khắp ảnh và ảnh thu đƣợc sẽ biểu diễn với công thức:
Xqs = Xgốc * η
o Nhiễu xung
Nhiễu xung thƣờng gây đột biến tại một số điểm ảnh.

 Làm trơn nhiễu bằng lọc tuyến tính: lọc trung bình và lọc dải thông thấp
Do có nhiều loại nhiễu can thiệp vào quá trình xử lý ảnh nên cần có nhiều bộ lọc thích
hợp. Với nhiễu cộng và nhiễu nhân ta dùng các bộ lọc thông thấp, trung bình với nhiễu xung
ta dùng lọc trung bị, giả trung vị, lọc ngoài (Outlier).
Lọc trung bình không gian:
Với lọc trung bình, mỗi điểm ảnh đƣợc thay thế bằng trung bình trọng số của các điểm lân
cận và đƣợc định nghĩa nhƣ sau:

Với: y(m,n): là ảnh đầu vào
v(m,n): là ảnh đầu ra
a(k,l): là cửa sổ lọc
Nếu trong kỹ thuật lọc trên, ta dùng các trọng số nhƣ nhau, phƣơng trình trên sẽ trở thành:

1

Với ak,l = 𝑁 và N là số điểm ảnh trong cửa sổ lọc W.
Hiểu một cách đơn giản thì lọc trung bình có trọng số chính là thực hiện chập ảnh đầu vào
với nhân chập H. Nhân chập H trong trƣờng hợp này có dạng:


Chương I: Kiến thức cơ bản về xử lý ảnh

5


GVHD Đậu Trọng Hiển
1 1 1
1
H=9 1 1 1
1 1 1
Trong lọc trung bình, thƣờng ngƣời ta ƣu tiên cho các hƣớng để bảo vệ biên của ảnh khỏi
bị mờ khi làm trơn ảnh. Các kiểu mặt nạ đƣợc sử dụng tùy theo các trƣờng hợp khác nhau.
Các bộ lọc trên là bộ lọc tuyến tính theo nghĩa là điểm ảnh ở tâm cửa số sẽ đƣợc thay bởi tổ
hợp các điểm lân cận chập với mặt nạ.
Ví dụ: Giả sử đầu vào biểu diễn bởi ma trận I:
4
5
6
5
5

I=

7
7
6
7
7


3
1
1
5
6

7
7
8
7
1

1
1
3
1
2

Ảnh số thu đƣợc bởi lọc trung bình Y=H⊗I :
tại điểm y(0,0)=[i(0,0)+ i(0,1) + i(1,1) + i(1,0)]/9=23/9
và tại điểm y(1,1)=[i(1,1) + i(0,0)+ i(0,1) + i(0,2) + i(1,0) + i(1,2) + i(2,0) + i(2,1) +
i(2,2)]/9 = 39/9
và tƣơng tự cho những điểm còn lại trong I ta có Y nhƣ sau:

𝟏

Y = 𝟗*

23
35

36
36
24

26
39
43
48
35

31
46
49
48
33

19
31
34
34
22

16
27
27
22
11

Lọc trung bình trọng số là một trƣờng hợp riêng của lọc thông thấp.
Lọc thông thấp:

Lọc thông thấp thƣờng đƣợc sử dụng để làm trơn nhiễu.Về nguyên lý của bộ lọc thông
thấp giống nhƣ đã trình bày trên. Và trong kỹ thuật này ngƣời ta thƣờng dùng một số nhân
chập có dạng sau:
1 b 1
𝟏
Hb = (𝒃+𝟐)𝟐 b b2 b
1 b 1
Dễ dàng nhận thấy rằng, khi ta thay b = 1 thì Hb = H chính là nhân chập trong lọc trung
bình.

Chương I: Kiến thức cơ bản về xử lý ảnh

6


GVHD Đậu Trọng Hiển
Lọc đồng hình (Homomorphie Filter):
Kỹ thuật lọc này hiệu quả với ảnh có nhiễu nhân. Ta xét một ảnh bị nhiễu bởi nhiễu nhân,
gọi X(m,n) là ảnh thu đƣợc, X(m, n) là ảnh gốc và η(m, n) là nhiễu, ta có:
𝑿(m,n) = X(m,n)* η(m, n).
Lọc đồng hình đƣợc thực hiện bằng cách lấy logarit của ảnh thu đƣợc. Do vậy ta có kết
quả:
Log(𝑿(m,n)) = Log(X(m,n)) + Log(η(m, n))
Rõ ràng, nhiễu nhân ảnh hƣởng đến ảnh đã giảm. Sau quá trình lọc tuyến tính, ta chuyển
về ảnh cũ bằng phép biến đổi hàm e mũ.

 Làm trơn nhiễu bằng lọc phi tuyến
Các bộ lọc phi tuyến cũng hay đƣợc dùng trong kỹ thuật tăng cƣờng ảnh.
Trong kỹ thuật này, ngƣời ta dùng bộ lọc trung vị, giả trung vị, lọc ngoài.
Lọc trung vị

Trong lọc trung vị, điểm ảnh đầu vào sẽ đƣợc thay thế bởi trung vị các điểm ảnh, còn lọc
giả trung vị sẽ dùng trung bình cộng của 2 giá trị ”trung vị” (trung bình cộng của max và
min).
Trung vị đƣợc viết với công thức:
v(m,n) = trungvị(y(m-k,n-l)) với k,l ∈ W
Kỹ thuật này đòi hỏi giá trị các điểm ảnh trong cửa sổ phải xếp theo thứ tự tăng hay giảm
dần so với giá trị trung vị. Kích thƣớc cửa số thƣờng đƣợc chọn sao cho số điểm ảnh trong
cửa số là lẻ. Các cửa sổ hay dùng là cửa sổ có kích thƣớc 3x3, hay 5x5 hay 7x7.
Ví dụ: Nếu y(m) = {2, 3, 8, 4, 2} và cửa sổ W=(-1, 0, 1), ảnh thu đƣợc sau lọc trung vị sẽ
là:
v(m) = (2, 3, 4, 4, 2).
Các bƣớc để thực hiện quá trình này nhƣ sau:
o Quét cửa sổ lọc lên các thành phần của ảnh gốc, điền các giá trị đƣợc quét vào
cửa sổ lọc.
Ví dụ khi quét W tại y[2], thì các giá trị trong cửa sổ lọc là (3,8,4).
o Sắp xếp các giá trị trong cửa sổ lọc
(3,4,8)
o Sau đó ta lấy trung vị của cửa sổ và gán vào lại vị trí cũ, ta đƣợc ảnh đầu ra
v[2]=4
v[0]= 2 <giá trị biên>;
v[1]=Trungvi(2,3,8)=3;
v[2]=Trungvi(3,4,8)=4;
v[3]= Trungvi(8,4,2)=4;
v[4]= 2 <giá trị biên>.
Tính chất của lọc trung vị:
o Lọc trung vị là loại lọc phi tuyến. Điều này dẽ nhận thấy từ:
Trungvi(x(m)+y(m)) ≠ Trungvi(x(m)) + Trungvi(y(m)).

Chương I: Kiến thức cơ bản về xử lý ảnh


7


GVHD Đậu Trọng Hiển
o Có lợi cho việc loại bỏ các điểm ảnh hay các hàng mà vẫn bảo toàn độ phân
giải.
Lọc ngoài (outlier filter)
Giả thiết có ngƣỡng nào đó cho các mức nhiễu (có thể dựa vào lƣợc đồ xám). Ta tiến hành
so sánh giá trị độ xám của một điểm ảnh với trung bình số học 8 lân cận của nó. Nếu sai lệch
này lớn hơn ngƣỡng đã đƣợc chọn trƣớc, thì điểm ảnh này đƣợc coi nhƣ nhiễu và sẽ đƣợc
thay thế bằng giá trị trung bình 8 lân cận vừa tính đƣợc.
Bộ lọc ngoài có thể diễn tả bằng công thức sau:
Y(m,n) =
α (w)
khi | u(m,n) – α(w) | > 𝜹
u(m,n)
ngƣợc lại
với: α(w) là trung bình cộng các điểm trong lân cận
𝜹 là ngƣỡng ngoài
Các cửa sổ tính toán thƣờng chọn là 3x3. Tuy nhiên, cửa sổ có thể mở rộng đến 5x5 hay
7x7 để đảm bảo tính tƣơng quan giữa các điểm ảnh.
Vấn đề quan trọng là xác định ngƣỡng để loại nhiễu mà vẫn không làm mất thông tin của
ảnh.

3. Một số phƣơng pháp phát hiện biên
Ảnh thu đƣợc sau khi qua giai đọan tiền xử lý ảnh, thì các thành phần nhiễu đã
đƣợc loại bỏ và ta bƣớc vào giai đoạn phân tích ảnh để trích chọn các đặc trƣng của
ảnh để phục vụ cho các công việc tiếp theo. Và phát hiện biên là một bƣớc quan trọng
trong quá trình phân tích ảnh. Để thấy rõ tầm quan trọng của biên ta xét ví dụ sau: khi
ngƣời họa sĩ muốn vẽ một ngƣời nào đó thì họ chỉ cần phát thảo một vài đƣờng cơ bản

của gƣơng mặt ngƣời đó thì ta có thể nhận ra ngƣời đó mà không cần vẽ đầy đủ tất cả
các chi tiết.
Trƣớc tiên ta xem xét một số khái niệm cơ bản trong phƣơng pháp phát hiện biên,
và sau đó đi vào phân tích cụ thể một vài phƣơng pháp.
a. Một số khái niệm
 Điểm biên
Một điểm ảnh đƣợc coi là điểm biên nếu có sự thay đổi nhanh hoặc đột ngột về mức xám
(hoặc màu). Ví dụ trong ảnh nhị phân, điểm đen gọi là điểm biên nếu lân cận nó có ít nhất
một điểm trắng.

 Đƣờng biên
Tập hợp các điểm biên liên tiếp tạo thành một đƣờng biên hay đƣờng bao.
Đƣờng biên là một loại đặc trƣng cục bộ tiêu biểu trong phân tích, nhận dạng ảnh. Ngƣời ta sử
dụng biên làm phân cách các vùng xám (màu) cách biệt. Ngƣợc lại, ngƣời ta cũng sử dụng các
vùng ảnh để tìm đƣờng phân cách.
Chương I: Kiến thức cơ bản về xử lý ảnh

8


GVHD Đậu Trọng Hiển
Mô hình biểu diễn đƣờng biên, theo toán học: điểm ảnh có sự biến đổi mức xám u(x) một
cách đột ngột theo hình dƣới.
u
u
u

x
đƣờng biên lý tƣởng


x
đƣờng biên bậc thang

x
đƣờng biên thực

b. Các phƣơng pháp phát hiện biên
Phân loại các kỹ thuật phát hiện biên:
Từ định nghĩa toán học của biên ngƣời ta sử dụng hai phƣơng pháp phát hiện biên nhƣ sau
(2 phƣơng pháp chính):


Phƣơng pháp phát hiện biên trực tiếp: phƣơng pháp này chủ yếu dựa vào sự biến
thiên độ sáng của điểm ảnh để làm nổi biên bằng kỹ thuật đạo hàm.
o Nếu lấy đạo hàm bậc nhất của ảnh: ta có phƣơng pháp Gradient
o Nếu lấy đạo hàm bậc hai của ảnh: ta có phƣơng pháp Laplace.
Hai phƣơng pháp này đƣợc gọi chung là phƣơng pháp dò biên cục bộ. Ngoài ra,
ngƣời ta còn sử dụng phƣơng pháp “đi theo đƣờng bao” dựa vào công cụ toán học
là nguyên lý quy hoạch động và đƣợng gọi là phƣơng pháp dò biên tổng thể.
Phƣơng pháp dò biên trực tiếp có hiệu quả và ít bị tác động của nhiễu.



Phƣơng pháp phát hiện biên gián tiếp: Nếu bằng cách nào đấy, chúng ta thu đƣợc
các vùng ảnh khác nhau thì đƣờng phân cách giữa các vùng đó chính là biên. Nói
cách khác, việc xác định đƣờng bao của ảnh đƣợc thực hiện từ ảnh đã đƣợc phân
vùng. Phƣơng pháp dò biên gián tiếp khó cài đặt nhƣng áp dụng tốt khi sự biến
thiên độ sáng nhỏ

Phƣơng pháp Gradient

Định nghĩa: Gradient là một vector f(x, y) có các thành phần biểu thị tốc độ thay đổi mức
xám của điểm ảnh (theo hai hƣớng x, y trong bối cảnh xử lý ảnh hai chiều) tức:

Trong đó dx, dy là khoảng cách giữa 2 điểm kế cận theo hƣớng x, y tƣơng ứng (thực tế
chọn dx= dy=1). Đây là phƣơng pháp dựa theo đạo hàm riêng bậc nhất theo hƣớng x, y.

Chương I: Kiến thức cơ bản về xử lý ảnh

9


GVHD Đậu Trọng Hiển
Cần lƣu ý rằng, do lạm dụng về ngôn từ, tuy ta lấy đạo hàm của ảnh nhƣng thực ra chỉ là
mô phỏng và xấp xỉ đạo hàm bằng kỹ thuật nhân chập do ảnh số là tín hiệu rời rạc, do vậy đạo
hàm không tồn tại.

 Kỹ thuật Gradient
Theo định nghĩa về Gradient, nếu áp dụng nó vào xử lý ảnh, việc tính toán sẽ rất phức tạp.
Để đơn giản mà không mất tính chất của phƣơng pháp Gradient, ngƣời ta sử dụng kỹ thuật
Gradient dùng cặp mặt nạ Hx, Hy trực giao (theo 2 hƣớng vuông góc). Nếu định nghĩa gx, gy
là Gradient theo hai hƣớng x, y tƣớng ứng thì biên độ g(m,n) tại điểm (m,n) đƣợc tính:
g(m,n) = √(gx2(m,n) + gy2(m,n) = A0
𝑔

𝜃𝑟 (m,n) = arctg( 𝑔𝑦 )
𝑥

Để giảm độ phức tạp tính toán, A0 đƣợc tính gần đúng nhƣ sau:
A0 = |gx(m,n)| + |gy(m,n)|
Tóm lại: Gradient đƣợc xấp xỉ với công thức

Gx = Hx ⨂ I
Gy = Hy ⨂ I
Và các toán tử dƣới đây có chung một thuật toán là:

Bƣớc 1: Tính I ⊗ Hx và I ⊗ Hy

Bƣớc 2: Tính I ⊗ Hx + I ⊗ Hy
Sau đây ta sẽ xét một số toán tử Gradient tiêu biểu nhƣ toán tử Sobel, Prewitt, đẳng
hƣớng (Isometric), 4-lân cận.
o Toán tử sobel
Toán tử Sobel đƣợc Duda và Hart đặt ra năm 1973 với các mặt nạ tƣơng tự nhƣ
của Robert nhƣng cấu hình khác nhƣ sau:
−1 0 1
Hx = −1 0 1
−1 0 1
Hƣớng ngang x

Chương I: Kiến thức cơ bản về xử lý ảnh

−1 −1 −1
Hy = 0
0
0
1
1
1
hƣớng dọc y

10



GVHD Đậu Trọng Hiển

Hình 1.3: Ảnh xám chƣa qua xử lý
sobel

Hình 1.4: Ảnh đƣợc làm nổi biên với toán tử

o Mặt nạ prewitt
Toán tử đƣợc Prewitt đƣa ra vào năm 1970 có dạng:
−1
Hx = −2
−1

0
0
0

1
2
1

−1 −2 −1
Hy = 0
0
0
1
2
1


Hình 1.5: Ảnh đƣợc làm nổi biên với mặt nạ prewitt
o Mặt nạ đẳng hƣớng
Một mặt nạ khác cũng đƣợc nêu nhƣ dƣới đây gọi là mặt nạ đẳng hƣớng
(Isometric).
−1
Hx = −√2
−1

0 1
0 √2
0 1

Chương I: Kiến thức cơ bản về xử lý ảnh

−1 −√2 −1
Hy = 0
0
0
1
1
√2

11


GVHD Đậu Trọng Hiển

Hình 1.6: Ảnh đƣợc làm nổi biên với mặt nạ đẳng hƣớng



Một vài so sánh giữa các mặt nạ trên:
o Toán tử Prewitt có thể tách sƣờn đứng tốt hơn toán tử Sobel, trong khi đó toán
tử Sobel tách các sƣờn trên các điểm ở đƣờng chéo tốt hơn.
o Mặt khác, các toán tử 4-lân cận có nhƣợc điểm là nhạy với nhiễu. Các toán tử
Gradient và Sobel giảm nhiễu do tác dụng của lọc trung bình các điểm lân cận.
o Nhƣ vậy, để đạt đƣợc kết quả mong muốn khi sử dụng các toán tử Gradient thì
ảnh dùng để xử lý phải đƣợc lọc nhiễu trƣớc.
o Các mặt nạ của các toán tử trên có kích thƣớc 2x2 hoặc 3x3 chiều. Các mặt nạ
có số chiều lớn hơn cũng đƣợc sử dụng. Ví dụ trong kỹ thuật phát hiện biên ngƣời
ta dùng mặt nạ 5x5 cho toán tử Sobel:

Hx =

2
2
2
2
2

1
1
1
1
1

0
0
0
0
0


-1
-1
-1
-1
-1

-2
-2
-2
-2
-2

Hy =

-2
-1
0
1
2

-2
-1
0
1
2

-2
-1
0

1
2

-2
-1
0
1
2

-2
-1
0
1
2

o Các toán tử kể trên đều sử dụng các mặt nạ theo hai chiều (x,y) tức là bốn
hƣớng (-x, y; -y, y). Với mục đích cho kết quả tinh và chính xác hơn (khi mà tốc
độ và bộ nhớ máy tính tốt).

 Toán tử la bàn
Kirsh đã đề xuất các mặt nạ theo 8 hƣớng nhƣ 8 hƣớng của la bàn (Compass). Hình 1.7 là
mô hình 8 hƣớng và đƣợc đặt tên theo hƣớng địa lý và theo chiều kim đồng hồ: Đông, ĐôngNam, Nam, Nam-Tây, Tây, Tây-Nam, Tây-Bắc, Bắc, Đông-Bắc; mỗi hƣớng lệch nhau 45o

Chương I: Kiến thức cơ bản về xử lý ảnh

12


GVHD Đậu Trọng Hiển




Hình 1.7: Mặt nạ 8 hƣớng theo Kirsh
Toán tử la bàn Kirsh

Có nhiều toán tử la bàn khác nhau. Trong phạm vi đề tài này, ta chỉ xem xét toán
tử la bàn Kirsh đặc trƣng bởi tám mặt nạ với kích thƣớc 3x3 nhƣ sau:
5
5
5
−3 5
5
−3 −3 5
HBắc = −3 0 −3 ; HĐông-Bắc = −3 0
5 ; HĐông = −3 0 5 ;
−3 −3 −3
−3 −3 −3
−3 −3 5
−3 −3 −3
−3 −3 −3
−3 −3 −3
HĐông-Nam = −3 0
5 ; HNam = −3 0 −3 ; HTây-Nam = 5
0 −3 ;
−3 5
5
5
5
5
5

5 −3
5 −3 −3
5
5 −3
HTây = 5 0 −3 ; HTây-Bắc = 5
0 −3
5 −3 −3
−3 −3 −3
Ký hiệu Ai; i= 1, 2, …, 8 là Gradient theo 8 hƣớng nhƣ 8 mặt nạ kể trên, khi đó biên độ
Gradient tại điểm ảnh (x,y) đƣợc tính theo:
A(x, y) = Max (|gi(x,y)|)
i =1, 2, …, 8.

Hình 1.8: Ảnh đƣợc làm nổi biên với toán tử la bàn
Chương I: Kiến thức cơ bản về xử lý ảnh

13


GVHD Đậu Trọng Hiển


Các toàn tử la bàn khác

Ngoài toán tử la bàn Kirsh, một số toán tử la bàn khác sử dụng bộ mặt nạ 8 hƣớng
khác nhƣ:
−1 −1
1 −1 −1
1 1 −1
;

H
=
;
H
=
−2 1
1 −2 −1
1 −2 −1 ;
Đông-Bắc
Đông
1
1
1 1
1
1 1 −1
1 1
1
1
1
1
1
1 1
HĐông-Nam = 1 −2 −1 ; HNam = 1 −2 1 ; HTây-Nam = −1 −2 1 ;
1 −1 −1
−1 −1 −1
−1 −1 1
−1 1 1
−1 −1 1
HTây = −1 −2 1 ; HTây-Bắc = −1 −2 1
−1 1 1

1
1 1
Trƣờng hợp tổng quát, ngƣời ta có thể mở rộng các mặt nạ với n hƣớng cách đều tƣơng
ứng với các mặt Wi; i=1, 2, …, n. Khi đó, biên độ tại hƣớng thứ i với mặt nạ Wi đƣợc xác
định:
HBắc =

−1
1
1

A(x,y) = Max( | gi(x,y) | )

với: i = 1, 2, ..., n.

Tóm lại: Các kỹ thuật sử dụng phƣơng pháp Gradient khá tốt khi độ sáng có tốc độ thay
đổi nhanh, khá đơn giản trên cơ sở các mặt nạ theo các hƣớng đã đƣợc định sẵn. Nhƣợc
điểm của các kỹ thuật Gradient là nhạy cảm với nhiễu và tạo các biên kép làm chất lƣợng
biên thu đƣợc không cao.

Kỹ thuật laplace
Để khắc phục hạn chế và nhƣợc điểm của phƣơng pháp Gradient, trong đó sử dụng đạo
hàm riêng bậc nhất ngƣời ta nghĩ đến việc sử dụng đạo hàm riêng bậc hai hay toán tử Laplace.
Phƣơng pháp dò biên theo toán tử Laplace hiệu quả hơn phƣơng pháp toán tử Gradient trong
trƣờng hợp mức xám biến đổi chậm, miền chuyển đổi mức xám có độ trải rộng.
Toán tử Laplace đƣợc định nghĩa nhƣ sau:
𝜕 2𝑓

𝜕 2𝑓


∇2 f = 𝜕 𝑥 2 + 𝜕 𝑦 2
𝜕2 𝑓
𝜕 𝜕𝑓
𝜕
=

𝑓 𝑥 + 1, 𝑦 − 𝑓 𝑥, 𝑦
𝜕𝑥 2 𝜕𝑥 2 𝜕𝑥
𝜕𝑥
≈ 𝑓 𝑥 + 1, 𝑦 − 𝑓 𝑥, 𝑦 − 𝑓 𝑥, 𝑦 − 𝑓 𝑥 − 1, 𝑦
≈ 𝑓 𝑥 + 1, 𝑦 − 2𝑓 𝑥, 𝑦 + 𝑓 𝑥 − 1, 𝑦
Tƣơng tự,
𝜕2𝑓
≈ 𝑓 𝑥, 𝑦 + 1 − 2𝑓 𝑥, 𝑦 + 𝑓 𝑥, 𝑦 − 1
𝜕𝑦 2
Vậy, ∇2 f= 𝑓 𝑥 + 1, 𝑦 − 4𝑓 𝑥, 𝑦 + 𝑓 𝑥 − 1, 𝑦 + 𝑓 𝑥, 𝑦 + 1 + 𝑓 𝑥, 𝑦 − 1
Dẫn tới,
Chương I: Kiến thức cơ bản về xử lý ảnh

14


GVHD Đậu Trọng Hiển
0 −1 0
H = −1 4 −1
0 −1 0
Ngoài ra, Toán tử Laplace còn dùng một số kiểu mặt nạ khác nhau nhằm tính gần đúng đạo
hàm riêng bậc hai. Các dạng mặt nạ theo toán tử Laplace bậc 3x3 có thể:
−1 −1 −1
1 −2 1

H1 = −1 8 −1
H2 = −2 5 −2
−1 −1 −1
1 −2 1

Hình 2.7: ảnh đƣợc làm nổi biên bằng kỹ thuật laplace

Phƣơng pháp canny
Phƣơng pháp Canny đƣợc phát triển bởi John F. Canny năm 1986 tại phòng thí nghiệm
ảnh thuộc MIT. Đây là phƣơng pháp khá phổ biến đƣợc dùng theo toán tử đạo hàm, nhƣ đã
nói, phƣơng pháp đạo hàm chịu ảnh hƣởng lớn của nhiễu. Và phƣơng pháp Canny này đã
khắc phục đƣợc nhƣợc điểm đó bằng cách sử dụng bộ lọc Gauss trƣớc khi lấy đạo hàm bậc
nhất.


Bộ lọc Gauss

Phƣơng pháp này cũng giống nhƣ những phƣơng pháp lọc ảnh đã đƣợc trình bày, ta cũng
tiến hành nhân chập mặt nạ Gauss với ảnh gốc thì chúng ta sẽ thu đƣợc ảnh kết quả đƣợc xử
lý bằng mạch lọc Gauss. Vai trò của bộ lọc Gauss cũng làm trơn ảnh nhƣ bộ lọc trung bình,
tuy nhiên bộ lọc Gauss cho chất lƣợng ảnh kết quả cao hơn vì có sự tập trung trọng số vào
pixel đang xét tại vị trí trung tâm. Và đây là một ví dụ về bộ lọc Gauss 5x5

1

H = 159 ×

Chương I: Kiến thức cơ bản về xử lý ảnh

2

4
5

4 5 4 2
9 12 9 4
12 15 12 5

4
2

9
4

12 9
5 4

4
2

15


×