Tải bản đầy đủ (.docx) (37 trang)

XỬ lý ẢNH NHẬN DIỆN HÌNH DẠNG vật THỂ (có code)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.27 MB, 37 trang )

XỬ LÝ ẢNH NHẬN DIỆN HÌNH DẠNG
VẬT THỂ


Page 2 of 38

MỤC LỤC
DANH MỤC CÁC HÌNH VẼ..............................................................................................V
DANH MỤC CÁC BẢNG BIỂU.......................................................................................VI
DANH MỤC CÁC TỪ VIẾT TẮT..................................................................................VII
CHƯƠNG 1. TỔNG QUAN XỬ LÝ ẢNH........................................................................8
1.1

GIỚI THIỆU..................................................................................................................8

1.2

CÁC VẤN ĐỀ CƠN BẢN TRONG XỬ LÝ ẢNH.................................................................8

1.2.1

Cơ bản về xử lý ảnh............................................................................................8

1.2.2

Ảnh và điểm ảnh.................................................................................................9

1.2.3

Khử nhiễu............................................................................................................9


1.2.4

Chỉnh mức xám...................................................................................................9

1.2.5

Trích chọn đặc điểm..........................................................................................10

1.2.6

Nhận dạng.........................................................................................................10

1.2.7

Nén ảnh.............................................................................................................11

CHƯƠNG 2. THU THẬP ẢNH VÀ TĂNG CƯỜNG CHẤT LƯỢNG ẢNH...........12
2.1

CƠ CHẾ NHẬN ẢNH PINHOLE...................................................................................13

2.2

CẢM BIẾN MÁY ÁNH (CCD).....................................................................................15

2.3

TĂNG CƯỜNG CHẤT LƯỢNG ẢNH..............................................................................16

2.3.1


Các kỹ thuật làm trơn ảnh................................................................................17

2.3.2

Làm trơn ảnh bằng lọc phi tuyến......................................................................17

2.3.3

Làm trơn lọc nhiễu bằng lọc tuyến tính...........................................................17

2.3.4

Gassian Blur.....................................................................................................19

2.3.5

Ứng dụng của làm trơn ảnh..............................................................................21

CHƯƠNG 3. CÁC PHƯƠNG PHÁP XỬ LÝ ẢNH CƠ BẢN......................................22
3.1

CÁC HÀM CHUYỂN ĐỔI KIỂU ẢNH............................................................................22

3.2

CHUYỂN ĐỔI ĐỊNH DẠNG CÁC FILE ẢNH..................................................................23

3.3


THAY ĐỔI KÍCH THƯỚC ẢNH.....................................................................................23


Page 3 of 38

3.4

DÒ BIÊN VÀ PHÂN VÙNG ẢNH..................................................................................26

3.4.1

Một số khái niệm...............................................................................................26

3.4.2

Phân loại các kỹ thuật phát hiện biên...............................................................27

3.4.3

Quy trình phát hiện biên...................................................................................28

3.4.4

Phương Pháp biên cục bộ.................................................................................28

3.4.5

Dò biên theo phương thức hoạt động...............................................................30

3.4.6


Phân vùng ảnh..................................................................................................32

CHƯƠNG 4. KẾT QUẢ MÔ PHỎNG XỬ LÝ ẢNH....................................................33
4.1

CHỨC NĂNG CỦA PHẦN MÔ PHỎNG..........................................................................34

4.2

CÁCH HOẠT ĐỘNG CỦA ĐOẠN CODE........................................................................34

CHƯƠNG 5. NHẬN XÉT..................................................................................................38
5.1

QUÁ TRÌNH THỰC HIỆN ĐỀ TÀI.................................................................................38

VỀ LÝ THUYẾT VÀ HIỂU RÕ HƠN VỀ PHẦN XỬ LÝ ẢNH.......................................................38

5.2

KHẢ NĂNG ỨNG DỤNG VÀO THỰC TẾ.......................................................................38

5.3

HƯỚNG PHÁT TRIỂN.................................................................................................38

CHƯƠNG 6. TÀI LIỆU THAM KHẢO..........................................................................39



Page 4 of 38

DANH MỤC CÁC HÌNH VẼ
HÌNH 1.1 QUÁ TRÌNH XỬ LÝ ẢNH..............................................................................10
HÌNH 1.2 CÁC BƯỚC CƠ BẢN TRONG HỆ THỐNG XỬ LÝ ẢNH.......................10
HÌNH 2.1 CẤU TẠO CỦA MỘT CAMERA SỐ.............................................................13
HÌNH 2.2 NGUYÊN LÝ TẠO ẢNH QUA KHE HẸP....................................................14
HÌNH 2.3 MÁY ẢNH PINHOLE CỔ ĐIỂN...................................................................14
HÌNH 2.4 MÁY ẢNH DSLR VỚI "ỐNG KÍNH" POHOLE.......................................15
HÌNH 2.5 CẤU TRÚC CỦA 1 CCD..................................................................................17
HÌNH 2.6 CỬA SỔ LỌC TRONG 1D VÀ 2D................................................................19
HÌNH 2.6 CAMERA ỨNG DỤNG LỌC..........................................................................23
HÌNH 3.1 : ẢNH TRƯỚC VÀ SAU KHI IMRESIZE...................................................25
HÌNH 3.2 CÁC LOẠI ĐƯỜNG BIÊN..............................................................................29
HÌNH 4.1 GIAO DIỆN GUI...............................................................................................36
HÌNH 4.2 HÌNH MÀU XÁM.............................................................................................37
HÌNH 4.3 HÌNH ẢNH NHỊ PHÂN...................................................................................38
HÌNH 4.4 HÌNH ẢNH NHỊ PHÂN ĐÃ ĐƯỢC INVERT..............................................38
HÌNH 4.5 HÌNH ẢNH SAU KHI ĐÃ ĐƯỢC NHẬN DIZ............................................39


Page 5 of 38

DANH MỤC CÁC BẢNG BIỂU


Page 6 of 38

DANH MỤC CÁC TỪ VIẾT TẮT
CCD


Charge Couple Device

ADC

Analog to digital converter


Page 7 of 38

CHƯƠNG 1.

TỔNG QUAN XỬ LÝ ẢNH

1.1 Giới thiệu
Xử lý ảnh là một lĩnh vực đã và đang rất phát triển. Khái niệm có liên quan tới nhiều
ngành học và hướng nghiên cứu khác nhau. Hệ thống xử lý ảnh bao gồm lý thuyết và các
kỹ thuật liên quan nhằm mục đích tạo ra một hệ thống nhân tạo có thể tiếp nhận thông tin
từ các hình ảnh thu được hoặc các tập dữ liệu đa chiều. Xử lý ảnh có thể kết hợp với nhiều
ngành khác nhau như công nghệ thông tin, truyền thông, điện tử, điều khiển tự động, cơ
khí… cho chúng ta rất nhiều ứng dụng trong đời sống hàng ngày. Ngày nay, ứng dụng của
xử lý ảnh đã phổ biến rộng rãi hơn vào mọi lĩnh vực từ quân sự, khoa học, vũ trụ, cho đến y
học, sản xuất, và tự động hóa tòa nhà.
1.2 Các vấn đề cơn bản trong xử lý ảnh
1.1.1 Cơ bản về xử lý ảnh
Con người thu nhận thông tin qua các giác quan, trong đó thị giác đóng vai trò quan trọng
nhất. Những năm trở lại đây với sự phát triển củaphần cứng máy tính, xử lý ảnh và đồ hoạ
đó phát triển một cách mạnh mẽ và có nhiều ứng dụng trong cuộc sống. Xử lý ảnh và đồ hoạ
đóng một vaitrò quan trọng trong tương tác người máy.
Quá trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào nhằm cho ra kết quả

mong muốn. Kết quả đầu ra của một quá trình xử lýảnh có thể là một ảnh “tốt hơn” hoặc một
kết luận.

Ảnh đã xử lý
Ảnh

Xử lý ảnh
Kết luận


Page 8 of 38

Hình 1.1 Quá trình xử lý ảnh

Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh được xem
như là đặc trưng của cường độ sáng hay một dấu hiệu nào đó tại một vị
trí nào đó của đối tượng trong không gian và nó có thể xem như một hàm
n biến P (c1, c2, c3…). Do đó ảnh trong xử lý ảnh có thể xem như ảnh n chiều.

Hình 1.2 Các bước cơ bản trong hệ thống xử lý ảnh

1.1.2 Ảnh và điểm ảnh
Điểm ảnh được xem như là dấu hiệu hay cường độ sáng tại một tọa độ trong không gian
của đối tượng và ảnh được xem như là một tập hợp các điểm ảnh.
1.1.3 Khử nhiễu
Có 2 loại nhiễu cơ bản trong quá trình thu nhận ảnh:
 Nhiễu hệ thống: là nhiễu có quy luật có thể khử bằng các phép biến đổi


Nhiễu ngẫu nhiên: vết bẩn không rõ nguyên nhân → khắc phục bằng các phép lọc


1.1.4 Chỉnh mức xám
Nhằm khắc phục tính không đồng đều của hệ thống gây ra. Thông thường có 2 hướng
tiếp cận:
 Giảm số mức xám: Thực hiện bằng cách nhóm các mức xám gần nhau thành một
bó. Trường hợp chỉ có 2 mức xám thì chính là chuyển về ảnh đen trắng. Ứng dụng: In ảnh
màu ra máy in đen trắng.


Tăng số mức xám: Thực hiện nội suy ra các mức xám trung gianbằng kỹ thuật nội

suy. Kỹ thuật này nhằm tăng cường độ mịn cho ảnh.


Page 9 of 38

1.1.5 Trích chọn đặc điểm
Các đặc điểm của đối tượng được trích chọn tuỳ theo mục đích nhận dạng trong quá trình
xử lý ảnh. Có thể nêu ra một số đặc điểm của ảnh sau đây:
 Đặc điểm không gian: Phân bố mức xám, biên độ, điểm uốn,…
 Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc thực hiện
lọc vùng (zonal filtering). Các bộ vùng được gọi là “mặt nạ đặc 10 điểm” (feature mask)
thường là các khe hẹp với hình dạng khác nhau (chữ nhật, tam giác, cung tròn v.v..)
 Đặc điểm biên và đường biên: Đặc trưng cho đường biên của đối tượng và do
vậy rất hữu ích trong việc trích trọn các thuộc tính bất biến được dùng khi nhận dạng đối
tượng. Các đặc điểm này có thể được trích chọn nhờ toán tử gradient, toán tử la bàn, toán
tử Laplace, toán tử “chéo không” (zero crossing) v.v..
1.1.6 Nhận dạng
Nhận dạng tự động (automatic recognition), mô tả đối tượng, phân loại và phân nhóm các
mẫu là những vấn đề quan trọng trong thị giác máy, được ứng dụng trong nhiều ngành khoa

học khác nhau.
Hệ thống nhận dạng tự động bao gồm ba khâu tương ứng với ba giai
đoạn chủ yếu sau đây:
1. Thu nhận dữ liệu và tiền xử lý.
2. Biểu diễn dữ liệu.
3. Nhận dạng, ra quyết định.
Bốn cách tiếp cận khác nhau trong lý thuyết nhận dạng là:
1. Đối sánh mẫu dựa trên các đặc trưng được trích chọn.
2. Phân loại thống kê.
3. Đối sánh cấu trúc.
4. Phân loại dựa trên mạng nơ-ron nhân tạo.
1.1.7 Nén ảnh


Page 10 of 38

Nhằm giảm thiểu không gian lưu trữ. Thường được tiến hành theo cả hai cách khuynh
hướng là nén có bảo toàn và không bảo toàn thông tin. Nén không bảo toàn thì thường có
khả năng nén cao hơn nhưng khả năng phục hồi thì kém hơn.

CHƯƠNG 2.

THU THẬP ẢNH VÀ TĂNG CƯỜNG
CHẤT LƯỢNG ẢNH

Trong công nghệ xử lý ảnh thì công đoạn đầu tiên là chụp ảnh, nghĩa là chúng ta lấy được
dữ liệu của 1 bức ảnh trước khi xử lý. Để làm được việc đó cần phải có thiết bị chụp ảnh mà
phổ biến là các camera. Chất lượng của bức ảnh được quyết định cấu tạo và chất lượng của
camera.
Về cơ bản, cấu tạo một camera số hay máy chụp hình kỹ thuật số gồm:



Page 11 of 38

Hình 2.1 Cấu tạo

của một camera số

Chất lượng hình

ảnh phụ thuộc nhiều

vào tốc độ cửa sập

và cảm biến thu nhận

ảnh.

đó,

phương pháp thu nhận

ảnh Pinhole được sử

dụng phổ biến trong

hầu hết các máy ảnh

hiện nay.


1.3 Cơ chế nhận ảnh

PinHole

Trong

Nguyên lý của

nhiếp ảnh pinhole dựa

trên một hiện tượng quang học vốn được khám phá hàng ngàn năm trước: Hiện tượng tạo
ảnh qua khe hẹp.

Hình 2.2 Nguyên lý tạo ảnh qua khe hẹp.


Page 12 of 38

Cấu tạo rất đơn giản: chúng là những hộp kín được đục lỗ nhỏ để tiếp nhận ánh sáng từ
bên ngoài. Hình ảnh sẽ được thu nhận trên phim hoặc tấm nhạy sáng đặt bên trong hộp.
Chính cái lỗ nhỏ trên thân máy giữ được chức năng của một ống kính máy ảnh.So với ống
kính thông thường, “ống kính” pinhole có độ mở nhỏ hơn hàng chục cho đến hàng trăm lần.
Đường kính của “lỗ kim” này càng nhỏ, bề dày càng mỏng thì ảnh thu được càng nét.

Hình 2.3 Máy ảnh pinhole cổ điển
Do độ mở của lỗ kín quá nhỏ, nên việc truyền tải ảnh tốt khá nhiều thời gian, và ảnh của
ống kính Pinhole thì thường bị mờ và đen ở góc. Ưu điểm duy nhất là ảnh không bị méo
hình ở mọi góc độ do không chịu hiện tượng cầu sai của thấu kính.

Hình 2.4 Máy ảnh DSLR với "ống kính" pohole

1.4 Cảm biến máy ánh (CCD)


Page 13 of 38

Camera CCD (Charge CoupleDevice) là một thiết bị thu nhận ảnh dưới dạng tín hiệu
số bằng cách thu nhận cường độ sáng tại từng điểm thông qua một loại linh kiện có tên là
photo diode. Cường độ sáng tại mỗi điểm này sẽ được mã hoá thành 3 giá trị màu cơ bản là
RED, GREEN, BLUE theo lý thuyết màu do Thomson đưa ra năm 1802. Ảnh nhận được từ
Camera loại này là một ma trận Vector:

R 
G 
[ p ]ij   
B 
 
 A

(3-1)

Hình 2.5 Cấu trúc của 1 CCD

1.5 Tăng cường chất lượng ảnh
Nâng cao chất lượng ảnh gồm hai công đoạn khác nhau: tăng cường ảnh và khôi phục
ảnh. Tăng cường ảnh nhằm hoàn thiện các đặc tính của ảnh như sau :
 Lọc nhiễu
 Tăng độ tương phản, điều chỉnh mức xám của ảnh


Page 14 of 38


 Làm nổi biên ảnh
1.1.8 Các kỹ thuật làm trơn ảnh
 Lọc trung bình (Mean Filter)
 Lọc thông thấp (Low pass Filter)
 Lọc đồng hình (Homomorphie Filter)
 Gaussian Blur
1.1.9 Làm trơn ảnh bằng lọc phi tuyến
 Lọc trung vị (Median Filter)
 Lọc ngoài (Outlier Filter)
 Lọc loại bỏ nhiễu đốm Crimmins (Crimmins Speckle Removal)
 Bộ lọc giữ biên (Kuwahara Filter)
1.1.10 Làm trơn lọc nhiễu bằng lọc tuyến tính
Lọc trung bình là bộ lọc sử dụng cửa sổ lọc của lớp tuyến tính(linear class) để lọc
nhiễu và làm trơn ảnh. Ý tưởng cơ bản của bộ lọc này là thay thế giá trị tại mỗi điểm ảnh
bằng trung bình các giá trị của các điểm lân cận nhằm loại bỏ những điểm ảnh biến đổi lớn
so với điểm lân cận(nhiễu), và những điểm ảnh nằm trên biên cũng có sự biến đổi lớn so với
lân cận. Chúng ta cùng xem một số ví dụ về cửa sổ lọc trong kĩ thuật lọc trung bình.


Page 15 of 38

Hình 2.6 Cửa sổ

lọc trong 1D và 2D

Lọc trung bình

được


bằng công thức

toán học như sau:

biểu

diễn

Nếu trong kỹ thuật trên ta dùng các trọng số(của cửa sổ lọc) như nhau, phương trình trên sẽ
trở thành :

Với : f(x,y) : ảnh đầu vào
g(x,y): ảnh đầu ra
a(k,l): cửa sổ lọc(mặt nạ)
Ưu điểm : Là bộ lọc tuyến tính đơn giản trong tính toán. Ảnh đạt độ trơn mịn.
Khuyết điểm: Không hoàn toàn loại bỏ các tác dụng của nhiễu, các điểm ảnh đơn
lẻ(nhiễu) sẽ ảnh hưởng đến giá trị trung bình của các pixel lân cận. Độ sắc nét
ảnh kém. Độ tương phản thấp.
1.1.11 Gassian Blur
Gaussian blurring là cách làm mờ một ảnh bằng hàm Gaussian. Phương pháp này được ứng
dụng rộng rãi và hiệu quả trong các phần mềm xử lý đồ họa. Nó cũng là công cụ phổ biến để


Page 16 of 38

thực hiện quá trình tiền xử lý hình ảnh dùng để làm dữ liệu đầu vào tốt cho các phân tích cao
cấp hơn trong Computer Vision, hoặc cho các giải thuật được thực hiện trong một tỉ lệ khác
của hình đã được cho.

Hình 2.7 Phương sai


của phân tán Gaussian

Với x, y là tọa độ

theo hai trục đứng và ngang.

Trong không gian hai chiều, công thức này sản sinh ra những đường viền là những đường
tròn đồng tâm, tuân theo logic phân tán Gausian từ điểm trung tâm. Giá trị từ hệ thống phân
tán này sẽ được sử dụng để xây dựng một ma trận tích chập dùng tính toán phép tích chập
với ảnh gốc.

1.1.12 Ứng dụng của làm trơn ảnh
Xét ở khía cạnh nào đó, ta có thể nói làm trơn ảnh sử dụng khá phổ biến trong nhiều lĩnh
vực như giải trí, y học, an ninh và một số lĩnh vực khá. Làm trơn ảnh nếu nó đứng riêng lẻ
thì nó chỉ có mỗi chức năng là làm mịn ảnh, và giảm nhiễu. Nhưng khi đặt nó vào trong quy
trình xử lý thì nó rất quan trọng, kết quả của nó giúp các xử lý phía sau chính xác hơn


Page 17 of 38

Hình 2.8 Camera ứng dụng lọc

CHƯƠNG 3.

CÁC PHƯƠNG PHÁP XỬ LÝ ẢNH CƠ BẢN

Xử lý ảnh là bước cần thực hiện trước khi đưa ra các quyết định về hình ảnh. Việc sử
dụng phần mềm Matlab hỗ trợ rất trong trong xử lý ảnh.
1.6 Các hàm chuyển đổi kiểu ảnh

Với các thao tác nhất định sẽ thật hữu ích khi có thể chuyển đổi ảnh từ dạng này sang
dạng khác. Khi ta áp dụng phép lọc tới ảnh RGB, Matlab sẽ lọc giá trị cường độ trong ảnh
tương ứng. Nếu ta cố gắng lọc ảnh chỉ số, Matlab đơn giản chỉ áp đặt phép lọc tới ma trận
ảnh chỉ số và kết quả sẽ không có ý nghĩa.
Chú ý: Khi chuyển đổi một ảnh từ dạng này sang dạng khác, ảnh kết quả có thể khác ảnh ban
đầu. Chẳng hạn, nếu ta chuyển đổi một ảnh màu chỉ số sang một ảnh cường độ, kết quả ta sẽ
thu được một ảnh đen trắng.
Danh sách sau đây sẽ liệt kê các hàm được sử dụng trong việc chuyển đổi kiểu ảnh:
 dither: Tạo một ảnh nhị phân từ một ảnh cường độ đen trắng bằng cách
trộn, tạo một ảnh chỉ số từ một ản RGB bằng cách trộn (dither).


Page 18 of 38

 gray2id: Tạo một ảnh chỉ số từ một ảnh cường độ đen trắng.
 grayslice: Tạo một ảnh chỉ số từ một ảnh cường độ đen trắng bằng cách đặt
ngưỡng.
 im2bw: Tạo một ảnh nhị phân từ một ảnh cường độ, ảnh chỉ số hay ảnh
RGB trên cơ sở của ngưỡng ánh sáng.
 ind2gray: Tạo một ảnh cường độ đen trắng từ một ảnh chỉ số.
 ind2rgb: Tạo một ảnh RGB từ một ảnh chỉ số.
 mat2gray: Tạo một ảnh cường độ đen trắng từ dữ liệu trong một ma trận bằng
cách lấy tỉ lệ giữ liệu.
 rgb2gray: Tạo một ảnh cường độ đen trắng từ một ảnh RGB.
 rgb2ind: Tạo một ảnh chỉ số từ một ảnh RGB.
Ảnh RGB thu được có các ma trận đồng nhất cho các mặt phẳng R, G, B vì vậy ảnh hiển
thị giống như bóng xám.Thêm vào những chức năng chuyển đổi chuẩn đã nói ở trên, cũng
có một số hàm đã có sẵn mà trả lại kiểu ảnh khác một phần mà chúng ta thực hiện. Chuyển
đổi không gian màu.
Toolbox xử lý ảnh biểu diễn màu sắc như các giá trị RGB ( trực tiếp trong ảnh chỉ số).

Tuy nhiên, có các phương pháp khá cho nhiều giá trị cụ thể và tinh tế hơn như: hue,
saturation và các giá trị thành
Toolbox cung cấp một tập các hàm để chuyển đổi giữa các không gian chúng coi dữ
liệu màu sắc dưới dạng RGB tuy nhiên, ta có thể xử lý một ảnh màu khác nhau bằng cách
chuyển đổi nó thành RGB và chuyển đổi lại ảnh màu ban đầu.
1.7 Chuyển đổi định dạng các file ảnh
Để thay đổi định dạng đồ hoạ của một ảnh, sử dụng hàm imread để đọc m
hàm imwrite đồng thời chỉ ra định dạng tương ứng.
Để minh hoạ, ví dụ sau đây sử dụng hàm imread để đọc một file BMP vào hàm imwrite
lưu ảnh này dưới định dạng PNG
bitmap = imread('mybitmap.bmp','bmp'); imwrite(bitmap,'mybitmap.png','png');
1.8 Thay đổi kích thước ảnh
Để thay đổi kích thước của một ảnh, sử dụng hàm imresize. Sử dụng hàm này ta có thể:
 Chỉ ra kích thước của ảnh.
 Chỉ ra phương pháp nội suy đã được sử dụng.


Page 19 of 38



Chỉ ra bộ lọc để ngăn ngừa hiện tượng răng cưa.

Sử dụng hàm imresize, ta có thể chỉ ra kích thước của ảnh kết quả theo hai cách:
 Bằng cách chỉ ra hệ số phóng đại trên màn hình.
 Bằng cách chỉ ra chiều của ảnh
Sử dụng hệ số phóng đại ảnh để mở rộng một ảnh cần xử lý, chỉ ra được các hệ số phóng
đại lớn hơn 1. Để thu nhỏ một ảnh, đưa ra hệ số phóng đại nằm giữa 0 và 1. Chẳng hạn, lệnh
sau tăng kích thước của ảnh II lên 1.6 lần.


Hình 3.1 : Ảnh trước và sau khi imresize

I = imread('circuit.tif');
J = imresize(I,1.25);
imshow(I)
figure, imshow(J)
Chỉ định kích thước của ảnh ra
- Ta có thể chỉ ra kích thước của ảnh ra bằng cách truyền một vectơ chứa số lượng hàng và
cột của ảnh sau cùng. Những lệnh sau đây tạo một ảnh ra Y với 100 hàng và 150 cột.
Y = imresize(X,[100 150])
Chú ý: Nếu kích thước được chỉ ra không có cùng tỉ lệ với ảnh vào, ảnh ra sẽ bị biến dạng.
Chỉ định phương pháp nội suy được sử dụng.
- Theo mặc định, hàm imresize sử dụng phương pháp nội suy các pixel gần nhất (nearest –
neighborinterpolation) để tính giá trị các pixel của ảnh ra. Bảng sau đây liệt kê các phương
pháp nội suy để hỗ trợ từ phương pháp đến con người.


Page 20 of 38

Bảng 3.1 Phương pháp nội suy

Sử dụng bộ lọc để ngăn chặn hiện tượng răng cưa
Chú ý: Thậm chí đã sử dụng một bộ lọc thông thấp, chất lượng của ảnh vẫn bị ảnh hưởng do
thông tin luôn bị mất trong quá trình nội suy
- Hàm imresize không sử dụng được cho bộ lọc thông thấp được, và cung cấp các hàm nội
suy để thực hiện công việc xử lý ảnh. Phương pháp nội suy này ban đầu được sử dụng với
các ảnh chỉ số và bộ lọc thông thấp không thích hợp cho kiểu ảnh này.
- Ta cũng có thể chỉ ra một bộ lọc tự tạo thay cho các bộ lọc có sẵn.
Hàm imresize
Cú pháp của hàm này như sau:

B = imresize(A,m) B = imresize(A,m,method)
B = imresize(A,[mrowsncols],method)
B = imresize(...,method,n) B = imresize(...,method,h)
Diễn giải
+ B=imresize(A,m): Trả lại một ảnh B lớn gấp m lần ảnh A (kích thước hình
học) sử dụng phương pháp nội suy mặc định (nearest - neighbor interpolcation). A có thể là
một ảnh chỉ số, ảnh đen trắng, RGB hoặc ảnh nhị phân.
+ B=imresize(A,m,method): Trả lại một ảnh lớn gấp m lần ảnh A sử dụng
phương pháp nội suy method.
+ B=imresize(A, [mrows ncols],method): Trả lại một ảnh với kích thước được chỉ ra
bởi vector. Nếu kích thước được chỉ ra không cùng tỉ lệ với ảnh vào, ảnh sẽ bị biến dạng .
Khi kích thước của ảnh ra nhỏ hơn kích thước của ảnh vào và phương pháp nội suy được sử
dụng là ‘bilinear’ hoặc ‘bicubic’, hàm imresize áp đặt một bộ lọc thông thấp.
Ta có thể chỉ ra một thứ tự khác cho bộ lọc mặc định sử dụng cấu trúc:
B=imresize(…,method,n): n là một số nguyên chỉ ra kích thước của bộ lọc – nxn. Nếu n=0,
hàm imresizebỏ qua bước lọc. Ta cũng có thể chỉ ra bộ lọc riêng sử dụng cú pháp
B=imresize(…,method,h): Trong đó h là một bộ lọc FIR hai chiều ( có thể được trả về bởi
các hàm ftrans2, fwind1, fwind2 hoặc fsamp2 ).


Page 21 of 38

1.9 Dò biên và phân vùng ảnh
1.1.13 Một số khái niệm
Điểm Biên: Một điểm ảnh được coi là điểm biên nếu có sự thay đổi nhanh hoặc đột
ngột về mức xám (hoặc màu).
Đường biên (đường bao: boundary): gồm tập hợp các điểm biên xếp liên tiếp tạo thành
một đường hay đường bao.
Ý nghĩa của đường biên trong xử lý: ý nghĩa đầu tiên: đường biên là một loại đặc
trưng được dùng trong phân tích, nhận dạng ảnh. Thứ hai, người ta sử dụng biên làm

phân cách các vùng xám (màu) cách biệt.
Tầm quan trọng của biên: để thấy rõ tầm quan trọng của biên, xét ví dụ sau: khi người
họa sỹ muốn vẽ một danh nhân, họa sỹ chỉ cần vẽ vài đường nứt tốc họa mà không cần
vẽ một cách đầy đủ.
Mô hình biểu diễn đường biên, theo toán học: điểm ảnh có sự biến đổi mức xám u(x)
một cách đột ngột theo hình dưới.

Hình 3.2 Các loại đường biên

1.1.14 Phân loại các kỹ thuật phát hiện biên
Từ định nghĩa toán học của biên người ta sử dụng hai phương pháp phát hiện biên như sau
(phương pháp chính)
1. Phương pháp phát hiện biên trực tiếp: phương pháp này chủ yếu dựa vào sự biến
thiên độ sáng của điểm ảnh để làm nổi biên bằng kỹ thuật đạo hàm.
• Nếu lấy đạo hàm bậc nhất của ảnh: ta có phương pháp Gradient
• Nếu lấy đạo hàm bậc hai của ảnh: ta có phương pháp Laplace.
2. Phương pháp phát hiện biên gián tiếp: Nếu bằng cách nào đấy, chúng ta thu
đượng các vùng ảnh khác nhau thì đường phân cách giữa các vùng đó chính là biên. Nói
cách khác, việc xác định đường bao của ảnh được thực hiện từ ảnh đã được phân vùng.


Page 22 of 38

Phương pháp dò biên gián tiếp khó cài đặt nhưng áp dụng tốt khi sự biến thiên độ sáng
nhỏ.
Chú ý: Kỹ thuật dò biên và phân vùng ảnh là hai bài toán đối ngẫu của nhau.
1.1.15 Quy trình phát hiện biên
B1: Do ảnh ghi được thường có nhiễu, bước một là phải lọc nhiễu theo các phương pháp
đã tìm hiểu ở các phần trước.
B2: Làm nổi biên sử dụng các toán tử phát hiện biên.

B3: Định vị biên. Chú ý rằng kỹ thuật nổi biên gây tác dụng phụ là gây nhiễu làm một số
biên giả xuất hiện do vậy cần loại bỏ biên giả.
B4: Liên kết và trích chọn biên.
1.1.16 Phương Pháp biên cục bộ
1.1.1.1 Phương pháp Gradient
Định nghĩa: Gradient là một vec tơ f(x, y) có các thành phần biểu thị tốc độ
thay đổi mức xám của điểm ảnh (theo hai hướng x, y trong bối cảnh xử lý ảnh hai
chiều) tức:

Trong đó dx, dy là khoảng cách giữa 2 điểm kế cận theo hướng x, y tương ứng (thực tế chọn
dx= dy=1). Đây là phương pháp dựa theo đạo hàm riêng bậc nhất theo hướng x, y.
Gradient trong tọa độ góc (r,θ), với r là véc tơ, θ: góc


Page 23 of 38

a. Kỹ thuật Gradient. Theo định nghĩa về Gradient, nếu áp dụng nó vào xử lý
ảnh, việc tính toán sẽ rất phức tạp. Để đơn giản mà không mất tính chất của phương
pháp Gradient, người ta sử dụng kỹ thuật Gradient dùng cặp mặt nạ H1, H2 trực giao
(theo 2 hướng vuông góc). Nếu định nghĩa g1, g2 là Gradient theo hai hướng x, y
tướng ứng thì biên độ g(m,n) tại điểm (m,n) được tính:

’’
 Toán tử (mặt nạ) Sobel.
Toán tử Sobel được Duda và Hart đặt ra năm 1973 với các mặt nạ tương tự như của
Robert nhưng cấu hình khác như sau:

• Mặt nạ Prewitt
Toán tử được Prewitt đưa ra vào năm 1970 có dạng:


• Mặt nạ hướng:
Một mặt nạn khác cũng được nêu như dưới đây gọi là mặt nạ đẳng hướng
(Isometric).


Page 24 of 38

1.1.17 Dò biên theo phương thức hoạt động
Như trên đã nói, dò biên theo phương pháp Gradient là xác định cực trị cục bộ
của Gradient theo các hướng; còn phương pháp Laplace dựa vào cắt điểm không của đạo
hàm bậc hai. Phương pháp dò biên theo quy hoạch động là phương pháp tìm cực trị tổng
thể theo nhiều bước. Nó dựa vào nguyên lý tối ưu của Bellman. Nguyên lý này phát biểu
như sau: “Con đường tối ưu giữa 2 điểm cho trước cũng là tối ưu giữa 2 điểm bất kỳ nằm
trên đường tối ưu đó”.
Thí dụ, nếu C là một điểm trên con đường tối ưu giữa A và B thì đoạn CB cũng là còn
đường tối ưu từ C đến B không kể đến ta đến C bằng cách nào

Hình 3.3 Ví dụ của phương pháp Bellman

Trong kỹ thuật này, giả sử bản đồ biên đã được xác định và được biểu diễn dưới dạng
đồ thị liên thông N chặng. Giả sử hàm đánh giá được tính theo công thức:
Đường bao tói ưu sẽ nhận được bằng cách nối các đỉnh S(x1,…, xN, N ) đạt cực đại.
Định nghĩa hàm φ như sau:


Page 25 of 38

Với cách này, thay
vì tìm tối ưu toàn cục
phức tạp của S(x1, …

,xN, N), ta tìm tối ư
của N chặng theo tối ưu 2 biến. Trong mỗi chặng, với mỗi xk tìm tối ưu φ ( x k , k ) . Để
dễ hình dung, xét ví dụ sau:
Giả sử có bản đồ biểu diễn bởi đồ thị liên thông . Theo phương pháp trên có φ ( A 1, )=
5 , với k =2 có φ ( D , 2 ) = max(11,12)= 12 . Điều đó có nghĩa là đường từ A đến D đi qua
C và ACD là biên được chọn với k=2. Tương tự, với k=4, có hai đường được chọn
là ACDEF và AGHJ. Tuy nhiên, với k=5 thì đoạn JB bị loại và chỉ tồn tại đường duy nhất
với cực đại là 28. Như vậy, biên được xác định là ADEFB.


×