Tải bản đầy đủ (.doc) (37 trang)

Báo cáo xử lý ảnh nhận dạng khối cơ bản matlab

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.04 MB, 37 trang )

Tiểu luận môn học Xử Lý Ảnh
MỞ ĐẦU
Xử lý ảnh là một lĩnh vực đã và đang rất phát triển. Khái niệm xử lý ảnh có liên
quan tới nhiều ngành học và hướng nghiên cứu khác nhau. Từ những năm 1970 khi
mà năng lực tính toán của máy tính ngày càng trở nên mạnh mẽ hơn, các máy tính lúc
này có thể xử lý được những tập dữ liệu lớn như các hình ảnh, các đoạn phim thì khái
niệm và kỹ thuật về thị giác máy ngày càng được nhắc đến và nghiên cứu
nhiều hơn cho tới ngày nay.Hệ thống xử lý ản bao gồm lý thuyết và các kỹ thuật
liên quan nhằm mục đích tạo ra một hệ thống nhân tạo có thể tiếp nhận thông tin từ
các hình ảnh thu được hoặc các tập dữ liệu đa chiều. Việc kết hợp các kỹ thuật khác
như công nghệ thông tin, truyền thông, điện tử, điều khiển tự động, cơ khí… cho
chúng ta rất nhiều ứng dụng trong đời sống hàng ngày cũng như trong khoa học, an
ninh, quân sự… Ngày nay, ứng dụng của xử lý ảnh đã trở nên rất rộng lớn và đa dạng,
len lỏi vào mọi lĩnh vực từ quân sự, khoa học, vũ trụ, cho đến y học, sản xuất, và tự
động hóa tòa nhà.
Trang 1
Tiểu luận môn học Xử Lý Ảnh
Mục lục
Chương 1: Thu thập ảnh
1.1. Cơ chế thu thập ảnh Pinhole……………………………… 2
1.2. Cảm biến CCD…………………………………………… 6
Chương 2: Xử lý tăng cường chất lượng ảnh.
2.1. Lọc nhiễu………………………………………………… 12
2.2. Tăng cường độ sáng, độ tương phản ảnh………………… 14
Chương 3: Các phương pháp xử lý ảnh cơ bản.
3.1. Tăng giảm kích thước……………………………………… 16
3.2. Xoay ảnh…………………………………………………… 18
3.3. Biến đổi không gian màu ảnh (RGB)…………………………21
Chương 4: Dò biên và phân vùng ảnh.
4.1. Kỹ thuật dò biên………………………………………………24
4.2. Phân vùng ảnh……………………………………………… 30


Chương 5: Nhận dạng đối tượng ảnh……………………………… 38
Phụ lục: Code Matlab nhận dạng hình tròn……………………………….40
Trang 2
Tiểu luận môn học Xử Lý Ảnh
CHƯƠNG 1: PHƯƠNG PHÁP THU THẬP ẢNH
Trong công nghệ xử lý ảnh thì công đoạn đầu tiên là chụp ảnh, nghĩa là chúng
ta lấy được dữ liệu của 1 bức ảnh trước khi xử lý. Để làm được việc đó cần phải có
thiết bị chụp ảnh mà phổ biến là các camera. Chất lượng của bức ảnh được quyết định
cấu tạo và chất lượng của camera.
Về cơ bản, cấu tạo một camera số hay máy chụp hình kỹ thuật số gồm:
Chất lượng hình ảnh phụ thuộc nhiều vào tốc độ cửa sập và cảm biến thu nhận
ảnh. Trong đó, phương pháp thu nhận ảnh Pinhole được sử dụng phổ biến trong
hầu hết các máy ảnh hiện nay.
1. Cơ chế thu nhận ảnh pinhole:
Trang 3
Tiểu luận môn học Xử Lý Ảnh
Nguyên lý của nhiếp ảnh pinhole dựa trên một hiện tượng quang học vốn được
khám phá hàng ngàn năm trước: Hiện tượng tạo ảnh qua khe hẹp.
Nguyên lý tạo ảnh qua khe hẹp.
Từ nguyên lý quang học này, những chiếc máy ảnh pinhole đã ra đời vào giữa thế kỷ
19. Cấu tạo của những chiếc máy ảnh này rất đơn giản: chúng chỉ là những hộp kín
được đục một lỗ rất nhỏ để tiếp nhận ánh sáng. Hình ảnh sẽ được thu nhận trên phim
hoặc tấm nhạy sáng đặt bên trong hộp. Chính cái lỗ nhỏ trên thân máy ảnh pinhole giữ
chắc năng như một ống kính máy ảnh.So với ống kính thông thường, “ống kính”
pinhole có độ mở nhỏ hơn hàng chục cho đến hàng trăm lần, và tất nhiên là không sử
dụng một thấu kính nào cả. Đường kính của “lỗ kim” này càng nhỏ, bề dày càng
mỏng thì ảnh thu được càng nét.
Máy ảnh pinhole cổ điển có cấu tạo rất đơn giản.
Trang 4
Tiểu luận môn học Xử Lý Ảnh

Do độ mở quá nhỏ, ảnh pịnhole rất rối, đòi hỏi thời gian phơi sáng dài, tùy từng
hoàn cảnh mà có thể là vài giây, vài phút cho đến vài ngày. Cũng do độ mở nhỏ, độ
sâu trường ảnh gần như là vô hạn, độ nét ở tất cả mọi điểm trên tấm ảnh là ngang bằng
nhau.Vệ mặt chất lượng, ảnh pinhole thường bị mờ, đen ở góc và sai sắc. Ưu điểm
duy nhất là ảnh không bị méo hình ở mọi góc độ do không chịu hiện tượng cầu sai của
thấu kính.Mặc dù có rất nhiều hạn chế, nhưng ở thời đại nào, nhiếp ảnh pinhole cũng
có một lượng tín đồ nhất định
Máy ảnh DSLR với "ống kính" pinhole.
Với một thân máy DSLR, nhiếp ảnh pinhole đã trở nên dễ dàng hơn rất nhiều so với
thời cha ông, do những thân máy này có khả năng đo sáng tự động, dải nhạy sáng
cao giúp tăng tốc độ chụp, trong một số điều kiện ánh sáng tốt có thể loại bỏ sự hỗ
trợ của chân máy. Nhiếp ảnh pinhole thực sự là một trải nghiệm thú vị không nên bỏ
qua đối với các tay máy DSLR, khi được bỏ qua những ống kính tân tiến nhất để trở
về với “cội nguồn” nhiếp ảnh của con người.Tuy nhiên, tạo ra một tấm ảnh pinhole
có chất lượng là một việc không dễ. Để tấm ảnh có độ nét cao nhất, những tay chơi
pinhole chuyên nghiệp phải sử dụng những tấm kim loại dát mỏng, với “lỗ kim” cực
nhỏ được đục bằng tia laser với độ chính xác cao nhất. Nhưng quan trọng hơn cả vẫn
là sự kiên nhẫn và lòng đam mê của người chụp ảnh.
1.2. Cảm biến máy ảnh ( CCD)
Trang 5
Tiểu luận môn học Xử Lý Ảnh
Camera CCD (Charge CoupleDevice) là một thiết bị thu nhận ảnh dưới dạng
tín hiệu số bằng cách thu nhận cường độ sáng tại từng điểm thông qua một loại linh
kiện có tên là photo diode. Cường độ sáng tại mỗi điểm này sẽ được mã hoá thành 3
giá trị màu cơ bản là RED, GREEN, BLUE theo lý thuyết màu do Thomson đưa ra
năm 1802. Ảnh nhận được từ Camera loại này là một ma trận Vector:













=
A
B
G
R
p
ij
][
(3-1)
Ma trận này chính là phần dữ liệu (data) của ảnh BITMAP. Các phép xử lý ảnh
thực chất là quá trình biến đổi ma trận trên bằng các công cụ tuyến tính (các phép
toán đại số như cộng trừ,…), phi tuyến (bộ lọc Median,…), hay chuyển ảnh sang một
không gian khác để xử lý rồi biến đổi ngược trở lại (như biến đổi Fourier,Wavelet…).
Mọi người thường hình dung CCD là một thiết bị số điển hình, song thiết bị
này lại sử dụng công nghệ tương tự. CCD thường có hình chữ nhật kích thước ½ inch
và 2/3 inch hoặc lớn hơn tuỳ thiết bị, bao gồm transitor MOS (metal oxide
semiconductor), được sắp xếp thành ma trận. Kích thước của ma trận (số lượng
transitor, hay còn gọi là số pixel) xác định độ phân giải tối đa của CCD. Chẳng hạn,
CCD với ma trận mỗi chiều 1280 và 1024 pixel (transistor) sẽ cho 2.048 x 1.536
=3.145.728 điểm ảnh (3,1 megapixel)
Số transitor càng lớn, CCD cho độ phân giải càng cao. Do công nghệ sản xuất
vi mạch ngày càng tinh vi kích thước của transitor ngày càng nhỏ hơn, cho phép tăng

nhiệt độ transitor trên một diện tích. Bởi vậy, các máy ảnh số hiện nay sử dụng CCD
có khả năng cho tới 5-6 triệu điểm ảnh.
Cùng với CCD, một thiết bị điện tử khác là ADC (analog to digital converter -
bộ chuyển tín hiệu tương tự sang tín hiệu số) độc lập thực hiện chức năng chuyển đổi
giá trị điện tích của các điểm trên CCD sang một giá trị số biểu thị màu tương ứng.
Nếu kích thước ma trận trên CCD quyết định độ phân giải, thì ADC xác định độ sâu
màu (color depth, đo bằng bit), tức khả năng thể hiện các sắc độ màu của hình ảnh
được ghi nhận. Độ sâu càng lớn, màu càng trung thực.
Trang 6
Tiểu luận môn học Xử Lý Ảnh
Cấu trúc của 1 CCD
Năm 1999, công ty Fuji Photo Film và Fujifilm Microdevices đã phát triển
thành công thế hệ tiếp theo của CCD là Super CCD. Bằng cách thay đổi hình dạng của
các pixel và sắp xếp chúng lại theo cách mới, Super CCD hơn hẳn CCD ở những điểm
sau:
-Nhờ diode quang có dạng bát giác và các điểm ảnh được sắp xếp theo kiểu tổ
ong, Super CCD có độ phân giải cao hơn, tỷ suất tín hiệu / nhiễu (S/N) cao hơn, vùng
màu động rộng hơn so với CCD thông thường.
-Sắp xếp theo kiến trúc tổ ong phù hợp hơn với quy tắc phân bố tần số trong tự
nhiên và đặc trưng trong mắt người. Vì thế độ hiệu quả điểm ảnh của CCD tăng lên
1,6 lần – Super CCD 2 triệu điểm ảnh có thể tạo ảnh có chất lượng tương đương ảnh
tạo ra bởi CCD 3 triệu điểm ảnh.
-Kiến trúc tổ ong kết hợp với công nghệ xử lý tín hiệu cho phép hạn chế độ
suy giảm chất lượng ảnh khi sử dụng chức năng phóng đại số (digital zoom)
-Kiến trúc này cho phép bỏ qua bước đọc lại dữ liệu ảnh mà không làm giảm
chất lượng ảnh ; chẳng hạn cho phép xuất ra tín hiệu video chất lượng cao.
-Để đáp ứng cùng chức năng, kiến trúc sử dụng CCD đơn giản hơn nhiều so
với CCD thông thường.
-Super CCD tiết kiệm được năng lượng vì có khả năng ghi nhận được hình ảnh
độ phân giải cao với lượng điểm ảnh ít hơn.

Hiện nay, Super CCD được sử dụng trong các loại máy ảnh số chuyên nghiệp
có độ phân giải cao (6 triệu điểm ảnh).
Một số hình minh họa cấu tạo một cảm biến ảnh:
Trang 7
Tiểu luận môn học Xử Lý Ảnh
a) 12.1 MegaPixels b) 6.1 MegaPixels c)3.2 MegiaPixels
Hình 3.2 Tương quan về kích thước sensor và số điểm ảnh
(Nguồn: hãng máy ảnh Canon)
Hình 3.4 Một CCD 300 KiloPixels được phóng to
Thế hệ CCD kế tiếp mang tính đột phá về công nghệ do công ty Sigma (Nhật
Bản) công bố đầu năm 2002 là bộ cảm biến ảnh (image sensor) FOVEON X3, có khả
năng ghi nhận tất cả màu RGB trên từng điểm ảnh (pixel). FOVEON X3 là bộ cảm
biến ảnh đầu tiên trên thế giới sử dụng bộ tách sóng quang (photo-detector) 3 lớp
tương tự công nghệ 3 lớp màu trên film thường. Các lớp này được xếp chồng lên nhau
trên một tấm silic để ghi nhận các màu RGB (Red, Green, Blue) trên từng pixel. Một
lớp ghi nhận màu đỏ, một màu xanh lá, lớp còn lại màu xanh dương. Nghĩa là mọi
pixel trên bộ cảm biến FOVEON X3 đều ghi nhận được tất cả màu RGB. Đây là hệ
thống đầu tiên có thể ghi nhận thông tin màu một cách trọn vẹn. Những loại cảm biến
khác chỉ sử dụng bộ tách sóng quang một lớp, nghĩa là chỉ có một bộ tách sóng quang
trên pixel. Để bắt màu, các pixel được tổ chức thành hệ thống lưới hoặc thể khảm
(mosaic), giống như một bàn cờ ba màu. Mỗi pixel chỉ bắt một màu R, G hay B. Các
Trang 8
Tiểu luận môn học Xử Lý Ảnh
bộ lọc chỉ cho phép một bước sóng ánh sáng (R, G hay B) đi qua và đến bất kỳ pixel
nào, nên nó chỉ ghi nhận được một màu ứng với bước sóng này. Kết quả là bộ cảm
biến mosaic chỉ có thể bắt được 25% ánh sáng màu R và màu B, và 50% ánh sáng
màu G. Khiếm khuyết của bộ cảm biến ảnh theo kiểu mosaic (mosaic-based image
sensor) là chúng chỉ có thể ghi nhận được 1/3 màu, sau đó phải dựa vào khả năng xử
lý liên hợp để nội suy 2/3 màu bị mất. Quá trình nội suy này sẽ tạo ra màu giả tạo và
làm mất chi tiết của ảnh. Thực tế, một số máy ảnh số dùng phương pháp làm mờ ảnh

nhằm giảm bớt màu giả tạo.
Hình 3.5 CCD thế hệ mới công nghệ Foveon X3 của Sigma.
Thử nghiệm cho thấy với công nghệ FOVEON X3 cho những tấm ảnh sắc nét
hơn, chi tiết màu tốt hơn và thực hơn, dù không cần phải hiệu chỉnh. Máy ảnh số sử
dụng công nghệ Foveon X3 không cần sức mạnh xử lý để tạo thông tin màu bị mất,
giảm thiểu đòi hỏi về phần cứng, thiết kế đơn giản và tối thiểu hóa thời gian trễ giữa
hai lần bấm của máy. Công nghệ Foveon X3 còn mở ra khả năng thiết kế những dòng
thiết bị thế hệ mới, không có ranh giới giữa ảnh tĩnh và video, không có sự suy giảm
chất lượng. Vì bộ cảm ứng ảnh dùng công nghệ Foveon X3 có thể bắt đầy đủ các màu
trên mọi pixel nên các pixel này có thể nhóm lại với nhau để tạo ra một hệ pixel lớn
hơn: “siêu pixel” với đầy đủ thông tin màu. Năng lực này gọi là khả năng thay đổi
điểm ảnh – Vairable Pixel Sizing (VPS), chuẩn mới đầu tiên của ảnh số. Với VPS, tín
hiệu từ các nhóm pixel có thể được nối lại với nhau để máy ảnh đọc chúng như một
pixel. Ví dụ, một bộ cảm biến 2300 x 1500 có thể chứa trên 3,4 triệu pixel. Nhưng nếu
VPS được dùng để nhóm các pixel này khối 4x4, bộ cảm biến ảnh sẽ tự điều chỉnh để
có độ phân giải 575 x 375 pixel, mỗi thành phần sẽ hơn 16 lần so với thành phần gốc.
Kích cỡ và cấu hình của một nhóm pixel có thể là biến số 2x2, 4x4, 3x5 , và được
điều chỉnh thông qua bộ xử lý tích hợp bên trong Foveon X3. Điều này cho phép CCD
Trang 9
Tiểu luận môn học Xử Lý Ảnh
có thể thu nhận bức ảnh đầy đủ màu trong điều kiện ánh sáng yếu bằng cách giảm tín
hiệu nhiễu nhờ khả năng gộp điểm ảnh. Sử dụng VPS để làm giảm độ phân giải cũng
cho phép bộ cảm biến chụp được số khung ảnh cao hơn, tăng tốc độ chụp mỗi tấm
ảnh.
Trang 10
Tiểu luận môn học Xử Lý Ảnh
CHƯƠNG 2: XỬ LÝ TĂNG CƯỜNG CHẤT LƯỢNG ẢNH
Trong hai thập kỉ gần đây, lọc bỏ nhiễu xung là một trong những vấn đề rất
được quan tâm ở lĩnh vực xử lý ảnh. Xuất phát từ nguyên nhân thực tế như lỗi trong
quá trình truyền tải, trục trặc ở bộ phận cảm biến trên thiết bị thu hình kỹ thuật số,…

Một bộ phận các điểm ảnh (tùy vào tỷ lệ nhiễu) sẽ biến đổi cường độ sáng, dẫn đến
chất lượng ảnh bị giảm đáng kể. Đối với những hệ thống xử lý ảnh số, việc lọc nhiễu,
làm trơn ảnh được xem là bước tiền xử lý quan trọng và chất lượng của giai đoạn này
ảnh hưởng rất lớn đến tính hiệu quả của các xử lý tiếp sau như: phân đoạn ảnh, nhận
dạng đối tượng, dò tìm cạnh,…hay nói cách khác đó là quá trình nâng cao chất lượng
ảnh. Nâng cao chất lượng ảnh là bước cần thiết trong xử lý ảnh nhằm hoàn thiện một
số đặc tính của ảnh. Nâng cao chất lượng ảnh gồm hai công đoạn khác nhau: tăng
cường ảnh và khôi phục ảnh. Tăng cường ảnh nhằm hoàn thiện các đặc tính của ảnh
như sau :
+ Lọc nhiễu
+Tăng độ tương phản, điều chỉnh mức xám của ảnh
+Làm nổi biên ảnh
Thường là ảnh thu nhận có nhiễu cần phải loại bỏ hay ảnh không sắc nét bị mờ
hoặc cần làm tỏ các chi tiết như đường biên ảnh. Các toán tử không gian trong kỹ
thuật tăng cường ảnh được phân nhóm theo công dụng : làm trơn nhiễu, nổi biên. Để
làm trơn ảnh hay tách nhiễu, người ta thường sử dụng các toán tử không gian dùng
trong kỹ thuật tăng cường ảnh, điển hình là sử dụng các bộ lọc tuyến tính (lọc trung
bình, lọc thông thấp) hay lọc phi tuyến (lọc trung vị, giả trung vị, lọc đồng hình). Từ
bản chất của nhiễu (thường tương ứng với tần số cao) và từ cơ sở lý thuyết lọc là : bộ
lọc chỉ cho tần số nào đó thông qua, do đó để lọc nhiễu người ta thường dùng lọc
thông thấp (low pass filter) hay lấy tổ hợp tuyến tính để san bằng lọc trung bình (mean
filter). Để làm nổi cạnh (ứng với tần số cao) người ta dùng bộ lọc thông cao (high pass
filter), lọc Laplace. Trước khi nói đến các kỹ thuật áp dụng lọc nhiễu, làm trơn ảnh,
em xin nói về phân biệt các loại nhiễu trong quá trình xử lý ảnh. Trên thực tế tồn tại
nhiều loại nhiễu, tuy nhiên người ta thường xem xét 3 loại nhiễu chính : nhiễu cộng,
nhiễu nhân và nhiễu xung. Nhiễu cộng : Nhiễu cộng thường phân bố khắp ảnh, nếu
gọi ảnh quan sát (ảnh thu được) là Xqs, ảnh gốc là Xgốc, nhiễu là , ảnh thu được có
thể biểu diễn bởi: Xqs = Xgốc + Nhiễu nhân : Nhiễu nhân thường phân bố khắp ảnh,
Trang 11
Tiểu luận môn học Xử Lý Ảnh

ảnh thu được có thể biểu diễn bởi: Xqs = Xgốc * Nhiễu xung : Nhiễu xung thường
gây đột biến tại một số điểm ảnh.
2.1. Các kỹ thuật chính được dùng làm trơn ảnh
2.1.1. Làm trơn nhiễu bằng lọc tuyến tính
- Lọc trung bình (Mean Filter)
- Lọc thông thấp (Low pass Filter)
- Lọc đồng hình (Homomorphie Filter)
- Gaussian Blur
2.1.2. Làm trơn nhiễu bằng lọc phi tuyến
- Lọc trung vị (Median Filter)
- Lọc ngoài (Outlier Filter)
- Lọc loại bỏ nhiễu đốm Crimmins (Crimmins Speckle Removal)
- Bộ lọc giữ biên (Kuwahara Filter)
2.1.3.Ứng dụng của làm trơn ảnh
Xét ở khía cạnh nào đó, ta có thể nói làm trơn ảnh được ứng dụng khá phổ biến
trong nhiều lĩnh vực của đời sống như giải trí, y học, an ninh và một số lĩnh vực
khác… Làm trơn ảnh nếu nó đứng riêng lẻ thì hầu như không có ứng dụng gì ngoài
công dụng theo nghĩa đen của nó là làm mịn ảnh, và giảm nhiễu. Nhưng khi đặt nó
vào trong quy trình xử lý thì nó rất quan trọng, kết quả của nó giúp các xử lý phía sau
chính xác hơn. Ví dụ như dò biên với thuật toán canny, trước tiên người ta sẽ dùng
Gaussian để làm mịn ảnh trước giúp lọai bỏ nhiễu nhằm giúp kết quả dò biên tránh
được những sai lầm do nhiễu gây ra. Trong một số trường hợp, các đối tượng thông
tin có cùng tính chất với nhiễu (điển hình là trong ảnh siêu âm), việc phát hiện đối
tượng khác thường (detect abnormal object) và loại bỏ chúng trước khi tiến hành các
xử lý cao hơn là rất quan trọng. Tùy từng đặc thù ảnh và nhiễu mà người ta chọn
phương pháp, và sử dụng cửa sổ (design kernel) thích hợp nhằm đạt hiệu quả cao nhất
là loại bỏ cái cần loại, giữ lại cái cần giữ. Ứng dụng vào công nghệ giám sát “camera
lọc nhiễu ba chiều” nhằm tăng cường công tác bảo mật an toàn – an ninh, nếu xảy ra
bất cứ một vấn đề hay sự cố gì đều được camera ghi lại, từ đó làm tư liệu, bằng chứng
để tìm ra nguyên nhân xảy ra vấn đề.

Trang 12
Tiểu luận môn học Xử Lý Ảnh
2.4. Làm trơn nhiễu bằng lọc tuyến tính (Linear Filter)
2.4.1. Lọc trung bình không gian (Mean Filter, Average Filter)
Lọc trung bình là bộ lọc sử dụng cửa sổ lọc của lớp tuyến tính(linear class) để
lọc nhiễu và làm trơn ảnh. Ý tưởng cơ bản của bộ lọc này là thay thế giá trị tại mỗi
điểm ảnh bằng trung bình các giá trị của các điểm lân cận nhằm loại bỏ những điểm
ảnh biến đổi lớn so với điểm lân cận(nhiễu), và những điểm ảnh nằm trên biên cũng
có sự biến đổi lớn so với lân cận. Chúng ta cùng xem một số ví dụ về cửa sổ lọc trong
kĩ thuật lọc trung bình.
Lọc trung bình được biểu diễn bằng công thức toán học như sau:
Nếu trong kỹ thuật trên ta dùng các trọng số(của cửa sổ lọc) như nhau, phương trình
trên sẽ trở thành :
Với : f(x,y) : ảnh đầu vào
g(x,y): ảnh đầu ra
a(k,l): cửa sổ lọc(mặt nạ)
Trang 13
Tiểu luận môn học Xử Lý Ảnh
Ưu điểm : Là bộ lọc tuyến tính đơn giản trong tính toán. Ảnh đạt độ trơn mịn.
Khuyết điểm:Không hoàn toàn loại bỏ các tác dụng của nhiễu, các điểm ảnh đơn
lẻ(nhiễu) sẽ ảnh hưởng đến giá trị trung bình của các pixel lân cận. Độ
sắc nét của ảnh kém. Độ tương phản thấp.
2.4.2. Gaussian Blur
Gaussian blurring là cách làm mờ một ảnh bằng hàm Gaussian. Phương pháp
này được ứng dụng rộng rãi và hiệu quả trong các phần mềm xử lý đồ họa. Nó cũng là
công cụ phổ biến để thực hiện quá trình tiền xử lý hình ảnh dùng để làm dữ liệu đầu
vào tốt cho các phân tích cao cấp hơn trong Computer Vision, hoặc cho các giải thuật
được thực hiện trong một tỉ lệ khác của hình đã được cho. Như vậy, ta có thể nói
Gaussian blurr là một loại bộ lọc làm mờ ảnh, sử dụng lý thuyết hàm Gaussian(cũng
được biết đến như là dạng phân tán chuẩn (Normal Distribution) trong thống kê) để

tính toán việc chuyển đổi (Transformation) mỗi điểm ảnh của hình, giúp làm giảm
nhiễu và mức độ chi tiết (không mong muốn) của hình ảnh. Đây là phương trình hàm
Gaussian (Gaussion Distribution) trong không gian một chiều.
Với x, y là tọa độ theo hai trục đứng và ngang. Trong không gian hai chiều,
công thức này sản sinh ra những đường viền là những đường tròn đồng tâm, tuân theo
logic phân tán Gausian từ điểm trung tâm. Giá trị từ hệ thống phân tán này sẽ được sử
dụng để xây dựng một ma trận tích chập dùng tính toán phép tích chập với ảnh gốc.
Giá trị mới sau khi tính tích nhân chập với cửa sổ (kernel) đại diện cho hàm Gaussian
có thể coi là trung bình lượng giá của các điểm ảnh xung quanh nó. Ta thấy rằng giá
trị lượng của phần tử trung tâm kernel tương ứng với điểm ảnh đang xét là lớn nhất,
giá trị này sẽ nhỏ hơn đối với các phần tử tương ứng với các điểm ảnh kế cận một
Trang 14
Tiểu luận môn học Xử Lý Ảnh
cách đối xứng và tỉ lệ thuận với khoảng cách của phần tử này với trung tâm. Tính chất
này giúp giữ lại đường viền và đường biên cũng như làm mờ một cách đồng bộ hơn so
với các phương pháp khác. Trong lý thuyết, hàm Gaussian tại mỗi điểm trên hình là
khác 0. Điều này có nghĩa là Gaussian kernel nên có kích thước bằng với hình ảnh và
giá trị tại mỗi phần luôn khác 0. Tuy nhiên trong thực hành, do việc tính toán dựa trên
xấp xỉ rời rạc (Discrete Appoximation) cho nên giá trị của các phần tử trên bề mặt
Gaussian ở khoảng cách lớn hơn 3σ so với trung tâm gần như không đáng kể (tiệm
cận 0). Do vậy các Gaussian distribution ngoài bán kính này sẽ bị bỏ qua, đó cũng là lí
do mà thông thường Gaussian kernel có kích thước giới hạn 3, 5, 7 (Cái này tùy thuộc
vào giá trị phương sai chuẩn mà bạn chọn). Khoảng cách giữa hai điểm gần nhau
trong Gausssian kernel là σ.
Trang 15
Tiểu luận môn học Xử Lý Ảnh
CHƯƠNG 3: CÁC PHƯƠNG PHÁP XỬ LÝ ẢNH CƠ BẢN
Xử lý ảnh là bước cần thực hiện trước khi đưa ra các quyết định về hình ảnh.
Việc sử dụng phần mềm Matlab hỗ trợ rất trong trong xử lý ảnh.
3.1 Các hàm chuyển đổi kiểu ảnh:

Với các thao tác nhất định sẽ thật hữu ích khi có thể chuyển đổi ảnh từ dạng
này sang dạng khác. Chẳng hạn, nếu ta muốn lọc một màu ảnh được lưu trữ dưới dạng
ảnh chỉ số đầu tiên ta nên chuyển đổ nó thành dạng ảnh RGB. Khi ta áp dụng phép
lọc tới ảnh RGB, Matlab sẽ lọc giá trị cường độ trong ảnh tương ứng. Nếu ta cố gắng
lọc ảnh chỉ số, Matlab đơn giản chỉ áp đặt phép lọc tới ma trận ảnh chỉ số và kết quả
sẽ không có ý nghĩa.
Chú ý: Khi chuyển đổi một ảnh từ dạng này sang dạng khác, ảnh kết quả có thể khác
ảnh ban đầu. Chẳng hạn, nếu ta chuyển đổi một ảnh màu chỉ số sang một ảnh cường
độ, kết quả ta sẽ thu được một ảnh đen trắng.
Danh sách sau đây sẽ liệt kê các hàm được sử dụng trong việc chuyển đổi
kiểu ảnh:
dither: Tạo một ảnh nhị phân từ một ảnh cường độ đen trắng bằng cách
trộn, tạo một ảnh chỉ số từ một ản RGB bằng cách trộn (dither).
gray2id: Tạo một ảnh chỉ số từ một ảnh cường độ đen trắng.
grayslice: Tạo một ảnh chỉ số từ một ảnh cường độ đen trắng bằng cách đặt
ngưỡng.
im2bw: Tạo một ảnh nhị phân từ một ảnh cường độ, ảnh chỉ số hay ảnh
RGB trên cơ sở của ngưỡng ánh sáng.
ind2gray: Tạo một ảnh cường độ đen trắng từ một ảnh chỉ số.
ind2rgb: Tạo một ảnh RGB từ một ảnh chỉ số.
mat2gray: Tạo một ảnh cường độ đen trắng từ dữ liệu trong một ma trận bằng
cách lấy tỉ lệ giữ liệu.
rgb2gray: Tạo một ảnh cường độ đen trắng từ một ảnh RGB.
rgb2ind: Tạo một ảnh chỉ số từ một ảnh RGB.
Ta cũng có thể thực hiện các phép chuyển đổi kiểu chỉ sử dụng cú pháp của
Matlab. Chẳng hạn, ta có thể chuyển đổi một ảnh cường độ sang ảnh RGB bằng
cách ghép nối 3 phần copy của ma trận ảnh gốc giữa 3 chiều: RGB=cat(3,I,I,I );
Ảnh RGB thu được có các ma trận đồng nhất cho các mặt phẳng R, G, B vì vậy
ảnh hiển thị giống như bóng xám.Thêm vào những công cụ chuyển đổi chuẩn đã nói
Trang 16

Tiểu luận môn học Xử Lý Ảnh
ở trên, cũng có một số hàm mà trả lại kiểu ảnh khác như một phần trong thao tác mà
chúng thực hiện. Chuyển đổi không gian màu.
Toolbox xử lý ảnh biểu diễn màu sắc như các giá trị RGB ( trực tiếp trong ả
ảnh chỉ số ). Tuy nhiên, có các phương pháp khác cho việc biểu diễn màu có thể được
đại diện bởi các giá trị hue, saturation và các giá trị thành
Toolbox cung cấp một tập các thủ tục để chuyển đổi giữa các không gian
chúng coi dữ liệu màu sắc dưới dạng RGB tuy nhiên, ta có thể xử lý một ảnh màu
khác nhau bằng cách chuyển đổi nó sang RGB sau đó chuyển đổi ảnh màu ban đầu.
3.2 Chuyển đổi định dạng các file ảnh:
Để thay đổi định dạng đồ hoạ của một ảnh, sử dụng hàm imread để đọc m
hàm imwrite đồng thời chỉ ra định dạng tương ứng.
Để minh hoạ, ví dụ sau đây sử dụng hàm imread để đọc một file BMP vào
hàm imwrite lưu ảnh này dưới định dạng PNG
bitmap = imread('mybitmap.bmp','bmp'); imwrite(bitmap,'mybitmap.png','png');
3.3 Thay đổi kích thước ảnh
- Để thay đổi kích thước của một ảnh, sử dụng hàm imresize. Sử dụng hàm này ta có
thể:
+ Chỉ ra kích thước của ảnh kết quả.
+ Chỉ ra phương pháp nội suy được sử dụng.
+ Chỉ ra bộ lọc được sử dụng để ngăn ngừa hiện tượng răng cưa.
+ Chỉ ra kích thước cho ảnh kết quả
- Sử dụng hàm imresize, ta chó thể chỉ ra kích thước của ảnh kết quả theo hai cách:
+ Bằng cách chỉ ra hệ số phóng đại được sử dụng trên ảnh.
+ Bằng cách chỉ ra chiều của ảnh kết quả.
Sử dụng hệ số phóng đại ảnh để mở rộng một ảnh, chỉ ra hệ số phóng đại lớn hơn 1.
Để thu nhỏ một ảnh, chỉ ra hệ số phóng đại nằm giữa 0 và 1. Chẳng hạn, lệnh sau tăng
kích thước của ảnh I lên 1.25 lần:
Hình : Ảnh trước và sau khi imresize
I = imread('circuit.tif');

Trang 17
Tiểu luận môn học Xử Lý Ảnh
J = imresize(I,1.25);
imshow(I)
figure, imshow(J)
Chỉ định kích thước của ảnh ra
- Ta có thể chỉ ra kích thước của ảnh ra bằng cách truyền một véc tơ chứa số lượng
hàng và cột của ảnh
sau cùng. Những lệnh sau đây tạo một ảnh ra Y với 100 hàng và 150 cột.
Y = imresize(X,[100 150])
Chú ý: Nếu kích thước được chỉ ra không có cùng tỉ lệ với ảnh vào, ảnh ra sẽ bị biến
dạng.
Chỉ định phương pháp nội suy được sử dụng.
- Theo mặc định, hàm imresize sử dụng phương pháp nội suy các pixel gần nhất
(nearest – neighborinterpolation) để tính giá trị các pixel của ảnh ra. Tuy nhiên, ta có
thể chỉ định các phương pháp nội suy khác. Bảng sau đây liệt kê các phương pháp
nội suy được trợ giúp theo thứ tự của độ phức tạp.
Sử dụng bộ lọc để ngăn chặn hiện tượng răng cưa
- Việc giảm kích thước (hình học) của một ảnh có thể gây ra những ảnh hưởng nhất
định lên ảnh chẳng hạn như hiện tượng xuất hiện răng cưa tại biên của ảnh . Điều này
là do thông tin luôn bị mất khi ta giảm kích thước một ảnh. Răng cưa xuất hiện như
những gợn sóng trong ảnh sau cùng.
- Khi giảm kích thước của ảnh sử dụng nội suy song tuyến tính hoặc song khối, hàm
imresize tự động áp đặt một bộ lọc thông thấp lên ảnh trước khi nội suy. Điều này để
giảm ảnh hưởng của răng cưa trong ảnh ra. Ta có thể chỉ ra kích thước của bộ lọc này
hoặc chỉ ra một bộ lọc khác thay thế.
Chú ý: Thậm chí đã sử dụng một bộ lọc thông thấp, chất lượng của ảnh vẫn bị ảnh
hưởng do thông tin luôn bị mất trong quá trình nội suy
- Hàm imresize không áp đặt một bộ lọc thông thấp lên ảnh nếu phương pháp nội suy
các pixel gần nhất được sử dụng. Phương pháp nội suy này ban đầu được sử dụng với

các ảnh chỉ số và bộ lọc thông thấp không thích hợp cho kiểu ảnh này.
- Ta cũng có thể chỉ ra một bộ lọc tự tạo thay cho các bộ lọc có sẵn.
Hàm imresize
Cú pháp của hàm này như sau:
Trang 18
Tiểu luận môn học Xử Lý Ảnh
B = imresize(A,m) B = imresize(A,m,method) B =imresize(A,[mrowsncols],method)
B = imresize( ,method,n) B = imresize( ,method,h)
Diễn giải
+ B=imresize(A,m): Trả lại một ảnh B lớn gấp m lần ảnh A (kích thước hình học) sử
dụng phương pháp nội suy mặc định (nearest - neighbor interpolcation). A có thể là
một ảnh chỉ số, ảnh đen trắng, RGB hoặc ảnh nhị phân. Nếu m nằm giữa 0 và 1, B sẽ
nhỏ hơn A. Nếu m lớn hơn 1, B sẽ lớn hơn A.
+ B=imresize(A,m,method): Trả lại một ảnh lớn gấp m lần ảnh A sử dụng phương
pháp nội suy method. method là một chuỗi chỉ ra phương pháp nội suy nào được sử
dụng chẳng hạn: ‘nearest’,’bilinear’,’bicubic’.
+ B=imresize(A, [mrows ncols],method): Trả lại một ảnh với kích thước được chỉ
ra bởi vector [mrows ncols]. Nếu kích thước được chỉ ra không cùng tỉ lệ với ảnh vào,
ảnh sẽ bị biến dạng . Khi kích thước của ảnh ra nhỏ hơn kích thước của ảnh vào và
phương pháp nội suy được sử dụng là ‘bilinear’ hoặc ‘bicubic’, hàm imresize áp đặt
một bộ lọc thông thấp trước khi tuyến tính hoá để giảm hiện tượng răng cưa. Kích
thước mặc định là 11x11.
Ta có thể chỉ ra một thứ tự khác cho bộ lọc mặc định sử dụng cấu trúc:
B=imresize(…,method,n): n là một số nguyên chỉ ra kích thước của bộ lọc – nxn. Nếu
n=0, hàm imresizebỏ qua bước lọc. Ta cũng có thể chỉ ra bộ lọc riêng sử dụng cú pháp
B=imresize(…,method,h): Trong đó h là một bộ lọc FIR hai chiều ( có thể được trả
về bởi các hàm ftrans2, fwind1, fwind2 hoặc fsamp2 ).
3.5 Xoay ảnh
Để xoay một ảnh, sử dụng hàm imrotate. Hàm này chấp nhận hai tham số
chính:

+ Ảnh cần quay
+ Góc quay
Góc quay tính theo độ. Nếu ta chỉ ra một giá trị dương, hàm imrotate quay ảnh
theo chiều ngược chiều kim đồng hồ. Nếu chỉ ra giá trị âm, hàm quay ảnh theo chiều
kim đồng hồ. Ví dụ sau quay một ảnh 35 độ theo chiều ngược chiều kim đồng hồ:
J=imrotate(I,35 ) ;
- Một số tham số tuỳ chọn ta có thể truyền vào cho hàm bao gồm:
+ Phương pháp nội suy được sử dụng
+ Kích thước của ảnh ra
Chỉ định phương pháp nội suy được sử dụng
- Theo mặc định, hàm imrotate sử dụng phương pháp nội suy thứ nhất (nearest-
neighbor interpolation) để tính giá trị các pixel trong ảnh ra. Tuy nhiên, ta có thể chỉ
ra các phương pháp nội suy khác như: ‘bilinear ‘,’bicubic’
Trang 19
Tiểu luận môn học Xử Lý Ảnh
Ví dụ sau quay một ảnh 35 độ ngược chiều kim đồng hồ sử dụng nội suy song tuyến
tính:
I = imread('circuit.tif'); J = imrotate(I,35,'bilinear'); imshow(I) figure, imshow(J)
Hình 2: Ảnh trước và sau khi imrotate
Chỉ định kích thước của ảnh ra
Theo mặc định, hàm imrotate tạo một ảnh ra đủ lớn để có thể bao gồm toàn bộ
các pixel của ảnh gốc.Các pixel nằm ngoài biên của ảnh gốc được gán giá trị 0 như thể
nền màu đen trong ảnh ra. Nếu ta chỉ ra chuỗi ‘crop’ như một tham số, hàm imrotate
sẽ xén ảnh ra tới kích thước như ảnh vào.
Hàm imrotate
Cú pháp của nó như sau:
B = imrotate(A,angle) B = imrotate(A,angle,method)
B = imrotate(A,angle,method,bbox)
Diễn giải
+ B=imrotate(A,angle): Quay ảnh A một góc angle độ theo chiều ngược chiều kim

đồng hồ, sử dụng phương pháp nội suy các pixel gần nhất. Để quay theo chiều kim
đồng hồ hãy truyền giá trị âm cho tham số angle
+ B=imrotate(A,angle,method): Quay ảnh A một góc angle độ theo chiều kim đồng
hồ sử dụng phương pháp nội suy được chỉ ra trong method.
+ B=imrotate(A,angle,method,bbox): Quay ảnh A một góc angle độ. Tham số bbox
chỉ ra hộp biên của ảnh trả về. bbox là một chuỗi có thể nhận các giá trị sau:‘crop’:
Ảnh ra B chỉ bao gồm phần trung tâm của ảnh được quay và có cùng kích thước với
ảnh A ‘loose’: ( Mặc định ): Ảnh ra B bao gồm toàn bộ ảnh được quay và lớn hơn
ảnh A. Hàm imrotate thiết lập giá trị 0 cho các pixel ngoài biên của ảnh gốc.
Ví dụ :
- Ví dụ này đọc một ảnh quang phổ ánh sáng mặt trời được lưu trong định dạng
FITS và quay nó và căn nó theo chiều ngang.
I = fitsread('solarspectra.fts'); I = mat2gray(I); J = imrotate(I,-1,'bilinear','crop');
imshow(I) figure, imshow(J)
Trang 20
Tiểu luận môn học Xử Lý Ảnh
Trang 21
Tiểu luận môn học Xử Lý Ảnh
CHƯƠNG 4: DÒ BIÊN VÀ PHÂN VÙNG ẢNH
4.1.1 Một số khái niệm
Định nghĩa và khái niệm
Điểm Biên: Một điểm ảnh được coi là điểm biên nếu có sự thay đổi nhanh
hoặc đột ngột về mức xám (hoặc màu). Ví dụ trong ảnh nhị phân, điểm đen gọi là
điểm biên nếu lân cận nó có ít nhất một điểm trắng.
Đường biên (đường bao: boundary): tập hợp các điểm biên liên tiếp tạo
thành một đường biên hay đường bao.
Ý nghĩa của đường biên trong xử lý: ý nghĩa đầu tiên: đường biên là một
loại đặc trưng cục bộ tiêu biểu trong phân tích, nhận dạng ảnh. Thứ hai, người ta
sử dụng biên làm phân cách các vùng xám (màu) cách biệt. Ngược lại, người ta
cũng sử dụng các vùng ảnh để tìm đường phân cách.

Tầm quan trọng của biên: để thấy rõ tầm quan trọng của biên, xét ví dụ sau:
khi người họa sỹ muốn vẽ một danh nhân, họa sỹ chỉ cần vẽ vài đường nứt tốc họa
mà không cần vẽ một cách đầy đủ.
Mô hình biểu diễn đường biên, theo toán học: điểm ảnh có sự biến đổi mức
xám u(x) một cách đột ngột theo hình dưới.
4.1.2 Phân loại các kỹ thuật phát hiện biên
Từ định nghĩa toán học của biên người ta sử dụng hai phương pháp phát hiện
biên như sau
(phương pháp chính)
a, Phương pháp phát hiện biên trực tiếp: phương pháp này chủ yếu dựa vào sự
biến thiên độ
sáng của điểm ảnh để làm nổi biên bằng kỹ thuật đạo hàm.

Nếu lấy đạo hàm bậc nhất của ảnh: ta có phương pháp Gradient

Nếu lấy đạo hàm bậc hai của ảnh: ta có phương pháp Laplace.
Hai phương pháp này được gọi chung là phương pháp dò biên cục bộ.
Ngoài ra, người ta còn sử dụng phương pháp “đi theo đường bao” dựa vào
công cụ toán học là nguyên lý quy hoạch động và đượng gọi là phương pháp dò biên
tổng thể. Phương pháp dò biên trực tiếp có hiệu quả và ít bị tác động của nhiễu.
Trang 22
Tiểu luận môn học Xử Lý Ảnh
b, Phương pháp phát hiện biên gián tiếp: Nếu bằng cách nào đấy, chúng ta
thu đượng các vùng ảnh khác nhau thì đường phân cách giữa các vùng đó chính là
biên. Nói cách khác, việc xác định đường bao của ảnh được thực hiện từ ảnh đã
được phân vùng. Phương pháp dò biên gián tiếp khó cài đặt nhưng áp dụng tốt khi
sự biến thiên độ sáng nhỏ.
Chú ý: Kỹ thuật dò biên và phân vùng ảnh là hai bài toán đối ngẫu của nhau.
4.1.3 Quy trình phát hiện biên.
B1: Do ảnh ghi được thường có nhiễu, bước một là phải lọc nhiễu theo các

phương pháp
dã tìm hiểu ở các phần trước.
B2: Làm nổi biên sử dụng các toán tử phát hiện biên.
B3: Định vị biên. Chú ý rằng kỹ thuật nổi biên gây tác dụng phụ là gây nhiễu
làm một số
biên giả xuất hiện do vậy cần loại bỏ biên giả.
B4: Liên kết và trích chọn biên.
4.2 Phương pháp biên cục bộ
4.2.1 Phương pháp Gradient
Định nghĩa: Gradient là một vec tơ f(x, y) có các thành phần biểu thị tốc
độ thay đổi mức xám của điểm ảnh (theo hai hướng x, y trong bối cảnh xử lý
ảnh hai chiều) tức:
Trong đó dx, dy là khoảng cách giữa 2 điểm kế cận theo hướng x, y tương ứng (thực tế
chọn dx= dy=1). Đây là phương pháp dựa theo đạo hàm riêng bậc nhất theo hướng x, y.
Gradient trong tọa độ góc (r,θ), với r là véc tơ, θ: góc
a. Kỹ thuật Gradient. Theo định nghĩa về Gradient, nếu áp dụng nó vào xử
Trang 23
Tiểu luận môn học Xử Lý Ảnh
lý ảnh, việc tính toán sẽ rất phức tạp. Để đơn giản mà không mất tính chất của
phương pháp Gradient, người ta sử dụng kỹ thuật Gradient dùng cặp mặt nạ
H
1
, H
2
trực giao (theo 2 hướng vuông góc). Nếu định nghĩa g
1
, g
2
là Gradient
theo hai hướng x, y tướng ứng thì biên độ g(m,n) tại điểm (m,n) được tính:

Toán tử (mặt nạ) Sobel.
Toán tử Sobel được Duda và Hart [5] đặt ra năm 1973 với các mặt nạ tương tự
như của
Robert nhưng cấu hình khác như sau:

Mặt nạ Prewitt
Toán tử được Prewitt đưa ra vào năm 1970 có dạng:

Mặt nạ đẳng hướng:
Một mặt nạn khác cũng được nêu như dưới đây gọi là mặt nạ đẳng hướng
(Isometric).
Một vài nhận xét:
1. Toán tử Prewitt có thể tách sườn đứng tốt hơn toán tử Sobel, trong khi đó
Trang 24
Tiểu luận môn học Xử Lý Ảnh
toán tử Sobel tách các sườn trên các điểm ở đường chéo tốt hơn. Mặt khác, các toán
tử Robert và toán tử 4-lân cận có nhược điểm là nhạy với nhiễu. Các toán tử
Gradient và Sobel giảm nhiễu do tác dụng của lọc trung bình các điểm lân cận.
Như vậy, để đạt được kết quả mong muốn các toán tử Gradient thường được dùng
trước dể làm sạch nhiễu.
2. Các mặt nạ của các toán tử trên có kích thước 2x2 hoặc 3x3 chiều. Các
mặt nạ có số chiều lớn hơn cũng được sử dụng. Ví dụ trong kỹ thuật phát hiện
biên người ta dùng mặt nạ 5x5 cho toán tử Sobel:
3. Các toán tử kể trên đểu sử dụng các mặt nạ theo hai chiều (x,y) tức là bốn
hướng (-x, y;-y, y). Với mục đích cho kết quả tinh và chính xác hơn (khi mà tốc độ
và bộ nhớ máy tính tốt).
4.2.2. Dò biên theo quy hoạch động
Như trên đã nói, dò biên theo phương pháp Gradient là xác định cực trị
cục bộ của Gradient theo các hướng; còn phương pháp Laplace dựa vào cắt điểm
không của đạo hàm bậc hai. Phương pháp dò biên theo quy hoạch động là phương

pháp tìm cực trị tổng thể theo nhiều bước. Nó dựa vào nguyên lý tối ưu của
Bellman. Nguyên lý này phát biểu như sau: “Con đường tối ưu giữa 2 điểm cho
trước cũng là tối ưu giữa 2 điểm bất kỳ nằm trên đường tối ưu đó”.
Thí dụ, nếu C là một điểm trên con đường tối ưu giữa A và B thì đoạn CB
cũng là còn đường tối ưu từ C đến B không kể đến ta đến C bằng cách nào
Trong kỹ thuật này, giả sử bản đồ biên đã được xác định và được biểu diễn
dưới dạng đồ thị liên thông N chặng. Giả sử hàm đánh giá được tính theo công thức:
Trang 25

×