Tải bản đầy đủ (.docx) (25 trang)

Nghiên cứu phương pháp cải thiện chất lượng ảnh nhị phân bằng phép toán hình thái

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (267.83 KB, 25 trang )

Bộ GIÁO DỤC VÀ ĐÀO TẠO
• • • TRƯỜNG ĐẠI HỌC sư PHẠM HÀ NỘI 2 • • • •
ĐINH THỊ HƯỜNG
NGHIÊN CỨU PHƯƠNG PHÁP CẢI THIÊN CHẤT LƯƠNG
ẢNH NHI PHÂN • • • BẰNG PHÉP TOÁN HÌNH THẤI
LUÂN VĂN THAC SỸ MÁY TÍNH
• •
Bộ GIÁO DỤC VÀ ĐÀO TẠO • • •
TRƯỞNG ĐẠI HỌC sư PHẠM HẢ NỘI 2 ĐINH THỊ HƯỜNG
NGHIÊN CỨU PHƯƠNG PHÁP CẢI THIÊN CHẤT LƯƠNG ẢNH NHI
PHÂN
• • •
BẰNG PHÉP TOÁN HÌNH THẤI
Chuyên ngành: Khoa học máy tính Mã số: 60 48 01 01
LUẬN VĂN THẠC SỸ MÁY TÍNH
HÀ NỘI,
Người hướng dẫn khoa học: PGS. TS Ngô Quốc Tạo
HÀ NỘI,
LỜI CẢM ƠN
Bằng sự kính trọng và lòng biết ơn sâu sắc, em xin chân thành cảm ơn
PGS. TS Ngô Quốc Tạo, người đã tận tình hướng dẫn và giúp đỡ em trong suốt
quá trình làm luận văn.
Em xin chân thành cảm ơn các thầy cô giáo trong khoa Công nghệ thông
tin, phòng Sau đại học trường Đại học Sự phạm Hà Nội 2, các thầy cô đã trực tiếp
giảng dạy các học phần trong khóa học đã tạo điều kiện thuận lợi cho em trong cả
quá trình học tập và nghiên cứu tại trường.
Xin chân thành cảm ơn gia đình, bạn bè, đồng nghiệp đã quan tâm, giúp đỡ
em trong thời gian nghiên cứu và hoàn thành luận văn.
Trong quá trình nghiên cứu, luận văn không tránh khỏi những thiếu sót. Rất
mong nhận được sự góp ý của quý thầy cô và bạn bè đồng nghiệp quan tâm đến
luận văn này.


Hà Nội, tháng 12 năm 2014
Học viên
Đinh Thị Hường
LỜI CAM ĐOAN
Trong quá trình hoàn thành luận văn, tôi đã tìm hiểu, nghiên cứu, tổng hợp
nhiều nguồn tài liệu khác nhau, dưới dự chỉ đạo, giúp đỡ của giáo viên hướng dẫn,
kết quả của đề tài là sản phẩm lao động của cá nhân tôi. Các nguồn tài liệu sử
dụng được trích dẫn rõ ràng, khoa học.
Nội dung luận văn này chưa từng được công bố hay xuất bản dưới bất kỳ
hình thức nào và cũng không sao chép từ bất kỳ một công trình nghiên cứu nào.
3
Tôi xin cam đoan những điều trên là hoàn toàn đúng.
Hà Nội, thảng 12 năm 2014
Học viên
Đinh Thị Hường
MỤC LỤC
Trang
Trang phụ bìa
DANH MUC CÁC HÌNH VẼ

1.1. Quá trình xử lý ảnh
1.2. Các bước cơ bản trong một hệ thống xử lý ảnh
1.3. Mô hình tổng quát của hệ thống nhận dạng ảnh
1.4. Ví dụ về ảnh và xương
4
1.5. Một số phép toán logic giữa các hình ảnh nhị phân
1.6. Một vài ví dụ về các phần tử cấu trúc
1.7. Một số dạng biểu diễn đường thẳng trong các bản vẽ kỹ thuật
2.1. Anh và đối tượng trong ảnh
2.2. Quan hệ giữa hai tập hợp

2.3. Phép biến đổi tập hợp
2.4. Hiệu quả của thao tác nhị phân đơn giản trên một ảnh nhỏ
2.5. Giãn A bởi В
2.6. Giãn mất điểm ảnh
2.7. Phép giãn nhị phân
2.8. Quá trình quét của phần tử cấu trúc trên hình ảnh nhị phân
2.9. Giãn ảnh sử dụng phần tử cấu trúc
2.10. Phép co nhị phân
2.11. Phép co nhị phân trên hai đối tượng
2.12. Quá trình lọc đối tượng
2.13. ứng dụng của phép co ảnh dưới dạng số nhị phân
2.14. Quá trình thực hiện phép mở ảnh
2.15. Phép mở ảnh trên phương diện ý nghĩa hình học
2.16. Quá trình thực hiện phép đóng ảnh
2.17. Minh họa phép đóng ảnh trên phương diện ý nghĩa hình học
2.18. Minh họa phép biến đổi trúng hoặc trượt
MỞ ĐẦU
1. Lí do chon đề tài

Cùng với ngôn ngữ, các thông tin duới dạng hình ảnh đóng một vai trò rất
quan trọng trong công việc trao đổi thông tin. Chính vì vậy những năm gần đây đã
có sự kết hợp rất chặt chẽ giữa ảnh và đồ hoạ trong lĩnh vực xử lý thông tin. Trong
công nghệ thông tin, xử lý ảnh chứa một vai trò rất quan trọng, bởi các ứng dụng
đa dạng và phong phú của nó trong nhiều lĩnh vực khoa học. Xử lý ảnh là một bộ
5
phận quan trọng trong việc trao đổi thông tin giữa người và máy. Nó góp phần
làm cho việc quan sát trở nên tốt hơn.
Hình ảnh là một dạng dữ liệu đóng vai trò quan trọng trong việc trao đổi, xử
lý, lưu giữ thông tin Trong một số các loại hình công việc, người ta đều càn đến
hình ảnh để mô tả, minh chứng hay diễn đạt những điều mà đôi khi chữ viết hay

ngôn ngữ nói không diễn tả hết được, phải tổ chức việc lưu các dạng hình ảnh này
như thế nào? Có cần xử lý trước khi lưu chúng không? Câu trả lời là có. Do vậy
tiền xử lý ảnh là việc cằn làm. Tăng cường chất lượng ảnh, mà công đoạn đàu tiên
là một bước tiền xử lý nhằm xác định ảnh, khắc phục những khiếm khuyết do
bước thu nhận ảnh không tốt là việc làm quan trọng. Có nhiều phương pháp cho
việc cải thiện chất lượng ảnh nói chung và tiền xử lý nói riêng. Trong luận văn
này tôi chỉ mô tả một vài phương pháp tiền xử lý hình ảnh (chú trọng đến ảnh nhị
phân, bởi ảnh của các bản vẽ kỹ thuật về sách Scan thường chỉ là ảnh 2 màu: đen,
trắng) nhằm cải thiện chất lượng ảnh nhị phân bằng các thao tác Hình thái học.
Các thao tác Hình thái học nói chung, đặc biệt là Hình thái học số được sử
dụng chủ yếu vào việc cải thiện ảnh bằng cách làm rõ (tái hiện) những nét đặc
trưng của các hình dạng, do vậy mà có thể tính toán được hay nhận biết được
chúng một cách dễ dàng. Việc sử dụng các thao tác hình thái và ứng dụng của
chúng, đặc biệt là ứng dụng cải thiện chất lượng ảnh cho bước tiền xử lý, trước
khi thực hiện những bước kế tiếp cho công việc xử lý ảnh. Chính vì những lí do
trên mà tôi đã lựa chọn đề tài: “Nghiên cứu phương pháp cải thiện chất luợng ảnh
nhị phân bằng phép toán hình thái ”
2. Mục đích nghiên cứu
Tìm hiểu nghiên cứu một số kỹ thuật nhằm cải thiện chất lượng ảnh nhị
phân vào xử lý các đối tượng trong hình ảnh và xây dựng chương trình ứng dụng
thực tế.
3. Nhiệm vụ nghiên cứu
1. Tìm hiểu về phương pháp cải thiện chất lượng ảnh nhị phân
2. Tìm hiểu về cải thiện chất lượng ảnh bằng phép toán hình thái
6
3. ứng dụng của phép toán hình thái trong cải thiện chất lượng ảnh
4. Đổi tượng và phạm vi nghiên cứu
Các vấn đề về cải thiện chất lượng ảnh nhị phân bằng phép toán hình thái.
5. Phương pháp nghiên cứu
Trong quá trình triển khai đề tài, tôi sử dụng chủ yếu các phương pháp: thu

thập tài liệu liên quan đến đề tài, tìm hiểu các tài liệu, các bài báo của các tác giả
theo định hướng của giáo viên hướng dẫn.
6. Cấu trúc của luân văn
Luận văn gồm phần mở đầu và 03 chương nội dung:
Chương 1: Tổng quan về phương pháp cải thiện chất lượng ảnh Chương 2:
Cải thiện chất lượng ảnh nhị phân bằng phép toán hình thái Chương 3: Cài
đặt thử nghiệm chương trình
Sau cùng là Kết luận và Tài liệu tham khảo.
CHƯƠNG 1. TỔNG QUAN VÈ PHƯƠNG PHÁP CẢI THIỆN CHẤT
LƯỢNG ẢNH
1.1. Giói thiệu chung về xử lý ảnh
Xử lý ảnh là đối tượng nghiên cứu của lĩnh vực thị giác máy, là quá trình
biến đổi từ một ảnh mới với các đặc tính và tuân theo ý muốn của người sử dụng.
Xử lý ảnh có thể gồm các quá trình phân tích, phân lớp các đối tượng, làm tăng
chất lượng, phân đoạn và tách cạnh, gán nhãn cho vùng hay quá trình biên dịch
các thông tin hình ảnh của ảnh.
Cũng như xử lý dữ liệu bằng đồ họa, xử lý ảnh số là một lĩnh vực của tin
học ứng dụng. Xử lý dữ liệu bằng đồ họa đề cập đến những hình ảnh nhân tạo, các
ảnh này được xem xét như là một cấu trúc dữ liệu và được tạo ra YỚi các chương
trình. Xử lý ảnh số bao gồm các phương pháp và kỹ thuật biến đổi, để truyền tải
hoặc mã hóa các ảnh tự nhiên.
Xử lý ảnh là lĩnh vực nghiên cứu, là quá trình biến đổi từ một ảnh ban đầu
sang một ảnh mới tuân thủ tính chất các đặc trưng của xử lý ảnh bao gồm.
7
Thứ nhất: Biến đổi ảnh và làm đẹp ảnh.
Thứ hai: Tự động phân tích nhận dạng ảnh hay đoán nhận ảnh và đánh giá
nội dung của ảnh.
Nhận biết và đánh giá các nội dung của ảnh là sự phân tích một hình ảnh
thành những phần có nghĩa để phân biệt đối tượng này với đối tượng khác. Dựa
vào đó ta có thể mô tả cấu trúc của hình ảnh ban đàu. Có thể liệt kê một số

phương pháp nhận dạng cơ bản như nhận dạng biên của một đối tượng trên ảnh
tách cạnh, phân đoạn hình ảnh. Kỹ thuật này được dùng nhiều trong y học (xử lý
tế bào, nhiễm sắc thể), nhận dạng chữ in hoặc đánh máy trong văn bản phục vụ
cho việc tự động hóa quá trình đọc tài liệu, tăng nhanh tốc độ và chất lượng thu
nhận thông tin từ máy tính.
8
Quá trình xử lý ảnh [1] được xem như là quá trình thao tác ảnh đầu vào
nhằm cho ra kết quả mong muốn. Kết quả đẩy ra của một quá trình xử lý có thể là
một ảnh "tốt hơn" hoặc một kết luận.
Hình 1.1. Quá trình xử lý ảnh Ảnh có thể xem là tập hợp
các điểm ảnh và mỗi điểm ảnh được xem như là đặc trưng cường độ sáng hay một
dấu hiệu nào đó tại một vị trí nào đó của đối tượng trong không gian.
Sơ đồ tổng quát của một hệ thống xử lý ảnh [1]:
Hình 1.2. Các bước cơ bản trong một hệ thống xử lý ảnh Trước hết là
quá trình thu nhận ảnh. Ảnh có thể thu nhận qua camera, thường ảnh thu nhận qua
camera là tín hiệu tương tự (loại camera ống kiểu CCIR) nhưng cũng có thể là tín
hiệu số hóa (loại CCD).
Ảnh có thể thu nhận từ vệ tinh qua các bộ cảm ứng (sensor), hay ảnh, sách được
quét qua scanner. Tiếp theo là quá trình số hóa (Digitalizer) để biến
9
Camer
a
Sensor
Hệ quyết định
Lưu
trữ
i i
Tiền xử

í i

Trích chọn
đặc điểm
- -
I
Hậu xử

Đối sách rút
ra kết luân


Lưu trữ
đổi tín hiệu tương tự sang tín hiệu rời rạc (lấy mẫu) và số hóa bằng lượng hóa,
trước khi chuyển sang giai đoạn xử lý, phân tích hay lưu trữ lại.
Quá trình phân tích ảnh thực chất bao gồm nhiều công đoạn nhỏ. Trước hết
là công việc tăng cường hình ảnh để cải thiện chất lượng hình ảnh. Do vậy càn
phải tăng cường và khôi phục lại ảnh để làm nổi bật một số đặc tính chính của
ảnh. Giai đoạn tiếp theo là phát hiện các đặc tính như biên, phân vùng ảnh, trích
chọn các đặc trưng, Cuối cùng tùy theo mục đích của quá trình xử lý ảnh, sẽ là
giai đoạn nhận dạng, phân lớp hay các quyết định khác. Các bước cơ bản trong
một hệ thống xử lý ảnh có thể mô tả ở hình 1.2.
1.2. Giói thiệu ảnh nhị phân
Như đã giới thiệu ở trên trong quá trình xử lý ảnh khi ảnh được nhận vào
máy tính phải được mã hóa. Hình ảnh khi lưu trữ dưới dạng tập tin phải được số
hóa tiêu chuẩn đặt ra là ảnh phải lưu trữ thế nào sao cho các ứng dụng khác nhau,
có thể thao tác trên các loại dữ liệu này.
1.2.1. Một số khái niệm cơ bản
Một số khái niệm cơ bản trong xử lý ảnh [1], [4]:
1.2.1.1. Ảnh và điểm ảnh
Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ sáng
chúng được biểu diễn bằng một thành hai biến thực hoặc phức kí hiệu là f(x,y).

Trong đó X, y là các giá trị tọa độ không gian và giá trị của f sẽ tỉ lệ YỚi độ sáng
của ảnh tại thời điểm này.
Để có thể xử lý ảnh bằng máy tính càn thiết phải tiến hành số hóa ảnh.
Trong quá trình số hóa, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc,
thông qua quá trình lấy mẫu (rời rạc hóa về không gian) và lượng tử hóa thành
phần giá trị mà về nguyên tắc mắt thường không phân biệt được hai điểm kề nhau.
Trong quá trình này, người ta sử dụng khái niệm Picture element mà ta quen gọi
hay viết tắt là Pixcel - Phần tử ảnh. Như vậy, mỗi ảnh là một tập hợp các Pixcel.
1.2.1.2. Độ phân giải
1
Độ phân giải (Resolution) là mật độ của ảnh được ấn định trên ảnh số khi
hiển thị. Như vậy khoảng cách giữa các điểm ảnh được chọn sao cho mắt người
vẫn thấy được sự liên tục của ảnh. Việc chọn này tạo nên mật độ phân bổ đó chính
là độ phân giải được phân bổ liên tục theo x,y.
1.2.1.3. Mức xám
Mức xám (gray level): là kết quả sự mã hóa tương ứng một cường độ sáng
của mỗi điểm ảnh với một giá trị số. Đây cũng chính là kết quả của quá trình
lượng tử hóa. Ảnh có nhiều mức xám. Cách mã hóa kinh điển thường dùng là 16,
32 hay 64 mức. Mã hóa 256 mức là phổ dụng nhất do lý do kỹ thuật vì 2
8
= 256
(1, 1, 255) nên YỚi 256 mức mỗi pixcel sẽ được mã hóa bởi 8 bit.
1.2.1.4. Ảnh nhị phân
Tùy theo vùng các giá trị mức xám của điểm ảnh, mà các ảnh được phân
chia thành ảnh màu ảnh xám, hay ảnh nhị phân. Ảnh chỉ cho hai mức xám là 0 và
1 thì ta nói đó là một ảnh nhị phân hoặc ảnh đen trắng và các điểm ảnh của nó gọi
là điểm ảnh nhị phân.
1.2.1.5. Ảnh màu và ảnh xám
* Ảnh màu
Ảnh màu là tổ họp từ ba màu cơ bản : đỏ (Red), lục (Green), lam (Blue) và

thường thu nhận trên các dải băng tần khác nhau. Để biểu diễn cho mỗi điểm ảnh
màu càn 3 byte để mô tả 24 bit màu.
* Ảnh xám
Ảnh xám là trường hợp đặc biệt của ảnh màu. Mỗi điểm ảnh màu có 3 giá
trị (Red, Green, Blue), nếu 3 giá trị này bằng nhau thì ta có ảnh xám.
1.2.1.6. Khử nhiễu
Có hai loại nhiễu cơ bản trong quá trình thu nhận ảnh:
- Nhiễu hệ thống: là nhiễu có quy luật có thể khử bằng các phép biến
đổi.
- Nhiễu ngẫu nhiên: vết bẩn không rõ nguyên nhân có thể khắc phục bằng
phép lọc.
1
1.2.1.7. Chỉnh mức xám.
Nhằm khắc phục tính không đồng đều của hệ thống gây ra. Thông thường
có 2 hướng tiếp cận:
- Giảm số mức xám: Thực hiện bằng các nhóm các mức xám gần nhau
thành một bó. Trường hợp có 2 mức xám thì chính là chuyển về ảnh đen trắng,
ứng dụng in ảnh màu ra máy in đen trắng.
- Tăng số mức xám: Thực hiện nội suy ra các mức xám trung gian bằng kỹ
thuật nội suy. Kỹ thuật này nhằm tăng cường độ mịn cho ảnh.
1.2.1.8. Trích chọn đặc điểm
Các đặc điểm của đối tượng được trích chọn tùy theo mục đích nhận dạng
trong quá trình xử lý ảnh. Có thể nêu ra một số đặc điểm của ảnh sau đây:
Đặc điểm không gian: phân bố mức xám, phân bố xác suất, biên độ, điểm
uốn, V.V
Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc thực
hiện lọc vùng (zonal filtering). Các bộ vùng được gọi là “mặt nạ đặc điểm”
(feature mask) thường là các khe hẹp với các hình dạng khác nhau (chữ nhật, tam
giác, cung tròn .V.V.).
Đặc điểm biên và đường biên: Đặc trưng cho đường biên của đối tượng và

do rất hữu ích trong việc trích chọn các thuộc tính bất biến được dùng khi nhận
dạng đối tượng. Các đặc điểm này có thể được trích chọn nhờ toán tử Gradient,
toán tò Laplace.
Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối
tượng ảnh chính xác, với tốc độ tính toán cao và dung lượng nhớ lưu trữ giảm
xuống.
1.2.1.9. Nhận dạng
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà muốn đặc
tả nó. Quá trình nhận dạng thường đi sau quá trình trích chọn các đặc tính chủ yếu
của đối tượng. Có hai kiểu mô tả đối tượng:
- Mô tả tham số (nhận dạng theo tham số).
1
- Mô tả theo cấu trúc (nhận dạng theo cấu trúc).
Trên thực tế, người ta đã áp dụng kỹ thuật nhận dạng khá thành công với
nhiều đối tượng khác nhau như: nhận dạng ảnh vân tay, nhận dạng chữ (chữ cái,
chữ số, chữ có dấu).
Nhận dạng chữ in hoặc đánh máy phục vụ cho việc tự động hóa quá trình
đọc tài liệu, tăng nhanh tốc độ và chất lượng thu nhận thông tin từ máy tính.
Nhận dạng chữ viết tay (với mức độ ràng buộc khác nhau về cách viết, kiểu
chữ, ) phục vụ cho nhiều lĩnh vực.
1.2.1.10. Nén ảnh
Nhằm giảm thiểu không gian lưu trữ. Thường được tiến hành theo cả hai
khuynh hướng là nén có bảo toàn và không bảo toàn thông tin. Nén không bảo
toàn thì thường có khả năng là nén cao hơn nhưng khả năng phục hồi thì
kém hơn. Trên cơ sở hai khuynh hướng, có 4 cách tiếp cận cơbản trong nén
ảnh:
- Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tàn suất xuất hiện của
giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa thích hợp. Một ví dụ
điển hình cho kỹ thuật mã hóa này là *.TIF.
1

- Nén ảnh không gian: Kỹ thuật này dựa vào vị trí không gian của các điểm ảnh để
tiến hành mã hóa. Kỹ thuật lợi dụng sự giống nhau của các điểm ảnh trong các
vùng gần nhau. Ví dụ cho kỹ thuật này là mã nén *.PCX
- Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng nén không
bảo toàn và do vậy, kỹ thuật thường nén hiệu quả hơn, *.JPG chính là tiếp cận
theo kỹ thuật nén này.
- Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng ảnh, thể hiện sự lặp
lại của các chi tiết. Kỹ thuật nén sẽ tính toán để chỉ cần lưu trữ phần gốc ảnh và
quy luật sinh ra ảnh theo nguyên lý Fractal.
1.2.2. Cải thiện chất lượng ảnh bằng kỹ thuật phát hiện biên và tìm xương
Trong xử lý và nhận dạng ảnh, có một số loại ảnh đường nét gồm các đối
tượng là các đường cong có độ dài lớn hơn nhiều so với độ dày của nó, YÍ dụ như
là ảnh các kí tự, dấu vân tay, sơ đồ mạch điện tử, bản vẽ kỹ thuật, bản đồ Để xử
lý các loại này người ta thường xây dựng các hệ mô phỏng theo cách phân tích
ảnh của con người gọi là hệ thống thị giác máy. Có nhiều hệ thống được cài đặt
theo phương pháp này như hệ thống nhận dạng chữ viết bằng thiết bị quang học
OCR (Optical Character Recognition), hệ thống nhận dạng vân tay AFIS
(Automated fingerprint Identification System)
1
Hình 1.3. Mô hình tổng quát của hệ thống nhận dạng ảnh
1
Có nhiều phương pháp trích chọn đặc điểm được biết tới như phương pháp
sử dụng sóng ngắn (Wavelet), sử dụng hệ số Fourier, sử dụng các mômen bất biến,
sử dụng các đặc trưng của biên như tính trơn và các điểm đặc biệt, sử dụng các
đặc trưng tôpô dựa trên phát hiện biên và tìm xương của đường nét ảnh .Phương
pháp trích chọn đặc điểm sử dụng ảnh được sử dụng nhiều. Kỹ thuật phát hiện
biên và tìm xương là một trong nhiều ứng dụng nghiên cứu và giải quyết một số
vấn đề của bài toán nêu trên công đoạn tiền xử lý ảnh.
1.2.2.1. Phương pháp phát hiện biên
Biên là vấn đề quan trọng trong trích chọn đặc điểm nhằm tiến tới hiểu ảnh.

về mặt toán học người ta xem điểm biên là điểm có sự thay đổi về mức xám. Ví
dụ: đối với ảnh đen trắng, một điểm được gọi là điểm biên nếu nó là điểm đen có
ít nhất một điểm trắng bên cạnh. Tập hợp các điểm biên tạo nên biên hay đường
bao của đối tượng.
Xuất phát từ cơ sở này người ta thường sử dụng hai phương pháp phát hiện
biên cơ bản đó là: phát hiện biên trực tiếp và phát hiện biên gián tiếp [1].
a)Phương pháp phát hiện biên trực tiếp
Phương pháp này làm nổi biên dựa vào sự biến thiên mức xám của ảnh. Kỹ
thuật chủ yếu dùng để phát hiện biên ở đây là dựa vào sự biến đổi theo hướng.
Nếu lấy đạo hàm bậc nhất của ảnh ta có kỹ thuật Gradient, nếu lấy đạo hàm bậc
hai của ảnh ta có kỹ thuật Laplace.
* Kỹ thuật pháp hiện biên Gradient
Theo định nghĩa, Gradient là một véctơ có các thành phần biểu thị tốc độ
thay đổi giá trị của điểm ảnh, ta có:
d/ (*, y)

_ p . ., /(* + dx,y) - f( x, ỳ)

I õ x dx
' ôf(x, y)

_ f(x,y + d y)-f( x,y

)

ô y d y
Trong đó: dx, dy là khoảng cách giữa các điểm theo hướng X, y (khoảng
cách tính bằng số điểm).
1
õ x

z

2
/
Việc xấp xỉ đạo hàm bậc nhất theo các hướng X, y được thực hiện thông
qua hai mặt nạ nhân chập tương ứng sẽ cho ta các kỹ thuật phát hiện biên khác
nhau (kỹ thuật Sobel, kỹ thuật Prewitt ).
* Kỹ thuật phát hiện biên Laplace
Các phương pháp đánh giá Gradient ở trên làm việc khá tốt khi mà độ sáng
thay đổi rõ nét. Khi mức xám thay đổi chậm, miền chuyển tiếp trải rộng, phương
pháp cho hiệu quả hơn đó là phương pháp sử dụng đạo hàm bậc hai Laplace.
Toán tử Laplace được định nghĩa như sau:
d x
2
d y
2
Ta có:

2
/ Ô M ô
TỶ =
+ l
\ y - f i x , ỳ ) )
o x o x o x o x
~ [ f { x + l , y ) - f { x , y j \ - \ f ( x , y ) - f{ x - 1, >0]
* /(* + y) -
2
/(*> y) + fi x -1, y )
Tương tự ta cũng có
ô

2
/
f ( x , y + l ) - 2 f i x , ỳ ) + f ( x , y - l )
2 f ( x + ỉ , y ) - 2 f ( x , y ) + f ( x - ỉ , y )
Từ đó ta có -
i f ( x , y + l ) - 2 f ( x , y ) + f ( x , y - 1)
_ày
2
Vậy: V
2
/ = / -1(* +1 , y ) + f ( x , y + 1) - 4 f ( x , y ) + f i x -1 , y ) + f ( x , y )
b) Phát hiện biên gián tiếp
Nếu bằng cách nào đó ta phân được ảnh thành các vùng thì ranh giới giữa các vùng
đó gọi là biên. Kỹ thuật dò biên và phân vùng ảnh là hai bài
1
ày
r
ô
2
f
toán đối ngẫu nhau YÌ dò biên để thực hiện phân lớp đối tượng mà khi đã xong
nghĩa là đã phân vùng được ảnh và ngược lại, khi đã phân vùng ảnh đã được phân
lớp thành các đối tượng, do đó có thể phát hiện được biên.
Có hai kỹ thuật dò biên cơ bản:
- Kỹ thuật thứ nhất: Xét ảnh biên thu được từ ảnh vùng sau một lần duyệt
như một đồ thị, sau đó áp dụng các thuật toán duyệt cạnh đồ thị.
- Kỹ thuật thứ hai: Dựa trên ảnh vùng, kết hợp đồng thời quá trình dò biên
và tách biên. Ở đây ta quan tâm cách tiếp cận thứ hai.
Trước hết, giả sử ảnh được xét chỉ bao gồm một vùng ảnh 8 - liên thông,
được bao bọc bởi một vành đai cách điểm nền.

về cơ bản, các thuật toán dò biên trên một vùng đều bao gồm các bước sau:
- Xác định điểm biên xuất phát.
- Dự báo và xác định điểm biên tiếp theo.
- Lặp bước 2 cho đến khi gặp điểm xuất phát.
Do xuất phát từ những tiêu chuẩn và định nghĩa khác nhau về điểm biên và
quan hệ liên thông, các thuật toán dò biên cho ta các đường biên mang các sắc thái
rất khác nhau.
Kết quả tác động của toán tử dò biên lên một điểm biên là điểm biên +1.
Thông thường các toán tử này được xây dựng như một hàm đại số Boolean trên
các 8 - láng giềng của điểm biên. Mỗi cách xây dựng các toán tử đều phụ thuộc
vào định nghĩa quan hệ liên thông và điểm biên. Do đó sẽ gây khó khăn cho việc
khảo sát các tính chất của đường biên. Ngoài ra, vì mỗi bước dò biên đều phải
kiểm tra tất cả các 8 - láng giềng của mỗi điểm nên thuật toán thường kém hiệu
quả. Để khắc phục các hạn chế trên, thay YÌ sử dụng một điểm biên ta sử dụng
cặp điểm biên (ngoài và trong), các cặp điểm này tạo nên tập nền vùng, tiếp theo
phân tích toán tử dò biên thành 2 bước:
- Xác định cặp điểm nền vùng tiếp theo.
- Lựa chọn điểm biên.
1
Trong đó bước thứ nhất thực hiện chức năng của một ánh xạ trên tập nền
vùng lên nền vùng tiếp theo và bước thứ hai thực hiện chức năng chọn điểm biên.
Thuật toán dò biên tổng quát
Bước 1: Xác định cặp nền - vùng xuất phát.
Bước 2: Xác định cặp nền - vùng tiếp theo.
Bước 3: Lựa chọn điểm biên.
Bước 4: Nếu gặp lại cặp xuất phát thì dừng, nếu không quay lại bước 2.
Việc xác định cặp nền - vùng xuất phát được thực hiện bằng cách duyệt ảnh
lần lượt từ trên xuống dưới và từ trái qua phải rồi kiểm tra điều kiện lựa
chọn cặp nền - vùng. Do việc chọn điểm biên chỉ mang tính chất quy ước, nên
ta gọi ánh xạ xác định cặp nền - vùng tiếp theo là toán tử dò biên.

c) Kết luận
Phương pháp phát hiện biên trực tiếp tỏ ra khá hiệu quả và ít chịu ảnh
hưởng của nhiễu, song nếu sự biến thiên độ sáng không đột ngột, phương pháp tỏ
ra kém hiệu quả, phương pháp phát hiện biên gián tiếp tuy khó cài đặt, song lại áp
dụng khá tốt trong trường hợp này.
1.2.2.2. Kỹ thuật tìm xương
Xương được coi như hình dạng cơ bản của một đối tượng, với số ít các
điểm ảnh cơ bản. Ta có thể lấy được các thông tin về hình dạng nguyên bản của
một đối tượng thông qua xương.
Một định nghĩa xúc tích về xương dựa trên tính continum (tương tự như
hiện tượng cháy đồng cỏ) được đưa ra bởi Blum (1976) [3] như sau: Giả thiết rằng
đối tượng là đồng nhất được phủ bởi cỏ khô và sau đó dụng lên một vòng biên
lửa. Xương được định nghĩa như nơi gặp của các vệt lửa và tại đó chúng được dập
tắt.
1
Hình 1.4. Ví dụ về ảnh và xương
Kỹ thuật tìm xương luôn là chủ đề nghiên cứu trong xử lý ảnh những năm
gần đây. Mặc dù có những nỗ lực cho việc phát triển các thuật toán tìm xương,
nhưng các phương pháp đưa ra đều bị mất mát thông tin. Có thể chia thành hai
loại thuật toán tìm xương cơ bản [1].
- Thuật toán tìm xương dựa trên làm mảnh.
- Thuật toán tìm xương không dựa trên làm mảnh.
a) Tìm xương dựa trên làm mảnh
Thuật toán làm mảnh ảnh số nhị phân là một trong các thuật toán quan
trọng xử lý ảnh và nhận dạng. Xương chứa những thông tin bất biến về cấu trúc
của ảnh, giúp cho quá trình nhận dạng hoặc vectơ hóa sau này.
Thuật toán làm mảnh là quá trình lặp duyệt và kiểm tra tất cả các điểm
thuộc đối tượng. Trong mỗi làn lặp tất cả các điểm của đối tượng sẽ được kiểm
tra: Neu như chúng thỏa mãn điều kiện xóa nào đó tùy thuộc và mỗi thuật toán thì
nó sẽ bị xóa đi. Quá trình cứ lặp lại như vậy cho đến khi không còn điểm biên nào

được xóa. Đối tượng được bóc dần lớp biên cho đến khi điểm nào bị thu mảnh lại
chỉ còn các điểm biên.
Các thuật toán làm mảnh được phân loại dựa trên phương pháp xử lý các
điểm là thuật toán làm mảnh song song và thuật toán làm mảnh tuần tự.
Thuật toán làm mảnh song song, là thuật toán mà trong đó các điểm được
xử lý theo phương pháp song song, tức là được xử lý cùng một lúc. Giá trị của
mỗi điểm sau một lần lặp chỉ phụ thuộc vào giá trị của các láng giềng bên cạnh
(thường là 8 - láng giềng) mà giá trị của các điểm này đã được xác định trong lần
2
lặp trước đó. Trong máy có nhiều bộ vi xử lý sẽ xử lý một vùng của đối tượng, nó
có quyền đọc từ các điểm ở vùng khác nhưng chỉ được ghi trên vùng của nó xử lý.
Trong thuật toán làm mảnh tuần tự các điểm thuộc đối tượng sẽ được kiểm
tra theo một thứ tự nào đó (chẳng hạn các điểm được xét từ trái qua phải, từ trên
xuống dưới). Giá trị của các điểm sau mỗi lần lặp không những phụ thuộc vào giá
trị của các láng giềng bên cạnh mà còn phụ thuộc vào các điểm đã được xét trước
đó trong chính làn lặp đang xét.
Chất lượng của thuật toán làm mảnh được đánh giá theo các tiêu chuẩn
được liệt kê dưới đây nhưng không nhất thiết phải thỏa mãn đồng thời tất cả các
tiêu chuẩn.
• Bảo toàn tính liên thông của đối tượng và phần bù của đối tượng.
• Sự tương hợp giữa xương và cấu trúc của ảnh đối tượng.
• Bảo toàn các thành phàn liên thông.
• Bảo toàn các điểm cụt.
• Xương chỉ gồm các điểm biên, càng mảnh càng tốt.
• Bền vững đối với nhiễu.
• Xương cho phép khôi phục ảnh ban đầu của đối tượng.
• Xương thu được ở chính giữa đường nét của đối tượng được làm mảnh.
• Xương nhận được bất biến với phép quay.
b) Tìm xương không dựa trên làm mảnh
Để tách được xương của đối tượng có thể sử dụng đường biên của đối

tượng. Với điểm p bất kỳ trên đối tượng, ta bao nó bởi một đường biên. Nếu như
có nhiều điểm biên có cùng khoảng cách ngắn nhất tới p thì p nằm trên
trục trung vị. Tập tất cả các điểm như vậy lập thành trục trung vị hay xương của
đối tượng. Việc xác định đối tượng được tiến hành thông qua hai bước:
• Bước thứ nhất: tính khoảng cách từ mỗi điểm ảnh của đối tượng đến điểm biên
gần nhất. Như vậy cần phải tính toán khoảng cách tới tất cả các điểm biên của
ảnh.
2
• Bước thứ hai: khoảng cách ảnh đã được tính toán và các điểm ảnh có giá trị lớn
nhất được xem là nằm trên xương của đối tượng.
1.2.3. Các phép toán Logic liên quan đến ảnh nhị phân
Phép toán cơ bản nhất được sử dụng trong xử lý ảnh là: phép AND, phép
OR, và phép toán NOT. Các tính chất của chúng được định nghĩa trong bảng
dưới đây:
Các phép toán cơ bản được sử dụng trong xử lý ảnh là AND ( A ) , O R
( v), NOT Các phép toán đó là cung cấp đầy đủ các chức năng, chúng có thể
được kết hợp dưới bất kỳ dạng nào của phép toán logic.
Toán tử logic được thực hiện trên một điểm ảnh cơ sở giữa các điểm ảnh
tương ứng của hai hoặc nhiều hình ảnh (ngoại trừ NOT, đó là toán tử các điểm
ảnh của một hình ảnh đơn giản). Bởi YÌ toán tử AND của hai biến nhị phân chỉ
là 1 khi cả hai biến là 1, YÌ vậy trong một hình ảnh ở bất kỳ vị trí nào thì với
toán tử AND giữa các điểm ảnh tương ứng, ta thu được kết quả là 1 khi và chỉ
khi các điểm ảnh đầu vào đều có giá trị là 1. Hình 1.5. là ví dụ để
2
p Q p/\q pvq iP
0 0 0 0 1
0 1 0 1 1
1 0 0 1 0
1 1 1 1 0
minh họa cho các phép toán logic, phần có màu xẫm là phần có giá trị là 1, phần

màu trắng là phần có giá trị là 0.
Các phép toán logic khác được xây dựng dựa trên các phép toán đã được
định nghĩa ở trên. Cho một ví dụ: Phép toán XOR (dựa trên phép toán AND và
NOT), giá trị của nó là 1 nếu giá trị của một trong hai điểm ảnh có giá trị là 1
(không phải là cả hai), và giá trị của nó là 0 khi cả hai điểm ảnh đều có giá trị là 0
hoặc 1. Phép toán này khác phép toán OR, giá trị trả về sẽ là 1 khi một trong hai
điểm ảnh đầu vào là 1, hoặc khi cả hai điểm ảnh đầu vào là 1. Phép toán NOT -
AND chỉ trả về giá tri là 0 khi cả hai điểm ảnh đầu vào là 1.
OR
XOR
NOT-
AND
r
Hình 1.5. Một sô phép toán logic giữa các hình ảnh nhị phân
2
NO
A
NOT(A)
(A) AND (B)
(A) OR (B)
B
(A) XOR (B)
(A) N-AND (B)
Phần có màu xẫm có các giá trị là 1, và phần có màu trắng có các giá trị
là 0.
Phép toán hình thái cung cấp hai phép toán cơ bản là phép giãn nhị phân
(Dilation) và phép co nhị phân (Erosion), hai phép này là cơ sở ban đầu cho nhiều
ứng dụng về hình thái khác.
Để đi vào tìm hiểu các phép toán hình thái, đầu tiên ta làm quen với một số
khái niệm quan trọng thường được sử dụng trong bài viết.

Phần tử cấu trúc (Constructing elements): Đôi khi được gọi là một nhân
(Kernel). Nhưng thuật ngữ này thường được sử dụng cho các đối tượng trong tích
chập (Convolutions). Các phần tử cấu trúc thường được quy định theo một mẫu
riêng dựa trên tọa độ của một số điểm có liên quan tới đối tượng nào đó. Ta quan
sát ví dụ từ hình minh họa phía dưới, đó là các mẫu đặc trưng cho các phần tử cấu
trúc có kích thước khác nhau.
1
-1
1
-1

-1
1
-1
-1
-1
1
1
- S - 1 - 1 - 1 1
1 " I - 1 - 1 1
-
1
1
1 1 1 1
-
I
1
1
-
1

1 - 1 - 1 1 1 1
1 1 1 C Đ 1 1 1 1
1 1 1 1 1 1 1 1 1
1 1 - Í - 1 - 1
-
1
1
- 1 - 1 - 1 1
- 1 - 1 1 - 1 1
1
1
1
Cc
D
1
o
Hình 1.6. Một vài ví dụ về các phần tử cấu trúc Ở hình
1.6 có đưa ra hai kiểu phần tử cấu trúc đặc trưng có kích
thước 3x3 và 9x9 các vòng tròn đánh dấu gốc của phần tử
cấu trúc ở hai kiểu này khác nhau, nhưng đều có đặc điểm
chung là vòng đánh dấu tâm điểm luôn được đặt ở điểm có
tọa độ ở trung tâm của phần tử cấu trúc.
1 -1 -1
1
©
1 1 1

×