Tải bản đầy đủ (.pdf) (63 trang)

Nghiên cứu phép toán hình thái trong xử lý ảnh và ứng dụng nâng cao chất lượng ảnh nhị phân luận văn ths công nghệ th

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.66 MB, 63 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

LƯU THỊ LIỄU

NGHIÊN CỨU PHÉP TOÁN HÌNH THÁI TRONG XỬ LÝ ẢNH VÀ ỨNG
DỤNG NÂNG CAO CHẤT LƯỢNG ẢNH NHỊ PHÂN

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

Hà Nội – Năm 2015


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

LƯU THỊ LIỄU

NGHIÊN CỨU PHÉP TOÁN HÌNH THÁI TRONG XỬ LÝ ẢNH VÀ ỨNG
DỤNG NÂNG CAO CHẤT LƯỢNG ẢNH NHỊ PHÂN

Ngành: Công nghệ thông tin
Chuyên ngành: Truyền dữ liệu và mạng máy tính
Mã số: Chuyên ngành đào tạo thí điểm

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS NGÔ QUỐC TẠO

Hà Nội – Năm 2015



LỜI CAM ĐOAN
Tác giả xin cam đoan những kết quả nghiên cứu được trình bày trong luận văn là
hoàn toàn trung thực của tác giả, không vi phạm bất cứ điều gì trong luật sở hữu trí tuệ
và pháp luật Việt Nam. Nếu sai, tác giả hoàn toàn chịu trách nhiệm trước pháp luật.
Người cam đoan

Lưu Thị Liễu


1

LỜI CẢM ƠN
Em xin gửi lời cảm ơn chân thành tới PGS. TS. Ngô Quốc Tạo - người đã trực
tiếp hướng dẫn và định hướng giúp em có thể nhanh chóng tiếp cận, nắm bắt kiến thức
và hoàn thành luận văn. Em xin gửi lời cảm ơn tới các thầy cô giáo trường Đại học
Công Nghệ -Đại học Quốc Gia Hà Nội, đã giảng dạy và chỉ bảo em 2 năm học vừa
qua.
Qua đây tác giả cũng xin gửi lời cảm ơn đến những người thân trong gia đình,
bạn bè, đồng nghiệp đã động viên và tạo mọi điều kiện giúp tác giả trong quá trình học
tập cũng như trong cuộc sống.


2

MỤC LỤC
LỜI CAM ĐOAN....................................................................................................... 0
LỜI CẢM ƠN ............................................................................................................ 1
MỤC LỤC .................................................................................................................. 2
DANH MỤC CÁC HÌNH VẼ.................................................................................... 4

LỜI MỞ ĐẦU ............................................................................................................ 5
CHƯƠNG 1................................................................................................................ 6
TỔNG QUAN VỀ PHƯƠNG PHÁP NÂNG CAO CHẤT LƯỢNG ẢNH ............. 6
1.1 Giới thiệu chung về xử lý ảnh……………………………………………………6
1.2. Một số vấn đề trong xử lý ảnh………………………………………………….8
1.2.1 Điểm ảnh (Picture Element)......................................................................... 8
1.2.2 Độ phân giải của ảnh................................................................................... 9
1.2.3 Mức xám của ảnh......................................................................................... 9
1.2.4. Quan hệ giữa các điểm ảnh......................................................................... 9
1.2.5. Lược đồ mức xám (Histogram) ................................................................. 10
1.2.6. Biểu diễn ảnh ............................................................................................ 11
1.2.7. Biến đổi ảnh (Image Transform) .............................................................. 12
1.2.8 Tăng cường ảnh – khôi phục ảnh ............................................................... 12
1.2.9. Nhận dạng ảnh.......................................................................................... 13
1.2.10. Các loại định dạng tập tin ảnh cơ bản .................................................... 14
1.2.11. Hiệu chỉnh gamma .................................................................................. 15
1.2.12. Phân vùng ảnh ........................................................................................ 15
1.3. Nâng cao chất lượng ảnh sử dụng các toán tử điểm…………………………..15
1.3.1. Điều chỉnh độ tương phản ......................................................................... 15
1.3.2.Phân ngưỡng nhị phân ............................................................................... 16
1.3.3. Biến đổi âm bản ........................................................................................ 16
1.3.4. Hiệu chỉnh ánh sáng trong ảnh ................................................................. 17
1.3.5. Đổi ảnh RGB sang ảnh grayscale ............................................................. 17
1.4. Nâng cao chất lượng ảnh dùng toán tử không gian…………………………..19
CHƯƠNG 2.............................................................................................................. 20
PHÉP TOÁN HÌNH THÁI TRONG XỬ LÝ ẢNH ................................................ 20
2.1. Giới thiệu………………………………………………………………………...20
2.2. Phần tử cấu trúc………………………………………………………………...20
2.3. Các phép toán với ảnh nhị phân……………………………………………….22
2.3.1. Phép giãn nhị phân (Dilation).................................................................. 22

2.3.2. Phép co nhị phân (Erosion) ...................................................................... 26
2.3.3. Phép mở ảnh (Opening) và phép đóng ảnh (Closing)……………………….29
2.3.3.1. Phép mở ảnh .......................................................................................... 29
2.3.3.2. Phép đóng ảnh ....................................................................................... 30
2.4. Các thao tác trên ảnh xám 31
2.4.1. Phép co ..................................................................................................... 31
2.4.2. Phép dãn................................................................................................... 32
2.4.3 Phép toán đóng mở ảnh ............................................................................. 33


3

2.5. Phép toán hình thái Gradient (Morphology Gradient Operator)……………33
2.6. Một số tính chất của phép toán hình thái……………………………………...35
2.7. Một số thuật toán dựa trên phép toán hình thái………………………………35
2.7.1. Trích biên ( Boundary Extraction) ............................................................ 35
2.7.2. Làm đầy (Region Filling) .......................................................................... 37
2.7.3. Làm mảnh(Thinning) ................................................................................ 38
2.7.4. Làm dày đối tượng trong ảnh – Thickening ............................................... 41
2.7.5. Tìm khung xương (Skeletonization) ........................................................... 41
CHƯƠNG 3.............................................................................................................. 43
ỨNG DỤNG NÂNG CAO CHẤT LƯỢNG ẢNH VĂN BẢN ............................... 43
3.1. Đặt vấn đề………………………………………………………………………43
3.2. Khắc phục sự đứt nét cho các tài liệu scan đen –trắng……………………….44
3.3. Khắc phục ảnh văn bản không rõ nét…………………………………………46
3.4. Giới thiệu chương trình………………………………………………………...46
3.5. Thực nghiệm…………………………………………………………………….48
3.6. Đánh giá…………………………………………………………………………50
KẾT LUẬN………………………………………………………………………….55
TÀI LIỆU THAM KHẢO ....................................................................................... 54

PHỤ LỤC………………………………………………………………………………….....57


4

DANH MỤC CÁC HÌNH VẼ
Hình 1.1. Các bước cơ bản trong một hệ thống xử lý ảnh ........................................ 7
Hình 1.2. Biểu đồ Histogram của ảnh .................................................................... 11
Hình 1.3 Hệ tọa độ RGB........................................................................................ 18
hình 1.4 Chuyển ảnh màu rgb sang ảnh gray.......................................................... 19
Hình 2.1. Một số hình dáng của phần tử cấu trúc phẳng ......................................... 21
Hình 2.2. Hiệu quả của thao tác nhị phân đơn giản trên một ảnh nhỏ. .................... 22
Hình 2.3. Dãn A bởi B .......................................................................................... 23
Hình 2.4. Quá trình quét của phần tử cấu trúc trên hình ảnh nhị phân. ................... 24
Hình 2.5. Ví dụ quá trình thực hiện của phép mở ảnh ............................................ 24
Hình 2.6. Quá trình thực hiện phép co nhị phân dùng phần tử cấu trúc đơn giản .... 27
Hình 2.7. Quá trình lọc đối tượng sử dụng phép co nhị phân và phép giãn nhị phân
.............................................................................................................................. 28
Hình 2.8. Ứng dụng của phép co ảnh dưới dạng số nhị phân................................. 28
Hình 2.9. Quá trình thực hiệp phép mở ảnh. .......................................................... 29
Hình 2.10. Quá trình thực hiện phép đóng ảnh. ...................................................... 31
Hình 2.11. Ví dụ về phép toán co ảnh trên ảnh xám với phần tử cấu trúc không
phẳng..................................................................................................................... 31
Hình 2.12. Ví dụ về phép toán dãn ảnh trên ảnh xám với phần tử cấu trúc không
phẳng..................................................................................................................... 32
Hình 2.13. Ví dụ quá trình thực hiện phép dãn ảnh xám ........................................ 33
Hình 2.14. Ví dụ về phép toán hình thái Gradient .................................................. 34
Hình 2.15. Quá trình tìm biên của đối tượng trên ảnh nhị phân. ............................. 36
Hình 2.16. Ví dụ trích lọc biên của đối tượng ........................................................ 36
Hình 2.17. Quá trình làm đầy đối tượng trong ảnh. ................................................ 38

Hình 2.18. Kết quả làm mỏng đối tượng ................................................................ 39
Hình 2.19. Quá trình làm mảnh đối tượng trong hình ảnh. .................................... 40
Hình 2.20. Kết quả làm dày đối tượng ................................................................... 41
Hình 2.21. Quá trình thực hiện thuật toán tìm xương. ............................................ 42
Hình 2.22. Ví dụ ảnh tìm xương của các đối tượng ................................................ 42
Hình 3.1. Hình ảnh văn bản bị xuống cấp…………………………………..43
Hình 3.2. Văn bản bị đứt nét theo chiêu ngang ...................................................... 44
Hình 3.3. Văn bản bị đứt nét theo chiều dọc .......................................................... 44
Hình 3.4. Ví dụ phần tử cấu trúc sẽ giúp giãn chữ theo chiều ngang ...................... 45
Hình 3.5. Ví dụ phần tử cấu trúc sẽ giúp giãn chữ theo chiều dọc .......................... 45


5

LỜI MỞ ĐẦU
Hình ảnh là một dạng dữ liệu đóng vai trò quan trọng trong việc trao đổi, xử
lý, lưu giữ thông tin. Hiện nay nhu cầu lưu trữ và xử lý các tài liệu, văn bản, bản vẽ
kỹ thuật,… dưới dạng hình ảnh scan là nhu cầu thiết yếu. Tuy nhiên, các hình ảnh
scan thu được bởi nhiều lý do có thể bị nhiễu, mờ nhòe, đứt nét… khiến việc thu
nhận thông tin và xử lý gặp nhiều khó khăn. Vì vậy việc khắc phục những nhược
điểm của hình ảnh thu nhận được là việc làm rất cần thiết và quan trọng. Đã có rất
nhiều các kỹ thuật được đưa ra, trong đó có xử lý hình thái học trên ảnh. Các thao
tác hình thái học trên ảnh cung cấp cho chúng ta những mô tả định lượng về cấu
trúc và hình dạng hình học của các đối tượng trong ảnh và nó đang được ứng dụng
rộng rãi trong việc nâng cao chất lượng ảnh, phân đoạn ảnh, kiểm tra khuyết điểm
trên ảnh,…
Trong luận văn này tác giả sẽ nghiên cứu về các phép toán hình thái học trên
ảnh và ứng dụng vào việc nâng cao chất lượng ảnh scan đen – trắng của các văn
bản.
Báo cáo luận văn được chia làm 3 chương:

Chương 1. Tổng quan về phương pháp nâng cao chất lượng ảnh: Chương
này gồm có các khái niệm ban đầu về xử lý ảnh, các kỹ thuật nâng cao chất lượng
ảnh.
Chương 2. Phép toán hình thái học trên ảnh: Chương này trình bày các
phép co – giãn-đóng – mở ảnh trên ảnh nhị phân, ảnh đa cấp xám và các thuật toán
ứng dụng dựa trên các phép toán hình thái.
Chương 3. Ứng dụng nâng cao chất lượng ảnh văn bản: Chương này trình
bày các kỹ thuật được sử dụng trong việc nâng cao chất lượng ảnh scan đen – trắng
của văn bản kém chất lượng (phép đóng ảnh, hiệu chỉnh gamma, phân ngưỡng nhị
phân), đồng thời tiến hành cài đặt các phép toán hình thái học, cài đặt chức năng
nâng cao chất lượng ảnh văn bản scan đen – trắng; trình bày những hình ảnh thực
nghiệm của chương trình.


6

CHƯƠNG 1
TỔNG QUAN VỀ PHƯƠNG PHÁP NÂNG CAO CHẤT LƯỢNG ẢNH

1.1 Giới thiệu chung về xử lý ảnh
Cũng như xử lý dữ liệu bằng đồ hoạ, xử lý ảnh là một lĩnh vực của tin học
ứng dụng. Xử lý dữ liệu bằng đồ họa đề cập đến những ảnh nhân tạo, các ảnh này
được xem xét như là một cấu trúc dữ liệu và được tạo ra bởi các chương trình. Xử
lý ảnh bao gồm các phương pháp và kỹ thuật để biến đổi, để truyền tải hoặc mã hóa
các ảnh tự nhiên. Mục đích của xử lý ảnh gồm:
Thứ nhất, biến đổi ảnh và làm đẹp ảnh.
Thứ hai, tự động nhận dạng ảnh hay đoán nhận ảnh và đánh giá các nội dung
của ảnh.
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người ta
muốn đặc tả nó. Quá trình nhận dạng thường đi sau quá trình trích chọn các đặc tính

chủ yếu của đối tượng. Có hai kiểu mô tả đối tượng:
- Mô tả tham số (nhận dạng theo tham số).
- Mô tả theo cấu trúc(nhận dạng theo cấu trúc).
Nhận biết và đánh giá các nội dung của ảnh là sự phân tích một hình ảnh thành
những phần có nghĩa để phân biệt đối tượng này với đối tượng khác. Dựa vào đó ta
có thể mô tả cấu trúc của hình ảnh ban đầu.
Có thể liệt kê một số phương pháp nhận dạng cơ bản như nhận dạng biên của
một đối tượng trên ảnh, tách cạnh, phân đoạn hình ảnh ... Kỹ thuật này được sử
dụng nhiều trong y học (xử lý tế bào, nhiễm sắc thể).
Trong thực tế người ta đã áp dụng kỹ thuật nhận dạng khá thành công với
nhiều đối tượng khác nhau như: nhận dạng ảnh vân tay, nhận dạng chữ (chữ cái,
chữ số, chữ có dấu). Nhận dạng chữ in hoặc đánh máy trong văn bản phục vụ cho
việc tự động hoá quá trình đọc tài liệu, tăng nhanh tốc độ và chất lượng thu nhận
thông tin từ máy tính, nhận dạng chữ viết tay (với mức độ ràng buộc khác nhau về
cách viết, kiểu chữ, ...).
Các quá trình của xử lý ảnh được tiến hành theo sơ đồ sau:


7

Hình 1.1. Các bước cơ bản trong một hệ thống xử lý ảnh
(theo tài liệu [2])
Sơ đồ này bao gồm các thành phần sau:
a) Phần thu nhận ảnh (Image Acquisition)
Ảnh có thể thu nhận qua camera. Thường ảnh thu nhận qua camera là tín hiệu
tương tự (loại camera ống kiểu CCIR), nhưng cũng có thể là tín hiệu số hoá (loại
CCD - Charge Coupled Device). Ảnh cũng có thể thu nhận từ vệ tinh qua các bộ
cảm ứng (sensor), hay ảnh được quét qua scanner. Tiếp theo là quá trình số hóa
(Digitalizer) để biến đổi tín hiệu tương tự sang tín hiệu rời rạc (lấy mẫu) và số hóa
bằng lượng hóa, trước khi chuyển sang giai đoạn xử lý, phân tích hay lưu trữ lại.

b) Tiền xử lý (Image Processing)
Do những nguyên nhân khác nhau có thể do thiết bị thu nhận ảnh, do nguồn
sáng hay do nhiễu, ảnh có thể có độ tương phản thấp, có thể bị suy biến. Do vậy
Chức năng chính của bộ tiền xử lý là lọc nhiễu, nâng độ tương phản, tăng cường và
khôi phục lại ảnh để làm nổi bật một số đặc tính chính của ảnh, hay làm cho ảnh
gần giống với trạng thái gốc- trạng thái trước khi ảnh bị biến dạng.
c) Phân đoạn (Segmentation) hay phân vùng ảnh
Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để biểu
diễn phân tích, nhận dạng ảnh trên từng vùng.
d) Biểu diễn và mô tả
Tìm các vùng đặc trưng điểm ảnh như biên ảnh (Boundary), vùng ảnh
(Region),….và biểu diễn lại thông qua các điểm ảnh đặc trưng.
e) Nhận dạng và nội suy ảnh (Image Recognition and Interpretation)


8

Nhận dạng ảnh là quá trình xác định ảnh. Quá trình này thường thu được bằng
cách so sánh với mẫu chuẩn đã được học (hoặc lưu) từ trước. Nội suy là phán đoán
theo ý nghĩa trên cơ sở nhận dạng. Ví dụ: một loạt chữ số và nét gạch ngang trên
phong bì thư có thể được nội suy thành mã điện thoại. Có nhiều cách phân loai ảnh
khác nhau về ảnh. Theo lý thuyết về nhận dạng, các mô hình toán học về ảnh được
phân theo hai loại nhận dạng ảnh cơ bản:
- Nhận dạng theo tham số.
- Nhận dạng theo cấu trúc.
Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng trong
khoa học và công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký điện tử),
nhận dạng văn bản (Text), nhận dạng vân tay, nhận dạng mã vạch, nhận dạng mặt
người…
f) Cơ sở tri thức (Knowledge Base)

Tiếp nhận và xử lý theo phương pháp trí tuệ con người.
1.2. Một số vấn đề trong xử lý ảnh
1.2.1 Điểm ảnh (Picture Element)
Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ sáng. Để có thể
xử lý ảnh bằng máy tính cần thiết phải tiến hành số hóa ảnh. Số hoá ảnh là sự biến
đổi gần đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí
(không gian) và độ sáng (mức xám). Khoảng cách giữa các điểm ảnh đó được thiết
lập sao cho mắt người không phân biệt được ranh giới giữa chúng. Mỗi một điểm
như vậy gọi là điểm ảnh (PEL: Picture Element) hay gọi tắt là Pixel. Trong khuôn
khổ ảnh hai chiều, mỗi pixel ứng với cặp tọa độ (x, y).
Định nghĩa: Điểm ảnh (Pixel) là một phần tử của ảnh số tại toạ độ (x, y) với độ xám
hoặc màu nhất định. Kích thước và khoảng cách giữa các điểm ảnh đó được chọn
thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức xám (hoặc
màu) của ảnh số gần như ảnh thật. Mỗi phần tử trong ma trận được gọi là một phần tử
ảnh.

Ảnh được xem như là một tập hợp các điểm ảnh. Khi được số hóa, nó thường được
biểu diễn bởi mảng 2 chiều (ví dụ ảnh I(mxn): m dòng và n cột và có m*n điểm
ảnh). Một điểm ảnh có thể được biểu diễn bằng 1, 4, 8, 24 bits.


9

1.2.2 Độ phân giải của ảnh
Định nghĩa: Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được ấn định
trên một ảnh số được hiển thị.
Theo định nghĩa, khoảng cách giữa các điểm ảnh phải được chọn sao cho mắt người
vẫn thấy được sự liên tục của ảnh. Việc lựa chọn khoảng cách thích hợp tạo nên một
mật độ phân bổ, đó chính là độ phân giải và được phân bố theo trục x và y trong
không gian hai chiều.

Ví dụ: Độ phân giải của ảnh trên màn hình CGA (Color Graphic Adaptor) là một
lưới điểm theo chiều ngang màn hình: 320 điểm chiều dọc * 200 điểm ảnh
(320*200). Rõ ràng, cùng màn hình CGA 12” ta nhận thấy mịn hơn màn hình CGA
17” độ phân giải 320*200. Lý do: cùng một mật độ (độ phân giải) nhưng diện tích
màn hình rộng hơn thì độ mịn (liên tục của các điểm) kém hơn.
1.2.3 Mức xám của ảnh
Một điểm ảnh (pixel) có hai đặc trưng cơ bản là vị trí (x, y) của điểm ảnh và độ xám
của nó. Dưới đây chúng ta xem xét một số khái niệm và thuật ngữ thường dùng
trong xử lý ảnh.
a) Định nghĩa: Mức xám của điểm ảnh là cường độ sáng của nó được gán bằng giá
trị số tại điểm đó.
b) Các thang giá trị mức xám thông thường: 16, 32, 64, 128, 256 (Mức 256 là mức
phổ dụng. Lý do: từ kỹ thuật máy tính dùng 1 byte (8 bit) để biểu diễn mức xám:
Mức xám dùng 1byte biểu diễn: 28=256 mức, tức là từ 0 đến 255).
c) Ảnh xám: là ảnh mà các điểm ảnh có mức xám nằm trong khoảng từ 0 đến 255.
d) Ảnh nhị phân: ảnh chỉ có 2 mức đen trắng phân biệt tức dùng 1 bit mô tả 21 mức
khác nhau. Mỗi điểm ảnh của ảnh nhị phân chỉ có thể là 0 hoặc 1.
e) Ảnh màu: ảnh tổ hợp từ ba màu cơ bản (Red, Blue, Green) để tạo nên thế giới
màu, người ta thường dùng 3 byte để mô tả mức màu, khi đó các giá trị màu:
28*3=224≈ 16,7 triệu màu.
1.2.4. Quan hệ giữa các điểm ảnh
Lân cận của điểm ảnh
Giả sử có điểm ảnh p tại tọa độ (x, y), p có các lân cận gần nhất theo chiều
ngang và dọc là: (x+1,y), (x-1,y), (x,y+1), (x,y-1). Tập hợp các điểm ảnh này được


10

gọi là lân cận 4 của p, ký hiệu N4(p). Mỗi điểm ảnh có khoảng cách đơn vị đến
(x,y), và nếu (x,y) nằm trên biên của ảnh thì lân cận của nó có thể nằm ngoài ảnh.

Các lân cận chéo của p có tọa độ: (x+1,y+1), (x+1,y-1), (x-1,y+1), (x-1,y-1).
Tập lân cận chéo được ký hiệu NP(p).
Tập lân cận chéo cùng với lân cận 4 tạo thành lân cận 8 của p, ký hiệu N8(p).
(x-1, y-1) (x, y-1) (x+1, y-1)
(x-1, y)
(x+1, y)
(x, y)
(x-1, y+1) (x, y+1) (x+1, y+1)
Hình 1.6 Lân cận các điểm ảnh của tọa độ (x, y)
Các mối liên kết điểm ảnh
Để xác định tính liên thông của hai điểm ảnh, thì chúng cần thỏa mãn rằng:
chúng phải là các lân cận và các cấp xám phải thỏa mãn tiêu chuẩn đề ra về tính
tương tự. Ví dụ, trong ảnh nhị phân với các giá trị là 0 và 1, hai điểm ảnh có thể là
4-lân-cận, nhưng chúng chỉ được gọi là liên thông nếu và chỉ nếu chúng có các giá
trị bằng nhau.
Các mối liên kết được sử dụng để xác định giới hạn của đối tượng vật thể
hoặc xác định vùng trong một ảnh. Một liên kết được đặc trưng bởi tính liền kề giữa
các điểm và mức xám của chúng.
Cho V là một tập các giá trị cấp xám dùng để xác định tính liền kề trong ảnh
Chúng ta có ba loại liền kề sau:
a) Liên kết 4: hai điểm ảnh p và q với giá trị từ V là liên kết 4 nếu q thuộc
tập N4(p)
b) Liên kết 8: hai điểm ảnh p và q với giá trị từ V là liên kết 8 nếu q thuộc
tập N8(p)
c) Liên kết m(liên kết hỗn hợp): hai điểm p và q với giá trị từ V là liên kết m
nếu thỏa mãn một trong hai điều kiện sau:
(i) q thuộc N4(p) hoặc
(ii) q thuộc NP(p)
1.2.5. Lược đồ mức xám (Histogram)
Lược đồ mức xám (có thể gọi là lược đồ xám hay biểu đồ tần suất) của một

ảnh là một hàm cung cấp tần suất xuất hiện của mỗi mức xám.
Lược đồ xám được biểu diễn trong hệ tọa độ vuông góc Oxy. Trong hệ tọa độ này,
trục hoành biểu diễn cho số mức xám từ 0-> N (N là số mức xám). Trục tung biểu
diễn số điểm ảnh cho một cho một mức xám (số điểm ảnh có cùng mức xám hay tỉ
lệ số điểm ảnh có cùng mức xám trên tổng số điểm ảnh.


11

Lược đồ xám cung cấp rất nhiều thông tin về phân bố mức xám của ảnh. Cho phép
phân tích trong khoảng nào đó phân bố phần lớn các mức xám của ảnh: Ảnh rất
sáng hay ảnh rất đậm.
Nếu ảnh sáng thì lược đồ xám nằm bên phải (mức xám cao)
Nếu ảnh đậm thì lược đồ xám nằm bên trái (mức xám thấp)

Hình 1.2. Biểu đồ Histogram của ảnh

1.2.6. Biểu diễn ảnh
Theo tài liệu [1] ảnh có thể được biểu diễn theo mô hình Vector hoặc mô hình
Raster.
Mô hình Raster: Đây là mô hình biểu diễn thông dụng nhất hiện nay. Ảnh được
biểu diễn dưới dạng ma trận các điểm ảnh. Tùy theo nhu cầu thực tế mà mỗi điểm
ảnh có thể được biểu diễn bởi một hay nhiều bit. Mô hình Raster rất thuận lợi cho
hiển thị và in ấn. Khi xử lý các ảnh Raster, chúng ta quan tâm đến mối quan hệ
trong vùng lân cận của các điểm ảnh. Các điểm ảnh có thể xếp hàng trên một lưới
(Raster) hình vuông, lưới hình lục giác hoặc theo một cách hoàn toàn ngẫu nhiên
với nhau.
Mô hình vectơ: Biểu diễn ảnh ngoài mục đích tiết kiệm không gian lưu trữ, dễ
dàng cho hiển thị và in ấn, còn phải đảm bảo dễ dàng trong lựa chọn, sao chép, di
chuyển, tìm kiếm,…theo những yêu cầu này, kỹ thuật biểu diễn Vector tỏ ra ưu việt

hơn. Trong mô hình Vector người ra sử dụng hướng giữa các Vector của điểm ảnh
lân cận để mã hóa và tái tạo hình ảnh ban đầu. Ảnh Vector được thu nhận trực tiếp
từ các thiết bị số hóa như Digital hoặc được chuyển đổi từ ảnh Raster thông qua các
chương trình số hóa. Công nghệ phần cứng cung cấp những thiết bị xử lý với tốc độ


12

nhanh và chất lượng cao cho cả đầu vào và ra, nhưng lại chỉ hỗ trợ cho ảnh Raster.
Do vậy, những nghiên cứu về biểu diễn Vector đều tập trung chuyển đổi từ ảnh
Raster.
1.2.7. Biến đổi ảnh (Image Transform)
Thuật ngữ biến đổi ảnh thường dùng để nói tới một lớp các ma trận đơn vị và
các kĩ thuật dùng để biến đổi ảnh. Biến đổi ảnh nhằm làm giảm các nguyên nhân
của ảnh để việc xử lý hiệu quả hơn. Như làm rõ hơn các thông tin mà ngời dùng
quan tâm nhưng người dùng phải chấp nhận mất đi một số thông tin cần thiết.
1.2.8 Nâng cao chất lượng– khôi phục ảnh
Tăng cường ảnh là một bước quan trọng, tạo tiền đề cho xử lý ảnh. Nó gồm
các kỹ thuật như: lọc độ tương phản, khử nhiễu, nổi màu… Khôi phục ảnh là nhằm
loại bỏ các suy giảm trong ảnh.
Nâng cao chất lượng ảnh:
Đây là một bước quan trọng, tạo tiền đề cho xử lý ảnh. Mục đích chính nhằm
làm nổi bật một số đặc tính của ảnh như thay đổi độ tương phản, lọc nhiễu, nổi biên,
làm trơn biên, khuếch đại ảnh … nhằm phục vụ cho việc hiển thị hoặc các quá trình
phân tích tiếp theo. Tùy theo các ứng dụng khác nhau mà chúng ta có các kỹ thuật
nâng cao chất lượng ảnh khác nhau.
Nâng cao chất lượng ảnh có quan hệ gần gũi với khôi phục ảnh. Khi một ảnh
bị nhiễu thì khôi phục ảnh gốc thường đưa đến nâng cao chất lượng ảnh. Có một số
khác biệt giữa khôi phục ảnh và nâng cao chất lượng ảnh. Trong khôi phục ảnh, một
ảnh gốc bị nhiễu thì mục tiêu là làm sao cho ảnh sau khi xử lý càng gần giống ảnh

gốc càng tốt. Còn trong nâng cao chất lượng ảnh thì mục tiêu là làm cho ảnh sau khi
xử lý có được chất lượng tốt hơn khi chưa xử lý. Như vậy một ảnh không bị nhiễu
thì không thể được xử lý bằng các kỹ thuật khôi phục ảnh nhưng ảnh đó có thể được
xử lý bằng các kỹ thuật nâng cao chất lượng ảnh. Nhưng một ảnh bị nhiễu thì nó có
thể được xử lý vừa bằng các kỹ thuật khôi phục ảnh vừa bằng các kỹ thuật nâng
cao chất lượng ảnh.
Khôi phục ảnh
Khôi phục ảnh là quá trình loại bỏ hay tối thiểu hóa các ảnh hưởng của môi
trường bên ngoài hoặc do các hệ thống thu nhận ảnh gây ra. Về nguyên tắc, khôi
phục ảnh nhằm xác định mô hình toán học của quá trình đã gây ra biến dạng, tiếp
theo là dùng ánh xạ ngược để xác định lại ảnh.


13

Bất kỳ một ảnh nào được thu bằng các thiết bị điện, quang điện hay quang
học thường bị nhiễu bởi môi trường cảm biến của các thiết bị đó. Các loại nhiễu có
thể là nhiễu hệ thống, bị mờ do lệch tiêu điểm camera, nhiễu ngẫu nhiên do chuyển
động giữa camera và đối tượng được chụp, nhiễu do khí quyển …
Khôi phục ảnh là dùng các bộ lọc để lọc các ảnh bị nhiễu nhằm giảm tối
thiểu sự ảnh hưởng của các loại nhiễu này để cho ra ảnh kết quả càng gần giống ảnh
gốc càng tốt. Hiệu quả của các bộ lọc khôi phục ảnh phụ thuộc vào sự nhận biết về
quá trình nhiễu cùng với quá trình thu nhận ảnh. Khôi phục ảnh thường được xử lý
trên miền tần số là chủ yếu. Bao gồm các kỹ thuật lọc ngược, lọc bình phương tối
thiểu (wiener).
1.2.9. Nhận dạng ảnh
Nhận dạng đối tượng chính là quá trình tiến hành phân lớp đối tượng cần
nhận dạng vào các lớp. Có hai lớp phương pháp tiếp cận chính trong quá trình phân
lớp các đối tượng, đó là các phương pháp phân lớp dựa vào đường ranh giới phân
biệt giữa các lớp và các phương pháp phân lớp dựa vào phân bố thống kê của các

lớp (mô hình markov ẩn, phương pháp phân loại thống kê, Bayesian, trường marko
ngẫu nhiên). Trên cơ sở các bài toán thì sẽ có các mô hình nhận dạng phù hợp và
các thuật toán đi kèm các mô hình đó. Ngoài ra còn một số cách tiếp cận khác trong
lý thuyết nhận dạng đó là đối sánh mẫu dựa trên các đặc trưng được trích chọn,
nhận dạng cấu trúc (xâu chuỗi, đồ thị …) nhận dạng dựa trên biểu diễn ngữ pháp
văn phạm.
Theo tài liệu [1] hệ thống nhận dạng tự động bao gồm 3 khâu tương ứng với
3 giai đoạn chủ yếu sau:
1. Thu nhận dữ liệu, tiền xử lý
2. Biểu diễn dữ liệu
3. Nhận dạng, ra quyết định
Bốn cách tiếp cận khác nhau trong lý thuyết nhận dạng là:
1. Đối sánh mẫu dựa trên các đặc trưng được trích chọn.
2. Phân loại thống kê.
3. Đối sánh cấu trúc.
4. Phân loại dựa trên mạng nơ-ron nhân tạo.
Trên thực tế, người ta áp dụng kỹ thuật nhận dạng khá thành công với nhiều
bài toán khác nhau như: nhận dạng vân tay, nhận dạng chữ (chữ cái, chữ số, chứ có
dấu). Nhận dạng chữ in hoặc đánh máy phục vụ cho việc tự động hóa quá trình đọc
tài liệu, tăng nhanh tốc độ và chất lượng thu nhận thông tin từ máy tính. Các bài
toán và ứng dụng nhận dạng rất phong phú như: Nhận dạng khuôn mặt, nhận dạng


14

người đi bộ, xây dựng các hệ thống giám sát thông minh, rô-bốt, các hệ thống dự
báo dựa vào hình ảnh …
1.2.10. Các loại định dạng tập tin ảnh cơ bản
Ảnh thu được sau quá trình số hóa thường được lưu lại cho các quá trình xử
lý tiếp theo hay truyền đi. Trong quá trình phát triển của kỹ thuật xử lý ảnh, tồn tại

nhiều định dạng ảnh khác nhau từ ảnh đen trắng (với định dạng IMG), ảnh đa cấp
xám cho đến ảnh màu: (BMP, GIF, JPEG…). Tuy các định dạng này khác nhau,
song chúng đều tuân theo một cấu trúc chung nhất. Nhìn chung, một tệp (file) ảnh
bất kỳ thường bao gồm 3 phần (theo tài liệu [2]):
- Đầu tệp (Header): Đầu tệp là phần chứa các thông tin về kiểu ảnh, kích
thước, độ phân giải, số bit dùng cho 1 pixel, cách mã hóa, vị trí bảng màu…
- Dữ liệu nén (Data Compression): Số liệu ảnh được mã hóa bởi kiểu mã hóa
chỉ ra trong phần Header.
- Bảng màu (Palette Color): Bảng màu không nhất thiết phải có, ví dụ khi
ảnh là đen trắng. Nếu có, bảng màu cho biết số màu dùng trong ảnh và bảng màu
được sử dụng để hiện thị màu của ảnh. Một số các định dạng khác, cấu hình, đặc
trưng của từng địng dạng và các tham số.
Ảnh BPM (Bitmap): Là ảnh được mô tả bởi một ma trận các giá trị số xác
định màu và bảng màu của các điểm ảnh tương ứng khi hiển thị. Ưu điểm của ảnh
Bitmap là tốc độ vẽ và tốc độ xử lý nhanh. Nhược điểm của nó là kích thước rất lớn.
Ảnh JPEG (Joint Photographic Experts Group): Là một định dạng ảnh
được phát triển để nén dung lượng và lưu trữ ảnh chụp. Được sử dụng tốt nhất cho
đồ họa có nhiều màu sắc, ví dụ như là ảnh chụp được scan. File ảnh JPEG là ảnh
Bitmap đã được nén lại.
Ảnh GIF (Graphics Interchange Format): Được phát triển dành cho
những ảnh có tính chất thay đổi được. Nó được sử dụng tốt nhất cho đồ họa có ít
màu, ví dụ như là ảnh hoạt hình hoặc là những bức vẽ với nhiều đường thẳng. File
ảnh GIF là những ảnh Bitmap được nén lại.
Có 2 sự khác nhau cơ bản giữa ảnh GIF và ảnh JPEG:
+ Ảnh GIF nén lại theo cách giữ nguyên toàn bộ dữ liệu ảnh trong khi ảnh
JPEG nén lại nhưng làm mất một số dữ liệu trong ảnh.
+ Ảnh GIF bị giới hạn bởi số màu nhiều nhất là 256 trong khi ảnh JPEG
không giới hạn số màu mà chúng sử dụng.
Ảnh TIFF (Tagged Image File Format): Định dạng TIFF cho ta nhiều
thông tin về ảnh hơn JPEG, và cũng là file ảnh có kích cỡ lớn nhất trong các định



15

dạng được sử dụng trên máy ảnh. Định dạng TIFF có thể biểu thị được độ sâu màu
lớn hơn JPEG, nó hỗ trợ đến 48 bit màu, nghĩa là mỗi kênh màu 16 bit (trong môi
trường RGB). Vì thế định dạng TIFF có thể tái hiện đến 251 triệu giá trị màu sắc.
Vì các files TIFF không nén, nên trong quá trình chỉnh sửa ảnh, mỗi lần lưu lại định
dạng này, lượng thông tin hầu như không thay đổi, chất lượng ảnh không bị suy
giảm. Định dạng TIFF có một nhược điểm đó là dung lượng lớn, thao tác chậm hơn
các định dạng khác.
1.2.11. Hiệu chỉnh gamma
Gamma có thể hiểu là mối liên hệ giữa đầu vào và kết quả đầu ra của ảnh.
Nếu chúng ta xét với đầu vào là giá trị độ nhạy sáng của ảnh màu RGB, khi đó mối
liên hệ đó được thể hiện theo công thức:

 Điều này làm giảm chất lượng hình ảnh và hình ảnh thường tối hơn bình
thường.
Hiệu chỉnh gamma: Hiệu chỉnh Gamma (Gamma correction) là lấy đảo của
Gamma, và khi đó ảnh I’ sau khi hiệu chỉnh gamma:

 hiệu chỉnh gamma sẽ làm tăng giá trị xám của các điểm ảnh.
Ta có thể tham khảo thêm thông tin về gamma ở tài liệu [14,15,16].
1.2.12. Phân vùng ảnh
Phân vùng là bước then chốt trong xử lý ảnh. Giai đoạn này nhằm phân tích
ảnh thành những thành phần có tính chất nào đó dựa theo biên hay các vùng liên
thông. Tiêu chuẩn để xác định các vùng liên thông có thể là mức xám, cùng màu
hay độ tương phản.
1.3. Nâng cao chất lượng ảnh sử dụng các toán tử điểm
1.3.1. Điều chỉnh độ tương phản

Độ tương phản biểu diễn sự thay đổi độ sáng của đối tượng so với nền. hay
nói cách khác độ tương phản là độ nổi của điểm ảnh hay vùng so với nền. Như vậy,
nếu ảnh có độ tương phản kém ta có thể thay đổi theo hàm sau:
(theo tài liệu [2])


16

Các độ dốc

xác định độ tương phản tương đối. L là số mức xám cực đại. Ta

có:
ảnh kết quả trùng với ảnh gốc
dãn độ tương phản
co độ tương phản
1.3.2.Phân ngưỡng nhị phân
Hay nói cách khác là đổi một ảnh màu sang ảnh đen trắng ta dùng kỹ thuật tác
ngưỡng. Giả sử ta có ảnh I kích thước (mxn), hai số Min, Max và ngưỡng . Khi
đó, kỹ thuật tách ngưỡng được thể hiện qua thuật toán sau:
B1: Thực hiện vòng lặp, thay đổi giá trị độ xám của từng điểm ảnh
For (i=0,iFor (j=0,j(Ở trường hợp này Max=1, Min=0)
B2: Gán các giá trị độ xám mới cho ảnh đầu ra
Kỹ thuật chuyển ảnh thành ảnh đen trắng được ứng dụng khi quét và nhận
dạng văn bản có thể xảy ra sai sót “nền thành ảnh” hoặc “ảnh thành nền” dẫn đến
ảnh bị đứt nét hoặc dính.
Phân ngưỡng động với kỹ thuật SISThreshold (Simple image statistic
Threshold tham khảo ở tài liệu [6]): Kỹ thuật này tính toán ngưỡng động bằng cách

sử dụng phương pháp thống kê hình ảnh đơn giản. Đối với mỗi điểm ảnh sẽ thực
hiện:
+ Tính 2 giá trị Gradient là: |I(x + 1, y) - I(x - 1, y)| và |I(x, y + 1) - I(x, y - 1)|
+ Trọng lượng (weight) được tính là giá trị lớn nhất của 2 giá trị gradient.
+ Tổng của các trọng lượng sẽ được cập nhật (weightTotal += weight)
+ Tổng của trọng số giá trị điểm ảnh được cập nhật (total += weight * I(x, y)
Ngưỡng kết quả được tính là tổng của trọng giá trị điểm ảnh chia tổng trọng
lượng.
1.3.3. Biến đổi âm bản
Biến đổi âm bản nhận được khi dùng phép biến đổi
Giả sử ta có ảnh I kích thước (mxn). Khi đó kỹ thuật biến đổi âm bản được thể hiện
qua thuật toán sau:
B1: Với mỗi điểm ảnh, thực hiện phép toán thay đổi mức xám của nó


17

For(int i=0; iFor (int j=0; jI[i,j]=255-I[i,j];
B2: Gán giá trị mức xám mới cho ảnh đầu ra

(a)

(b)

1.3.4. Hiệu chỉnh ánh sáng trong ảnh
Hiệu chỉnh ánh sáng trong ảnh là một kỹ thuật máy tính nhằm xử lý ánh sáng
trong ảnh nhằm đạt một mục đích nào đó của người dùng. Ánh sáng có thể được
làm tăng, giảm hoặc loại bỏ tác động của nó lên bức ảnh.

Để hiệu chỉnh ánh sáng phương pháp đơn giản nhất là thay đổi giá trị điểm ảnh của
ảnh. Ý tưởng của phương pháp này là thay đổi một cách đồng đều giá trị tại mỗi
điểm ảnh, được thực hiện bằng cách cộng giá trị mỗi điểm ảnh với một số nguyên
nằm trong khoảng [-255, 255].
Giả sử ta có ảnh I với kích thước (mxn) và một số nguyên c. Khi đó thuật toán được
mô tả như sau:
For (i=0,iFor (j=0;jI[i,j] = I[i,j] +c;
Nếu c>0: ảnh sáng lên
Nếu c<0: Ảnh tối đi
Với ảnh màu ta áp dụng thuật toán trên cho từng kênh màu.
1.3.5. Đổi ảnh RGB sang ảnh grayscale
Hệ chuẩn màu CIE-RGB dùng 3 màu cơ bản R, G, B và ký hiệu RGBCIE để
phân biệt với các chuẩn khác. Như đã nêu trên, một màu là tổ hợp của các màu cơ
bản theo một tỷ lệ nào đó. Như vậy, mỗi pixel ảnh màu ký hiệu Px, được viết: (T:
trong công thức dướ đây là ký hiệu chuyển vị)
Px = [red, green,blue]T
Người ta dùng hệ tọa độ ba màu R-G-B (tương ứng với hệ tọa độ x-y-z) để
biểu diễn màu như sau:


18

Hình 1.3 Hệ tọa độ RGB
(theo tài liệu [2])
Trong cách biểu diễn này ta có công thức:
đỏ + lục + lơ =1
Công thức này gọi là công thức Maxwell. Trong hình trên, tam giác tạo bởi ba
đường đứt đoạn gọi là tam giác Maxwell. Màu trắng trong hệ tọa độ này được tính

bởi:
trắngCIE = (đỏCIE + lụcCIE + lơCIE) = 1
Ảnh xám hay còn gọi là ảnh đơn sắc (monochromatic), là ảnh mà tại mỗi điểm
ảnh có một giá trị mức xám. Ảnh 8 mức xám sẽ có giá trị mỗi điểm ảnh nằm trong
đoạn [0, 7]. Ảnh 256 mức xám sẽ có giá trị mỗi điểm ảnh nằm trong đoạn [0, 255].
Giá trị điểm ảnh = 0 nghĩa là điểm ảnh đó tối (đen), giá trị điểm ảnh lớn nhất
nghĩa là điểm ảnh đó trắng. Nói cách khác, giá trị mỗi điểm ảnh càng lớn thì điểm
ảnh đó càng sáng.
Cường độ sáng được tính theo công thức (chuyển đổi từ RGB sang grayscale):
Độ sáng = 0.2989R + 0.5870G + 01.1140B
Hoặc theo công thức:
Độ sáng = 0.3086R + 0.6094G + 0.0820B
Chú ý rằng giá trị mỗi điểm ảnh I(x,y) hay còn gọi là cường độ sáng (Luminance
Intensity) trong ảnh đa mức xám tính được là tổng trọng số khác nhau của mỗi
thành phần màu trong hệ màu RGB. Một trong những lý do của việc này là nếu
chúng ta sử dụng cùng trọng số, ví dụ (R + G + B) / 3 thì màu đỏ, màu xanh nước
biển hay màu xanh da trời sẽ có cùng mức xám sau khi chuyển đổi. Mặt khác theo
khoa học đã chứng minh thì mắt người nhạy cảm hơn với thành phần màu xanh lá
cây và màu đỏ so với xanh da trời.


19

hình 1.4 Chuyển ảnh màu rgb sang ảnh gray

(a)

(b)

1.4. Nâng cao chất lượng ảnh dùng toán tử không gian

Thường là ảnh thu nhận có nhiễu cần phải loại bỏ nhiễu hay ảnh không sắc
nét bị mờ hoặc cần làm rõ các chi tiết như đường biên ảnh. Các toán tử không gian
dùng trong kỹ thuật tăng cường ảnh được phân nhóm theo công dụng: Làm trơn
nhiễu, nổi biên. Để làm trơn nhiễu hay tác nhiễu người ta sử dụng các bộ lọc tuyến
tính (lọc trung bình, lọc thông thấp) hay lọc phi tuyến (lọc trung vị, giả trung vị, lọc
đồng hình). Từ bản chất của nhiễu (thường tương ứng với tần số cao) và từ cơ sở lý
thuyết lọc là: bộ lọc chỉ cho tín hiệu có tần số nào đó thông qua do đó để lọc nhiễu
người ta thường dùng lọc thông thấp hay lấy tổ hợp tuyến tính để san bằng (lọc
trung bình). Để làm nổi cạnh (ứng với tần số cao) người ta dùng các bộ lọc thông
cao, lọc Laplace. Chúng ta có thể tham khảo kỹ thuật và thuật toán các bộ lọc trong
tài liệu [2].


20

CHƯƠNG 2
PHÉP TOÁN HÌNH THÁI TRONG XỬ LÝ ẢNH
2.1. Giới thiệu
“Morphology” là thuật ngữ chỉ sự nghiên cứu về cấu trúc hay hình học (topo)
của đối tượng trong ảnh. Hình thái học có vai trò rất quan trọng trong các lĩnh vực
ngôn ngữ học và sinh học. Trong ngôn ngữ học, hình thái học là sự nghiên cứu về
cấu trúc của từ, tập hợp từ, câu. Còn trong sinh học, hình thái học lại chú trọng tới
hình dạng của một cá thể hơn, chẳng hạn có thể phân tích hình dạng của một chiếc
lá để từ đó có thể nhận dạng được đó là loại cây gì, nghiên cứu hình dạng của một
nhóm vi khuẩn, dựa trên các đặc điểm nhận dạng để phân biệt chúng thuộc nhóm vi
khuẩn nào,…
Trong các ứng dụng thị giác máy tính, xử lý hình thái học có thể được sử
dụng để nhận dạng đối tượng, nâng cao chất lượng ảnh, phân đoạn ảnh và kiểm tra
khuyết điểm trên ảnh. Các phép toán xử lý hình thái học được thực hiện chủ yếu
trên ảnh nhị phân và ảnh xám. Phần lớn các phép toán hình thái học được định

nghĩa từ hai phép toán cơ bản là phép toán co ảnh (Erosion) và giãn ảnh (Dilation).
Yếu tố quan trọng trong các phép toán này là lựa chọn một phần tử cấu trúc có hình
dáng phù hợp thì ta mới thu được kết quả như mong đợi.
2.2. Phần tử cấu trúc
Một phần quan trọng của các thao tác giãn-nở ảnh là phần tử cấu trúc dùng
được sử dụng để rê đi khắp ảnh. Phần tử cấu trúc hai chiều (phần tử cấu trúc phẳng)
được xem là ma trận gồm các phần tử 0 và 1 (thường nhỏ hơn nhiều so với các hình
ảnh được xử lý). Các điểm ảnh trung tâm của phần tử cấu trúc, được gọi là gốc (xác
định các điểm ảnh sẽ được tác động tới trong quá trình thao tác ảnh) Các điểm ảnh
trong phần tử cấu trúc có giá trị 1 được coi là lân cận và cũng sẽ được xem xét tới
trong quá trình thực hiện phép co-dãn ảnh.
Một số hình dáng của phần tử cấu trúc thường được sử dụng trên ảnh nhị
phân: dạng đường theo chiều ngang và dọc, hình vuông, hình ellipse


21

Hình 2.1. Một số hình dáng của phần tử cấu trúc phẳng
(theo tài liệu [3])
Đối với ảnh xám, phần tử cấu trúc là không phẳng, tức là các phần tử cấu trúc
sử dụng các giá trị 0 và 1 để xác định phạm vi của phần tử cấu trúc trong mặt phẳng
x và mặt phẳng y và thêm giá trị độ cao để xác định chiều thứ ba.Cấu trúc phần tử
không phẳng gồm có hai phần:
Phần thứ nhất: Một mảng hai chiều gồm có các giá trị 0 và 1, trong đó giá trị
bằng 1 xác định hàng xóm của phần tử cấu trúc
0 1 0
1 1 1
0 1 0
Phần thứ hai: Một mảng hai chiều có kích thước bằng với kích thước của
mảng hai chiều ở phần thứ nhất nhưng chứa các giá trị thực của phần tử cấu trúc

0

1.3 0

1.5 1

1.4

0
1.6 0
Khi một phép toán hình thái được thực hiện thì các gốc của phần tử cấu trúc
thường dịch chuyển lần lượt trên các điểm ảnh. Và khi đó giá trị của các điểm ảnh
vừa được quét qua sẽ được so sánh với nhau, các kết quả thu được sau khi so sánh
phụ thuộc vào phép toán hình thái đang được sử dụng.


22

2.3. Các phép toán với ảnh nhị phân
2.3.1. Phép giãn nhị phân (Dilation)
Trong luận văn này, ta coi đối tượng ảnh là những điểm đen và nền là những
điểm trắng. Trước hết, để bắt đầu ta hãy xem hình 2.2a -Tập hợp các điểm ảnh đen
tạo nên đối tượng ảnh hình vuông) và trong 2.2b -đối tượng ảnh cũng là hình vuông
nhưng là hình vuông lớn hơn so với 2.2a một điểm ảnh về mọi phía, nghĩa là thay
mọi lân cận trắng của các điểm ảnh trong 2.2a thành các điểm ảnh đen. Đối tượng
trong 2.2c cũng được thao tác tương tự. Thao tác đó có thể coi như một phép dãn
đơn giản, phép dãn một điểm ảnh về mọi phía. Việc dãn đó có thể được thực hiện
cho đến khi toàn bộ ảnh được thay bằng các điểm ảnh đen. Tuy nhiên trong thực tế,
đối tượng ảnh được xem như là một tập hợp toán học của các điểm ảnh đen, mỗi
điểm ảnh đen được coi như là một điểm trong không gian hai chiều và nó được xác

định bởi số hàng và số cột.

Hình 2.2. Hiệu quả của thao tác nhị phân đơn giản trên một ảnh nhỏ.
(a) Ảnh ban đầu ; (b) Ảnh dãn 1 điểm ảnh; (c) Ảnh dãn 2 điểm ảnh (so với
ảnh ban đầu). (theo tài liệu [5])
Phép giãn nhị phân của tập hợp A bởi tập hợp B là tồn tại các điểm c thuộc
sao cho c là tổng của hai điểm tương ứng bất kỳ thuộc tập hợp A và tập hợp B,
định nghĩa này được mô tả qua công thức :
(theo tài liệu [5])
Trong đó, tập C gọi là kết quả của phép dãn A sử dụng phần tử cấu trúc B và
gồm các phần tử như được mô tả ở trên, tuy nhiên một vài điểm trong số chúng có
thể trùng nhau.


×