Tải bản đầy đủ (.pdf) (72 trang)

(Luận văn thạc sĩ) Nghiên cứu một số tính chất nội suy ảnh số sử dụng phép toán hình thái để nâng cao chất lượng ảnh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.04 MB, 72 trang )

LỜI CAM ĐOAN

Tơi là Tơ Hồng Qn, học viên khóa 2019B, ngành Máy tính, chun ngành Hệ
Thống Thơng Tin. Tơi xin cam đoan luận văn “Nghiên cứu một số tính chất nội suy
ảnh số sử dụng phép tốn hình thái để nâng cao chất lượng ảnh” là do tôi nghiên
cứu, tìm hiểu và phát triển dưới sự hướng dẫn của PGS.TS. Ngơ Quốc Tạo và TS.
Nguyễn Hồng Hà, khơng phải sự sao chép từ các tài liệu, cơng trình nghiên cứu của
người khác mà không ghi rõ trong tài liệu tham khảo. Tôi xin chịu trách nhiệm về lời
cam đoan này.
Hà Nội, ngày

tháng

năm 2021

Tác giả

Tô Hồng Quân


LỜI CẢM ƠN
Lời cảm ơn trân trọng đầu tiên em muốn dành tới các thầy cô Học viện khoa học
và công nghệ Việt Nam, Viện Công nghệ thông tin, Viện Hàn lâm Khoa học và Cơng
nghệ Việt Nam nói chung và các thầy cô trong bộ môn Hệ thống thông tin cũng như
khoa Cơng nghệ thơng tin nói riêng đã tận tình giảng dạy và truyền đạt những kiến thức
quý báu trong suốt khoá cao học vừa qua, giúp em có những kiến thức chun mơn nền
tảng để làm cơ sở lý luận khoa học cho luận văn này.
Đặc biệt em xin chân thành cảm ơn thầy PGS.TS. Ngô Quốc Tạo và thầy TS.
Nguyễn Hồng Hà đã dìu dắt và hướng dẫn em trong suốt quá trình làm luận văn, sự chỉ
bảo và định hướng của các thầy đã giúp em nghiên cứu và hoàn thành luận văn này.
Em xin trân trọng cảm ơn Ban giám hiệu Học viện khoa học công nghệ Việt Nam


- Viện Hàn lâm khoa học và công nghệ Việt Nam đã tạo các điều kiện cho em được học
tập và làm luận văn một cách thuận lợi.
Qua đây, em cũng xin gửi lời cảm ơn đến người thân trong gia đình, bạn bè và
đồng nghiệp đã luôn động viên, hỗ trợ và tạo mọi điều kiện tốt nhất giúp em hoàn thành
việc học tập và thực hiện luận văn này.
Mặc dù đã cố gắng nỗ lực, nhưng chắc chắn trong quá trình học tập cũng như
thực hiện luận văn, em không tránh khỏi những thiếu xót. Em rất mong nhận được sự
thơng cảm và chỉ bảo tận tình của các thầy cơ và các bạn.
Nội dung nghiên cứu của luận văn này nằm trong đề tài khoa học mã số
VAST01.01/19-20 tiêu đề “Nghiên cứu phát triển phương pháp phát hiện tự động các
điểm mốc hình thái trên ảnh cánh côn trùng”.
Bản luận văn này của em được sự hỗ trợ bởi đề tài CS21.04 của Viện Công nghệ
thông tin(IOIT), Viện hàn lâm Khoa học và Công nghệ Việt Nam (VAST).
Hà Nội, ngày
.

tháng

năm 2021

Tác giả

Tô Hồng Quân


MỤC LỤC

DANH MỤC KÝ HIỆU VÀ CÁC CHỮ VIẾT TẮT ...................................................... i
DANH MỤC HÌNH VẼ VÀ ĐỒ THỊ ............................................................................ ii
MỞ ĐẦU .........................................................................................................................1

1. Động lực nghiên cứu................................................................................................1
2. Mục tiêu luận văn ....................................................................................................1
3. Cấu trúc luận văn .....................................................................................................2
CHƯƠNG 1. CÁC KHÁI NIỆM CƠ BẢN VỀ XỬ LÝ ẢNH VÀ PHÉP TỐN HÌNH
THÁI ................................................................................................................................3
Giới thiệu về xử lý ảnh ....................................................................................3

1.1.
1.1.1

Xử lý ảnh .....................................................................................................3

1.1.2

Giới thiệu về hệ thống xử lý ảnh .................................................................4

1.1.3

Các vấn đề cơ bản trong xử lý ảnh ..............................................................5

1.1.3.1 Một số khái niệm cơ bản .........................................................................5
1.1.3.2 Biểu diễn ảnh ...........................................................................................7
1.1.3.3 Tăng cường ảnh – khôi phục ảnh ............................................................8
1.1.3.4 Biến đổi ảnh .............................................................................................8
1.1.3.5 Phân tích ảnh ...........................................................................................8
1.1.3.6 Nhận dạng ảnh .........................................................................................9
1.1.3.7 Nén ảnh ..................................................................................................10
1.1.4
1.2.


Một số phương pháp nâng cao chất lượng ảnh..........................................11
Các khái niệm về phép tốn hình thái Morphology ......................................13

1.2.1. Một số khái niệm cơ bản về tập hợp..........................................................14
1.2.1.1.

Một số phép toán trên ảnh nhị phân ..................................................14

1.2.1.2.

Các phép toán logic trên ảnh nhị phân ..............................................15

1.2.2. Các khái niệm hình thái cơ bản .................................................................16
1.2.3. Bốn nguyên tắc hình thái ...........................................................................19
1.3.

Kết luận..........................................................................................................20

CHƯƠNG 2. PHÉP TỐN HÌNH THÁI HỌC TRONG XỬ LÝ ẢNH ......................21
2.1.

Các phép tốn hình thái học ..........................................................................21


2.1.1. Phần tử cấu trúc .........................................................................................21
2.1.2. Các phép tốn hình thái học trên ảnh nhị phân .........................................22
2.1.2.1.

Phép giãn nở trên ảnh nhị phân .........................................................22


2.1.2.2.

Phép co trên ảnh nhị phân .................................................................25

2.1.2.3.

Phép mở ảnh (Opening) và phép đóng ảnh (Closing) .......................28

2.1.2.4.

Phép biến đổi trúng hay trượt (Hit-or- miss transformation) ............32

2.1.2.5.

Phép toán dãn nở có điều kiện ...........................................................34

2.1.3. Các phép tốn hình thái học trên ảnh xám ................................................35
2.1.3.1.

Phép giãn ...........................................................................................35

2.1.3.2.

Phép co ..............................................................................................36

2.1.3.3.

Phép toán đóng mở ảnh .....................................................................37

2.2.


Các tính chất nội suy của phép tốn hình thái học ........................................37

2.3.

Ứng dụng của phép tốn hình thái .................................................................38

2.3.1. Ứng dụng làm trơn ảnh ..............................................................................38
2.3.2. Trích biên (Boundary Extraction) .............................................................39
2.3.3. Tơ đầy vùng (Region Filling) ....................................................................41
2.3.4. Trích chọn các thành phần liên thông (Extraction of Connected
Components) ..........................................................................................................42
2.3.5. Làm mảnh ảnh (Thinning) .........................................................................43
2.3.6. Làm dày đối tượng trong ảnh (Thickening) ..............................................46
2.3.7. Tìm khung xương (Skeletonization) .........................................................46
2.3.8. Phép tốn hình thái Gradient (Morphology Gradient Operator) ...............47
2.4.

Các phép lọc hình thái học ứng dụng cho ảnh OCR .....................................48

2.4.1. Mơ hình ảnh tài liệu kém chất lượng .........................................................48
2.4.2. Lọc hình thái học .......................................................................................49

2.5.

2.4.2.1.

Tốn tử hình thái trên khơng gian đồ thị ...........................................49

2.4.2.2.


Tốn tử hình thái trên các phức hợp đơn giản ...................................50

2.4.2.3.

Bộ lọc đóng và mở khu vực hình thái ...............................................53

Phương pháp đánh giá chất lượng ảnh ..........................................................53

2.5.1. Sai số bình phương trung bình (MSE) ......................................................53
2.5.2. Tỷ số tín hiệu cực đại/ nhiễu (PSNR) ........................................................54
2.5.3. Chỉ số tương đồng về cấu trúc SSIM ........................................................54
2.6.

Kết luận..........................................................................................................55

CHƯƠNG 3. THỬ NGHIỆM PHÉP LỌC HÌNH THÁI HỌC .....................................57


3.1.

Thiết kế mơ hình thử nghiệm ........................................................................57

3.1.1. Cơng cụ ......................................................................................................57
3.1.2. Tập dữ liệu thử nghiệm .............................................................................57
3.2.

Phép tốn hình thái cơ bản ............................................................................57

3.3.


Làm rõ đối tượng ảnh. ...................................................................................58

3.4.

Kết hợp các phép tốn hình thái để khử nhiễu ảnh. ......................................60

3.5.

Kết luận..........................................................................................................61

TÀI LIỆU THAM KHẢO .............................................................................................63


DANH MỤC KÝ HIỆU VÀ CÁC CHỮ VIẾT TẮT

Từ viết tắt

Từ chuẩn

Diễn giải

OCR

Optical Character
Recognition

Nhận dạng ký tự quang học

MSE


Mean Squared Error

Sai số tồn phương trung bình

PSNR

Peak Signal-to-Noise Ration Tỉ số tín hiệu cực đại trên nhiễu

SSIM

Structural Similarity Index
Measure

Đo lường chỉ số tương đồng về cấu trúc


DANH MỤC HÌNH VẼ VÀ ĐỒ THỊ
Hình 1.1. Q trình xử lý ảnh ..........................................................................................3
Hình 1.2. Các bước cơ bản trong một hệ thống xử lý ảnh...............................................4
Hình 1.3. Biểu đồ Histogram của ảnh ...........................................................................12
Hình 1.4. Cân bằng biểu đồ Histogram .........................................................................12
Hình 1.5. Phép đảo ảnh ..................................................................................................14
Hình 1.6. Ví dụ về tập điểm ...........................................................................................18
Hình 1.7. Các phần tử cấu trúc cơ bản...........................................................................18
Hình 1.8. Tịnh tiến với một véc tơ ................................................................................19
Hình 2.1. Một số hình dáng của phần tử cấu trúc phẳng ...............................................21
Hình 2.2. Hiệu quả của thao tác nhị phân đơn giản trên một ảnh nhỏ. .........................22
Hình 2.3. Dãn A bởi B ...................................................................................................23
Hình 2.4. Quá trình quét của phần tử cấu trúc trên hình ảnh nhị phân. .........................24

Hình 2.5. Phép co nhị phân trên hai đối tượng ..............................................................26
Hình 2.6. Quá trình lọc đối tượng sử dụng phép co nhị phân và phép giãn nhị phân ...27
Hình 2.7. Ứng dụng của phép co ảnh dưới dạng số nhị phân .......................................28
Hình 2.8. Quá trình thực hiện phép mở ảnh. .................................................................29
Hình 2.9. Sử dụng phép tốn mở ...................................................................................30
Hình 2.10. Q trình thực hiện phép đóng ảnh. ............................................................31
Hình 2.11. Sử dụng phép tốn đóng ..............................................................................31
Hình 2.12. Phép đóng với độ sâu lớn ............................................................................32
Hình 2.13. Minh hoạ thao tác đánh trúng và trượt ........................................................33
Hình 2.14. Dãn theo điều kiện .......................................................................................35
Hình 2.15. Phép tốn dãn ảnh trên ảnh xám với phần tử cấu trúc khơng phẳng. ..........36
Hình 2.16. Phép toán co ảnh trên ảnh xám với phần tử cấu trúc khơng phẳng. ............37
Hình 2.17. Làm trơn ảnh đa cấp xám ............................................................................39
Hình 2.18. Quá trình tìm biên của đối tượng trên ảnh nhị phân. ...................................40
Hình 2.19. Trích lọc biên của đối tượng ........................................................................40
Hình 2.20. Quá trình lấp đầy vùng đối tượng trong ảnh................................................42
Hình 2.21. Q trình trích chọn các thành phần liên thơng trong ảnh bằng phép tốn hình
thái .................................................................................................................................43
Hình 2.22. Quá trình làm mảnh đối tượng trong hình ảnh ............................................45
Hình 2.23. Ví dụ về làm mảnh đối tượng ......................................................................46
Hình 2.24. Kết quả làm dày đối tượng ..........................................................................46
Hình 2.25. Q trình thực hiện thuật tốn tìm xương ...................................................47


Hình 2.26. Ví dụ tìm xương của các đối tượng .............................................................47
Hình 2.27. Đường dốc hình thái ....................................................................................48
Hình 2.28. Minh họa về sự giãn nở và ăn mịn hình thái trên các phức hợp .................53
Hình 3.1. Các phép tốn hình thái cơ bản......................................................................58
Hình 3.2. Làm rõ đối tượng tiền cảnh ...........................................................................59
Hình 3.3. Khử nhiễu ảnh................................................................................................60

Hình 3.4. Khử nhiễu ảnh OCR ......................................................................................61


MỞ ĐẦU
1. Động lực nghiên cứu
Hình ảnh trong cuộc sống hiện tại là một dạng dữ liệu đóng vai trị quan trọng
trong việc trao đổi, xử lý và lưu giữ thông tin. Hiện nay, nhu cầu lưu trữ và xử lý các tài
liệu, văn bản, bản vẽ kỹ thuật, … dưới dạng hình ảnh scan hoặc dưới dạng ảnh là nhu
cầu cần thiết.
Tuy nhiên, các hình ảnh scan hoặc chụp thu được bởi nhiều lý do có thể bị nhiễu,
mờ nhịe, đứt nét và khơng được rõ ràng… dẫn đến việc thu nhận thơng tin và xử lý gặp
nhiều khó khăn. Vì vậy việc khắc phục những nhược điểm của hình ảnh thu nhận được
là việc làm rất cấp thiết và quan trọng.
Trên thế giới cũng như tại Việt Nam đã có rất nhiều các kỹ thuật được đưa ra, trong
đó có xử lý hình thái học trên ảnh. Các phép tốn hình thái trên ảnh cung cấp cho chúng
ta những mơ tả định lượng về cấu trúc và hình dạng hình học của các đối tượng trong
ảnh và nó đang được ứng dụng rộng rãi trong việc nâng cao chất lượng ảnh, phân đoạn
ảnh, kiểm tra khuyết điểm trên ảnh, …
Trong luận văn này tác giả sẽ nghiên cứu : “Một số tính chất nội suy ảnh số sử
dụng phép tốn hình thái để nâng cao chất lượng ảnh ”
2. Mục tiêu luận văn
Với đề tài “ Nghiên cứu một số tính chất nội suy ảnh số sử dụng phép tốn hình
thái để nâng cao chất lượng ảnh”, luận văn tập trung các vấn đề sau :
• Tổng quan về xử lý ảnh và phép tốn hình thái : Lý thuyết cơ bản về xử lý
ảnh, quá trình xử lý ảnh, các vấn đề cơ bản trong xử lý ảnh, các khái niệm về phép
tốn hình thái Morphology.
• Trình bày một số tính chất nội suy của phép tốn hình thái : trình bày các phép
tốn hình thái học trên ảnh nhị phân, ảnh xám và các tính chất nội suy của phép tốn
hình thái học. Tiếp theo đó sẽ trình bày các phép lọc hình thái học cho ảnh OCR.
Thực hiện cài đặt và đánh giá kết quả đạt được với phép lọc hình thái học ứng dụng

cho một số loại ảnh tài liệu đang bị các vết mờ theo thời gian, ảnh có những chi tiết thừa,

1


nhiễu như vết lem mực, nhịe, ố… Từ đó đưa ra đánh giá và hướng phát triển trong
tương lai.
3. Cấu trúc luận văn
Cấu trúc của luận văn bao gồm:
MỞ ĐẦU: Giới thiệu và đưa ra hướng nghiên cứu.
CHƯƠNG 1: Các khái niệm cơ bản về xử lý ảnh và phép tốn hình thái: Tại
chương này tác giả nghiên cứu về khái niệm xử lý ảnh, quá trình xử lý ảnh và các khái
niệm về phép tốn hình thái Morphology.
CHƯƠNG 2: Phép tốn hình thái học trong xử lý ảnh: Chương này tác giả sẽ
trình bày các phép tốn hình thái học trên ảnh nhị phân, ảnh xám và các tính chất nội
suy của phép tốn hình thái học. Tiếp theo đó sẽ trình bày các phép lọc hình thái học
cho ảnh OCR.
CHƯƠNG 3: Chương trình thử nghiệm phép lọc hình thái: Chương này trình
bày sơ đồ chương trình, thử nghiệm phép lọc hình thái và đánh giá MSE cũng như đánh
giá PSNR, đánh giá SSIM.
TÀI LIỆU THAM KHẢO: Liệt kê các tài liệu mà luận văn tham khảo trên nhiều
nguồn khác nhau.

2


CHƯƠNG 1. CÁC KHÁI NIỆM CƠ BẢN VỀ XỬ LÝ ẢNH VÀ PHÉP TỐN
HÌNH THÁI
Chương này trình bày về khái niệm xử lý ảnh, quá trình xử lý ảnh và các khái
niệm về phép tốn hình thái Morphology.

1.1. Giới thiệu về xử lý ảnh
1.1.1 Xử lý ảnh
Thông tin được con người thu nhận qua các giác quan, trong đó thị giác đóng vai
trị quan trọng nhất. Những năm trở lại đây với sự phát triển của phần cứng máy tính,
xử lý ảnh và đồ hoạ đã phát triển một cách mạnh mẽ và có nhiều ứng dụng trong cuộc
sống. Xử lý ảnh và đồ hoạ đóng một vai trị quan trọng trong tương tác người máy.
Quá trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào nhằm cho ra kết
quả mong muốn. Kết quả đầu ra của một q trình xử lý ảnh có thể là một ảnh “tốt hơn”
hoặc một kết luận nào đó.

Hình 1.1. Quá trình xử lý ảnh
Cũng như xử lý dữ liệu bằng đồ hoạ, xử lý ảnh số là một lĩnh vực của tin học ứng
dụng. Xử lý dữ liệu bằng đồ họa đề cập đến những ảnh nhân tạo, các ảnh này được xem
xét như là một cấu trúc dữ liệu và được tạo ra bởi các chương trình. Xử lý ảnh số bao
gồm các phương pháp và kĩ thuật để biến đổi, để truyền tải hoặc mã hóa các ảnh tự
nhiên. Mục đích của xử lý ảnh gồm:

- Thứ nhất, biến đổi ảnh và làm đẹp ảnh.
- Thứ hai, tự động nhận dạng ảnh hay đoán ảnh và đánh giá các nội dung của
ảnh.
Nhận dạng ảnh là quá trình liên quan đến các mơ tả đối tượng mà người ta muốn
đặc tả nó. Q trình nhận dạng thường đi sau q trình trích chọn các đặc tính chủ yếu
của đối tượng. Có hai kiểu mơ tả đối tượng:
3


- Mô tả tham số (nhận dạng theo tham số)
- Mô tả theo cấu trúc (nhận dạng theo cấu trúc)
Nhận biết và đánh giá các nội dung của ảnh (nhận dạng) là sự phân tích một hình
ảnh thành những phần có nghĩa để phân biệt đối tượng này với đối tượng khác. Dựa vào

đó ta có thể mơ tả cấu trúc của hình ảnh ban đầu.[1]
Có thể liệt kê một số phương pháp nhận dạng cơ bản như nhận dạng biên của một
đối tượng trên ảnh, tách cạnh, phân đoạn hình ảnh, v.v... Kĩ thuật này được dùng nhiều
trong y học (xử lý tế bào, nhiễm sắc thể) và nhận dạng chữ viết trong văn bản.
1.1.2 Giới thiệu về hệ thống xử lý ảnh
Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh được xem như là đặc
trưng cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của đối tượng trong
khơng gian và nó có thể xem như một hàm n biến P(c1, c2,..., cn). Do đó, ảnh trong xử
lý ảnh có thể xem như ảnh n chiều.
Các q trình của xử lý ảnh được tiến hành theo sơ đồ sau[2]:

Hình 1.2. Các bước cơ bản trong một hệ thống xử lý ảnh
Sơ đồ này bao gồm các thành phần sau:
a) Phần thu nhận ảnh (Image Acquisition)
Ảnh có thể thu nhận qua camera. Thường ảnh thu nhận qua camera là tín hiệu
tương tự (loại camera ống kiểu CCIR), nhưng cũng có thể là tín hiệu số hố (loại CCD
- Charge Coupled Device). Ảnh cũng có thể thu nhận từ vệ tinh qua các bộ cảm ứng
(sensor), hay ảnh được quét qua scanner. Tiếp theo là q trình số hóa (Digitalizer) để
biến đổi tín hiệu tương tự sang tín hiệu rời rạc (lấy mẫu) và số hóa bằng lượng hóa,
trước khi chuyển sang giai đoạn xử lý, phân tích hay lưu trữ lại.
b) Tiền xử lý (Image Processing)

4


Do những nguyên nhân khác nhau có thể do thiết bị thu nhận ảnh, do nguồn sáng
hay do nhiễu, ảnh có thể có độ tương phản thấp, có thể bị suy biến. Do vậy, chức năng
chính của bộ tiền xử lý là lọc nhiễu, nâng độ tương phản, tăng cường và khôi phục lại
ảnh để làm nổi bật một số đặc tính chính của ảnh, hay làm cho ảnh gần giống với trạng
thái gốc- trạng thái trước khi ảnh bị biến dạng.

c) Phân đoạn (Segmentation) hay phân vùng ảnh
Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để biểu diễn
phân tích, nhận dạng ảnh trên từng vùng.
d) Biểu diễn và mơ tả
Tìm các vùng đặc trưng điểm ảnh như biên ảnh (Boundary), vùng ảnh (Region),
và biểu diễn lại thông qua các điểm ảnh đặc trưng.
e) Nhận dạng và nội suy ảnh (Image Recognition and Interpretation)
Nhận dạng ảnh là quá trình xác định ảnh. Quá trình này thường thu được bằng
cách so sánh với mẫu chuẩn đã được học (hoặc lưu) từ trước. Nội suy là phán đốn theo
ý nghĩa trên cơ sở nhận dạng. Ví dụ: một loạt chữ số và nét gạch ngang trên phong bì
thư có thể được nội suy thành mã điện thoại. Có nhiều cách phân loai ảnh khác nhau
về ảnh. Theo lý thuyết về nhận dạng, các mơ hình tốn học về ảnh được phân theo hai
loại nhận dạng ảnh cơ bản:
- Nhận dạng theo tham số.
- Nhận dạng theo cấu trúc.
Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng trong khoa
học và công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký điện tử), nhận dạng
văn bản (Text), nhận dạng vân tay, nhận dạng mã vạch, nhận dạng mặt người…
f) Cơ sở tri thức (Knowledge Base)
Tiếp nhận và xử lý theo phương pháp trí tuệ con người.
1.1.3 Các vấn đề cơ bản trong xử lý ảnh
1.1.3.1 Một số khái niệm cơ bản
❖ Pixel (Picture Element): Điểm ảnh

5


Ảnh trong thực tế là một ảnh liên tục về khơng gian và về giá trị độ sáng. Để có
thể xử lý ảnh bằng máy tính cần thiết phải tiến hành số hố ảnh. Trong q trình số hố,
người ta biến đổi tín hiêụ liên tục sang tín hiệu rời rạc thơng qua q trình lấy mẫu (rời

rạc hố về khơng gian) và lượng hố thành phần giá trị mà về nguyên tắc, mắt thường
không phân biệt được hai điểm kề nhau. Trong quá trình này, người ta sử dụng khái
niệm Picture Element mà ta quen gọi hay viết là pixel (điểm ảnh). Trong khuôn khổ ảnh
hai chiều, mỗi pixel ứng với cặp tọa độ (x, y).
Điểm ảnh (Pixel) là một phần tử của ảnh số tại toạ độ (x, y) với độ xám hoặc màu
nhất định. Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích hợp sao
cho mắt người cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của ảnh số
gần như ảnh thật. Mỗi phần tử trong ma trận được gọi là một phần tử ảnh.
Ảnh được xem như là một tập hợp các điểm ảnh. Khi được số hóa, nó thường được
biểu diễn bởi mảng 2 chiều (ví dụ ảnh I(mxn): m dịng và n cột và có m*n điểm ảnh).
Một điểm ảnh có thể được biểu diễn bằng 1, 4, 8, 24 bits.
❖ Ảnh nhị phân: Khi trên một ảnh chỉ tồn tại các giá trị 0 hoặc 1 thì ta nói đó là
ảnh nhị phân (hoặc ảnh đen trắng) và các điểm ảnh của nó gọi là điểm ảnh nhị phân
mỗi điểm chỉ có giá trị đen hoặc trắng khơng có các mức xám khác nhau.
❖ Ảnh xám: Nếu dùng 8-bit (1 byte) để biểu diễn mức xám, thì số các mức xám
có thể biểu diễn được là 28 hay 256. Mỗi mức xám được biểu diễn dưới dạng là một số
nguyên nằm trong khoảng từ 0 đến 255, với mức 0 biểu diễn cho mức cường độ tối
nhất và 255 biểu diễn cho mức cường độ sáng nhất.
❖ Ảnh màu: Cách biểu diễn cũng tương tự như với ảnh đen trắng, chỉ khác là các
số tại mỗi phần tử của ma trận biểu diễn cho ba màu riêng rẽ gồm: đỏ (red), lục (green)
và lam (blue). Để biểu diễn cho một điểm ảnh màu cần 24-bit, 24-bit này được chia
thành ba khoảng 8 bit. Mỗi khoảng này biểu diễn cho cường độ sáng của một trong các
màu chính, tổ hợp của các màu ta được nhiều mức biểu diễn, như vậy mỗi điểm ảnh có
thể được mơ tả rõ giá trị màu tự nhiên của nó (true color).
❖ Ảnh đa cấp xám: Ảnh được áp dụng trong nhiều lĩnh vực như sinh vật học
hoặc trong công nghiệp. Thực tế chỉ ra rằng bất kỳ ứng dụng nào trên ảnh mức xám
cũng ứng dụng được trên ảnh màu. Ta có thể biến đổi ảnh màu về ảnh xám. Mỗi điểm
6



của ảnh màu có 3 giá trị (Red, Green, Blue), nếu 3 giá trị này bằng nhau thì ta có màu
xám (Grey), khi đó với mỗi điểm ảnh ta chỉ cần lưu một giá trị.
Việc xử lý ảnh nhị phân là một bước tiền xử lý các ảnh, để phân đoạn và tách ra
các đặc tính. Nhờ vậy ta có thể biết được mối quan hệ tôpô giữa các điểm ảnh cũng như
thực hiện các phép biến đổi ảnh không tuyến tính đạt hiệu quả; trong q trình xử lý ảnh
các phép biến đổi này dẫn đến sự đơn giản hoá việc đánh giá ảnh. Việc đếm các điểm
ảnh trên ảnh nhị phân đã qua biến đổi tạo điều kiện thuận lợi cho việc tách ra các đặc
tính. Bằng cách sử dụng các ảnh nhị phân đã qua xử lý như là những mặt nạ đối với các
ảnh xám, ta có thể tách ra các vùng đáng quan tâm của một ảnh xám từ tập hợp các ảnh.
Để tạo ra một ảnh nhị phân, một ảnh xám cần phải được biến đổi thành một ảnh
nhị phân nhờ một quá trình phân đoạn thích hợp. Muốn thế, phương pháp đơn giản nhất
là phương pháp tách ngưỡng. Các giá trị nằm ở bên trên ngưỡng được gán giá trị 1 còn
ở bên dưới ngưỡng thì được gán giá trị 0. Việc tìm giá trị ngưỡng có thể thực hiện tự
động nhờ kĩ thuật tách ngưỡng tự động.
1.1.3.2 Biểu diễn ảnh
Ảnh trên máy tính là kết quả thu nhận theo các phương pháp số hoá được nhúng
trong các thiết bị kỹ thuật khác nhau. Q trình lưu trữ ảnh nhằm 2 mục đích:

• Tiết kiệm bộ nhớ
• Giảm thời gian xử lý
Việc lưu trữ thơng tin trong bộ nhớ có ảnh hưởng rất lớn đến việc hiển thị, in ấn
và xử lý ảnh được xem như là 1 tập hợp các điểm với cùng kích thước nếu sử dụng càng
nhiều điểm ảnh thì bức ảnh càng đẹp, càng mịn và càng thể hiện rõ hơn chi tiết của ảnh
người ta gọi đặc điểm này là độ phân giải.
Việc lựa chọn độ phân giải thích hợp tuỳ thuộc vào nhu cầu sử dụng và đặc trưng
của mỗi ảnh cụ thể, trên cơ sở đó các ảnh thường được biểu diễn theo mơ hình tốn học,
mơ hình thống kê. Trong mơ hình tốn học, ảnh hai chiều được biểu diễn nhờ các hàm
hai biến trực giao gọi là các hàm cơ sở. Với mơ hình thống kê, một ảnh được coi như
một phần tử của một tập hợp đặc trưng bởi các đại lượng như: hàm phân bố mật độ xác
suất, kỳ vọng, hàm tương quan, ma trận tương quan, ma trận hiệp phương sai.

7


1.1.3.3 Tăng cường ảnh – khôi phục ảnh
Tăng cường ảnh là bước quan trọng, tạo tiền đề cho xử lý ảnh. Nó gồm một loạt
các kỹ thuật như: tăng cường độ tương phản, khử nhiễu, nỗi màu, vv.
Khôi phục ảnh là nhằm loại bỏ các suy giảm trong ảnh. Với một hệ thống tuyến
tính, ảnh của một đối tượng có thể biểu diễn bởi:
+∞ +∞

Trong đó

𝑔(𝑥, 𝑦) = ∫ ∫ ℎ(𝑥, 𝑦; ∝, 𝛽) 𝑓 (𝛼 , 𝛽)𝑑𝛼𝑑 (𝛽 + η(𝑥, 𝑦))
−∞ −∞

(1.1)

(x, y): là hàm biểu diễn nhiễu cộng
f (, ): hàm biểu diễn đối tượng
g (x, y): là ảnh thu nhận
ℎ(𝑥, 𝑦; 𝛼, 𝛽): là hàm ánh xạ điểm

1.1.3.4 Biến đổi ảnh

Thuật ngữ biến đổi ảnh dùng để nói tới một lớp các ma trận đơn vị và các kỹ thuật
dùng để biến đổi ảnh. Cũng như các tín hiệu một chiều được biểu diễn bởi một chuỗi
các hàm cơ sở, ảnh cũng có thể được biểu diễn bởi một chuỗi rời rạc các ma trận cơ sở
gọi là ảnh cơ sở. Phương trình ảnh cơ sở có dạng:
𝐴∗𝑘,𝑙 = 𝑎𝑘 𝑎𝑙∗𝑇 , với ak là cột thứ k của ma trận A. A là ma trận đơn vị. Có nghĩa là



A*T=I. Các 𝐴𝑘,𝑙 được định nghĩa ở trên với k, l = 0,1, …, N-1 là ảnh cơ sở. Có nhiều loại
biến đổi được dùng như:

- Biến đổi Fourier, Sin, Cosin, Hadamard, …
- Tích Kronecker
-

Biến đổi KL (Karhumen Loeve): biến đổi này có nguồn gốc từ khai triển của

các quá trình ngẫu nhiên gọi là phương pháp trích chọn các thành phần chính.
1.1.3.5 Phân tích ảnh
Đây là khâu quan trọng trong quá trình xử lý ảnh để tiến tới hiểu ảnh. Trong phân
tích ảnh việc trích chọn đặc điểm là một bước quan trọng. Các đặc điểm của đối tượng
được trích chọn tuỳ theo mục đích nhận dạng trong q trình xử lý ảnh. Có thể nêu ra
một số đặc điểm của ảnh sau đây:
8


Đặc điểm không gian: Phân bố mức xám, phân bố xác suất, biên độ, điểm uốn
v.v...
Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc thực hiện
lọc vùng (zonal filtering). Các bộ vùng được gọi là “mặt nạ đặc điểm” (feature mask)
thường là các khe hẹp với hình dạng khác nhau (chữ nhật, tam giác, cung tròn v.v..).
Đặc điểm biên và đường biên: Là đặc trưng cho đường biên của đối tượng và do
vậy rất hữu ích trong việc trích trọn các thuộc tính bất biến được dùng khi nhận dạng
đối tượng. Các đặc điểm này có thể được trích chọn nhờ tốn tử gradient, tốn tử la bàn,
tốn tử Laplace, tốn tử “chéo khơng” (zero crossing) v.v...
Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối tượng ảnh
chính xác, với tốc độ tính tốn cao và dung lượng nhớ lưu trữ giảm xuống.

1.1.3.6 Nhận dạng ảnh
Nhận dạng tự động (automatic recognition), mơ tả đối tượng, phân loại và phân
nhóm các mẫu là những vấn đề quan trọng trong thị giác máy, được ứng dụng trong
nhiều ngành khoa học khác nhau. Tuy nhiên, một câu hỏi đặt ra là: mẫu (pattern) là gì?
Watanabe, một trong những người đi đầu trong lĩnh vực này đã định nghĩa: “Ngược lại
với hỗn loạn (chaos), mẫu là một thực thể (entity), được xác định một cách mơ hồ
(vaguely defined) và có thể gán cho nó một tên gọi nào đó”. Ví dụ mẫu có thể là ảnh
của vân tay, ảnh của một vật nào đó được chụp, một chữ viết, khuôn mặt người hoặc
một ký đồ tín hiệu tiếng nói. Khi biết một mẫu nào đó, để nhận dạng hoặc phân loại mẫu
đó có thể:
Hoặc phân loại có mẫu (supervised classification), chẳng hạn phân tích phân biệt
(discriminant analyis), trong đó mẫu đầu vào được định danh như một thành phần của
một lớp đã xác định.
Hoặc phân loại khơng có mẫu (unsupervised classification hay clustering) trong
đó các mẫu được gán vào các lớp khác nhau dựa trên một tiêu chuẩn đồng dạng nào đó.
Các lớp này cho đến thời điểm phân loại vẫn chưa biết hay chưa được định danh.
Hệ thống nhận dạng tự động bao gồm ba khâu tương ứng với ba giai đoạn chủ yếu
sau đây:

o Thu nhận dữ liệu và tiền xử lý.
o Biểu diễn dữ liệu.
9


o Nhận dạng, ra quyết định.
Bốn cách tiếp cận khác nhau trong lý thuyết nhận dạng là:

o Đối sánh mẫu dựa trên các đặc trưng được trích chọn.
o Phân loại thống kê.
o Đối sánh cấu trúc.

o Phân loại dựa trên mạng nơ-ron nhân tạo.
Trong các ứng dụng rõ ràng là khơng thể chỉ dùng có một cách tiếp cận đơn lẻ để
phân loại “tối ưu” do vậy cần sử dụng cùng một lúc nhiều phương pháp và cách tiếp cận
khác nhau. Do vậy, các phương thức phân loại tổ hợp hay được sử dụng khi nhận dạng
và nay đã có những kết quả có triển vọng dựa trên thiết kế các hệ thống lai (hybrid
system) bao gồm nhiều mơ hình kết hợp.
Việc giải quyết bài toán nhận dạng trong những ứng dụng mới, nảy sinh trong cuộc
sống không chỉ tạo ra những thách thức về thuật giải, mà còn đặt ra những u cầu về
tốc độ tính tốn. Đặc điểm chung của tất cả những ứng dụng đó là những đặc điểm đặc
trưng cần thiết thường là nhiều, không thể do chuyên gia đề xuất, mà phải được trích
chọn dựa trên các thủ tục phân tích dữ liệu.
1.1.3.7 Nén ảnh
Nhằm giảm thiểu không gian lưu trữ và thường được tiến hành theo cả hai cách là
nén có bảo tồn và khơng bảo tồn thơng tin. Nén khơng bảo tồn thì thường có khả
năng nén cao hơn nhưng khả năng phục hồi thì kém hơn. Trên cơ sở hai khuynh hướng,
có 4 cách tiếp cận cơ bản trong nén ảnh:

- Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần suất xuất hiện
của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa thích hợp. Một ví dụ
điển hình cho kỹ thuật mã hóa này là *.TIF

- Nén ảnh khơng gian: Kỹ thuật này dựa vào vị trí khơng gian của các điểm ảnh
để tiến hành mã hóa. Kỹ thuật lợi dụng sự giống nhau của các điểm ảnh trong các vùng
gần nhau. Ví dụ cho kỹ thuật này là mã nén *.PCX

- Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng nén
khơng bảo tồn và do vậy, kỹ thuật thướng nến hiệu quả hơn. *.JPG chính là tiếp cận
10



theo kỹ thuật nén này.

- Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng ảnh, thể hiện sự
lặp lại của các chi tiết. Kỹ thuật nén sẽ tính tốn để chỉ cần lưu trữ phần gốc ảnh và quy
luật sinh ra ảnh theo nguyên lý Fractal.
1.1.4 Một số phương pháp nâng cao chất lượng ảnh
Nâng cao chất lượng ảnh bao gồm một loạt các phương pháp nhằm hoàn thiện
trạng thái quan sát của ảnh. Nhiệm vụ của thao tác này không phải là làm tăng lượng
thông tin vốn có trong ảnh mà làm nổi bật các đặc trưng mong muốn sao cho có thể phát
hiện tốt hơn, tạo thành q trình tiền xử lý cho phân tích ảnh [5]
Có nhiều phương pháp khác nhau trong nâng cao chất lượng ảnh như:

- Các phương pháp trên điểm: Biến đổi tuyến tính từng đoạn, biến đổi
logarithm, biến đổi âm bản. Phương pháp này thích hợp cho việc tăng cường các chi tiết
của ảnh.

- Cân bằng, biến đổi biểu đồ Histogram: biểu đồ Histogram của một ảnh là
biểu đồ mô tả sự phân bố của các giá trị mức xám của các điểm ảnh (Pixel) trong một
bức ảnh hoặc một vùng ảnh (Region).
Biểu đồ Histogram được biểu diễn trong hệ tọa độ vng góc Oxy. Trong hệ tọa
độ này, trục hoành biểu diễn cho số mức xám từ 0-> N (N là số mức xám). Trục tung
biểu diễn số điểm ảnh cho một cho một mức xám (số điểm ảnh có cùng mức xám hay tỉ
lệ số điểm ảnh có cùng mức xám trên tổng số điểm ảnh).
Dựa vào biểu đồ Histogram có thể biết được hình ảnh sáng tối như thế nào.
Nếu ảnh sáng thì biểu đồ Histogram nằm bên phải (mức xám cao)
Nếu ảnh đậm thì biểu đồ Histogram nằm bên trái (mức xám thấp)

11



Hình 1.3. Biểu đồ Histogram của ảnh
Cân bằng Histogram (Histogram equalization) là phương pháp làm cho biểu đồ
Histogram của ảnh được phân bố một cách đồng đều. Đây là một cách giúp nâng cao
chất lượng hình ảnh.

Hình 1.4. Cân bằng biểu đồ Histogram
(a) Ảnh gốc
(b) Histogram của ảnh gốc
(c) Ảnh với cân bằng Histogram
12


(d) Histogram của ảnh (c)

- Các phép toán trên miền khơng gian: Lọc nhiễu, bù nghiêng, giảm mờ. Có
nhiều thuật tốn nâng cao chất lượng ảnh thuộc nhóm này như: Giảm nhiễu (nhiễu
Gauss, nhiễu muối tiêu, nhiễu lốm đốm), lọc mờ (thuật toán Lucy-Richardson, thuật
toán Blind Deconvolution, lọc Wiener), bù nghiêng (dùng biến đổi Hough, dùng phương
pháp láng giềng gần nhất, sử dụng chiếu nghiêng).
Trong đề tài luận văn này, tác giả sử dụng các phép tốn hình thái trong nâng cao
chất lượng ảnh. Chi tiết về các kỹ thuật liên quan sẽ được trình bày ở phần sau.
1.2. Các khái niệm về phép tốn hình thái Morphology
Hiểu một cách đầy đủ thì “Morphology” là hình thái và cấu trúc của đối tượng,
hay, nó diễn tả những phạm vi và các mối quan hệ giữa các phần của một đối tượng.
Hình thái học khá quen thuộc trong các lĩnh vực ngơn ngữ học và sinh học. Trong ngơn
ngữ học, hình thái học là sự nghiên cứu về cấu trúc của từ, tập hợp từ, câu...và đó cũng
là một lĩnh vực nghiên cứu từ nhiều năm nay. Còn trong sinh học, hình thái học lại chú
trọng tới hình dạng của một cá thể hơn, chẳng hạn có thể phân tích hình dạng của một
chiếc lá để từ đó có thể nhận dạng được loại cây đó là cây gì; nghiên cứu hình dạng của
một nhóm vi khuẩn, dựa trên các đặc điểm nhận dạng để phân biệt chúng thuộc nhóm

vi khuẩn nào, v.v... Tuỳ theo trường hợp cụ thể mà có một cách phân lớp phù hợp với
nó: Có thể phân lớp dựa trên những hình dạng bao quanh như (elip, trịn, ...), kiểu và
mức độ của những hình dạng ất quy tắc (lồi, lõm, ...), những cấu trúc trong (lỗ, đường
thẳng, đường cong, ...) mà đã được tích luỹ qua nhiều năm quan sát.
Tính khoa học của Hình thái học số chỉ mới thực sự phát huy khả năng của nó kể
từ khi máy tính điện tử số ra đời và đã làm cho Hình thái học trở nên thơng dụng, có
nhiều tính năng mới. Những đối tượng ảnh trong Hình thái học hầu như, ta có thể coi
như là tập hợp của các điểm ảnh, nhóm lại theo cấu trúc 2 chiều. Những thao tác toán
học cụ thể trên tập hợp điểm đó được sử dụng để làm rõ (tái hiện) những nét đặc trưng
của những hình dạng, do vậy mà có thể tính tốn được hay nhận biết được chúng một
cách dễ dàng.

13


1.2.1. Một số khái niệm cơ bản về tập hợp
1.2.1.1. Một số phép toán trên ảnh nhị phân
Trong toán học hình thái, một ảnh được định nghĩa như là một tập của các véc tơ
tọa độ trong không gian Euclid. Kí hiệu EN là tập tất cả các điểm p = (x1, x2, …, xN)
trong một không gian Euclid N chiều. Mỗi tập A tương ứng với một ảnh nhị phân (Một
không gian N chiều cấu thành trong màu trắng và đen), khi điểm p là màu đen trong ảnh
nhị phân nếu và chỉ nếu 𝑝 ∈ 𝐴, ngược lại p là màu trắng. Một ảnh nhị phân E2 là một
hình đen, một tập tương ứng với vùng ảnh nền.

Cho A kí hiệu là một tập (hay một ảnh nhị phân) trong E2. Nếu một tập không chứa phần
tử nào, nó được gọi là một tập rỗng hay tập trống, ký hiệu là Φ . Cho 𝑎 ∈ 𝐴là một phần
tử a = (a1 , a2 ) trong A. Phần bù (hay nghịch đảo) của A là một ảnh nhị phân mà thay
đổi màu đen và trắng, được cho như sau.
𝐴‾ = (𝐴)𝑐 = { 𝑎 ∣ 𝑎 ∉ 𝐴 }


(1.2)

Nghịch ảnh của một ảnh A là đối xứng của ảnh A qua gốc tọa độ và được cho như

sau:
𝐴̂ = {𝑤|𝑤 = −𝑎, 𝑎 ∈ 𝐴}

(1.3)

Trong đó các phần tử với (a1 , a2 ) được đổi dấu. Một ví dụ của phép nghich đảo
với gốc tọa độ là tại tâm của điểm ảnh.

Hình 1.5. Phép đảo ảnh
Phép hợp của hai ảnh A và B là một ảnh nhị phân trong đó các điểm ảnh là đen
nếu tương ứng các điểm ảnh là đen trong A hoặc B, được cho như sau:
𝐴 ∪ 𝐵 = {𝑝|𝑝 ∈ 𝐴 ℎ𝑜ặ𝑐 𝑝 ∈ 𝐵}

(1.4)

Phép giao của hai ảnh A và B là một ảnh nhị phân với các điểm là đen nếu tương
ứng các điểm ảnh của A và B đều đen, như sau:
𝐴 ∩ 𝐵 = {𝑝|𝑝 ∈ 𝐴 ℎ𝑜ặ𝑐 𝑝 ∈ 𝐵}
14

(1.5)


Phép hợp và phép giao có thể được thay đổi bởi phép toán logic đối ngẫu (Luật
DeMorgan).
(𝐴 ∪ 𝐵)𝑐 = 𝐴𝑐 ∩ 𝐵𝑐


(1.6)

𝐴 − 𝐵 = 𝐴 ∩ 𝐵̅

(1.7)

Phép toán trừ của A và B được kí hiệu là A – B hay A\B, là những điểm ảnh trong
A mà khơng ở trong B.

1.2.1.2. Các phép tốn logic trên ảnh nhị phân

Các phép toán logic nhận được từ đại số Bool (Boolean algebra), là một cách tiếp
cận toán học sử dụng các khái niệm đúng – sai theo một cách trừu tượng. Một giá trị
trong đại số Bool chỉ có thể có một trong hai giá trị đúng hoặc sai. Logic Bool là công
cụ được sử dụng để thực hiện các thuật toán xử lý ảnh dựa trên toán học hình thái.
Các tốn tử cơ bản trong logic Bool là AND, OR và NOT. Phép toán AND cho
giá trị đầu ra là 1 (true) nếu và chỉ nếu tất cả các giá trị đầu vào là 1. Phép toán OR tạo
ra các giá trị là 1 nếu tồn tại một giá trị đầu vào là 1. Phép toán NOT (phép nghịch đảo)
đơn giản tạo giá trị đầu ra đối xứng với giá trị đầu vào. Tương tự phép toán AND và
OR, có hai phép tốn sử dụng cùng logic nhưng các giá trị đầu ra được đảo ngược. Phép
toán NAND cho ra giá trị là 0 nếu tất cả giá trị đầu vào là 1, và phép NOR cho giá trị là
0 nếu có một giá trị đầu vào là 1. Một dạng biến đổi khác của OR là XOR (phần tử loại
từ OR), cho giá trị 1 nếu hai giá trị đầu vào là khác nhau. Bảng chân lý của các phép
toán logic chỉ ra tất cả các kết hợp giá trị vào được miêu tả ở bảng sau:
A

B

A and B


A or B

not A

A nand B

A nor B

A xor B

0

0

0

0

1

1

1

0

0

1


0

1

1

1

0

1

1

0

0

1

0

1

0

1

1


1

1
1
0
0
0
Bảng 1. Bảng chân lý của các phép AND, OR, NOT, NAND, NOR, XOR

0

Một ảnh nhị phân bao gồm các đối tượng điểm ảnh 1 và các điểm ảnh nền 0 mà
có thể được coi như là giá trị true và false tương ứng với các giá trị trong bảng chân lý.
Bằng cách áp dụng khái niệm này, các phép toán logic trên ảnh nhị phân được áp dụng
một cách đơn giản các luật kết hợp trong bảng giá trị chân lý cho các giá trị điểm ảnh
với một cặp giá trị ảnh vào (hoặc một ảnh nếu sử dụng phép tốn NOT). Hay nói cách
15


khác, các phép toán logic so sánh các điểm ảnh vào tương ứng của hai ảnh cùng kích
thước và tạo ra ảnh có cùng kích thước.
Hơn nữa, các phép tốn logic có thể mở rộng cho ảnh đa cấp xám. Các phép toán
logic được suy ra trong một phép đảo bít trên ảnh nhị phân biểu diễn của các điểm ảnh,
so sánh các bít tương ứng để cho ra các giá trị điểm ảnh đầu ra. Ví dụ một điểm trong
ảnh 256 mức độ xám có 8 bit. Cho hai điểm ảnh có giá trị vào là 13 và 203 trong số thập
phân. Giá trị biểu diễn nhị phân tương ứng là 00001101 và 11001011. Khi áp dụng phép
toán AND, kết quả biểu diễn nhị phân là 00001001, tương ứng với 9 trong số thập phân.
1.2.2. Các khái niệm hình thái cơ bản
Tốn học hình thái bắt đầu phát triển vào những năm cuối của thập kỉ 60 và nó

như là một phần của phân tích ảnh. Nó dựa trên các tốn tử phi tuyến tính trong đại số
thực hiện trên các đối tượng hình dạng và mong muốn thay thế nhiều hệ thống đại số
tuyến tính của tích chập. Tốn học hình thái thực hiện nhiều chức năng tiền xử lý, phân
vùng ảnh sử dụng các đối tượng hình dạng, và lượng tử hóa đối tượng. Cách tiếp cận
theo tốn học hình thái tốt hơn và nhanh hơn các cách tiếp cận truyền thống. Các công
cụ tạo ra sự trở ngại cho người chưa có kinh nghiệm trong tốn học hình thái là sự khác
nhau rõ ràng về đại số hơn là sử dụng các chuẩn đại số và các phần tính tốn. Các cơng
cụ của hình thái được sử dụng trong các ứng dụng về dạng của đối tượng và tốc độ là
một vần đề, ví dụ phân tích ảnh chụp từ kính hiển vi (trong sinh học, khoa học vật liệu,
địa chất học, tội phạm học), kiểm tra công nghiệp, nhận dạng các đối tượng quang học,
và phân tích tài liệu.
Cách tiếp cận khơng hình thái để xử lý ảnh là gần với tính tốn, đang dược dựa
trên khái niệm hàm tốc độ điểm và các phép biến đổi tuyến tính như tích chập. Tốn học
hình thái sử dụng các cơng cụ của đại số và tốn tử phi tuyến với các tập điểm, liên
thơng và hình dạng. Các tốn tử hình thái đơn giản ảnh, định lượng và giữ các đặc tính
chính hình dạng của đối tượng.
Các phép tốn được sử dụng chính cho các mục đích chính sau:


Tiền xử lý ảnh (lọc nhiễu, đơn giản hình ảnh).



Tăng các đối tượng cấu trúc (xương, làm mỏng, làm dày, bao lồi, đánh

dấu đối tượng).


Tách các đối tượng từ nền.




Lượng tử hóa miêu tả các đối tượng (vùng, chu vi, chiếu, các đặc trưng Euler16


Poincare).
Tốn học hình thái sử dụng các thuộc tính của tập điểm, kết quả của tích hình học
và topo. Giả thiết đầu tiên là ảnh thực có thể được mơ hình hóa sử dụng tập các tập điểm
nhiều chiều (ví dụ không gian Euclid N chiều); không gian Euclid 2D ε2 và các tập con
của nó là một miền tự nhiên để miêu tả hình dáng của của quả cầu. Giả sử chúng ta đã
biết các phép toán: Thuộc (⊂ hoặc ⊃ ), phép giao ( ∩ ), phép hợp ( ∪ ), tập rỗng (∅) và
phần bù (c). Phép trừ được định nghĩa bởi:

𝑋 ∖ 𝑌 = 𝑋 ∩ 𝑌𝑐

(1.8)

Máy tính sử dụng số hóa của khơng gian Euclid – tập của cặp số thực (∈ 𝑍 2 ) cho

hình thái ảnh nhị phân hay tập của 3 số thực (∈ 𝑍 3 ) cho hình thái ảnh đa cấp xám hay
hình thái nhị phân 3D.

Chúng ta bắt đầu bằng cách xem ảnh nhị phân có thể được biểu diễn như là các
tập con của không gian 2D của tất cả các số thực, Z2. Một điểm được biểu diễn bởi một
cặp số thực mà cho bởi một hệ trục tọa độ tương ứng với hai trục của lưới số. Đơn vị độ
dài của lưới bằng với mẫu trong mỗi hướng. Chúng ta nói về lưới số rời rạc nếu quan
hệ lân cận giữa các điểm được định nghĩa tốt. Biểu diễn này có thể thực hiện với cả lưới
hình chữ nhật hoặc lưới lục giác, nhưng lưới hình chữ nhật hay được dùng hơn.
Một ảnh nhị phân có thể được coi như là một tập điểm 2D. Các điểm thuộc các đối
tượng trong ảnh biểu diễn một tập X – nhưng điểm này là các điểm ảnh với giá trị bằng

1. Các điểm của tập phần bù Xc tương ứng cho ảnh nền với giá trị điểm ảnh bằng 0.
Điểm gốc có tọa độ (0,0), và tọa độ của điểm bất kỳ được biểu diễn như là (x, y) theo
cách biểu diễn thông thường được sử dụng trong tốn học. Hình 4 chỉ ra một ví dụ một
tập – các điểm thuộc đối tượng được kí hiệu vởi một hình vng đen nhỏ. Bất kỳ điểm
x từ một ảnh rời rạc X = {(1, 0), (1, 1), (1, 2), (2, 2), (0, 3), (0, 4)} có thể được coi như
là một véc tơ với gốc tọa độ tương ứng (0, 0).

17


×