ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CNTT & TT
--------------------
HOÀNG VĂN TAM
NỘI SUY ẢNH SỐ
SỬ DỤNG PHÉP TỐN HÌNH THÁI VÀ ỨNG DỤNG
PHÉP LỌC HÌNH THÁI HỌC ĐỂ NÂNG CAO
CHẤT LƯỢNG ẢNH TÀI LIỆU
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS. TS. NGÔ QUỐC TẠO
THÁI NGUYÊN- 2020
i
LỜI CAM ĐOAN
Tên tôi là:
Sinh ngày:
Học viên lớp:
Hiện đang công tác tại:.
Tác giả xin cam đoan những kết quả nghiên cứu được trình bày trong
luận văn“nội suy ảnh số sử dụng phép tốn hình thái và ứng dụng phép lọc
hình thái học để nâng cao chất lượng ảnh tài liệu” do PGS.TS Ngơ Quốc
Tạo hướng dẫn là hồn tồn trung thực của tác giả, khơng vi phạm bất cứ điều
gì trong luật sở hữu trí tuệ và pháp luật Việt Nam. Nếu sai, tác giả hoàn toàn
chịu trách nhiệm trước pháp luật.
Tác giả luận văn
Xác nhận của khoa chuyên môn
Xác nhận của người hướng dẫn
khoa học
PGS.TS Ngô Quốc Tạo
ii
iii
MỤC LỤC
LỜI CAM ĐOAN ............................................................................................. i
LỜI CẢM ƠN .................................................... Error! Bookmark not defined.
MỤC LỤC ....................................................................................................... iii
DANH MỤC KÍ HIỆU, CÁC CHỮ VIẾT TĂT .......................................... v
DANH MỤC CÁC HÌNH .............................................................................. vi
LỜI MỞ ĐẦU .................................................................................................. 1
CHƯƠNG 1 TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ PHÉP TỐN HÌNH
THÁI ................................................................................................................. 3
1.1. Xử lý ảnh ................................................................................................... 3
1.2. Quá trình xử lý ảnh .................................................................................. 4
1.3. Các vấn đề cơ bản trong xử lý ảnh....................................................... 4
1.3.1. Một số khái niệm cơ bản....................................................................... 4
1.3.2. Nắn chỉnh biến dạng ........................................................................... 5
1.3.3. Khử nhiễu ............................................................................................ 6
1.3.4. Chỉnh mức xám ................................................................................... 7
1.3.5. Trích chọn đặc điểm ........................................................................... 7
1.3.6. Nhận dạng ........................................................................................... 8
1.3.7. Nén ảnh ................................................................................................ 9
1.4. Thu nhận và biểu diễn ảnh .................................................................... 10
1.4.1. Thu nhận, các thiết bị thu nhận ảnh ................................................. 10
1.4.2. Biểu diễn ảnh ....................................................................................... 10
1.5. Các khái niệm về phép tốn hình thái Morphology ......................... 10
CHƯƠNG 2 MỘT SỐ TÍNH CHẤT NỘI SUY CỦA PHÉP TỐN HÌNH
THÁI HỌC..................................................................................................... 13
2.1. Các phép tốn hình thái học.................................................................. 13
2.1.1. Các phép tốn hình thái học trên ảnh nhị phân............................... 13
2.1.2. Các phép tốn hình thái học trên ảnh xám....................................... 16
2.1.3. Các phép tốn hình thái học trên ảnh màu ...................................... 22
2.1.3.1. Hình thái học dựa trên biểu đồ đồng bằng .................................... 23
iv
2.1.3.2. Hình thái học dựa trên biểu đồ làm mịn ........................................ 25
2.1.3.3. Hình thái học cho một loại hình ảnh tương tự .............................. 26
2.2. Các tính chất nội suy của phép tốn hình thái học ............................. 27
2.3. Các phép lọc hình thái học ứng dụng cho ảnh OCR .......................... 28
2.3.1. Mơ hình ảnh tài liệu kém chất lượng ................................................ 28
2.3.2. Lọc hình thái học ................................................................................. 31
2.3.2.1. Tốn tử hình thái trên khơng gian đồ thị ...................................... 31
2.3.2.2. Tốn tử hình thái trên các phức hợp đơn giản ............................. 32
2.3.2.3. Bộ lọc đóng và mở khu vực hình thái ............................................. 35
CHƯƠNG 3 THỬ NGHIỆM PHÉP LỌC HÌNH THÁI HỌC ỨNG
DỤNG CHO ẢNH TÀI LIỆU KÉM CHẤT LƯỢNG ............................... 38
3.1. Thiết kế mơ hình thử nghiệm ................................................................ 38
3.2. Phép tốn hình thái cơ bản.................................................................... 39
3.3. Loại bỏ nhiễu để làm rõ đối tượng ....................................................... 39
3.4. Làm rõ điểm bất thường........................................................................ 41
3.5. Kết hợp các phép tốn hình thái để khử nhiễu ảnh ............................ 42
KẾT LUẬN .................................................................................................... 46
TÀI LIỆU THAM KHẢO ............................................................................ 47
PHỤ LỤC ....................................................................................................... 48
v
DANH MỤC KÍ HIỆU, CÁC CHỮ VIẾT TẮT
Chữ viết tắt Ý nghĩa, dạng viết đầy đủ
ORC
Nhận dạng ký tự quang học (Optical Character Recognition).
MSE
sai số tồn phương trung bình (Mean squared error)
PSNR
Tỉ số tín hiệu cực đại trên nhiễu (peak signal-to-noise ratio)
vi
DANH MỤC CÁC HÌNH
Hình 1.1. Sơ đồ q trình xử lý ảnh ...................................................... 4
Hình 1.2. Ảnh thu nhận và ảnh mong muốn ........................................ 5
Hình 3.1. Minh họa các phép tốn hình thái cơ bản .......................... 39
Hình 3.2. Làm rõ đối tượng tiền cảnh ................................................. 40
Hình 3.3. Làm rõ điểm bất thường ...................................................... 42
Hình 3.4. Khử nhiễu ảnh ...................................................................... 43
Hình 3.5. Khử nhiễu ảnh ORC ............................................................ 44
1
LỜI MỞ ĐẦU
1. Đặt vấn đề
Hình ảnh trong cuộc sống hiện tại là một dạng dữ liệu đóng vai trị quan
trọng trong việc lưu giữ, xử lý và trao đổi thông tin. Với thời đại 4.0 nhu cầu
lưu trữ và xử lý các tài liệu, văn bản, bản vẽ kỹ thuật,… dưới dạng hình ảnh
scan hoặc dưới dạng ảnh là nhu cầu cần thiết. Tuy nhiên, các hình ảnh scan
hoặc chụp thu được bởi nhiều lý do có thể bị nhiễu, mờ nhịe, đứt nét và khơng
được rõ ràng… dẫn đến việc thu nhận thông tin và xử lý gặp nhiều khó khăn.
Vì vậy việc khắc phục những nhược điểm của hình ảnh thu nhận được là việc
làm rất cấp thiết. Trên thế giới cũng như tại Việt Nam đã có rất nhiều các kỹ
thuật được đưa ra, trong đó có xử lý ảnh. Các phép tốn hình thái trên ảnh cung
cấp cho chúng ta những mô tả định lượng về cấu trúc và hình dạng hình học
của các đối tượng trong ảnh và nó đang được ứng dụng rộng rãi trong việc nâng
cao chất lượng ảnh, phân đoạn ảnh, kiểm tra khuyết điểm trên ảnh,…
Trong luận văn này tác giả sẽ nghiên cứu: “Một số tính chất nội suy ảnh
số sử dụng phép tốn hình thái và ứng dụng phép lọc hình thái học để nâng cao
chất lượng ảnh tài liệu kém chất lượng”.
2. Đối tượng và phạm vi nghiên cứu
Luận văn tập trung khảo sát các đối tượng liên quan đến các phép tốn
hình thái:
- Lý thuyết cơ bản về xử lý ảnh;
- Các phép tốn hình thái.
- Tính chất nội suy của phép tốn hình thái.
3. Hướng nghiên cứu của đề tài
- Nghiên cứu lý thuyết liên quan đến đề tài: Quá trình xử lý ảnh, các
vấn đề cơ bản trong xử lý ảnh, phép tốn hình thái, tính chất nội suy
của phép tốn hình thái.
- Cài đặt thử nghiệm phép tốn hình thái học ứng dụng cho ảnh tài liệu
kém chất lượng.
2
4. Cấu trúc của luận văn và những nội dung nghiên cứu chính
Cấu trúc của luận văn gồm:
- Phần mở đầu.
- Chương 1, 2 và 3.
- Phần kết luận và đề nghị.
- Tài liệu tham khảo.
- Phụ lục
Nội dung chính của luận văn:
Chương 1: Tổng quan về xử lý ảnh và phép tốn hình thái: Tại chương
này tác giả nghiêm cứu về khái niệm xử lý ảnh, quá trình xử lý ảnh và các khái
niệm về phép tốn hình thái Morphology.
Chương 2: Một số tính chất nội suy của phép tốn hình thái học: Chương
này tác giả sẽ trình bày các phép tốn hình thái học trên ảnh xám, ảnh màu và
các tính chất nội suy của phép tốn hình thái học. Tiếp theo đó sẽ trình bày các
phép lọc hình thái học cho ảnh OCR.
Chương 3: Chương trình thử nghiệm phép lọc hình thái học ứng dụng
cho ảnh tài liệu kém chất lượng: Chương này trình bày sơ đồ chương trình, thử
nghiệm phép lọc hình thái và đánh giá MSE cũng như đánh giá PSNR.
5. Phương pháp nghiên cứu
Trong luận văn học viên sử dụng các phương pháp nghiên cứu chính sau:
- Nghiên cứu lý thuyết: Tổng hợp tài liệu, hệ thống lại các kiến thức,
tìm hiểu các khái niệm, thuật toán sử dụng trong đề tài.
- Lấy ý kiến chuyên gia.
- Lập trình thử nghiệm.
3
CHƯƠNG 1
TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ PHÉP TOÁN HÌNH THÁI
Chương này trình bày về khái niệm xử lý ảnh, quá trình xử lý ảnh và các
khái niệm về phép tốn hình thái Morphology.
1.1. Xử lý ảnh
Con người thu nhận thơng tin qua các giác quan, trong đó thị giác đóng
vai trị quan trọng nhất. Những năm trở lại đây với sự phát triển của phần cứng
máy tính, xử lý ảnh và đồ hoạ đã phát triển một cách mạnh mẽ và có nhiều ứng
dụng trong cuộc sống. Xử lý ảnh và đồ hoạ đóng một vai trị quan trọng trong
tương tác người máy. Quá trình xử lý ảnh được xem như là quá trình thao tác
ảnh đầu vào nhằm cho ra kết quả mong muốn. Kết quả đầu ra của một q trình
xử lý ảnh có thể là một ảnh “tốt hơn” hoặc một kết luận nào đó.
Cũng như xử lý dữ liệu bằng đồ hoạ, xử lý ảnh số là một lĩnh vực của tin
học ứng dụng. Xử lý dữ liệu bằng đồ họa đề cập đến những ảnh nhân tạo, các
ảnh này được xem xét như là một cấu trúc dữ liệu và được tạo ra bởi các chương
trình. Xử lý ảnh số bao gồm các phương pháp và kĩ thuật để biến đổi, để truyền
tải hoặc mã hóa các ảnh tự nhiên. Mục đích của xử lý ảnh gồm:
- Thứ nhất, biến đổi ảnh và làm đẹp ảnh.
- Thứ hai, tự động nhận dạng ảnh hay đoán ảnh và đánh giá các nội dung
của ảnh.
Nhận biết và đánh giá các nội dung của ảnh (nhận dạng) là sự phân tích
một hình ảnh thành những phần có nghĩa để phân biệt đối tượng này với đối
tượng khác. Dựa vào đó ta có thể mơ tả cấu trúc của hình ảnh ban đầu. Có thể
liệt kê một số phương pháp nhận dạng cơ bản như nhận dạng biên của một đối
tượng trên ảnh, tách cạnh, phân đoạn hình ảnh, v.v... Kĩ thuật này được dùng
nhiều trong y học (xử lý tế bào, nhiễm sắc thể) và nhận dạng chữ viết trong văn
bản.
4
1.2. Q trình xử lý ảnh
Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh được xem như
là đặc trưng cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của
đối tượng trong khơng gian và nó có thể xem như một hàm n biến P(c1, c2,...,
cn). Do đó, ảnh trong xử lý ảnh có thể xem như ảnh n chiều.
Sơ đồ tổng quát của một hệ thống xử lý ảnh:
Thu nhận ảnh
(Scaner,
Camera,
Sénor)
Hệ quyết định
Tiền xử lý
Trích chọn
đặc điểm
Đổi sánh rút
ra kết luận
Hậu xử lý
Lưu trữ
Hình 1.1. Sơ đồ quá trình xử lý ảnh
1.3. Các vấn đề cơ bản trong xử lý ảnh
1.3.1. Một số khái niệm cơ bản
Điểm ảnh (pixel – viết tắt là px) là đơn vị nhỏ nhất tạo nên hình ảnh,
thường mang một màu duy nhất (kết quả của sự pha trộn các màu cơ bản giữa
các kênh màu). Để thơng số điểm ảnh có ý nghĩa, người ta phải qui về một đơn
vị kích thước nhất định, như inch hay cm/mm để tính và điểm ảnh thường được
diễn đạt theo số lượng điểm trên một inch/cm chiều dài.
Các điểm ảnh được tạo thành từ sự tổ hợp 3 màu chính R (red), G (green),
B (blue). Cùng một giá trị có thể hiển thị khác nhau trên các thiết bị khác nhau.
Màu 16 bit: mỗi màu được mã hóa bằng 5bit hay thêm một bit cịn lại cho
mau xanh lá cây.
Màu 24 bit: mỗi kênh màu được mã hóa bằng 1 byte (8 bit) có giá trị nằm
trong đoạn [0-255] mã hóa được 255 * 255 * 255 = 16,581,375 màu hay gọi là
16 triệu màu.
5
Màu 32 bit: tương tự như màu 24 bit, nhưng ở đây có 8 bit dư khơng sử
dụng (ngoại trừ khả năng sử dụng như kênh alpha). Có vận tốc cao hơn mà
phần lớn các phần cứng ngày nay có thể truy cập theo các địa chỉ byte của cấp
số 2.
Màu 48 bit: tương tự màu 16 bit nhưng mỗi thành phần được mã hóa bởi
16 bit màu, điều này làm cho mỗi màu có khả năng biểu thị 65.535 sắc thái thay
vì chỉ có 255. Được sử dụng trong chỉnh sửa ảnh chun nghiệp do có độ chính
xác cao hơn.
Màu RGBA: với việc xuất hiện nhu cầu ghép ảnh, việc thêm vào 8 bit dư
cho độ trong suốt tạo thành màu 32 bit với một kênh mới là Alpha, biểu diễn
độ trong suốt của điểm ảnh
Ảnh xám hay còn gọi là ảnh đơn sắc (monochromatic). Mức xám của ảnh
là kết quả của sự biến đổi tương ứng 1 giá trị độ sáng của 1 điểm ảnh với 1 giá
trị ngun dương. Thơng thường nó xác định trong [0, 255] tuỳ thuộc vào giá
trị mà mỗi điểm ảnh được biểu diễn. Các thang giá trị mức xám thông thường:
16, 32, 64, 128, 256 (mức 256 là mức phổ dụng).
Ảnh nhị phân là ảnh số, trong đó mỗi điểm ảnh được biểu diễn bởi giá trị
là 0 (trắng) hoặc 1 (đen). Ảnh nhị phân được tạo ra bằng cách biến đổi ảnh xám
dựa vào một ngưỡng xác định.
1.3.2. Nắn chỉnh biến dạng
Ảnh thu nhận thường bị biến dạng do các thiết bị quang học và điện tử.
Hình 1.2. Ảnh thu nhận và ảnh mong muốn
Để khắc phục người ta sử dụng các phép chiếu, các phép chiếu thường
được xây dựng trên tập các điểm điều khiển.
6
Giả sử (Pi, Pi’) i = 1,.., n: có n các tập điều khiển
Tìm hàm f: Pi f (Pi) sao cho
𝑛
∑ |𝑓(𝑃𝑖 ) − 𝑃𝑖 ′|2 → 𝑚𝑖𝑛
𝑖=1
Giả sử ảnh i bị biến đổi thông qua các phép biến đổi: Tịnh tiến, quay, tỷ
lệ, biến dạng bậc nhất tuyến tính. Khi đó hàm f có dạng:
f (x, y) = (a1x + b1y + c1, a2x + b2y + c2)
Ta có:
𝑛
𝑛
𝜑 = ∑( 𝑓(𝑃𝑖 ) − 𝑃𝑖 ′)2 = ∑[( 𝑎1 𝑥𝑖 + 𝑏1 𝑦𝑖 + 𝑐1 − 𝑥𝑖′ )2 + (𝑎2 𝑥𝑖 + 𝑏2 𝑦𝑖 + 𝑐2 − 𝑦𝑖′ )2 ]
𝑖=1
𝑖=1
Để cho φ → min
Giải hệ phương trình tuyến tính tìm được a1, b1, c1
Tương tự tìm được a2, b2, c2
Từ đó, ta xác định được hàm f.
1.3.3. Khử nhiễu
Có 2 loại nhiễu cơ bản trong q trình thu nhận ảnh
• Nhiều hệ thống: là nhiễu có quy luật có thể khử bằng các phép biến đổi.
• Nhiễu ngẫu nhiên: vết bẩn khơng rõ ngun nhân, có thể khắc phục bằng
các phép lọc.
7
1.3.4. Chỉnh mức xám
Nhằm khắc phục tính khơng đồng đều của hệ thống gây ra. Thơng thường
có 2 hướng tiếp cận:
• Giảm số mức xám: Thực hiện bằng cách nhóm các mức xám gần nhau
thành một bó. Trường hợp chỉ có 2 mức xám thì chính là chuyển về ảnh đen
trắng, ứng dụng: in ảnh màu ra máy in đen trắng.
• Tăng số mức xám: Thực hiện nội suy ra các mức xám trung gian bằng
kỹ thuật nội suy. Kỹ thuật này nhằm tăng cường độ mịn cho ảnh
1.3.5. Trích chọn đặc điểm
Các đặc điểm của đối tượng được trích chọn tuỳ theo mục đích nhận dạng
trong q trình xử lý ảnh. Có thể nêu ra một số đặc điểm của ảnh sau đây:
Đặc điểm không gian: Phân bố mức xám, phân bố xác suất, biên độ, điểm
uốn v.v..
Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc thực
hiện lọc vùng (zonal filtering). Các bộ vùng được gọi là “mặt nạ đặc 10 điểm”
(feature mask) thường là các khe hẹp với hình dạng khác nhau (chữ nhật, tam
giác, cung tròn v.v..).
Đặc điểm biên và đường biên: Là đặc trưng cho đường biên của đối
tượng và do vậy rất hữu ích trong việc trích trọn các thuộc tính bất biến được
dùng khi nhận dạng đối tượng. Các đặc điểm này có thể được trích chọn nhờ
tốn tử gradient, toán tử la bàn, toán tử Laplace, toán tử “chéo khơng” (zero
crossing) v.v..
Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối
tượng ảnh chính xác, với tốc độ tính tốn cao và dung lượng nhớ lưu trữ giảm
xuống.
8
1.3.6. Nhận dạng
Nhận dạng tự động (automatic recognition), mô tả đối tượng, phân loại
và phân nhóm các mẫu là những vấn đề quan trọng trong thị giác máy, được
ứng dụng trong nhiều ngành khoa học khác nhau. Tuy nhiên, một câu hỏi đặt
ra là: mẫu (pattern) là gì? Watanabe, một trong những người đi đầu trong lĩnh
vực này đã định nghĩa: “Ngược lại với hỗn loạn (chaos), mẫu là một thực thể
(entity), được xác định một cách mơ hồ (vaguely defined) và có thể gán cho nó
một tên gọi nào đó”. Ví dụ mẫu có thể là ảnh của vân tay, ảnh của một vật nào
đó được chụp, một chữ viết, khn mặt người hoặc một ký đồ tín hiệu tiếng
nói. Khi biết một mẫu nào đó, để nhận dạng hoặc phân loại mẫu đó có thể:
Hoặc phân loại có mẫu (supervised classification), chẳng hạn phân tích
phân biệt (discriminant analyis), trong đó mẫu đầu vào được định danh như một
thành phần của một lớp đã xác định.
Hoặc phân loại không có mẫu (unsupervised classification hay clustering)
trong đó các mẫu được gán vào các lớp khác nhau dựa trên một tiêu chuẩn đồng
dạng nào đó. Các lớp này cho đến thời điểm phân loại vẫn chưa biết hay chưa
được định danh. Hệ thống nhận dạng tự động bao gồm ba khâu tương ứng với
ba giai đoạn chủ yếu sau đây:
1. Thu nhận dữ liệu và tiền xử lý.
2. Biểu diễn dữ liệu.
3. Nhận dạng, ra quyết định.
Bốn cách tiếp cận khác nhau trong lý thuyết nhận dạng là:
1. Đối sánh mẫu dựa trên các đặc trưng được trích chọn.
2. Phân loại thống kê.
3. Đối sánh cấu trúc.
4. Phân loại dựa trên mạng nơ-ron nhân tạo.
Trong các ứng dụng rõ ràng là khơng thể chỉ dùng có một cách tiếp cận
đơn lẻ để phân loại “tối ưu” do vậy cần sử dụng cùng một lúc nhiều phương
9
pháp và cách tiếp cận khác nhau. Do vậy, các phương thức phân loại tổ hợp hay
được sử dụng khi nhận dạng và nay đã có những kết quả có triển vọng dựa trên
thiết kế các hệ thống lai (hybrid system) bao gồm nhiều mơ hình kết hợp.
Việc giải quyết bài toán nhận dạng trong những ứng dụng mới, nảy sinh
trong cuộc sống không chỉ tạo ra những thách thức về thuật giải, mà còn đặt ra
những yêu cầu về tốc độ tính tốn. Đặc điểm chung của tất cả những ứng dụng
đó là những đặc điểm đặc trưng cần thiết thường là nhiều, không thể do chuyên
gia đề xuất, mà phải được trích chọn dựa trên các thủ tục phân tích dữ liệu.
1.3.7. Nén ảnh
Nhằm giảm thiểu khơng gian lưu trữ. Thường được tiến hành theo cả hai
cách khuynh hướng là nén có bảo tồn và khơng bảo tồn thơng tin. Nén khơng
bảo tồn thì thường có khả năng nén cao hơn nhưng khả năng phục hồi thì kém
hơn. Trên cơ sở hai khuynh hướng, có 4 cách tiếp cận cơ bản trong nén ảnh:
- Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần xuất xuất
hiện của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa thích hợp.
Một ví dụ điển hình cho kỹ thuật mã hóa này là *.TIF
- Nén ảnh không gian: Kỹ thuật này dựa vào vị trí khơng gian của các
điểm ảnh để tiến hành mã hóa. Kỹ thuật lợi dụng sự giống nhau của các điểm
ảnh trong các vùng gần nhau. Ví dụ cho kỹ thuật này là mã nén *.PCX
- Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng nén
khơng bảo tồn và do vậy, kỹ thuật thướng nến hiệu quả hơn. *.JPG chính là
tiếp cận theo kỹ thuật nén này.
- Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng ảnh, thể
hiện sự lặp lại của các chi tiết. Kỹ thuật nén sẽ tính tốn để chỉ cần lưu trữ phần
gốc ảnh và quy luật sinh ra ảnh theo nguyên lý Fractal.
10
1.4. Thu nhận và biểu diễn ảnh
1.4.1. Thu nhận, các thiết bị thu nhận ảnh
Các thiết bị thu nhận ảnh bao gồm camera, scanner các thiết bị thu nhận
này có thể cho ảnh đen trắng. Các thiết bị thu nhận ảnh có 2 loại chính ứng với
2 loại ảnh thơng dụng là Raster và Vector.
Các thiết bị thu nhận ảnh thông thường Raster là camera các thiết bị thu
nhận ảnh thơng thường Vector là sensor hoặc bàn số hố Digitalizer hoặc
được chuyển đổi từ ảnh Raster.
Nhìn chung các hệ thống thu nhận ảnh thực hiện quá trình hai bước: Cảm
biến: biến đổi năng lượng quang học thành năng lượng điện; Tổng hợp năng
lượng điện thành ảnh.
1.4.2. Biểu diễn ảnh
Ảnh trên máy tính là kết quả thu nhận theo các phương pháp số hoá được
nhúng trong các thiết bị kỹ thuật khác nhau. Q trình lưu trữ ảnh nhằm hai
mục đích là tiết kiệm bộ nhớ và giảm thời gian xử lý.
Việc lưu trữ thơng tin trong bộ nhớ có ảnh hưởng rất lớn đến việc hiển
thị, in ấn và xử lý ảnh được xem như là một tập hợp các điểm với cùng kích
thước nếu sử dụng càng nhiều điểm ảnh thì bức ảnh càng đẹp, càng mịn và càng
thể hiện rõ hơn chi tiết của ảnh người ta gọi đặc điểm này là độ phân giải.
Việc lựa chọn độ phân giải thích hợp tuỳ thuộc vào nhu cầu sử dụng và
đặc trưng của mỗi ảnh cụ thể, trên cơ sở đó các ảnh thường được biểu diễn theo
hai mơ hình cơ bản là mơ hình Raster và mơ hình Vector.
1.5.
Một số phương pháp nâng cao chất lượng ảnh
Có nhiều phương pháp khác nhau trong nâng cao chất lượng ảnh như:
- Các phương pháp trên điểm: Biến đổi tuyến tính từng đoạn, biến đổi
logarithm, biến đổi âm bản. Phương pháp này thích hợp cho việc tăng cường
các chi tiết của ảnh.
11
- Cân bằng, biến đổi biểu đồ Histogram: biểu đồ Histogram của một ảnh
là biểu đồ mô tả sự phân bố của các giá trị mức xám của các điểm ảnh (Pixel)
trong một bức ảnh hoặc một vùng ảnh (Region). Dựa vào biều đồ Histogram
có thể biết được hình ảnh sáng tối như thế nào. Cân bằng Histogram (Histogram
equalization) là phương pháp làm cho biểu đồ Histogram của ảnh được phân
bố một cách đồng đều. Đây là một cách giúp nâng cao chất lượng hình ảnh.
- Các phép tốn trên miền khơng gian: Lọc nhiễu, bù nghiêng, giảm mờ.
Có nhiều thuật tốn nâng cao chất lượng ảnh thuộc nhóm này như: Giảm nhiễu
(nhiễu Gauss, nhiễu muối tiêu, nhiễu lốm đốm), lọc mờ (thuật toán LucyRichardson, thuật toán Blind Deconvolution, lọc Wiener), bù nghiêng (dùng
biến đổi Hough, dùng phương pháp láng giềng gần nhất, sử dụng chiếu
nghiêng).
Trong đề tài luận văn này, chúng tơi sử dụng các phép tốn hình thái
trong nâng cao chất lượng ảnh. Chi tiết về các kỹ thuật liên quan sẽ được trình
bày ở các phần sau.
1.6.
Các khái niệm về phép tốn hình thái Morphology
Hiểu một cách đầy đủ thì ”Morphology” là hình thái và cấu trúc của đối
tượng, hay, nó diễn tả những phạm vi và các mối quan hệ giữa các phần của
một đối tượng. Hình thái học quá quen thuộc trong các lĩnh vực ngơn ngữ học
và sinh học. Trong ngơn ngữ học, hình thái học là sự nghiên cứu về cấu trúc
của từ, tập hợp từ, câu... và đó cũng là một lĩnh vực nghiên cứu từ nhiều năm
nay. Còn trong sinh học, hình thái học lại chú trọng tới hình dạng của một cá
thể hơn, chẳng hạn có thể phân tích hình dạng của một chiếc lá để từ đó có thể
nhận dạng được loại cây đó là cây gì; nghiên cứu hình dạng của một nhóm vi
khuẩn, dựa trên các đặc điểm nhận dạng để phân biệt chúng thuộc nhóm vi
khuẩn nào, v.v... Tuỳ theo trường hợp cụ thể mà có một cách phân lớp phù hợp
với nó: Có thể phân lớp dựa trên những hình dạng bao quanh như (elip, trịn,...),
kiểu và mức độ của những hình dạng bất quy tắc (lồi, lõm,...), những cấu trúc
trong (lỗ, đường thẳng, đường cong,...) mà đã được tích luỹ qua nhiều năm quan
sát.
12
Tính khoa học của Hình thái học số chỉ mới thực sự phát huy khả năng
của nó kể từ khi máy tính điện tử số ra đời và đã làm cho Hình thái học trở nên
thơng dụng, có nhiều tính năng mới. Những đối tượng ảnh trong Hình thái học
hầu như, ta có thể coi hầu như là tập hợp của các điểm ảnh, nhóm lại theo cấu
trúc 2 chiều. Những thao tác toán học cụ thể trên tập hợp điểm đó được sử dụng
để làm rõ (tái hiện) những nét đặc trưng của những hình dạng, do vậy mà có
thể tính tốn được hay nhận biết được chúng một cách dễ dàng.
13
CHƯƠNG 2
MỘT SỐ TÍNH CHẤT NỘI SUY CỦA PHÉP TỐN HÌNH THÁI HỌC
Chương này trình bày về một số tính chất nội suy của phép tốn hình
thái học trên nhiều cấu trúc ảnh và định dạng ảnh khác nhau, được thực hiện
trong điều kiện không gian khác nhau.
2.1. Các phép tốn hình thái học
2.1.1. Các phép tốn hình thái học trên ảnh nhị phân
* Phép giãn nở trên ảnh nhị phân
Công thức:
𝑨 ⊕ 𝑩 = {𝒄 | 𝒄 = 𝒂 + 𝒃, 𝒂 ∈ 𝑨, 𝒃 ∈ 𝑩
(2.1)
Trong đó:
- A: Là ma trận điểm ảnh của ảnh nhị phân.
- B: Là phần tử cấu trúc.
Phép giãn nở (Dilation) ảnh sẽ cho ra một tập điểm ảnh c thuộc D(i), bạn
hoàn toàn dễ dàng thấy rằng đây là một phép tổng giữa A và B. A sẽ là tập con
của D(i). Chú ý: Nhận xét này khơng hồn tồn đúng với trường hợp phần tử
cấu trúc B khơng có gốc (Origin) hay nói cách khác là gốc mang giá trị 0.
Ví dụ
𝟎
𝟎
𝟎
𝐈𝐬𝐫𝐜= 𝟎
𝟎
𝟎
[𝟎
𝟎
𝟎
𝟏
𝟎
𝟎
𝟏
𝟎
𝟎
𝟏
𝟏
𝟏
𝟏
𝟏
𝟎
𝟎
𝟎
𝟏
𝟏
𝟎
𝟏
𝟎
𝟎
𝟎
𝟏
𝟏
𝟏
𝟏
𝟎
𝟎
𝟎
𝟏
𝟏
𝟎
𝟏
𝟎
𝟎
𝟎
𝟎
𝟏 𝟎
]𝐈
𝟎 𝐁=[
𝟏 𝟏 𝐝𝐬𝐭=
𝟎
𝟎
𝟎]
𝟎
𝟎
𝟎
𝟎
𝟎
𝟎
[𝟎
𝟎
𝟏
𝟏
𝟎
𝟏
𝟏
𝟎
𝟏
𝟏
𝟏
𝟏
𝟏
𝟏
𝟎
𝟎
𝟏
𝟏
𝟏
𝟏
𝟏
𝟎
𝟎
𝟏
𝟏
𝟏
𝟏
𝟏
𝟎
𝟎
𝟏
𝟏
𝟏
𝟏
𝟏
𝟎
𝟎
𝟎
𝟏
𝟏
𝟎
𝟏
𝟎]
Ma trận điểm ảnh Isrc, ma trận điểm ảnh sau phép giãn nở Idst và phần tử
cấu trúc B.
14
Ứng với công thức ở trên, ta lần lượt đặt phần tử cấu trúc vào các điểm
ảnh có giá trị 1 của ma trận điểm ảnh Isrc. Kết quả thu được là ma trận điểm ảnh
Idst.
Tính tốn
Ta có ở ma trận điểm ảnh Isrc = {(1, 2), (2,1), (2, 2), (2, 3), (2, 4), (2,
5), (3, 2), (3, 3), (3, 4), (3, 5), (4, 2), (4, 4), (5, 1), (5, 2), (5, 3), (5, 4), (5,
5)}.
Ta có ở ma trận phần tử cấu trúc B = {(0,0), (-1, 0), (0, 1)} với (0,0) là
điểm gốc.
Áp dụng công thức phép giãn nở ta có: Isrc(0,0) = {(1, 2), (2,1), (2, 2), (2,
3), (2, 4), (2, 5), (3, 2), (3, 3), (3, 4), (3, 5), (4, 2), (4, 4), (5, 1), (5, 2), (5,
3), (5, 4), (5, 5)}.
Isrc(-1,0) = {(0, 2), (1,1), (1, 2), (1, 3), (1, 4), (1, 5), (2, 2), (2, 3), (2, 4), (2,
5), (3, 2), (3, 4), (4, 1), (4, 2), (4, 3), (4, 4), (4, 5)}
Isrc(0, 1) = {(1, 3), (2,2), (2, 3), (2, 4), (2, 5), (2, 6), (3, 3), (3, 4), (3, 5), (3,
6), (4, 3), (4, 5), (5, 3), (5, 3), (5, 4), (5, 5), (5, 6)}
Phép giãn nở của Isrc bởi B là hợp của Isrc(0,0), Isrc(-1,0) và Isrc(0,1) hay là Idst.
Với phần tử cấu trúc khơng có điểm gốc (Origin), cách tính tốn cũng
tương tự.
* Phép co trên ảnh nhị phân
Cơng thức
𝑨 ⊖ 𝑩 = {𝒄 |(𝑩)c ⊆ A }
(2.2)
Trong đó:
A: Ma trận điểm ảnh của ảnh nhị phân.
B: Là phần tử cấu trúc.
Phép co ảnh sẽ cho ra một tập điểm ảnh c thuộc A, nếu bạn đi chuyển phần
tử cấu trúc B theo C, thì B nằm trong đối tượng A. E(i) là một tập con của tập
15
ảnh bị co A. Chú ý: Nhận xét này không hoàn toàn đúng với trường hợp phần
tử cấu trúc B khơng có gốc (Origin) hay nói cách khác là gốc mang giá trị 0.
Ví dụ:
𝟎
𝟎
𝟎
𝐈𝐬𝐫𝐜= 𝟎
𝟎
𝟎
[𝟎
𝟎
𝟎
𝟏
𝟎
𝟎
𝟏
𝟎
𝟎
𝟏
𝟏
𝟏
𝟏
𝟏
𝟎
𝟎
𝟎
𝟏
𝟏
𝟎
𝟏
𝟎
𝟎
𝟎
𝟏
𝟏
𝟏
𝟏
𝟎
𝟎
𝟎
𝟏
𝟏
𝟎
𝟏
𝟎
𝟎
𝟎
𝟎
𝟏
𝟎 𝐁=[
𝟏
𝟎
𝟎
𝟎]
𝟎
]𝐈
𝟏 𝐝𝐬𝐭=
𝟎
𝟎
𝟎
𝟎
𝟎
𝟎
[𝟎
𝟎
𝟎
𝟎
𝟎
𝟎
𝟎
𝟎
𝟎
𝟎
𝟏
𝟏
𝟎
𝟏
𝟎
𝟎
𝟎
𝟎
𝟏
𝟎
𝟎
𝟎
𝟎
𝟎
𝟎
𝟏
𝟎
𝟏
𝟎
𝟎
𝟎
𝟎
𝟎
𝟎
𝟎
𝟎
𝟎
𝟎
𝟎
𝟎
𝟎
𝟎
𝟎]
Ta có ma trận điểm ảnh Isrc, ma trận điểm ảnh sau phép co Idst và cấu
trúc phần tử B.
Ứng với công thức ở trên, ta lần lượt đặt phần tử cấu trúc vào các điểm
ảnh có giá trị 1 của ma trận điểm ảnh Isrc. Kết quả thu được là ma trận điểm ảnh
Idst.
Tính tốn
Ta có ở ma trận điểm ảnh Isrc = {(1, 2), (2,1), (2, 2), (2, 3), (2, 4), (2,
5), (3, 2), (3, 3), (3, 4), (3, 5), (4, 2), (4, 4), (5, 1), (5, 2), (5, 3), (5, 4), (5, 5)}.
Ta có ở ma trận phần tử cấu trúc B = {(0,0), (-1, 0), (0, 1)} với (0,0) là
điểm gốc.
Ở đây, ta khơng quan tâm tới tồn bộ các điểm đen (mang giá trị 1) ở Isrc,
ta chỉ quan tâm tới đến những tọa độ của những điểm đen của Isrc khi mà ta di
chuyển phần tử cấu trúc trên đối tượng ảnh Isrc thì gốc của B trùng với một điểm
ảnh và các điểm lân cận mang giá trị 1 của phần tử cấu trúc B trùng với điểm
đen (Mang giá trị 1) của Isrc theo phần tử cấu trúc B. Ví dụ ở đây ta có 6 điểm
đen (Mang giá trị 1) trên Isrc phù hợp với điều kiện trên: Isrc(2, 2), Isrc(3, 2), Isrc(3,
3), Isrc(3, 4), Isrc(5, 2), Isrc(2, 4).
Isrc(2,1) = Isrc(2,2) = 1 & Isrc(1,1) = 0. Vậy nên Isrc(2,1) không thỏa với
cấu trúc phần tử. Nên Isrc(2,1) = 0.
Isrc(2,2) = Isrc(1,2) = Isrc(2,3) = 1. Vậy nên Isrc(2,2) thỏa với cấu trúc phần
tử B. Nên Isrc(3,3) = 1.
16
Với phần tử cấu trúc khơng có điểm gốc (Origin), cách tính tốn cũng
tương tự.
2.1.2. Các phép tốn hình thái học trên ảnh xám
* Phép giãn nở trên ảnh đa mức xám
Công thức
𝑫(𝒊) = (𝑨 ⊕ 𝑩)(𝒙, 𝒚) = 𝒎𝒂𝒙(𝑨(𝒙 + 𝒊, 𝒚 + 𝒊) + 𝑩(𝒊, 𝒋)| (𝒊, 𝒋) ∈ 𝑫B)
(2.3)
Trong đó
A: Ma trận điểm ảnh của ảnh xám.
B: Là phần tử cấu trúc.
DB: Là không gian ảnh của phần tử cấu trúc khơng phẳng B.
Ví dụ
0 10 0
[10 10 10]
0 10 0
Phần tử cấu trúc B
Ta có một ma trận ảnh đa mức xám Isrc
𝟎
𝟎
𝟏
𝟎
[𝟎
𝟎
𝟎
𝟏
𝟎
𝟎
𝟏
𝟏
𝟏
𝟏
𝟏
𝟎
𝟎
𝟏
𝟎
𝟎
𝟎
𝟎
𝟏
𝟎
𝟎]
𝟎
𝟎
𝟎
𝟎
[𝟎
𝟎
𝟏
𝟏
𝟏
𝟎
𝟎
𝟏
𝟏
𝟏
𝟎
𝟎
𝟏
𝟏
𝟏
𝟎
𝟎 𝟎
𝟎 𝟎
𝟎 𝟏
𝟎 𝟎
𝟎] [𝟎
𝟎
𝟏
𝟏
𝟏
𝟎
𝟏
𝟏
𝟏
𝟏
𝟏
𝟎
𝟏
𝟏
𝟏
𝟎
𝟎 𝟎
𝟎 𝟎
𝟏 𝟏
𝟎 𝟎
𝟎 ] [𝟎
𝟎
𝟎
𝟏
𝟎
𝟎
𝟎
𝟎
𝟎
𝟎
𝟎
𝟎
𝟎
𝟏
𝟎
𝟎
𝟎
𝟎
𝟏
𝟎
𝟎]
Các thành phần với một phần tử cấu trúc
1. Kích thước của ma trận phần tử cấu trúc.
2. Hình dáng của phần tử cấu trúc.
3. Gốc của phần tử (Ogirin). Thơng thường thì gốc của phần tử mang giá
trị 1 nhưng trong một số trường hợp thì gốc phần tử mang giá trị 0 (Phần tử cấu
trúc khơng có gốc).
Trong các phép tốn hình thái học, một phần tử cấu trúc có kích
thước (NxN) được di chuyển khắp ảnh và thực hiện phép tính tốn với từng
17
điểm ảnh (Pixel) của ảnh với (N2 -1) điểm ảnh (Pixel) lân cận (Khơng tính điểm
ở tâm). Phép tính tốn ở đây tùy thuộc vào nội dung của phép toán hình thái
học mà từ đó cho ra một kết quả phù hợp:
Nếu gốc của phần tử cấu trúc (Ogirin) nằm ở phía bên trái thì ảnh sẽ có
xu hướng co và giãn nở về phía bên phải.
Nếu gốc của phần tử cấu trúc (Ogirin) nằm ở phía bên phải thì ảnh sẽ có
xu hướng co và giãn về nở phía bên trái.
Vì vậy: Trong các kết quả của phép tốn xử lý hình thái học thì yếu tố
quan trọng là phần tử cấu trúc.
Chú ý: Những nội dung kiến thức trên đây là phần tử cấu trúc dùng trong
các phép tốn hình thái học trên ảnh nhị phân. Với ảnh đa mức xám thì phần tử
cấu trúc tương tự nhưng khác ở chỗ là các giá trị phần tử từ 0 đến 255 chứ
không phải là chỉ 0 với 1 như phần tử cấu trúc trên ảnh nhị phân.
0 10
[10 10
0 10
0
10]
0
Phép toán giãn nở
Là một trong các hoạt động cơ bản trong hình thái tốn học. Phép tồn
này có tác dụng làm cho đối tượng ban đầu trong ảnh tăng lên về kích thước
(Giãn nở ra).
Phép giãn nở trên ảnh nhị phân
Công thức
𝑨 ⊕ 𝑩 = {𝒄 | 𝒄 = 𝒂 + 𝒃, 𝒂 ∈ 𝑨, 𝒃 ∈ 𝑩}
(2.4)
Trong đó:
A: Ma trận điểm ảnh của ảnh nhị phân.
B: Là phần tử cấu trúc.
Phép giãn nở (Dilation) ảnh sẽ cho ra một tập điểm ảnh c thuộc D(i), bạn
hoàn toàn dễ dàng thấy rằng đây là một phép tổng giữa A và B. A sẽ là tập con
của D(i). Chú ý: Nhận xét này khơng tồn tồn đúng với trường hợp phần tử
18
cấu trúc B khơng có gốc (Origin) hay nói cách khác là gốc (Origin) mang giá
trị 0.
Ví dụ
Ta có ma trận điểm ảnh Isrc, ma trận điểm ảnh sau phép giãn nở Idst và
phần tử cấu trúc B.
Ứng với công thức ở trên, ta lần lượt đặt phần tử cấu trúc vào các điểm
ảnh có giá trị 1 của ma trận điểm ảnh Isrc. Kết quả thu được là ma trận điểm ảnh
Idst.
𝟎
𝟎
𝟎
𝐈𝐬𝐫𝐜= 𝟎
𝟎
𝟎
[𝟎
𝟎
𝟎
𝟏
𝟎
𝟎
𝟏
𝟎
𝟎
𝟏
𝟏
𝟏
𝟏
𝟏
𝟎
𝟎
𝟎
𝟏
𝟏
𝟎
𝟏
𝟎
𝟎
𝟎
𝟏
𝟏
𝟏
𝟏
𝟎
𝟎
𝟎
𝟏
𝟏
𝟎
𝟏
𝟎
𝟎
𝟎
𝟎
𝟏 𝟎
]𝐈
𝟎 𝐁=[
𝟏 𝟏 𝐝𝐬𝐭=
𝟎
𝟎
𝟎]
𝟎
𝟎
𝟎
𝟎
𝟎
𝟎
[𝟎
𝟎
𝟏
𝟏
𝟎
𝟏
𝟏
𝟎
𝟏
𝟏
𝟏
𝟏
𝟏
𝟏
𝟎
𝟎
𝟏
𝟏
𝟏
𝟏
𝟎
𝟎
𝟎
𝟏
𝟏
𝟏
𝟏
𝟏
𝟎
𝟎
𝟏
𝟏
𝟏
𝟏
𝟏
𝟎
𝟎
𝟎
𝟏
𝟏
𝟎
𝟏
𝟎]
Tính tốn
Ta có ở ma trận điểm ảnh Isrc = {(1, 2), (2,1), (2, 2), (2, 3), (2, 4),
(2, 5), (3, 2), (3, 3), (3, 4), (3, 5), (4, 2), (4, 4), (5, 1), (5, 2), (5, 3),
(5, 4), (5, 5)}.
Ta có ở ma trận phần tử cấu trúc B = {(0,0), (-1, 0), (0, 1)} với (0,0) là
điểm gốc.
Áp dụng công thức phép giãn nở ta có: Isrc(0,0) = {(1, 2), (2,1), (2, 2),
(2, 3), (2, 4), (2, 5), (3, 2), (3, 3), (3, 4), (3, 5), (4, 2), (4, 4), (5, 1),(5, 2),
(5, 3), (5, 4), (5,5)}.
Isrc(-1,0) = {(0, 2), (1,1), (1, 2), (1, 3), (1, 4), (1, 5), (2, 2), (2, 3),
(2, 4), (2, 5), (3, 2), (3, 4), (4, 1),(4, 2), (4, 3), (4, 4), (4, 5)}.
Isrc(0, 1) = {(1, 3), (2,2), (2, 3), (2, 4), (2, 5), (2, 6), (3, 3), (3, 4),
(3, 5), (3, 6), (4, 3), (4, 5), (5, 3),(5, 3), (5, 4), (5, 5), (5, 6)}
Phép giãn nở của Isrc bởi B là hợp của Isrc(0,0), Isrc(-1,0) và Isrc(0,1) hay là Idst.
Với phần tử cấu trúc khơng có điểm gốc (Origin), cách tính tốn cũng tương
tự.