Tải bản đầy đủ (.pdf) (67 trang)

Nghiên cứu phương pháp cải thiện chất lượng ảnh nhị phân bằng phép toán hình thái (LV01401)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.46 MB, 67 trang )




BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2



ĐINH THỊ HƯỜNG



NGHIÊN CỨU PHƯƠNG PHÁP
CẢI THIỆN CHẤT LƯỢNG ẢNH NHỊ PHÂN
BẰNG PHÉP TOÁN HÌNH THÁI




LUẬN VĂN THẠC SỸ MÁY TÍNH






HÀ NỘI, 2014


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2




ĐINH THỊ HƯỜNG


NGHIÊN CỨU PHƯƠNG PHÁP
CẢI THIỆN CHẤT LƯỢNG ẢNH NHỊ PHÂN
BẰNG PHÉP TOÁN HÌNH THÁI


Chuyên ngành: Khoa học máy tính
Mã số: 60 48 01 01


LUẬN VĂN THẠC SỸ MÁY TÍNH


Người hướng dẫn khoa học: PGS. TS Ngô Quốc Tạo



HÀ NỘI, 2014
1

LỜI CẢM ƠN

Bằng sự kính trọng và lòng biết ơn sâu sắc, em xin chân thành cảm ơn
PGS. TS Ngô Quốc Tạo, người đã tận tình hướng dẫn và giúp đỡ em trong
suốt quá trình làm luận văn.
Em xin chân thành cảm ơn các thầy cô giáo trong khoa Công nghệ

thông tin, phòng Sau đại học trường Đại học Sự phạm Hà Nội 2, các thầy cô
đã trực tiếp giảng dạy các học phần trong khóa học đã tạo điều kiện thuận lợi
cho em trong cả quá trình học tập và nghiên cứu tại trường.
Xin chân thành cảm ơn gia đình, bạn bè, đồng nghiệp đã quan tâm,
giúp đỡ em trong thời gian nghiên cứu và hoàn thành luận văn.
Trong quá trình nghiên cứu, luận văn không tránh khỏi những thiếu sót.
Rất mong nhận được sự góp ý của quý thầy cô và bạn bè đồng nghiệp quan
tâm đến luận văn này.

Hà Nội, tháng 12 năm 2014

Học viên



Đinh Thị Hường






2

LỜI CAM ĐOAN

Trong quá trình hoàn thành luận văn, tôi đã tìm hiểu, nghiên cứu, tổng
hợp nhiều nguồn tài liệu khác nhau, dưới dự chỉ đạo, giúp đỡ của giáo viên
hướng dẫn, kết quả của đề tài là sản phẩm lao động của cá nhân tôi. Các
nguồn tài liệu sử dụng được trích dẫn rõ ràng, khoa học.

Nội dung luận văn này chưa từng được công bố hay xuất bản dưới bất
kỳ hình thức nào và cũng không sao chép từ bất kỳ một công trình nghiên
cứu nào.
Tôi xin cam đoan những điều trên là hoàn toàn đúng.

Hà Nội, tháng 12 năm 2014

Học viên



Đinh Thị Hường










3

MỤC LỤC
Trang
Trang phụ bìa
LỜI CẢM ƠN 1

LỜI CAM ĐOAN 2


MỤC LỤC 3

DANH MỤC CÁC HÌNH VẼ 5

MỞ ĐẦU 7

CHƯƠNG 1. TỔNG QUAN VỀ PHƯƠNG PHÁP 9

CẢI THIỆN CHẤT LƯỢNG ẢNH 9
1.1. Giới thiệu chung về xử lý ảnh 9
1.2. Giới thiệu ảnh nhị phân 11

1.2.1. Một số khái niệm cơ bản 11

1.2.2. Cải thiện chất lượng ảnh bằng kỹ thuật phát hiện biên và tìm xương 15

1.2.3. Các phép toán Logic liên quan đến ảnh nhị phân 22

1.2.4. Cải thiện chất lượng ảnh bằng phép toán hình thái 25

1.2.5. Kết luận về vấn đề nghiên cứu 26

CHƯƠNG 2. CẢI THIỆN CHẤT LƯỢNG ẢNH NHỊ PHÂN 27

BẰNG PHÉP TOÁN HÌNH THÁI 27

2.1. Các phép toán hình thái cơ bản 28

2.1.1. Phép giãn nhị phân (Dilation [1], [2]) 31


2.1.2. Phép co nhị phân (Erosion [1], [2]) 37

2.1.3. Phép mở ảnh (Opening) và phép đóng ảnh (Closing)[1], [2] 42

2.1.4. Phép biến đổi trúng hoặc trượt (Hit –or-Miss) 46

2.2. Một số tính chất của phép toán hình thái 48

2.3. Một số thuật toán cơ bản của hình thái học 50

2.3.1. Trích lọc biên ảnh (Boundary Extraction ) 50

4

2.3.2. Làm mảnh (Thinning) 52

2.4. Sử dụng phép toán hình thái để cải thiện chất lượng biên ảnh 54

2.5. Loại bỏ các đối tượng ở các khu vực nhỏ trong ảnh nhị phân 55

2.6. Sử dụng phép toán hình thái trong nối chữ nét đứt 56

CHƯƠNG 3: CÀI ĐẶT THỬ NGHIỆM CHƯƠNG TRÌNH 58

3.1. Giới thiệu 58

3.2. Các chức năng của chương trình 59

KẾT LUẬN 64


TÀI LIỆU THAM KHẢO 65



















5

DANH MỤC CÁC HÌNH VẼ
Trang
Hình 1.1. Quá trình xử lý ảnh 10

Hình 1.2. Các bước cơ bản trong một hệ thống xử lý ảnh 10

Hình 1.3. Mô hình tổng quát của hệ thống nhận dạng ảnh 15


Hình 1.4. Ví dụ về ảnh và xương 20

Hình 1.5. Một số phép toán logic giữa các hình ảnh nhị phân 23

Hình 1.6. Một vài ví dụ về các phần tử cấu trúc 24

Hình 1.7. Một số dạng biểu diễn đường thẳng trong các bản vẽ kỹ thuật 26

Hình 2.1. Ảnh và đối tượng trong ảnh 28

Hình 2.2. Quan hệ giữa hai tập hợp 29

Hình 2.3. Phép biến đổi tập hợp 31

Hình 2.4. Hiệu quả của thao tác nhị phân đơn giản trên một ảnh nhỏ 32

Hình 2.5. Giãn A bởi B. 33

Hình 2.6. Giãn mất điểm ảnh 34

Hình 2.7. Phép giãn nhị phân 35

Hình 2.8. Quá trình quét của phần tử cấu trúc trên hình ảnh nhị phân 36

Hình 2.9. Giãn ảnh sử dụng phần tử cấu trúc 37

Hình 2.10. Phép co nhị phân 39

Hình 2.11. Phép co nhị phân trên hai đối tượng 39


Hình 2.12. Quá trình lọc đối tượng 41

Hình 2.13. Ứng dụng của phép co ảnh dưới dạng số nhị phân 42

Hình 2.14. Quá trình thực hiện phép mở ảnh 43

Hình 2.15. Phép mở ảnh trên phương diện ý nghĩa hình học. 44

Hình 2.16. Quá trình thực hiện phép đóng ảnh 45

Hình 2.17. Minh họa phép đóng ảnh trên phương diện ý nghĩa hình học 45

Hình 2.18. Minh họa phép biến đổi trúng hoặc trượt 47

6

Hình 2.19. Quá trình tìm biên của đối tượng trên ảnh nhị phân 51

Hình 2.20. Trích lọc biên của đối tượng 51

Hình 2.21. Kết quả làm mảnh đối tượng 52

Hình 2.22. Quá trình làm mảnh đối tượng trong hình ảnh 53

Hình 2.23. Kết quả của phép toán giãn nở 54

Hình 2.24. Kết quả của phép toán co ảnh 54

Hình 2.25. Quá trình xác định được rõ sơ đồ mạch điện 55


Hình 3.1. Giao diện chương trình thử nghiệm 58

Hình 3.2. Phép co với phần tử cấu trúc hình vuông 59

Hình 3.3. Phép giãn với phần tử cấu trúc hình vuông 60

Hình 3.4. Tìm biên theo phương pháp Gradient 61

Hình 3.5. Tìm biên theo phương pháp Laplace 61

Hình 3.7. Làm mảnh đối tượng 62

Hình 3.8. Nối chữ nét đứt 63













7

MỞ ĐẦU

1. Lí do chọn đề tài
Cùng với ngôn ngữ, các thông tin duới dạng hình ảnh đóng một vai trò
rất quan trọng trong công việc trao đổi thông tin. Chính vì vậy những năm gần
đây đã có sự kết hợp rất chặt chẽ giữa ảnh và đồ hoạ trong lĩnh vực xử lý
thông tin. Trong công nghệ thông tin, xử lý ảnh chứa một vai trò rất quan
trọng, bởi các ứng dụng đa dạng và phong phú của nó trong nhiều lĩnh vực
khoa học. Xử lý ảnh là một bộ phận quan trọng trong việc trao đổi thông tin
giữa người và máy. Nó góp phần làm cho việc quan sát trở nên tốt hơn.
Hình ảnh là một dạng dữ liệu đóng vai trò quan trọng trong việc trao đổi,
xử lý, lưu giữ thông tin Trong một số các loại hình công việc, người ta đều
cần đến hình ảnh để mô tả, minh chứng hay diễn đạt những điều mà đôi khi
chữ viết hay ngôn ngữ nói không diễn tả hết được, phải tổ chức việc lưu các
dạng hình ảnh này như thế nào? Có cần xử lý trước khi lưu chúng không? Câu
trả lời là có. Do vậy tiền xử lý ảnh là việc cần làm. Tăng cường chất lượng
ảnh, mà công đoạn đầu tiên là một bước tiền xử lý nhằm xác định ảnh, khắc
phục những khiếm khuyết do bước thu nhận ảnh không tốt là việc làm quan
trọng. Có nhiều phương pháp cho việc cải thiện chất lượng ảnh nói chung và
tiền xử lý nói riêng. Trong luận văn này tôi chỉ mô tả một vài phương pháp
tiền xử lý hình ảnh (chú trọng đến ảnh nhị phân, bởi ảnh của các bản vẽ kỹ
thuật về sách Scan thường chỉ là ảnh 2 màu: đen, trắng) nhằm cải thiện chất
lượng ảnh nhị phân bằng các thao tác Hình thái học.
Các thao tác Hình thái học nói chung, đặc biệt là Hình thái học số được
sử dụng chủ yếu vào việc cải thiện ảnh bằng cách làm rõ (tái hiện) những nét
đặc trưng của các hình dạng, do vậy mà có thể tính toán được hay nhận biết
được chúng một cách dễ dàng. Việc sử dụng các thao tác hình thái và ứng
dụng của chúng, đặc biệt là ứng dụng cải thiện chất lượng ảnh cho bước tiền
8

xử lý, trước khi thực hiện những bước kế tiếp cho công việc xử lý ảnh. Chính
vì những lí do trên mà tôi đã lựa chọn đề tài: “Nghiên cứu phương pháp cải

thiện chất luợng ảnh nhị phân bằng phép toán hình thái”
2. Mục đích nghiên cứu
Tìm hiểu nghiên cứu một số kỹ thuật nhằm cải thiện chất lượng ảnh nhị
phân vào xử lý các đối tượng trong hình ảnh và xây dựng chương trình ứng
dụng thực tế.
3. Nhiệm vụ nghiên cứu
1. Tìm hiểu về phương pháp cải thiện chất lượng ảnh nhị phân
2. Tìm hiểu về cải thiện chất lượng ảnh bằng phép toán hình thái
3. Ứng dụng của phép toán hình thái trong cải thiện chất lượng ảnh
4. Đối tượng và phạm vi nghiên cứu
Các vấn đề về cải thiện chất lượng ảnh nhị phân bằng phép toán hình thái.
5. Phương pháp nghiên cứu
Trong quá trình triển khai đề tài, tôi sử dụng chủ yếu các phương pháp:
thu thập tài liệu liên quan đến đề tài, tìm hiểu các tài liệu, các bài báo của các
tác giả theo định hướng của giáo viên hướng dẫn.
6. Cấu trúc của luận văn
Luận văn gồm phần mở đầu và 03 chương nội dung:
Chương 1: Tổng quan về phương pháp cải thiện chất lượng ảnh
Chương 2: Cải thiện chất lượng ảnh nhị phân bằng phép toán hình thái
Chương 3: Cài đặt thử nghiệm chương trình
Sau cùng là Kết luận và Tài liệu tham khảo.




9

CHƯƠNG 1. TỔNG QUAN VỀ PHƯƠNG PHÁP
CẢI THIỆN CHẤT LƯỢNG ẢNH


1.1. Giới thiệu chung về xử lý ảnh
Xử lý ảnh là đối tượng nghiên cứu của lĩnh vực thị giác máy, là quá
trình biến đổi từ một ảnh mới với các đặc tính và tuân theo ý muốn của người
sử dụng. Xử lý ảnh có thể gồm các quá trình phân tích, phân lớp các đối
tượng, làm tăng chất lượng, phân đoạn và tách cạnh, gán nhãn cho vùng hay
quá trình biên dịch các thông tin hình ảnh của ảnh.
Cũng như xử lý dữ liệu bằng đồ họa, xử lý ảnh số là một lĩnh vực của
tin học ứng dụng. Xử lý dữ liệu bằng đồ họa đề cập đến những hình ảnh nhân
tạo, các ảnh này được xem xét như là một cấu trúc dữ liệu và được tạo ra với
các chương trình. Xử lý ảnh số bao gồm các phương pháp và kỹ thuật biến
đổi, để truyền tải hoặc mã hóa các ảnh tự nhiên.
Xử lý ảnh là lĩnh vực nghiên cứu, là quá trình biến đổi từ một ảnh ban
đầu sang một ảnh mới tuân thủ tính chất các đặc trưng của xử lý ảnh bao gồm.
Thứ nhất: Biến đổi ảnh và làm đẹp ảnh.
Thứ hai: Tự động phân tích nhận dạng ảnh hay đoán nhận ảnh và đánh
giá nội dung của ảnh.
Nhận biết và đánh giá các nội dung của ảnh là sự phân tích một hình
ảnh thành những phần có nghĩa để phân biệt đối tượng này với đối tượng
khác. Dựa vào đó ta có thể mô tả cấu trúc của hình ảnh ban đầu. Có thể liệt kê
một số phương pháp nhận dạng cơ bản như nhận dạng biên của một đối tượng
trên ảnh tách cạnh, phân đoạn hình ảnh. Kỹ thuật này được dùng nhiều trong
y học (xử lý tế bào, nhiễm sắc thể), nhận dạng chữ in hoặc đánh máy trong
văn bản phục vụ cho việc tự động hóa quá trình đọc tài liệu, tăng nhanh tốc độ
và chất lượng thu nhận thông tin từ máy tính.
10

Quá trình xử lý ảnh [1] được xem như là quá trình thao tác ảnh đầu vào
nhằm cho ra kết quả mong muốn. Kết quả đẩy ra của một quá trình xử lý có
thể là một ảnh "tốt hơn" hoặc một kết luận.






Hình 1.1. Quá trình xử lý ảnh
Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh được xem
như là đặc trưng cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó
của đối tượng trong không gian.
Sơ đồ tổng quát của một hệ thống xử lý ảnh [1]:







Hình 1.2. Các bước cơ bản trong một hệ thống xử lý ảnh
Trước hết là quá trình thu nhận ảnh. Ảnh có thể thu nhận qua camera,
thường ảnh thu nhận qua camera là tín hiệu tương tự (loại camera ống kiểu
CCIR) nhưng cũng có thể là tín hiệu số hóa (loại CCD).
Ảnh có thể thu nhận từ vệ tinh qua các bộ cảm ứng (sensor), hay ảnh,
sách được quét qua scanner. Tiếp theo là quá trình số hóa (Digitalizer) để biến
Ảnh Xử lý ảnh
Ảnh "tốt hơn"
Kết luận
Camera
Sensor
Scanner
Tiền
xử lý

Trích chọn
đặc
điểm
Lưu trữ
Hậu
xử lý
Đối sách rút
ra kết luận
Hệ quyết
định
Lưu trữ
11

đổi tín hiệu tương tự sang tín hiệu rời rạc (lấy mẫu) và số hóa bằng lượng hóa,
trước khi chuyển sang giai đoạn xử lý, phân tích hay lưu trữ lại.
Quá trình phân tích ảnh thực chất bao gồm nhiều công đoạn nhỏ. Trước
hết là công việc tăng cường hình ảnh để cải thiện chất lượng hình ảnh. Do vậy
cần phải tăng cường và khôi phục lại ảnh để làm nổi bật một số đặc tính chính
của ảnh. Giai đoạn tiếp theo là phát hiện các đặc tính như biên, phân vùng
ảnh, trích chọn các đặc trưng, Cuối cùng tùy theo mục đích của quá trình xử
lý ảnh, sẽ là giai đoạn nhận dạng, phân lớp hay các quyết định khác. Các bước
cơ bản trong một hệ thống xử lý ảnh có thể mô tả ở hình 1.2.
1.2. Giới thiệu ảnh nhị phân
Như đã giới thiệu ở trên trong quá trình xử lý ảnh khi ảnh được nhận
vào máy tính phải được mã hóa. Hình ảnh khi lưu trữ dưới dạng tập tin phải
được số hóa tiêu chuẩn đặt ra là ảnh phải lưu trữ thế nào sao cho các ứng
dụng khác nhau, có thể thao tác trên các loại dữ liệu này.
1.2.1. Một số khái niệm cơ bản
Một số khái niệm cơ bản trong xử lý ảnh [1], [4]:
1.2.1.1. Ảnh và điểm ảnh

Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ
sáng chúng được biểu diễn bằng một thành hai biến thực hoặc phức kí hiệu là
f(x,y). Trong đó x, y là các giá trị tọa độ không gian và giá trị của f sẽ tỉ lệ với
độ sáng của ảnh tại thời điểm này.
Để có thể xử lý ảnh bằng máy tính cần thiết phải tiến hành số hóa ảnh.
Trong quá trình số hóa, người ta biến đổi tín hiệu liên tục sang tín hiệu rời
rạc, thông qua quá trình lấy mẫu (rời rạc hóa về không gian) và lượng tử hóa
thành phần giá trị mà về nguyên tắc mắt thường không phân biệt được hai
điểm kề nhau. Trong quá trình này, người ta sử dụng khái niệm Picture
12

element mà ta quen gọi hay viết tắt là Pixcel - Phần tử ảnh. Như vậy, mỗi ảnh
là một tập hợp các Pixcel.
1.2.1.2. Độ phân giải
Độ phân giải (Resolution) là mật độ của ảnh được ấn định trên ảnh số
khi hiển thị. Như vậy khoảng cách giữa các điểm ảnh được chọn sao cho mắt
người vẫn thấy được sự liên tục của ảnh. Việc chọn này tạo nên mật độ phân
bổ đó chính là độ phân giải được phân bổ liên tục theo x,y.
1.2.1.3. Mức xám
Mức xám (gray level): là kết quả sự mã hóa tương ứng một cường độ
sáng của mỗi điểm ảnh với một giá trị số. Đây cũng chính là kết quả của quá
trình lượng tử hóa. Ảnh có nhiều mức xám. Cách mã hóa kinh điển thường
dùng là 16, 32 hay 64 mức. Mã hóa 256 mức là phổ dụng nhất do lý do kỹ
thuật vì 2
8
= 256 (1, 1, 255) nên với 256 mức mỗi pixcel sẽ được mã hóa
bởi 8 bit.
1.2.1.4. Ảnh nhị phân
Tùy theo vùng các giá trị mức xám của điểm ảnh, mà các ảnh được
phân chia thành ảnh màu ảnh xám, hay ảnh nhị phân. Ảnh chỉ cho hai mức

xám là 0 và 1 thì ta nói đó là một ảnh nhị phân hoặc ảnh đen trắng và các
điểm ảnh của nó gọi là điểm ảnh nhị phân.
1.2.1.5. Ảnh màu và ảnh xám
* Ảnh màu
Ảnh màu là tổ hợp từ ba màu cơ bản : đỏ (Red), lục (Green), lam (Blue)
và thường thu nhận trên các dải băng tần khác nhau. Để biểu diễn cho mỗi
điểm ảnh màu cần 3 byte để mô tả 24 bit màu.
* Ảnh xám
Ảnh xám là trường hợp đặc biệt của ảnh màu. Mỗi điểm ảnh màu có 3
giá trị (Red, Green, Blue), nếu 3 giá trị này bằng nhau thì ta có ảnh xám.
13

1.2.1.6. Khử nhiễu
Có hai loại nhiễu cơ bản trong quá trình thu nhận ảnh:
- Nhiễu hệ thống: là nhiễu có quy luật có thể khử bằng các phép biến
đổi.
- Nhiễu ngẫu nhiên: vết bẩn không rõ nguyên nhân có thể khắc phục
bằng phép lọc.
1.2.1.7. Chỉnh mức xám
Nhằm khắc phục tính không đồng đều của hệ thống gây ra. Thông
thường có 2 hướng tiếp cận:
- Giảm số mức xám: Thực hiện bằng các nhóm các mức xám gần nhau
thành một bó. Trường hợp có 2 mức xám thì chính là chuyển về ảnh đen
trắng. Ứng dụng in ảnh màu ra máy in đen trắng.
- Tăng số mức xám: Thực hiện nội suy ra các mức xám trung gian bằng
kỹ thuật nội suy. Kỹ thuật này nhằm tăng cường độ mịn cho ảnh.
1.2.1.8. Trích chọn đặc điểm
Các đặc điểm của đối tượng được trích chọn tùy theo mục đích nhận
dạng trong quá trình xử lý ảnh. Có thể nêu ra một số đặc điểm của ảnh sau
đây:

Đặc điểm không gian: phân bố mức xám, phân bố xác suất, biên độ,
điểm uốn, v.v
Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc
thực hiện lọc vùng (zonal filtering). Các bộ vùng được gọi là “mặt nạ đặc
điểm” (feature mask) thường là các khe hẹp với các hình dạng khác nhau (chữ
nhật, tam giác, cung tròn .v.v.).
Đặc điểm biên và đường biên: Đặc trưng cho đường biên của đối tượng
và do rất hữu ích trong việc trích chọn các thuộc tính bất biến được dùng khi
14

nhận dạng đối tượng. Các đặc điểm này có thể được trích chọn nhờ toán tử
Gradient, toán tử Laplace.
Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối
tượng ảnh chính xác, với tốc độ tính toán cao và dung lượng nhớ lưu trữ giảm xuống.
1.2.1.9. Nhận dạng
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà muốn
đặc tả nó. Quá trình nhận dạng thường đi sau quá trình trích chọn các đặc tính
chủ yếu của đối tượng. Có hai kiểu mô tả đối tượng:
- Mô tả tham số (nhận dạng theo tham số).
- Mô tả theo cấu trúc (nhận dạng theo cấu trúc).
Trên thực tế, người ta đã áp dụng kỹ thuật nhận dạng khá thành công
với nhiều đối tượng khác nhau như: nhận dạng ảnh vân tay, nhận dạng chữ
(chữ cái, chữ số, chữ có dấu).
Nhận dạng chữ in hoặc đánh máy phục vụ cho việc tự động hóa quá
trình đọc tài liệu, tăng nhanh tốc độ và chất lượng thu nhận thông tin từ máy tính.
Nhận dạng chữ viết tay (với mức độ ràng buộc khác nhau về cách viết,
kiểu chữ, ) phục vụ cho nhiều lĩnh vực.
1.2.1.10. Nén ảnh
Nhằm giảm thiểu không gian lưu trữ. Thường được tiến hành theo cả
hai khuynh hướng là nén có bảo toàn và không bảo toàn thông tin. Nén không

bảo toàn thì thường có khả năng là nén cao hơn nhưng khả năng phục hồi thì
kém hơn. Trên cơ sở hai khuynh hướng, có 4 cách tiếp cận cơ bản trong nén
ảnh:
- Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần suất
xuất hiện của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa
thích hợp. Một ví dụ điển hình cho kỹ thuật mã hóa này là *.TIF.
15

- Nén ảnh không gian: Kỹ thuật này dựa vào vị trí không gian của các
điểm ảnh để tiến hành mã hóa. Kỹ thuật lợi dụng sự giống nhau của các điểm
ảnh trong các vùng gần nhau. Ví dụ cho kỹ thuật này là mã nén *.PCX
- Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng
nén không bảo toàn và do vậy, kỹ thuật thường nén hiệu quả hơn, *.JPG chính
là tiếp cận theo kỹ thuật nén này.
- Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng ảnh, thể
hiện sự lặp lại của các chi tiết. Kỹ thuật nén sẽ tính toán để chỉ cần lưu trữ
phần gốc ảnh và quy luật sinh ra ảnh theo nguyên lý Fractal.
1.2.2. Cải thiện chất lượng ảnh bằng kỹ thuật phát hiện biên và tìm xương
Trong xử lý và nhận dạng ảnh, có một số loại ảnh đường nét gồm các
đối tượng là các đường cong có độ dài lớn hơn nhiều so với độ dày của nó, ví
dụ như là ảnh các kí tự, dấu vân tay, sơ đồ mạch điện tử, bản vẽ kỹ thuật, bản
đồ…Để xử lý các loại này người ta thường xây dựng các hệ mô phỏng theo
cách phân tích ảnh của con người gọi là hệ thống thị giác máy. Có nhiều hệ
thống được cài đặt theo phương pháp này như hệ thống nhận dạng chữ viết
bằng thiết bị quang học OCR (Optical Character Recognition), hệ thống nhận
dạng vân tay AFIS (Automated fingerprint Identification System)…









Hình 1.3. Mô hình tổng quát của hệ thống nhận dạng ảnh
Đọc ảnh
Tiền xử lý (nâng cấp và
khôi phục)
Trích trọn đặc điểm
Đối sánh Nhận dạng
16

Có nhiều phương pháp trích chọn đặc điểm được biết tới như phương
pháp sử dụng sóng ngắn (Wavelet), sử dụng hệ số Fourier, sử dụng các
mômen bất biến, sử dụng các đặc trưng của biên như tính trơn và các điểm
đặc biệt, sử dụng các đặc trưng tôpô dựa trên phát hiện biên và tìm xương của
đường nét ảnh…Phương pháp trích chọn đặc điểm sử dụng ảnh được sử dụng
nhiều. Kỹ thuật phát hiện biên và tìm xương là một trong nhiều ứng dụng
nghiên cứu và giải quyết một số vấn đề của bài toán nêu trên công đoạn tiền
xử lý ảnh.
1.2.2.1. Phương pháp phát hiện biên
Biên là vấn đề quan trọng trong trích chọn đặc điểm nhằm tiến tới hiểu
ảnh. Về mặt toán học người ta xem điểm biên là điểm có sự thay đổi về mức
xám. Ví dụ: đối với ảnh đen trắng, một điểm được gọi là điểm biên nếu nó là
điểm đen có ít nhất một điểm trắng bên cạnh. Tập hợp các điểm biên tạo nên
biên hay đường bao của đối tượng.
Xuất phát từ cơ sở này người ta thường sử dụng hai phương pháp phát
hiện biên cơ bản đó là: phát hiện biên trực tiếp và phát hiện biên gián tiếp [1].
a) Phương pháp phát hiện biên trực tiếp
Phương pháp này làm nổi biên dựa vào sự biến thiên mức xám của ảnh.

Kỹ thuật chủ yếu dùng để phát hiện biên ở đây là dựa vào sự biến đổi theo
hướng. Nếu lấy đạo hàm bậc nhất của ảnh ta có kỹ thuật Gradient, nếu lấy đạo
hàm bậc hai của ảnh ta có kỹ thuật Laplace.
* Kỹ thuật pháp hiện biên Gradient
Theo định nghĩa, Gradient là một véctơ có các thành phần biểu thị tốc
độ thay đổi giá trị của điểm ảnh, ta có:
















dy
yxfdyyxf
fy
y
yxf
dx
yxfydxxf
fx

x
yxf
),(),(),(
),(),(),(

17

Trong đó: dx, dy là khoảng cách giữa các điểm theo hướng x, y
(khoảng cách tính bằng số điểm).
Việc xấp xỉ đạo hàm bậc nhất theo các hướng x, y được thực hiện thông
qua hai mặt nạ nhân chập tương ứng sẽ cho ta các kỹ thuật phát hiện biên
khác nhau (kỹ thuật Sobel, kỹ thuật Prewitt…).
* Kỹ thuật phát hiện biên Laplace
Các phương pháp đánh giá Gradient ở trên làm việc khá tốt khi mà độ
sáng thay đổi rõ nét. Khi mức xám thay đổi chậm, miền chuyển tiếp trải rộng,
phương pháp cho hiệu quả hơn đó là phương pháp sử dụng đạo hàm bậc hai
Laplace.
Toán tử Laplace được định nghĩa như sau:

2
2
2
2
2
dy
f
dx
f
f






Ta có:

   
),1(),(2),1(
),1(),(),(),1(
)),(),1(()(
2
2
yxfyxfyxf
yxfyxfyxfyxf
yxfyxf
xx
f
xx
f















Tương tự ta cũng có

)1,(),(2)1,(
2
2



yxfyxfyxf
y
f

Từ đó ta có













)1,(),(2)1,(

),1(),(2),1(
2
2
2
2
yxfyxfyxf
y
f
yxfyxfyxf
x
f

Vậy:
),(),1(),(4)1,(),1(1
2
yxfyxfyxfyxfyxff 

b) Phát hiện biên gián tiếp
Nếu bằng cách nào đó ta phân được ảnh thành các vùng thì ranh giới
giữa các vùng đó gọi là biên. Kỹ thuật dò biên và phân vùng ảnh là hai bài
18

toán đối ngẫu nhau vì dò biên để thực hiện phân lớp đối tượng mà khi đã
xong nghĩa là đã phân vùng được ảnh và ngược lại, khi đã phân vùng ảnh đã
được phân lớp thành các đối tượng, do đó có thể phát hiện được biên.
Có hai kỹ thuật dò biên cơ bản:
- Kỹ thuật thứ nhất: Xét ảnh biên thu được từ ảnh vùng sau một lần
duyệt như một đồ thị, sau đó áp dụng các thuật toán duyệt cạnh đồ thị.
- Kỹ thuật thứ hai: Dựa trên ảnh vùng, kết hợp đồng thời quá trình dò
biên và tách biên. Ở đây ta quan tâm cách tiếp cận thứ hai.

Trước hết, giả sử ảnh được xét chỉ bao gồm một vùng ảnh 8 – liên
thông, được bao bọc bởi một vành đai cách điểm nền.
Về cơ bản, các thuật toán dò biên trên một vùng đều bao gồm các bước sau:
- Xác định điểm biên xuất phát.
- Dự báo và xác định điểm biên tiếp theo.
- Lặp bước 2 cho đến khi gặp điểm xuất phát.
Do xuất phát từ những tiêu chuẩn và định nghĩa khác nhau về điểm
biên và quan hệ liên thông, các thuật toán dò biên cho ta các đường biên mang
các sắc thái rất khác nhau.
Kết quả tác động của toán tử dò biên lên một điểm biên là điểm biên
+1. Thông thường các toán tử này được xây dựng như một hàm đại số
Boolean trên các 8 - láng giềng của điểm biên. Mỗi cách xây dựng các toán tử
đều phụ thuộc vào định nghĩa quan hệ liên thông và điểm biên. Do đó sẽ gây
khó khăn cho việc khảo sát các tính chất của đường biên. Ngoài ra, vì mỗi
bước dò biên đều phải kiểm tra tất cả các 8 - láng giềng của mỗi điểm nên
thuật toán thường kém hiệu quả. Để khắc phục các hạn chế trên, thay vì sử
dụng một điểm biên ta sử dụng cặp điểm biên (ngoài và trong), các cặp điểm
này tạo nên tập nền vùng, tiếp theo phân tích toán tử dò biên thành 2 bước:
- Xác định cặp điểm nền vùng tiếp theo.
19

- Lựa chọn điểm biên.
Trong đó bước thứ nhất thực hiện chức năng của một ánh xạ trên tập
nền vùng lên nền vùng tiếp theo và bước thứ hai thực hiện chức năng chọn
điểm biên.
Thuật toán dò biên tổng quát
Bước 1: Xác định cặp nền – vùng xuất phát.
Bước 2: Xác định cặp nền – vùng tiếp theo.
Bước 3: Lựa chọn điểm biên.
Bước 4: Nếu gặp lại cặp xuất phát thì dừng, nếu không quay lại bước 2.

Việc xác định cặp nền - vùng xuất phát được thực hiện bằng cách duyệt
ảnh lần lượt từ trên xuống dưới và từ trái qua phải rồi kiểm tra điều kiện lựa
chọn cặp nền - vùng. Do việc chọn điểm biên chỉ mang tính chất quy ước, nên
ta gọi ánh xạ xác định cặp nền - vùng tiếp theo là toán tử dò biên.
c) Kết luận
Phương pháp phát hiện biên trực tiếp tỏ ra khá hiệu quả và ít chịu ảnh
hưởng của nhiễu, song nếu sự biến thiên độ sáng không đột ngột, phương
pháp tỏ ra kém hiệu quả, phương pháp phát hiện biên gián tiếp tuy khó cài
đặt, song lại áp dụng khá tốt trong trường hợp này.
1.2.2.2. Kỹ thuật tìm xương
Xương được coi như hình dạng cơ bản của một đối tượng, với số ít các
điểm ảnh cơ bản. Ta có thể lấy được các thông tin về hình dạng nguyên bản
của một đối tượng thông qua xương.
Một định nghĩa xúc tích về xương dựa trên tính continum (tương tự như
hiện tượng cháy đồng cỏ) được đưa ra bởi Blum (1976) [3] như sau: Giả thiết
rằng đối tượng là đồng nhất được phủ bởi cỏ khô và sau đó dựng lên một
vòng biên lửa. Xương được định nghĩa như nơi gặp của các vệt lửa và tại đó
chúng được dập tắt.
20


Hình 1.4. Ví dụ về ảnh và xương
Kỹ thuật tìm xương luôn là chủ đề nghiên cứu trong xử lý ảnh những
năm gần đây. Mặc dù có những nỗ lực cho việc phát triển các thuật toán tìm
xương, nhưng các phương pháp đưa ra đều bị mất mát thông tin. Có thể chia
thành hai loại thuật toán tìm xương cơ bản [1].
- Thuật toán tìm xương dựa trên làm mảnh.
- Thuật toán tìm xương không dựa trên làm mảnh.
a) Tìm xương dựa trên làm mảnh
Thuật toán làm mảnh ảnh số nhị phân là một trong các thuật toán quan

trọng xử lý ảnh và nhận dạng. Xương chứa những thông tin bất biến về cấu
trúc của ảnh, giúp cho quá trình nhận dạng hoặc vectơ hóa sau này.
Thuật toán làm mảnh là quá trình lặp duyệt và kiểm tra tất cả các điểm
thuộc đối tượng. Trong mỗi lần lặp tất cả các điểm của đối tượng sẽ được
kiểm tra: Nếu như chúng thỏa mãn điều kiện xóa nào đó tùy thuộc và mỗi
thuật toán thì nó sẽ bị xóa đi. Quá trình cứ lặp lại như vậy cho đến khi không
còn điểm biên nào được xóa. Đối tượng được bóc dần lớp biên cho đến khi
điểm nào bị thu mảnh lại chỉ còn các điểm biên.
Các thuật toán làm mảnh được phân loại dựa trên phương pháp xử lý
các điểm là thuật toán làm mảnh song song và thuật toán làm mảnh tuần tự.
Thuật toán làm mảnh song song, là thuật toán mà trong đó các điểm
được xử lý theo phương pháp song song, tức là được xử lý cùng một lúc. Giá
21

trị của mỗi điểm sau một lần lặp chỉ phụ thuộc vào giá trị của các láng giềng
bên cạnh (thường là 8 - láng giềng) mà giá trị của các điểm này đã được xác
định trong lần lặp trước đó. Trong máy có nhiều bộ vi xử lý sẽ xử lý một vùng
của đối tượng, nó có quyền đọc từ các điểm ở vùng khác nhưng chỉ được ghi
trên vùng của nó xử lý.
Trong thuật toán làm mảnh tuần tự các điểm thuộc đối tượng sẽ được
kiểm tra theo một thứ tự nào đó (chẳng hạn các điểm được xét từ trái qua
phải, từ trên xuống dưới). Giá trị của các điểm sau mỗi lần lặp không những
phụ thuộc vào giá trị của các láng giềng bên cạnh mà còn phụ thuộc vào các
điểm đã được xét trước đó trong chính lần lặp đang xét.
Chất lượng của thuật toán làm mảnh được đánh giá theo các tiêu chuẩn
được liệt kê dưới đây nhưng không nhất thiết phải thỏa mãn đồng thời tất cả
các tiêu chuẩn.

Bảo toàn tính liên thông của đối tượng và phần bù của đối tượng.


Sự tương hợp giữa xương và cấu trúc của ảnh đối tượng.

Bảo toàn các thành phần liên thông.

Bảo toàn các điểm cụt.

Xương chỉ gồm các điểm biên, càng mảnh càng tốt.

Bền vững đối với nhiễu.

Xương cho phép khôi phục ảnh ban đầu của đối tượng.

Xương thu được ở chính giữa đường nét của đối tượng được làm mảnh.

Xương nhận được bất biến với phép quay.
b) Tìm xương không dựa trên làm mảnh
Để tách được xương của đối tượng có thể sử dụng đường biên của đối
tượng. Với điểm p bất kỳ trên đối tượng, ta bao nó bởi một đường biên. Nếu
như có nhiều điểm biên có cùng khoảng cách ngắn nhất tới p thì p nằm trên
22

trục trung vị. Tập tất cả các điểm như vậy lập thành trục trung vị hay xương
của đối tượng. Việc xác định đối tượng được tiến hành thông qua hai bước:
 Bước thứ nhất: tính khoảng cách từ mỗi điểm ảnh của đối tượng
đến điểm biên gần nhất. Như vậy cần phải tính toán khoảng cách tới tất cả các
điểm biên của ảnh.
 Bước thứ hai: khoảng cách ảnh đã được tính toán và các điểm
ảnh có giá trị lớn nhất được xem là nằm trên xương của đối tượng.
1.2.3. Các phép toán Logic liên quan đến ảnh nhị phân
Phép toán cơ bản nhất được sử dụng trong xử lý ảnh là: phép AND, phép

OR, và phép toán NOT. Các tính chất của chúng được định nghĩa trong bảng
dưới đây:
p Q
qp 

qp 

p

0 0 0 0 1
0 1 0 1 1
1 0 0 1 0
1 1 1 1 0

Các phép toán cơ bản được sử dụng trong xử lý ảnh là AND (

), OR
(

), NOT (

). Các phép toán đó là cung cấp đầy đủ các chức năng, chúng có
thể được kết hợp dưới bất kỳ dạng nào của phép toán logic.
Toán tử logic được thực hiện trên một điểm ảnh cơ sở giữa các điểm ảnh
tương ứng của hai hoặc nhiều hình ảnh (ngoại trừ NOT, đó là toán tử các
điểm ảnh của một hình ảnh đơn giản). Bởi vì toán tử AND của hai biến nhị
phân chỉ là 1 khi cả hai biến là 1, vì vậy trong một hình ảnh ở bất kỳ vị trí nào
thì với toán tử AND giữa các điểm ảnh tương ứng, ta thu được kết quả là 1
khi và chỉ khi các điểm ảnh đầu vào đều có giá trị là 1. Hình 1.5. là ví dụ để
23


minh họa cho các phép toán logic, phần có màu xẫm là phần có giá trị là 1,
phần màu trắng là phần có giá trị là 0.
Các phép toán logic khác được xây dựng dựa trên các phép toán đã được
định nghĩa ở trên. Cho một ví dụ: Phép toán XOR (dựa trên phép toán AND
và NOT), giá trị của nó là 1 nếu giá trị của một trong hai điểm ảnh có giá trị là
1 (không phải là cả hai), và giá trị của nó là 0 khi cả hai điểm ảnh đều có giá
trị là 0 hoặc 1. Phép toán này khác phép toán OR, giá trị trả về sẽ là 1 khi một
trong hai điểm ảnh đầu vào là 1, hoặc khi cả hai điểm ảnh đầu vào là 1. Phép
toán NOT – AND chỉ trả về giá trị là 0 khi cả hai điểm ảnh đầu vào là 1.

















Hình 1.5. Một số phép toán logic giữa các hình ảnh nhị phân
A
NOT

NOT(A)
A
B
AND
(A) AND (B)
A
B
OR
(A) OR (B)
A
B
XOR
(A) XOR (B)
A
B
NOT-
AND
(A) N-AND (B)

×