Tải bản đầy đủ (.pdf) (53 trang)

PHÁT HIỆN VÀ XÓA ĐỐI TƯỢNG NHỎ TRONG ẢNH ĐƯỜNG NÉT

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (590.58 KB, 53 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2

PHAN VĂN ÂN

PHÁT HIỆN VÀ XÓA ĐỐI TƯỢNG NHỎ
TRONG ẢNH ĐƯỜNG NÉT

LUẬN VĂN THẠC SĨ MÁY TÍNH

HÀ NỘI, 2014


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2

PHAN VĂN ÂN

PHÁT HIỆN VÀ XÓA ĐỐI TƯỢNG NHỎ
TRONG ẢNH ĐƯỜNG NÉT

Chuyên ngành: Khoa học máy tính
Mã số: 60 48 01 01

LUẬN VĂN THẠC SĨ MÁY TÍNH

Người hướng dẫn khoa học: PGS.TS Đỗ Năng Toàn

HÀ NỘI, 2014



1
LỜI CẢM ƠN
Trong quá trình thực hiện luận văn này, em luôn nhận được sự hướng
dẫn, chỉ bảo tận tình của PGS. TS. Đỗ Năng Toàn hiện công tác tại Viện Công
nghệ Thông tin thuộc Đại học quốc gia Hà Nội là cán bộ trực tiếp hướng dẫn

khoa học cho em. Em xin chân thành cảm ơn sự giúp đỡ quý báu đó.
Em xin chân thành cảm ơn các Thầy, Cô giáo trong khoa Công nghệ
thông tin, các cán bộ, chuyên viên phòng Đào tạo Sau đại học, trường Đại học
sư phạm Hà Nội 2 cùng các anh chị đồng nghiệp trong cơ quan đã tạo những
điều kiện thuận lợi cho tôi học tập và nghiên cứu tại trường Đại học Sư Phạm
Hà Nội 2.
Xin chân thành cảm ơn các anh, các chị và các bạn học viên lớp Cao
học K16KHMT- trường Đại học sư phạm Hà Nội 2 đã luôn động viên, giúp
đỡ và nhiệt tình chia sẻ với tôi những kinh nghiệm học tập, công tác trong
suốt khoá học.
Sau cùng tôi muốn gửi lời cảm vô hạn tới gia đình và bạn bè, những
người thân yêu luôn bên cạnh và động viên tôi trong suốt quá trình thực hiện
luận văn.
Do thời gian có hạn và kinh nghiệm nghiên cứu khoa học chưa nhiều
nên luận văn này không thể tránh khỏi những thiếu sót, rất mong nhận được ý
kiến đóng góp của các quý thầy cô và các anh chị học viên.
Hà Nội, ngày 12 tháng 12 năm 2014
Tác giả

Phan Văn Ân


2
LỜI CAM ĐOAN

Tôi xin cam đoan rằng số liệu và kết quả nghiên cứu trong luận văn này
là trung thực và không trùng lặp với các đề tài khác. Tôi cũng xin cam đoan
rằng mọi sự giúp đỡ cho việc thực hiện luận văn này đã được cảm ơn và các
thông tin trích dẫn trong luận văn đã được chỉ rõ nguồn gốc.
Hà Nội, ngày 12 tháng 12 năm 2014
Tác giả

Phan Văn Ân


3
MỤC LỤC
MỤC LỤC ..................................................................................................... 3
MỞ ĐẦU ....................................................................................................... 5
Chương 1. KHÁI QUÁT XỬ LÝ ẢNH VÀ BÀI TOÁN XÓA ĐỐI TƯỢNG
NHỎ TRONG ẢNH ĐƯỜNG NÉT ............................................................... 7
1.1. Khái quát về xử lý ảnh ....................................................................... 7
1.1.1. Xử lý ảnh, sơ đồ tổng quát của một hệ thống xử lý ảnh ................ 7
1.1.2. Các vấn đề cơ bản trong xử lý ảnh ............................................. 10
1.1.2.1. Một số khái niệm .................................................................. 10
1.1.2.2. Biểu diễn ảnh ........................................................................ 17
1.1.2.3. Tăng cường ảnh – khôi phục ảnh .......................................... 17
1.1.2.4. Nhận dạng ảnh ...................................................................... 17
1.1.3. Thu nhận ảnh ............................................................................. 18
1.1.3.1. Thiết bị thu nhận ảnh ............................................................ 18
1.1.3.2. Biểu diễn màu ....................................................................... 19
1.1.3.3. Hệ tọa độ màu....................................................................... 20
1.1.4. Các kỹ thuật xử lý ảnh cơ bản .................................................... 21
1.1.4.1. Nhị phân hóa ........................................................................ 23
1.1.4.2. Khử nhiễu ............................................................................. 24

1.1.4.3. Làm trơn biên, lấp đầy chỗ trống .......................................... 24
1.2. Bài toán xoá đối tượng nhỏ trong ảnh đường nét .............................. 25
Chương 2. CÁC KỸ THUẬT XOÁ ĐỐI TƯỢNG NHỎ TRONG ẢNH
ĐƯỜNG NÉT .............................................................................................. 27
2.1. Loại bỏ đối tượng nhỏ dựa vào chu tuyến .......................................... 27
2.1.1. Phát hiện lỗ hổng và nhiễu ........................................................... 27
2.1.2. Thuật toán lấp đầy lỗ hổng và xoá nhiễu dựa theo chu tuyến ....... 30
2.1.3. Nâng cao tốc độ ........................................................................... 31


4
2.1.4. Ứng dụng chu tuyến vào việc loại bỏ đối tượng nhỏ trong quá trình
véc tơ hoá tự động ................................................................................. 32
2.2. Kỹ thuật lấp lỗ hổng: .......................................................................... 33
2.2.1. Phương pháp tam giác:................................................................. 33
2.2.1.1 Phương pháp: .......................................................................... 33
2.2.1.2. Thuật toán tìm chu tuyến: ...................................................... 34
2.2.1.3. Tìm hiểu về thuật toán tô màu................................................ 38
2.2.2. Phương pháp đoạn thẳng:............................................................. 39
2.2.2.1 Các bước của phương pháp: .................................................... 39
2.3. Kỹ thuật lọc nhiễu: ............................................................................. 40
2.3.1. Lọc trung vị: ................................................................................ 40
2.3.2. Lọc giả trung vị:........................................................................... 42
2.3.3 Lọc ngoài: ..................................................................................... 44
Chương 3. CHƯƠNG TRÌNH THỬ NGHIỆM ............................................ 45
3.1. Bài toán xây dựng chương trình thử nghiệm ................................... 45
3.2. Phân tích bài toán............................................................................ 46
3.3. Chương trình thử nghiệm ................................................................ 47
3.3.1. Thiết kế chương trình................................................................ 47
3.3.2. Một số kết quả chương trình ..................................................... 48

PHẦN KẾT LUẬN ...................................................................................... 50
TÀI LIỆU THAM KHẢO ............................................................................ 51


5
MỞ ĐẦU
1. Lý do chọn đề tài
Xử lý ảnh là là một ngành khoa học còn tương đối mới mẻ so với nhiều
ngành khoa học khác nó là một trong những lĩnh vực quan trọng của nghành
công nghệ thông tin, có tốc độ phát triển rất nhanh, có liên quan đến nhiều
lĩnh vực khoa học như: khoa học đời sống, quân sự, y tế…
Trong chuỗi các bước xử lý ảnh, tiền xử lý là một trong những bước đầu
của giai đoạn xử lý đóng vai trò cực kỳ quan trọng. Ảnh đầu vào thường có
chất lượng chưa tốt do nhiều lý do như máy thu, người chụp, môi trường hoặc
các điều kiện khách quan khác khiến ảnh nhận được không được sát thực, mà
mắt thường có thể phát hiện khi nhìn hình ảnh, như các đối tượng nhỏ trong
ảnh. Việc khắc phục những nhược điểm này luôn là vấn đề đặt ra cho các hệ
thống xử lý ảnh.
Trong phạm vi một đề tài luận văn thạc sỹ, tôi sẽ đi sâu vào tìm hiểu kỹ
thuật xóa các đối tượng nhỏ trong ảnh đường nét. Do đó tôi lựa chọn đề tài:
“Phát hiện và xóa đối tượng nhỏ trong ảnh đường nét”.
2. Mục đích nghiên cứu
- Tăng cường chất lượng ảnh, đưa ảnh cần xử lý mang đặc điểm của
ảnh gốc ban đầu.
- Giảm thiểu khả năng xuất hiện của các thông tin sai trên ảnh, làm tiền
đề phục vụ tốt cho các bước xử lý cao hơn trong giai đoạn sau.
3. Nhiệm vụ nghiên cứu
- Tìm hiểu khái quát về xử lý ảnh, nhiễu và lỗ hổng.
- Tìm hiểu một số kỹ thuật lọc nhiễu và lấp lỗ hổng .
- Cài đặt thử nghiệm một trong những kỹ thuật tìm hiểu được.



6
4. Đối tượng và phạm vi nghiên cứu
a. Đối tượng nghiên cứu
- Các loại ảnh đường nét như: Các bản vẽ, sơ đồ mạng lưới, mạch in,
bản đồ đường sá, sông ngòi, vân tay…
- Các kỹ thuật xử lý và xóa đối tượng nhỏ trong ảnh đường nét.
- Xây dựng phần mềm mô phỏng phát hiện và xóa đối tượng nhỏ trong
ảnh đường nét.
b. Phạm vi nghiên cứu
- Một số kỹ thuật hỗ trợ phát hiện và xóa đối tượng nhỏ trong ảnh
đường nét.
5. Dự kiến đóng góp mới
Đề tài khi hoàn thành sẽ giải quyết một phần quan trọng của bài toán
phát hiện và xóa đối tượng nhỏ trong ảnh đường nét: Xác định vùng chứa các
đối tượng nhỏ xóa các đối tượng đó và đưa ảnh về gần giống ảnh gốc nhất.
Đây là cơ sở để có thể phát triển ứng dụng áp dụng trong thực tế ở tất cả các
lĩnh vực khoa học có liên quan đến ảnh đường nét.
6. Phương pháp nghiên cứu
- Nghiên cứu tài liệu, tìm hiểu các thông tin trên Internet về các kỹ thuật
liên quan.
- Sử dụng thử nghiệm công cụ có sẵn để hiểu rõ bản chất vấn đề, sau đó
xây dựng chương trình demo.


7

NỘI DUNG
Chương 1

KHÁI QUÁT XỬ LÝ ẢNH VÀ BÀI TOÁN XÓA ĐỐI TƯỢNG NHỎ
TRONG ẢNH ĐƯỜNG NÉT
1.1. Khái quát về xử lý ảnh
1.1.1. Xử lý ảnh, sơ đồ tổng quát của một hệ thống xử lý ảnh
Để có thể hình dung cấu hình một hệ thống xử lý ảnh chuyên dụng hay
một hệ thống xử lý ảnh dùng trong nghiên cứu, đào tạo, trước hết chúng ta sẽ
xem xét các bước cần thiết trong xử lý ảnh.

Hệ quyết định
Thu nhận ảnh
(Scanner,
Camera, Sensor)

Tiền xử lý

Trích
chọn đặc
điểm

Hậu
xử lý

Đối sánh rút
ra kết luận
Lưu
trữ

Hình 1.1: Các bước cơ bản trong một hệ thống xử lý ảnh
* Thu nhận ảnh:
Các thiết bị thu nhận ảnh có hai loại chính ứng với hai loại ảnh thông

dụng là Raster và Vector. Các thiết bị thu nhận ảnh Raster là camera còn các
thiết bị thu nhận ảnh Vector là sensor hoặc bộ số hoá (digitalizer) hoặc được
chuyển đổi từ ảnh Raster. Các thiết bị thu ảnh thông thường gồm camera cộng
với bộ chuyển đổi tương tự số AD (Analog to Digital) hoặc scanner chuyên


8
dụng. Các thiết bị thu nhận ảnh này có thể cho ảnh đen trắng hoặc ảnh màu.
Đầu ra của scanner là ảnh ma trận số mà ta quen gọi là bản đồ ảnh (ảnh
Bitmap). Bộ số hoá (digitalizer) sẽ tạo ảnh vector có hướng. Nhìn chung, các
hệ thống thu nhận ảnh thực hiện hai quá trình:
+ Cảm biến: biến đổi năng lượng quang học (ánh sáng) thành năng
lượng điện.
+ Tổng hợp năng lượng điện thành ảnh.
* Tiền xử lý:
Tiền xử lý là bước tăng cường ảnh để nâng cao chất lượng ảnh. Do
những nguyên nhân khác nhau: có thể do chất lượng thiết bị thu nhận ảnh, do
nguồn sáng hay do nhiễu, ảnh có thể bị suy biến. Do vậy cần phải tăng cường
và khôi phục lại ảnh để làm nổi bật một số đặc tính chính của ảnh, hay làm
cho ảnh gần giống nhất với trạng thái gốc - trạng thái trước khi ảnh bị biến
dạng.
* Trích chọn đặc điểm:
Việc trích chọn các đặc điểm giúp cho việc nhận dạng các đối tượng
ảnh một cách chính xác hơn với tốc độ tính toán cao và dung lượng nhớ lưu
trữ giảm xuống. Các đặc điểm của đối tượng được trích chọn tuỳ theo mục
đích nhận dạng trong quá trình xử lý ảnh. Có thể nêu ra một số đặc điểm của
ảnh sau đây:
+ Đặc điểm không gian: Phân bố mức xám, phân bố xác suất, biên độ,
điểm uốn v.v…
+ Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc

thực hiện lọc vùng (zonal filtering). Các bộ vùng được gọi là “mặt nạ đặc


9
điểm” (feature mask) thường là các khe hẹp với hình dạng khác nhau (chữ
nhật, tam giác, cung tròn v.v...)
+ Đặc điểm biên và đường biên: Đặc trưng cho đường biên của đối
tượng và do vậy rất hữu ích trong việc trích trọn các thuộc tính bất biến được
dùng khi nhận dạng đối tượng. Các đặc điểm này có thể được trích chọn nhờ
toán tử gradient, toán tử la bàn, toán tử Laplace, toán tử “chéo không” (zero
crossing) v.v… Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận
dạng các đối tượng ảnh chính xác, với tốc độ tính toán cao và dung lượng nhớ
lưu trữ giảm xuống.
* Hậu xử lý:
Bao gồm có các kỹ thuật: Rút gọn số lượng điểm biểu diễn ,nhằm bớt
các điểm thu được nhằm giảm thiểu không quan lưu trữ. Với các thuật toán:
+ Thuật toán Douglas Peucker.
+ Thuật toán Band width.
+ Thuật toán Angles.
Ảnh là một đối tượng khá phức tạp về đường nét, độ sáng tối, dung
lượng điểm ảnh, môi trường để thu ảnh phong phú kéo theo nhiễu. Trong
nhiều khâu xử lý và phân tích ảnh ngoài việc đơn giản hóa các phương pháp
toán học đảm bảo tiện lợi cho xử lý, người ta mong muốn bắt chước quy trình
tiếp nhận và xử lý ảnh theo cách của con người. Trong các bước xử lý đó,
nhiều khâu hiện nay đã xử lý theo các phương pháp trí tuệ con người. Vì vậy,
ở đây các cơ sở tri thức - hệ quyết định được phát huy.
* Đối chiếu và đưa ra kết luận:
Ảnh sau khi xử lý sẽ được lưu trữ, kết hơp với cơ sở tri thức để đưa ra
những kết luận phục vụ cho mục đích nhận dạng và nội suy.



10
1.1.2. Các vấn đề cơ bản trong xử lý ảnh
Như đã đề cập trong phần giới thiệu, chúng ta đã thấy được một cách
khái quát các vấn đề chính trong xử lý ảnh. Để hiểu chi tiết hơn, trước tiên ta
xem xét hai khái niệm (thuật ngữ) thường dùng trong xử lý ảnh, đó là Pixel
(phần tử ảnh) và Grey level (mức xám), tiếp theo là tóm tắt các vấn đề chính.
1.1.2.1. Một số khái niệm
Pixel (Picture Element): phần tử ảnh
Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ sáng.
Để có thể xử lý ảnh bằng máy tính cần thiết phải tiến hành số hóa ảnh. Trong
quá trình số hóa, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông
qua quá trình lấy mẫu (rời rạc hóa về không gian) và lượng hóa thành phần giá
trị mà về nguyên tắc bằng mắt thường không phân biệt được hai điểm kề nhau.
Trong quá trình này, người ta sử dụng khái niệm Picture element mà ta quen
gọi hay viết là Pixel – phần tử ảnh. Như vậy, một ảnh là một tập hợp các pixel.
Ở đây cũng cần phân biệt khái niệm pixel hay đề cập đến trong các hệ thống đồ
họa máy tính. Để tránh nhầm lẫn ta tạm gọi khái niệm pixel này là pixel thiết
bị. Khái niệm pixel thiết bị có thể xem xét như sau: khi ta quan sát màn hình
(trong chế độ đồ họa), màn hình không liên tục mà gồm nhiều điểm nhỏ, gọi là
pixel. Mỗi pixel gồm một cặp tọa độ (x, y) và giá trị màu.

a. Ảnh với độ phân giải 72 dpi

b. Ảnh với độ phân giải 36 dpi

Hình 1.2: Biểu diễn ảnh với độ phân giải khác nhau


11

Cặp tọa độ (x, y) tạo nên độ phân giải (resolution). Như màn hình máy
tính có nhiều loại với độ phân giải khác nhau: màn hình CGA có độ phân giải
là 320 x 320; màn hình VGA là 640 x 350,…
Như vậy, một ảnh là một tập hợp các điểm ảnh. Khi được số hóa, nó
thường được biểu diễn bởi bảng hai chiều I(n, p): n dòng và p cột. Ta nói ảnh
gồm n x p pixels. Người ta thường ký hiệu I(x, y) để chỉ một pixel. Hình 1.2
cho ta thấy việc biểu diễn một ảnh với độ phân giải khác nhau. Một pixel có
thể lưu trữ trên 1, 4, 8 hay 24 bit.
Gray level: Mức xám
Mức xám là kết quả sự mã hóa tương ứng một cường độ sáng của mỗi
điểm ảnh với một giá trị số - kết quả của quá trình lượng hóa. Cách mã hóa
kinh điển thường dùng 16, 32 hay 64 mức. Mã hóa 256 mức là phổ dụng nhất
do lý do kỹ thuật. Vì 2^8 = 256 (0, 1, …, 255), nên với 256 mức, mỗi pixel sẽ
được mã hóa bởi 8 bit.
Các điểm 4 và 8-láng giềng
Giả sử (i,j) là một điểm ảnh, các điểm 4-láng giềng là các điểm trực tiếp
bên trên, dưới, trái, phải của điểm (i,j):
N4= {(i -1,j), (i +1,j), (i, j -1), (i, j +1)},
và những điểm 8-láng giềng (hình 1.3) gồm:
N8 = N4  {(i -1,j -1), (i +1,j -1), (i -1,j +1), (i +1,j +1)}.
Ví dụ trong hình 1.3 các điểm 0, 2, 4, 6 là các 4-láng giềng của điểm P,
còn các điểm 0, 1, 2, 3, 4, 5, 6, 7 là các 8 láng giềng của P.
Chu tuyến


12
Chu tuyến của một đối tượng ảnh là tập các điểm biên của đối tượng
p0,p1,,pN sao cho pi-1 và pi+1 là các 8-láng giềng của pi và p0= pN. Chẳng hạn
trong hình 1.4 biểu diễn chu tuyến của ảnh.
3


2

1

4

P

0

z
p

5

6

x

7

Hình 1.3: Ma trận 8 láng giềng kề nhau

Hình 1.4:Ví dụ về chu tuyến của ảnh

Độ dài của chu tuyến:
Độ dài của chu tuyến với các hướng như hình 2 được tính theo công thức
sau:
PERIMETER = EVENPERIM+ODDPERIM* 2 .

Ở đây EVENPERIM - số lượng vectơ theo hướng chẵn, còn
ODDPERIM - số lượng vectơ theo hướng lẻ.
Chu tuyến láng giềng
Hai chu tuyến C= <P1P2..Pn> và C1= <Q1Q2..Qm> được gọi là láng giềng
của nhau (Hình 1.3) nếu và chỉ nếu:
1. Pi  Qj i,j.
2. i j sao cho Pi và Qj là 8 láng giềng của nhau.
3. Các điểm Pi là ảnh thì Qj là nền và ngược lại.
Điểm trong và điểm ngoài chu tuyến
C= <P1P2..Pn> là một chu tuyến và P là một điểm ảnh khi đó theo điều
kiện Jordan[2] ta có:


13
- P được gọi là điểm trong chu tuyến C nếu nửa đường thẳng xuất phát từ
P sẽ cắt chu tuyến C tại số lẻ lần,
- P được gọi là điểm ngoài chu tuyến C nếu không phải là điểm trong.
Nhiễu (Noise)
Cho trước chu tuyến C và ngưỡng  > 0, khi đó tập hợp các điểm trong
chu tuyến C sẽ được gọi là nhiễu nếu thoả mãn hai điều kiện sau:
- Có ít nhất một điểm là điểm ảnh quan tâm sao cho điểm này là
8-láng giềng của một điểm nào đó của chu tuyến C.
- Độ dài của chu tuyến C nhỏ hơn ngưỡng .
Trong trường hợp này C được gọi là chu tuyến xác định nhiễu.
Lỗ hổng (Hole)
Cho trước chu tuyến C và ngưỡng  > 0, khi đó tập hợp các điểm trong
chu tuyến C sẽ được gọi là lỗ hổng nếu thoả mãn hai điều kiện sau:
- Có ít nhất một điểm có cùng giá trị với thuộc tính nền sao cho điểm này
là 8-láng giềng của điểm nào đó của chu tuyến C.
- Độ dài của chu tuyến C nhỏ hơn ngưỡng .

Trong trường hợp này C được gọi là chu tuyến xác định lỗ hổng.
Ảnh đen trắng
Ảnh đen trắng là ảnh chỉ bao gồm hai mầu đen và trắng. Người ta phân
mức đen trắng thành L mức, nếu xử dụng 8 bít mã hóa mức đen trắng thì L
được xác định: L=2B (nếu B=8 ta có L=28=256).


14
* Nếu L=2, B=1, nghĩa là chỉ có hai mức, mức 1 và 0, còn được gọi là
ảnh nhị phân, mức 1 ứng với màu sáng mức 0 ứng với màu tối, nếu L lớn hơn
2 thì ta có ảnh đa cấp xám).
* Đối với mỗi điểm ảnh được mã hóa trên 8 bít để biểu diễn mức
xám,thì số mức xám có thể biể diễn được là 256. Mỗi mức xám được biểu
diễn dưới dạng là một số nguyên nằm trong khoảng từ 0 đến 255.
Ảnh mầu
Biểu diễn tương tự như ảnh đen trắng, chỉ khác là số phần tử của ma
trận biểu diễn cho bằng ba mầu riêng rẽ (red, green, blue). Để biểu diễn một
điểm ảnh cần 24 bit chia ra làm ba khoảng mỗi khoảng 8 bit.
Ảnh đường nét
Ảnh đường nét là ảnh gồm các thanh có chiều dài lớn hơn gấp nhiều
lần chiều rộng.
Ví dụ: Các bản vẽ, sơ đồ mạng lưới, mạch in, bản đồ đường sá, sông
ngòi, vân tay…
Độ phân giải của ảnh
Độ phân giải của ảnh là khoảng cách giữa các điểm ảnh được chọn sao
cho mắt người vẫn thấy được sự liên tục của ảnh, việc lựa chọn khoảng cách
thích hợp tạo lên mật độ phân bố, đó chính là độ phân giải và được phân bố
theo trục x và y trong không gian hai chiều.
Có 3 cách để biểu thị độ phân giải ảnh:
+ Biểu thị bằng số lượng điểm ảnh theo chiều dọc và chiều ngang của

ảnh (ví dụ: 1024 x 768).
+ Biểu thị bằng tổng số điểm ảnh trên 1 tấm ảnh (960.000 pixel).


15
+ Biểu thị bằng số lượng điểm ảnh có trên 1 inch (ppi) hoặc số chấm
(dot) có trên 1 inch (dpi).
Ảnh có thể được biểu diễn theo mô hình Vector hoặc mô hình Raster:
Mô hình Raster
Đây là mô hình biểu diễn ảnh thông dụng nhất hiện nay. Ảnh được biểu
diễn dưới dạng ma trận các điểm ảnh. Tùy theo nhu cầu thực tế mà mỗi điểm
ảnh có thể được biểu diễn bởi một hay nhiều bit. Mô hình Raster rất thuận lợi
cho hiển thị và in ấn. Khi xử lý các ảnh Raster, chúng ta quan tâm đến mối
quan hệ trong vùng lân cận của các điểm ảnh. Các điểm ảnh có thể xếp hàng
trên một lưới (Raster) hình vuông, lưới hình lục giác hoặc theo một cách hoàn
toàn ngẫu nhiên với nhau:

Hình 1.5: Quan hệ giữa các điểm ảnh
Mô hình Vector
Biểu diễn ảnh ngoài mục đích tiết kiệm không gian lưu trữ, dễ dàng cho
hiển thị và in ấn, còn phải đảm bảo dễ dàng trong lựa chọn, sao chép, di
chuyển, tìm kiếm… Theo những yêu cầu này, kỹ thuật biểu diễn Vector tỏ ra
ưu việt hơn. Trong mô hình Vector người ta sử dụng hướng giữa các Vector
của điểm ảnh lân cận để mã hoá và tái tạo hình ảnh ban đầu. Ảnh Vector được
thu nhận trực tiếp từ các thiết bị số hóa như Digital hoặc được chuyển đổi từ
ảnh Raster thông qua các chương trình số hóa. Công nghệ phần cứng cung


16
cấp những thiết bị xử lý với tốc độ nhanh và chất lượng cao cho cả đầu vào và

ra, nhưng lại chỉ hỗ trợ cho ảnh Raster. Do vậy, những nghiên cứu về biểu
diễn Vector đều tập trung chuyển đổi từ ảnh Raster.
Biên
Biên là một vấn đề chủ yếu và cực kỳ quan trọng trong quá trình phân
tích ảnh vì các kỹ thuật phân đoạn ảnh chủ yếu dựa vào biên. Cho đến nay
chưa có định nghĩa chính xác về biên, với mỗi ứng dụng người ta đưa ra các
độ đo khác nhau về biên. Một điểm ảnh được gọi là biên nếu nó có sự thay
đổi đột ngột về mức xám. Ví dụ: Đối với ảnh đen trắng, một điểm được gọi là
điểm biên nếu nó là điểm đen có ít nhất một điểm trắng bên cạnh. Tập hợp
các điểm biên tạo nên biên hay đường bao của đối tượng. Dựa trên cơ sở này
người ta thường sử dụng hai phương pháp phát hiện biên cơ bản: phát hiện
biên trực tiếp và phát hiện biên gián tiếp.
Các ảnh thu được sau quá trình số hóa thường được lưu lại cho các quá
trình xử lý tiếp theo hay truyền đi. Trong quá trình phát triển của kỹ thuật xử
lý ảnh, tồn tại nhiều định dạng ảnh khác nhau từ ảnh đen trắng (với định dạng
IMG), ảnh đa cấp xám cho đến ảnh màu: (BMP, GIF, JPEG…). Tuy các
định dạng này khác nhau, song chúng đều tuân theo một cấu trúc chung nhất.
Nhìn chung, một tệp ảnh bất kỳ thường bao gồm 3 phần:
- Mào đầu tệp (Header).
- Dữ liệu nén (Data Compression).
- Bảng màu (Palette Color).
Điểm biên
Cho p là một điểm ảnh, khi đó: p là điểm biên nếu tồn tại q là 8-láng
giềng của p sao cho cường độ sáng của q khác với cường độ sáng của p. Nói


17
cách khác, nếu p là điểm ảnh quan tâm thì q là điểm có thuộc tính nền và
ngược lại.
1.1.2.2. Biểu diễn ảnh

Trong biểu diễn ảnh, người ta thường dùng các phần tử đặc trưng của
ảnh là pixel. Nhìn chung có thể xem một hàm hai biến chứa các thông tin như
biểu diễn của một ảnh. Các mô hình biểu diễn ảnh cho ta một mô tả logic hay
định lượng các tính chất của hàm này. Trong biểu diễn ảnh cần chú ý tính
trung thực của ảnh hoặc các tiêu chuẩn “thông minh” để đo chất lượng ảnh
hoặc tính hiệu quả của các kỹ thuật xử lý.
Việc xử lý ảnh số yêu cầu ảnh phải được mẫu hóa và lượng tử hóa. Thí
dụ một ảnh ma trận 512 dòng gồm khoảng 512 x 512 pixel. Việc lượng tử hóa
ảnh là chuyển đổi tín hiệu tương tự sang tín hiệu số (Analog Digital Convert)
của một ảnh đã lấy mẫu sang một số hữu hạn các mức xám.
Một số mô hình thường được dùng trong biểu diễn ảnh: mô hình toán,
mô hình thống kê. Trong mô hình toán, ảnh hai chiều được biểu diễn nhờ các
hàm hai biến trực giao gọi là các hàm cơ sở. Với mô hình thống kê, một ảnh
được coi như một phần tử của một tập hợp đặc trưng bởi các đại lượng như:
kỳ vọng toán học, hiệp biến, phương sai, moment.
1.1.2.3. Tăng cường ảnh – khôi phục ảnh
Tăng cường ảnh là bước quan trọng, tạo tiền đề cho xử lý ảnh. Nó gồm
một loạt các kỹ thuật như: lọc độ tương phản, khử nhiễu, nổi màu, v.v…
1.1.2.4. Nhận dạng ảnh
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người
ta muốn đặc tả nó. Quá trình nhận dạng thường đi sau quá trình trích chọn các
đặc tính chủ yếu của đối tượng. Có hai kiểu mô tả đối tượng:


18
- Mô tả tham số (nhận dạng theo tham số).
- Mô tả theo cấu trúc (nhận dạng theo cấu trúc).
Trên thực tế, người ta đã áp dụng kỹ thuật nhận dạng khá thành công
với nhiều đối tượng khác nhau như: nhận dạng ảnh vân tay, nhận dạng chữ
(chữ cái, chữ số, chữ có dấu).

Ngoài ra, hiện nay một kỹ thuật nhận dạng mới dựa vào kỹ thuật mạng
nơron đang được áp dụng và cho kết quả khả quan.
1.1.3. Thu nhận ảnh
1.1.3.1. Thiết bị thu nhận ảnh
Các thiết bị thu nhận ảnh có thể cho ảnh trắng đen B/W (Black &
White) với mật độ từ 400 đến 1600 dpi (dot per inch) hoặc ảnh màu 600 dpi.
Với ảnh B/W mức màu là 0 hoặc 1. Với ảnh đa cấp xám, mức xám biến thiên
từ 0 đến 255. Ảnh màu, mỗi điểm ảnh lưu trữ trong 3 bytes và do đó ta có 2 8 x 3
màu (cỡ 16,7 triệu màu).
Khi dùng scanner, một dòng photodiot sẽ quét ngang ảnh (quét theo
hàng) và cho ảnh với độ phân giải ngang khá tốt. Đầu ra của scanner là ảnh
ma trận số mà ta quen gọi là bản đồ ảnh (ảnh Bitmap), bộ số hóa (digitalizer)
sẽ tạo ảnh vectơ có hướng.
Trong xử lý ảnh bằng máy tính, ta không thể không nói đến thiết bị
monitor (màn hình) để hiện ảnh. Monitor có nhiều loại khác nhau:
 CGA: 640 x 320 x 16 màu,
 EGA: 640 x 350 x 16 màu,
 VGA: 640 x 480 x 16 màu,
 SVGA: 1024 x 768 x 256 màu.


19
Với ảnh màu, có nhiều cách tổ hợp màu khác nhau. Theo lý thuyết màu
do Thomas đưa ra từ năm 1802, mọi màu đều có thể tổ hợp từ 3 màu cơ bản:
Red (đỏ), Green (lục) và Blue (lơ).
Thiết bị ra ảnh có thể là máy đen trắng, máy in màu hay máy vẽ
(ploter). Máy vẽ cũng có nhiều loại: loại dùng bút, loại phun mực.
Nhìn chung, các hệ thống thu nhận ảnh thực hiện hai quá trình:
- Cảm biến: biến đổi năng lượng quang học (ánh sáng) thành năng
lượng điện.

- Tổng hợp năng lượng điện thành ảnh.
1.1.3.2. Biểu diễn màu
Ánh sáng màu là tổ hợp của ánh sáng đơn sắc. Mắt người chỉ có thể
cảm nhận được vài chục màu, song lại có thể phân biệt được hàng ngàn màu.
Có 3 thuộc tính chủ yếu trong cảm nhận màu:
- Brighness: sắc màu, còn gọi là độ chói.
- Hue: sắc lượng, còn gọi là sắc thái màu.
- Saturation: độ bão hòa.

Hình 1.6: Hệ tọa độ màu RGB


20
Với nguồn sáng đơn sắc, độ hue tương ứng với bước sóng . Độ bão
hòa thay đổi nhanh nếu ta thêm lượng ánh sáng trắng. Hình 1.3 mô tả mối liên
quan giữa những các đại lượng trên và 3 màu chủ yếu R, G và B.
Với điểm W* cố định, các ký hiệu G, R, B chỉ vị trí tương đối của các
phổ màu đỏ, lục và lơ.
Do sự tán sắc ánh sáng mà ta nhìn rõ màu. Theo Maxwell, trong võng
mạc có 3 loại tế bào hình nón cảm thụ 3 màu cơ bản ứng với 3 phổ hấp thụ
S1(  ), S2(  ) và S3(  );  min = 380 nm;  max = 780 nm.
- Một màu bất kỳ sẽ là một điểm trên vòng tròn.
- Nếu White và Black là như nhau thì đường tròn là lớn nhất và R là
điểm bão hòa.
- S thay đổi theo bán kính
- H thay đổi theo góc  .
- W* là sắc màu.
1.1.3.3. Hệ tọa độ màu
Tổ chức y tế về chuẩn hóa màu CIE (Commision Internationalé
d’Eclairage) đưa ra một số các chuẩn để biểu diễn màu. Các hệ này có các

chuẩn riêng. Ở đây chỉ đề cập đến chuẩn mầu CIE-RGB (hệ tọa độ dùng 3
màu cơ bản). Như đã nêu trên, một màu là tổ hợp của các màu cơ bản theo
một tỉ lệ nào đấy. Người ta dùng hệ tọa độ ba màu R-G-B (tương ứng với hệ
tọa độ x-y-z) để biểu diễn màu như sau:


21

Hình 1.7: Hệ tọa độ R-G-B
Trong cách biểu diễn này ta có công thức: đỏ + lục + lơ = 1. Công thức
này gọi là công thức Maxwell. Ta cũng có thể chuyển từ hệ tọa độ 3 màu về
hệ tọa độ x-y-z.
1.1.4. Các kỹ thuật xử lý ảnh cơ bản
Một số ảnh trước khi được đưa vào trong quá trình xử lý thường dễ
thấy các đối tượng nhỏ trên bề mặt ảnh những đối tượng đó có thể do nhiều
nguyên nhân khác nhau trong đó có thể bao gồm nhiễu và lỗ hổng. Qua quá
trình tìm hiểu đề tài giúp em hiểu một cách ánh xạ: nhiễu và lỗ hổng trên ảnh
tương tự như vết bẩn (nhàu) và chỗ rách trên một chiếc áo từ đó giúp em tìm
hiểu về đề tài một cách đầy đủ hơn.
Trên thực tế tồn tại khá nhiều loại nhiễu, do sự thay đổi của cảm biến,
sự biến đổi của môi trường, sai số quá trình lượng tử hóa… tuy nhiên người ta
thường xét ba loại nhiễu chính và phổ biến là: nhiễu cộng, nhiễu nhân và
nhiễu xung.


22
* Nhiễu cộng (additive noise): thường được phân bố khắp ảnh và
được biểu diễn bởi:
Y=X+n (Y là ảnh quan sát, X là ảnh gốc và n là nhiễu).
* Nhiễu nhân: cũng thường phân bố khắp ảnh và được biểu diễn:

Y=X*n (Y là ảnh quan sát, X là ảnh gốc và n là nhiễu).
* Nhiễu xung: là một loại nhiễu khá đặc biệt có thể sinh ra bởi nhiều lý
do khác nhau. Nhiễu này thường gây đột biến tại một số điểm ảnh.
Đối tượng nhỏ trong ảnh bị nhiễu gây lên, thường thấy ở nhiễu đốm
(speckle noise) và nhiễu muối tiêu (salt-pepper noise). Đây là những loại
nhiễu điển hình của nhiễu xung, nhiễu đốm xảy ra trên những đối tượng lồi
lõm có dạng bước sóng và tăng gấp bội nếu đối tượng có độ phân giải
thấp.nhiễu muối tiêu cho thấy rõ hơn tính chất đột biến của nó các điểm ảnh
bị nhiễu có thể nhận giá trị cực đại hoặc cực tiểu trong khoảng giá trị [0, 255].
Với ảnh mức xám nếu điểm ảnh có giá trị cực đại thì nó sẽ tạo lên những đốm
trắng trên ảnh, trông giống như hạt muối. Nếu điểm ảnh có giá trị cực tiểu thì
nó sẽ tao lên đốm đen giống hạt tiêu.
Trong quá trình xử lý ảnh thì với mỗi điểm của ảnh gốc, sẽ tìm được vị
trí của nó bên ảnh đích. Nhưng đối với ảnh đích mà chưa có điểm nào từ ảnh
gốc ánh xạ sang lên các điểm đó vấn mang màu lền. Những điểm ảnh mà ảnh
đích không có điểm ảnh mà ảnh gốc ánh xạ sang thì ta gọi là những lỗ hổng.
Nâng cao chất lượng ảnh là bước cần thiết trong xử lý ảnh nhằm hoàn
thiện một số đặc tính của ảnh. Công đoạn tăng cường ảnh là bước đầu của quá
trình nâng cao chất lượng, tăng cường ảnh là một loạt phương pháp nhằm cải
thiện quan sát của một ảnh tập hợp các kỹ thuật này tạo lên giai đoạn tiền xử
lý ảnh nhiệm vụ của tăng cường ảnh không phải là làm tăng lượng thông tin


23
vốn có trong ảnh mà làm nổi bật các đặc trưng đã chọn làm sao có thể để thể
hiện tốt hơn, tạo thành quá trình tiền xử lý cho phân tích ảnh, tăng cường ảnh
bao gồm: điều khiển mức xám, dãn độ tương phản, làm trơn ảnh, nội suy,
phóng đại, nổi biên,… Giảm nhiễu và lấp lỗ hổng cũng là một trong những kỹ
thuật quan trọng trong tăng cường ảnh.
Do có nhiều loại nhiễu can thiệp vào quá trình xử lý ảnh lên cần có

nhiều bộ lọc thích hợp. Đối với nhiễu cộng nhiễu nhân ta dùng bộ lọc thông
thấp, trung bình và lọc đồng hình. Đối với nhiễu xung ta dùng bộ lọc trung vị,
giả trung vị, lọc ngoài, ngoài ra còn có các bộ lọc phát triển dựa trên bộ lọc
trung vị Adaptive Median filter, Weighted Median filter, Center-Weighted
Median filter… Dù có nhiều cải tiến nhưng các bộ lọc này vẫn có nhược điểm
xử lý toàn bộ các pixel trong ảnh vì vậy làm mất hoặc mờ các chi tiết ảnh.
Ý tưởng để lấp lỗ hổng M, ta tìm cho M một điểm ảnh M’ tương ứng
với nó ở ảnh gốc. Việc tìm M’ dựa vào các điểm điểm đã được ánh xạ và có
khoảng cách đến M là nhỏ nhất.
Trên đây đã nói đến một số khái niệm cơ bản trong xử lý ảnh, chúng ta
sẽ tìm hiểu một số kỹ thuật xử lý ảnh cơ bản.
Trên đây đã nói các khái niệm cơ bản trong xử lý ảnh, chúng ta sẽ tìm
hiểu một số kỹ thuật xử lý ảnh.
1.1.4.1. Nhị phân hóa
Nhị phân hóa là thực hiện phép biến đổi ảnh từ ảnh đa cấp xám về ảnh
nhị phân (có 2 cấp xám). Do các kỹ thuật nhận dạng chỉ cẩn ảnh đầu vào là
ảnh nhị phân nên bước này cần thực hiện khi ảnh đầu vào là ảnh đa cấp xám.
Phương pháp đơn giản là dùng một hàm cắt với giá trị ngưỡng .


×