Chương 1: Giới Thiệu Xử Lý Ảnh
1
Chương 1
GIỚI THIỆU XỬ LÝ ẢNH
1.1 Giới thiệu về hệ thống xử lý ảnh
Xử lý ảnh là một ngành khoa học còn tương ñối mới mẻ so với nhiều ngành
khoa học khác. Hiện nay nó ñang là một trong những lĩnh vực ñược quan tâm và ñã
trở thành môn học chuyên ngành của sinh viên hệ kỹ sư, cử nhân ngành Công nghệ
Thông tin, ðiều khiển Tự ñộng…
Nhờ có công nghệ số hóa hiện ñại, ngày nay con người ñã có thể xử lý tín
hiệu nhiều chiều thông qua nhiều hệ thống khác nhau, từ những mạch số ñơn giản
cho ñến những máy tính song song cao cấp. Mục tiêu của xử lý này có thể chia làm
ba hướng như sau:
• Xử lý ảnh ban ñầu ñể có ñược ảnh mới theo một yêu cầu xác ñịnh (ví dụ như
ả
nh
mờ cần xử lý ñể ñược ảnh rõ hơn)
• Phân tích ảnh ñể thu ñược các thông tin ñặc trưng giúp cho việc phân loại,
nhận biết ảnh (ví dụ phân tích ảnh vân tay ñể trích chọn các ñặc trưng vân
tay)
• Hiểu ảnh ñầu vào ñể có những mô tả về ảnh ở mức cao hơn, sâu hơn (ví dụ từ
ả
nh
một tai nạn giao thông phác họa hiện trường tai nạn).
Trong bài giảng này, chúng ta sẽ tập trung vào những khái niệm cơ bản của xử lý
ảnh và tập trung vào vấn ñề trong phạm vi ảnh 2 – chiều, còn ảnh nhiều chiều không
ñược xét kỹ ở ñây
Lĩnh vực ứng dụng:
• Sản xuất và kiểm tra chất lượng
• Di chuyển của Robot
• Các phương tiện ñi lại tự trị
• Công cụ hướng dẫn cho người mù
• An ninh và giám sát
• Nhận dạng ñ
ối
• Ứng dụng tro
n
• Sản xuất, hiệu
• Chinh phục v
ũ
Với những ứng dụ
n
ngay từ bây giờ tìm hiểu,
ðể dễ tưởng tượng,
từ thế giới ngoài ñược
thu
Trước ñây, ảnh thu qua
C
Gần ñây, với sự phát t
ri
Camera, sau ñó nó ñượ
c
theo. (Máy ảnh số hiện
nhận từ vệ tinh, có thể
qué
các bước cơ bản trong x
ử
H
Tín hiệu ảnh thuộc
lo
•
Ảnh tĩnh trong không
S là giá trị biên ñ
ộ (ñ
• Phân loại ảnh:
− Ảnh tương tự
S(
Chương 1
2
ối
tượng, nhận dạng mặt
n
g y học
chỉnh video
ũ
trụ…
n
g to lớn của công nghệ xử lý ảnh,
chúng
làm việc với một trong những thế giới ñ
ầy
xét các bước cần thiết trong xử lý ảnh.
ð
thu
nhận qua các thiết bị thu (như Cam
er
Ca
mera là các ảnh tương tự (loại Cam
era
ri
ển của công nghệ, ảnh màu hoặc ñen
tr
c
chuyển trực tiếp thành ảnh số tạo thu
ận
nay là một thí dụ gần gũi). Mặt khác,
ản
quét
từ ảnh chụp bằng máy quét ảnh.
Hình
ử
lý ảnh.
Hình 1.1
Các bước cơ b
ản trong xử lý ảnh
lo
ại tín hiệu ña chiều: tọa ñộ (x,y,z), ñộ
sán
không gian 2 chiều ñ
ược ñịnh nghĩa là một h
àm
ộ (ñ
ược biểu diễn bằng màu s
ắc) tại vị trí khô
S(x
,y): (x,y) liên tục, S liên tục.
g 1
: Giới Thiệu Xử Lý Ảnh
chúng
ta hãy bắt tay vào
ầy
tiềm năng này.
ð
ầu tiên, ảnh tự nhiên
era,
máy chụp ảnh).
era
ống kiểu CCIR).
tr
ắng ñược lấy ra từ
ận
lợi cho xử lý tiếp
ảnh
cũng có thể tiếp
Hình
1.1 dưới ñây mô tả
nh
sán
g(λ), thời gian(t).
àm 2 bi
ến S(x,y), với
rí không gian (x,y).
Chương 1: Giới Thiệu Xử Lý Ảnh
3
− Ảnh số S(m,n): (m,n) rời rạc, S rời rạc.
• Một ảnh (gồm một tập các ñiểm ảnh) có thể xem như bao gồm tập các ảnh con
(các vùng ảnh). Thuật ngữ gọi là ROIs – vùng quan tâm (Regions of Interest).
• Ảnh số trong không gian rời rạc thu ñược từ ảnh tương tự trong không gian liên
tục thông qua quá trình số hóa. Quá trình số hóa có thể hiểu ñơn giản như sau:
− Ảnh tương tự ñược chia thành M hàng, N cột.
− Giao của hàng và cột ñược gọi là: pixel
−
Giá trị
biên ñộ của pixel tại tọa ñộ nguyên (m,n) là s(m,n): là trung bình
ñộ sáng trong pixel ñó. S(m,n) ≤ L (L số mức xám dùng biểu diễn ảnh)
• M, N thường ñược chọn là M=N=2
K
(K=8,9,10). L =2
B
, B là số bít mã hóa cho
ñộ sáng (biên ñộ) mỗi pixel.
• Ảnh số ñược biểu diễn bởi ma trận 2 chiều. Các phần tử của nó là biểu diễn
cho các pixel số hóa.
• Ta ký hiệu 1 ảnh số là S(M,N). Ta nói ảnh có ñộ phân giải MxN. Ký hiệu s(m,n)
ñể chỉ ra một phần tử ảnh.
Hình 1.2 Sơ ñồ phân tích xử lý ảnh và các lưu ñồ thông tin giữa các khối
1.1.1 Thu nhận ảnh (Image Acquisition)
Ảnh có thể nhận qua camera màu hoặc ñen trắng. Thường ảnh nhận qua camera
là ảnh tương tự (loại ca
m
có loại camera ñã số
ho
photodiode tạo cường ñ
ộ
Camera thường
dùng
một ảnh thu nhận ñư
ợc ph
cảnh)
1.1.2 Ti
ền xử lý ảnh (Im
Sau bộ thu nhận,
ảnh
lý ñể nâng cao chất lượ
ng
tương phản ñể làm ảnh r
õ
Chương 1
4
m
era ống chuẩn CCIR với tần số 1/25, m
ỗi ả
hoá
(như loại CCD – Change Cou
pled
ộ
sáng tại mỗi ñiểm ảnh.
dùng
là loại quét dòng: ảnh tạo ra có dạng
hai
ợc phụ thuộc
vào thiết bị thu, vào môi trườ
ng
Hình 1.3 Thu nhận ảnh
nh (Image
Processing)
ảnh
có thể nhiễu ñộ tương phản thấp nên c
ần
ng.
Chức năng chính của bộ tiền xử lý
là
õ
hơn, nét hơn.
Hình 1.4 Tiền xử lý ảnh
g 1
: Giới Thiệu Xử Lý Ảnh
ỗi ảnh
25 dòng), cũng
pled
Device) là loại
hai
chiều. Chất lượng
ng
(ánh sáng, phong
ần ñ
ưa vào bộ tiền xử
là
lọc nhiễu, nâng ñộ
1.1.3 Phân ñoạn ảnh (
Im
Phân vùng ảnh là
tác
phân tích, nhận dạng ả
nh.
cho mục ñích phân lo
ại b
thành các từ, các chữ,
các
phức tạp khó khăn nhất
của ảnh. Kết quả nhận d
ạn
1.1.4 Bi
ểu diễn ảnh (Ima
ðầu ra ảnh sau
phân
cộng với mã liên kết vớ
i c
thích hợp là cần thi
ết cho x
hiện ảnh gọi là trích ch
ọn ñ
của ảnh dưới dạng các
thôn
này với ñối tượng khác
tr
trên phong bì thư, chúng
này với ký tự khác.
Chương 1
5
Image
Segmentation)
tách
một ảnh ñầu vào thành các vùng
thành
nh.
Ví dụ: ñể nhận dạng chữ (hoặc mã v
ạch)
ại b
ưu phẩm, cần chia các câu, chữ về ñ
ịa c
các
số (hoặc các vạch) riêng biệt ñể nh
ận
trong xử lý ảnh và cũng dễ gây lỗi,
làm
ạng
ảnh phụ thuộc rất nhiều vào công ño
ạn
Hình 1.5: Phân ñoạn ảnh
nh (Image Representation)
phân
ñoạn chứa các ñiểm ảnh của vùng ảnh
i các vùng
lận cận. Việc biến ñổi các s
ố li
t cho xử
lý tiếp theo bằng máy tính. Vi
ệc chọn c
ọn ñặc tr
ưng (Feature Selection) gắn vớ
i vi
thông
tin ñịnh lượng hoặc làm cơ sở ñ
ể phân
tr
ong phạm vi ảnh nhận ñược. Ví d
ụ: tron
ta miêu tả các ñặc trưng của từng ký t
ự gi
g 1
: Giới Thiệu Xử Lý Ảnh
thành
phần ñể biểu diễn
ạch)
trên phong bì thư
ịa chỉ hoặc
tên người
ận
dạng. ðây là phần
làm
mất ñộ chính xác
ạn
này.
(ảnh ñã phân ñoạn)
ố liệu n
ày thành dạng
chọn các
tính chất ñể thể
i vi
ệc tách các ñặc tính
ể phân
biệt lớp ñối tượng
: trong
nhận dạng ký tự
ự giúp phân
biệt ký tự
Chương 1: Giới Thiệu Xử Lý Ảnh
6
Hình 1.6 Biểu diễn ảnh số
1.1.5 Nhận dạng và nội suy ảnh (Image Recognition and Interpretation)
Nhận dạng ảnh là quá trình xác ñịnh ảnh. Quá trình này thường thu ñược bằng
cách so sánh với mẫu chuẩn ñã ñược học (hoặc lưu) từ trước. Nội suy là phán ñoán
theo ý nghĩa trên cơ sở nhận dạng. Ví dụ: một loạt chữ số và nét gạch ngang trên
phong bì thư có thể ñược nội suy thành mã ñiện thoại. Có nhiều cách phân loại ảnh
khác nhau về ảnh. Theo lý thuyết về nhận dạng, các mô hình toán học về ảnh ñược
phân theo hai loại nhận dạng ảnh cơ bản:
• Nhận dạng theo tham số.
• Nhận dạng theo cấu trúc.
Một số ñối tượng nhận dạng khá phổ biến hiện nay ñang ñược áp dụng trong
khoa học và công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký ñiện tử), nhận
dạng văn bản (Text), nhận dạng vân tay, nhận dạng mã vạch, nhận dạng mặt người…
1.1.6 Cơ sở tri thức (Knowledge Base)
Như ñã nói ở trên, ảnh là một ñối tượng khá phức tạp về ñường nét, ñộ sáng tối,
dung lượng ñiểm ảnh, môi trường ñể thu ảnh phong phú kéo theo nhiễu. Trong
(1,1)
(2,1)
(1,2)
(2,2)
(1,3)
(2,3)
(1,4)
(2,4)
(1,j)
(2,j)
(1,j+1)
(2,j+1)
(1,n-1)
(2,n-1)
(1,n)
(2,n)
(3,1)
(4,1)
(3,2)
(4,2)
(3,3)
(4,3)
(3,4)
(4,4)
(3,j)
(4,j)
(3,j+1)
(4,j+1)
(3,n-1)
(4,n-1)
(3,n)
(4,n)
(i,1)
(i+1,1)
(i,2)
(i+1,2)
(i,3)
(i+1,3)
(i,4)
(i+1,4)
(i,j)
(i+1,j)
(i,j+1)
(i+1,j+1)
(i,n-1)
(i+1,n-1)
(3,n)
(i+1,n)
(m-1,1)
(m,1)
(m-1,2)
(m,2)
(m-1,3)
(4,3)
(m-1,4)
(4,4)
(m-1,j)
(4,j)
(m-1,j+1)
(4,j+1)
(m-1,n-
1)
(m,n-1)
(m-1,n)
(m,n)
Digital Image
Representation
x
y
nhiều khâu xử lý
và phân
học ñảm bảo tiện lợi c
ho
và xử lý ảnh theo cách c
ủa
ñã xử lý theo các ph
ương
ñược phát huy. Trong
tài
cách sử dụng các cơ sở
tri t
Hì
n
1.1.7 Bi
ểu diễn (mô tả) ả
Từ Hình 1.1, ảnh
sau
khâu tiếp theo ñể
phân tíc
lượng bộ nhớ cực lớn v
à
Thông thường, các ảnh
thô
theo các ñặc ñiểm của
ảnh
ảnh (Boundary), vùng
ảnh
• Biểu diễn bằng mã
lo
• Biểu diễn bằng m
ã xí
• Biểu diễn bằng m
ã t
Chương 1
7
phân
tích ảnh ngoài việc ñơn giản hóa
các
ho
xử lý, người ta mong muốn bắt chướ
c q
ủa con ng
ười. Trong các bước xử lý ñó,
nh
ương
pháp trí tuệ con người. Vì vậy, ở ñ
â
tài
liệu, chương 6 về nhận dạng ảnh có
nêu
tri th
ức ñó.
n
h 1.7 Các cơ sở tri thức trong xử lý ảnh
ô tả) ảnh
sau
khi số hoá sẽ ñược lưu vào bộ nhớ,
ho
hân tích.
Nếu lưu trữ ảnh trực tiếp từ các
ảnh
à không
hiệu quả theo quan ñiểm ứng
d
thô
ñó ñược ñặc tả (biểu diễn) lại (hay
ñơ
ảnh
ñược gọi là các ñặc trưng ảnh (
Image F
ảnh (
Region). Một số phương pháp bi
ểu diễn
lo
ạt dài (Run-Length Code)
ã xích (Chaine
-Code)
ã t
ứ phân (Quad-Tree Code)
g 1
: Giới Thiệu Xử Lý Ảnh
các
phương pháp toán
c q
uy trình tiếp nhận
nhi
ều khâu hiện nay
â
y các cơ sở tri thức
nêu
một vài ví dụ về
ho
ặc chuyển sang các
ảnh
thô, ñòi hỏi dung
d
ụng và công nghệ.
ñơn
giản là mã hoá)
ge Feature
s) như: biên
diễn th
ường dùng:
Chương 1: Giới Thiệu Xử Lý Ảnh
8
Hình 1.8: Biểu diễn ảnh mã loạt dài
a. Biểu diễn bằng mã loạt dài
Phương pháp này thường biểu diễn cho vùng ảnh và áp dụng cho ảnh nhị
phân. Một vùng ảnh R có thể mã hoá ñơn giản nhờ một ma trận nhị phân:
S(m, n) = 1 nếu (m, n) thuộc R
S( m, n) = 0 nếu (m, n) không thuộc R
Trong ñó: S(m, n) là hàm mô tả mức xám ảnh tại tọa ñộ (m, n). Với cách
biểu diễn trên, một vùng ảnh ñược mô tả bằng một tập các chuỗi số 0 hoặc 1. Giả
sử chúng ta mô tả ảnh nhị phân của một vùng ảnh ñược thể hiện theo toạ ñộ (x,
y), các chiều và ñặc tả chỉ ñối với giá trị “1” khi ñó dạng mô tả có thể là: (x, y)r;
trong ñó (x, y) là toạ ñộ, r là số lượng các bit có giá trị “1” liên tục theo chiều
ngang hoặc dọc.
b. Biểu diễn bằng mã xích
Phương pháp này thường dùng ñể biểu diễn ñường biên ảnh. Một ñường bất
kỳ ñược chia thành các ñoạn nhỏ. Nối các ñiểm chia, ta có các ñoạn thẳng kế tiếp
ñược gán hướng cho ñoạn thẳng ñó tạo thành một dây xích gồm các ñoạn. Các
hướng có thể chọn 4, 8, 12, 24,… mỗi hướng ñược mã hoá theo số thập phân
hoặc số nhị phân thành mã của hướng.
c. Biểu diễn bằng mã tứ phân
Phương pháp mã tứ phân ñược dùng ñể mã hoá cho vùng ảnh. Vùng ảnh
ñầu tiên ñược chia làm bốn phần thường là bằng nhau. Nếu mỗi vùng ñã ñồng
nhất (chứa toàn ñiểm ñen (1) hay trắng (0)), thì gán cho vùng ñó một mã và
không chia tiếp. Các vùng không ñồng nhất ñược chia tiếp làm bốn phần theo thủ
Chương 1: Giới Thiệu Xử Lý Ảnh
9
tục trên cho ñến khi tất cả các vùng ñều ñồng nhất. Các mã phân chia thành các
vùng con tạo thành một cây phân chia các vùng ñồng nhất.
Trên ñây là các thành phần cơ bản trong các khâu xử lý ảnh. Trong thực tế,
các quá trình sử dụng ảnh số không nhất thiết phải qua hết các khâu ñó tùy theo
ñặc ñiểm ứng dụng. Hình 1.2 cho sơ ñồ phân tích và xử lý ảnh và lưu ñồ thông tin
giữa các khối một cách khá ñầy ñủ. Ảnh sau khi ñược số hóa ñược nén, lưu lại ñể
truyền cho các hệ thống khác sử dụng hoặc ñể xử lý tiếp theo. Mặt khác, ảnh sau
khi số hóa có thể bỏ qua công ñoạn nâng cao chất lượng (khi ảnh ñủ chất lượng
theo một yêu cầu nào ñó) ñể chuyển tới khâu phân ñoạn hoặc bỏ tiếp khâu phân
ñoạn chuyển trực tiếp tới khâu trích chọn ñặc trưng. Hình 1.2 cũng chia các
nhánh song song như: nâng cao chất lượng ảnh có hai nhánh phân biệt: nâng cao
chất lượng ảnh (tăng ñộ sáng, ñộ tương phản,
lọc nhiễu) hoặc khôi phục ảnh (hồi
phục lại ảnh thật khi ảnh nhận ñược bị méo) …
d. Histogram của ảnh:
• Histogram (biểu ñồ xám) mô tả sự phân bố của cấp ñộ sáng của một ảnh theo số
lượng pixel mang cùng một giá trị.
Hình 1.9 Histogram ảnh xám
• Histogram của ảnh màu: Giá trị vector của histogram, h(g,1,b) như sau:
− h(g+1,1,1) = các pixel trong I với cường ñộ sáng màu ñỏ là g
− h(g+1,1,2) = các pixel trong I với cường ñộ sáng màu xanh lá là g
− h(g+1,1,3) = các pixel trong I với cường ñộ sáng màu xanh lam là g
1.2 Những vấn ñề c
ơ b
1.2.1 ðiểm
ảnh (Picture
Gốc của ảnh (ảnh t
ự
bằng máy tính (số), ảnh
một ảnh liên tục thành
m
ñộ sáng (mức xám). Kh
o
người không phân biệt
ñiểm ảnh (PEL: Picture
El
mỗi pixel ứng với cặp tọ
a ñ
a. ðịnh nghĩa:
ðiểm ảnh (Pixel) là
nhất ñịnh. Kích thước
và
cho mắt người cảm nhận
số gần như ảnh thật. M
ỗi p
Chương 1
10
Hình 1.10 Histogram ảnh màu
ơ b
ản trong hệ thống xử lý ảnh
cture Element)
ự
nhiên) là ảnh liên tục về không gian
và
cần phải ñược số hoá. Số hoá ảnh là s
ự
m
ột tập ñiểm phù hợp với ảnh thật về v
ị
o
ảng cách giữa các ñiểm ảnh ñó ñược
thi
ñược ranh giới giữa chúng. Mỗi một
ñi
Element)
hay gọi tắt là Pixel.
Trong khuôn
a ñ
ộ (x, y).
một phần tử của ảnh số tại toạ ñộ (x, y)
v
và
khoảng cách giữa các ñiểm ảnh ñó ñư
ợc c
sự liên tục về không gian và mức xám
ỗi phần tử tro
ng ma trận ñược gọi là m
ột phầ
Hình 1.11 ðiểm ảnh
g 1
: Giới Thiệu Xử Lý Ảnh
và
ñộ sáng. ðể xử lý
ự
biến ñổi gần ñúng
ị
trí (không gian) và
thi
ết lập sao cho mắt
ñi
ểm như vậy gọi là
khuôn kh
ổ ảnh hai chiều,
v
ới ñộ xám hoặc màu
ợc chọn
thích hợp sao
(hoặc màu) của ảnh
ột phần tử ảnh.
Chương 1: Giới Thiệu Xử Lý Ảnh
11
b. Biểu diễn
ả
nh
• Ảnh có thể xem là một hàm 2 biến chứa các thông tin như biểu diễn của một
ảnh. Các mô hình biểu diễn ảnh cho ta một mô tả logic hay ñịnh lượng của hàm
này. Dựa vào phần tử ñặc trưng của ảnh ñó là pixel. Giá trị pixel có thể là
một giá trị vô hướng, hoặc là 1 vector (3 thành phần trong trường hợp ảnh màu).
• Ta có thể biểu diễn ảnh bằng hàm toán học, hoặc các ma trận ñiểm. Trong
mô hình toán học, ảnh hai chiều ñược biểu diễn nhờ các hàm hai biến, ñó là
),(.),(),( lnkmlkSnmS
k l
−−=
∑ ∑
∞
−∞=
∞
−∞=
δ
(1.1)
Với
0
m,k
M
1, 0
n,l
N
1
c. Biểu diễn bằng hàm toán
• S: ảnh
• (m,n): Tọa ñộ của Pixel trong miền không gian (2D)
• s(m,n): ðộ sáng (Mức xám) của pixel (m,n).
• [0-Lmax
]: Thang mức xám - Vùng các mức xám ñược phép sử dụng. L
max
thường l
à 255, nghĩa là chúng ta sử dụng thang mức xám 8 bit. 0≤s(m,n)≤255.
Với
0
m
M
1, 0
n
N
1
, ta gọi ñó là ảnh số M x N
d.
Biểu diễn bằng ma trận
ñ
i
ể
m
Hình
1.12 a. Ảnh thật 10x10; b. Ảnh ñược zoom; c. Mô tả ảnh bằng ma trận
ñ
i
ể
m
e. Mô hình hóa
ả
nh
• Mô hình cảm nhận ảnh: Là mô hình biểu diễn thông qua các thuộc tính cảm nhận
ảnh (màu sắc, cường ñộ sáng), các thuộc tính về thời gian, các cảm nhận về phối
cảnh, bố cục.
Chương 1: Giới Thiệu Xử Lý Ảnh
12
• Mô hình cục bộ: Là mô hình biểu diễn thể hiện mối tương quan cục bộ của các
phần tử ảnh (ứng dụng cho các bài toán xử lý và nâng cao chất lượng ảnh).
• Mô hình tổng thể: Là mô hình biểu diễn ảnh xem ảnh như là một tập hợp các ñối
tượng, và các ñối tượng này có mối quan hệ không gian với nhau (ứng dụng cho
các bài toán phân nhóm và nhận dạng ảnh).
1.2.2 ðộ phân giải của ảnh (Resolution)
a. ðịnh nghĩa
ðộ phân giải (Resolution) của ảnh là mật ñộ ñiểm ảnh ñược ấn ñịnh trên
một ảnh số ñược hiển thị.
Theo ñịnh nghĩa, khoảng cách giữa các ñiểm ảnh phải ñược chọn sao cho
mắt người vẫn thấy ñược sự liên tục của ảnh. Việc lựa chọn khoảng cách thích
hợp tạo nên một mật ñộ phân bố, ñó chính là ñộ phân giải và ñược phân bố theo
trục x và y trong không gian hai chiều.
b. Ví dụ
ðộ phân giải của ảnh trên màn hình CGA (Color Graphic Adaptor) là
một lưới ñiểm theo chiều ngang màn hình: 320 ñiểm, chiều dọc 200 ñiểm ảnh
(320*200). Rõ ràng, cùng màn hình CGA 12” ta nhận thấy mịn hơn màn hình
CGA 17” ñộ phân giải 320*200. Lý do: cùng một mật ñộ (ñộ phân giải) nhưng
diện tích màn hình rộng hơn thì ñộ mịn (liên tục của các ñiểm) kém hơn.
1.2.3 Mức xám của ảnh (grey Level)
Một ñiểm ảnh (pixel) có hai ñặc trưng cơ bản là vị trí (x, y) của ñiểm ảnh và ñộ
xám của nó. Dưới ñây chúng ta xem xét một số khái niệm và thuật ngữ thường dùng
trong xử lý ảnh.
a. ðịnh nghĩa: Mức xám của ñiểm ảnh là cường ñộ sáng của nó ñược gán bằng giá
trị số tại ñiểm ñó.
b. Các thang giá trị mức xám thông thường: 16, 32, 64, 128, 256 (Mức 256 là
mức phổ dụng. Lý do: từ kỹ thuật máy tính dùng 1 byte (8 bit) ñể biểu diễn
mức xám: Mức xám dùng 1 byte biểu diễn: 2
8
=256 mức, tức là từ 0 ñến 255).
c. Ảnh ñen trắng: là
xám ở các ñiểm
ảnh
d. Ảnh nhị phân:
ảnh
mức
khác nhau. Nói
hoặc 1.
e. Ảnh màu: trong k
h
thế giới màu, ngườ
i
màu: 2
8*3
=2
24
≈
16,
thêm thông tin về c
ác
1.2.4 ð
ịnh nghĩa ảnh số
Ảnh số là tập hợ
p các
ảnh thật
1.2.5 Quan h
ệ giữa các ñi
Một ảnh số giả sử
ñư
cặp ñiểm ảnh có quan h
ệ v
sau
a. Các lân cận của
ñi
Giả sử có ñi
ể
chiều ñứng
và ngang
Bắc).
{(x-1, y)
;
trong ñó: số
1
Các lân cận
ché
là 4 hướng: ðông-
Na
Chương 1
13
ảnh có hai màu ñen, trắng (không chứa
ảnh
có thể khác nhau.
ảnh
chỉ có 2 mức ñen trắng phân biệt tức
dù
. Nói c
ách khác: mỗi ñiểm ảnh của
ảnh nhị p
h
uôn khổ lý thuyết ba màu (Red,
Blue,
i
ta thường dùng 3 byte ñể mô tả mức m
àu
16,7
triệu màu.
Chúng ta cần ñọc thêm
sá
ác khái n
iệm này.
nh số
p các ñi
ểm ảnh với mức xám phù hợp dù
ng ñ
các ñiểm ảnh
ñư
ợc biểu diễn bằng hàm f(x, y). Tập
con
ệ v
ới nhau ký hiệu là p, q. Chúng ta nêu
m
ñi
ểm ảnh (Image Neighbors)
ể
m ảnh p tại toạ ñộ (x, y). p có 4 ñiểm
lân
ngang (có t
hể coi như lân cận 4 hướng
chính:
;
(x, y-1); (x, y+1); (x+1, y)} = N
4
(p)
1
là giá trị logic; N
4
(p) tập 4 ñiểm lân c
ận củ
Hình 1.13 Lân cận 4
chéo:
Các ñiểm lân cận chéo N
P
(p) (Có
th
Na
m, ðông-Bắc, Tây-Nam, Tây-Bắc)
g 1
: Giới Thiệu Xử Lý Ảnh
màu khác) với mức
dùng 1
bit mô tả 2
1
nhị p
hân chỉ có thể là 0
Blue,
Green) ñể tạo nên
àu,
khi ñó các giá trị
sá
ch tham khảo ñể có
ng ñ
ể mô tả ảnh gần với
con
các ñiểm ảnh là S;
m
ột số các khái niệm
lân
cận gần nhất theo
chính: ðôn
g, Tây, Nam,
(1.2)
ận của
p.
th
ể coi lân cận chéo
N
p
(p)
= {
Tập kết hợp:
N
Chú ý: Nếu (
x,
b. Các mối liên k
ết ñiểm
Các mối liên
k
tượng vật thể hoặc
xá
tính liền kề giữa
các
Giả sử V là t
ập
từ thang mức xám t
ừ
V={32,
33
Có 3 loại li
ên k
− Liên kết 4:
Hai
cường ñộ sán
g
− Liên kết 8:
Hai
thuộc N
8
(p)
− Liên kết m
(liê
ñộ sáng V ñư
ợ
o q thuộc
N
o q thu
ộc N
c. ðo khoảng cách gi
ữa
− ðịnh nghĩa:
Kh
ñộ (s, t) là hà
m
o D(p,q)
≥ 0
Chương 1
14
= {
(x+1, y+1); (x+1, y-1); (x-1, y+1); (x-
1, y
N
8
(p) = N
4
(p) + N
P
(p) là tập hợp 8 lân c
ận
Hình 1.13 Lân cận 8
x,
y) nằm ở biên (mép) ảnh; một số ñiểm s
ẽ
ñiểm
ảnh
k
ết ñược sử dụng ñể xác ñịnh giới hạn (
B
xác
ñịnh vùng trong một ảnh. Một liên k
ết
các
ñiểm và mức xám của chúng.
ập
các giá trị mức xám. Một ảnh có các
giá
ừ 32 ñến 64 ñ
ược mô tả như sau :
33, … ,
63,64}.
ên k
ết:
Hai
ñiểm ảnh p và q ñược nói là liên
k
g
V nếu q nằm trong một các lân cận của
p
Hai ñi
ểm ảnh p và q nằm trong một cá
c lân
(liên
kết hỗn hợp): Hai ñiểm ảnh p và q
v
ợ
c nói là liên kết m nếu.
N
4
(p) hoặc
c N
P
(p)
ữa
các ñiểm ảnh
Kho
ảng cách D(p, q) giữa hai ñiểm ảnh
p
m kho
ảng cách (Distance) hoặc Metric n
ếu:
≥ 0
(Với D(p,q)=0 nếu và chỉ nếu p=q)
g 1
: Giới Thiệu Xử Lý Ảnh
1, y
-1)} (1.3)
ận của ñiểm
ảnh p.
ẽ n
ằm ngoài ảnh.
Bound
aries) của ñối
ết
ñược ñặc trưng bởi
giá
trị cường ñộ sáng
k
ết 4 với các giá trị
p
, tức q thuộc N
4
(p)
c lân c
ận 8 của p, tức q
v
ới các giá trị cường
p
toạ ñộ (x, y), q toạ
ếu:
Chương 1: Giới Thiệu Xử Lý Ảnh
15
o D(p,q) = D(q,p)
o D(p,z) ≤ D(p,q) + D(q,z); z là một ñiểm ảnh khác.
− Khoảng cách Euclide: Khoảng cách Euclide giữa hai ñiểm ảnh p(x, y) và
q(s, t) ñược
ñịnh nghĩa như sau:
( )
2
2
)(),( tysxqpD
e
−+−= (1.4)
− Khoảng cách khối: Khoảng cách D
4
(p, q) ñược gọi là khoảng cách khối ñồ
thị (Block Distance) và ñược xác ñịnh như sau:
tysxqpD −+−=),(
4
(1.5)
Giá trị khoảng cách giữa các ñiểm ảnh r: giá trị bán kính r giữa ñiểm ảnh từ
tâm ñiểm ảnh ñến tâm ñiểm ảnh q khác. Ví dụ: Màn hình CGA 12”
(12”*2,54cm=30,48cm=304,8mm) ñộ phân giải 320*200; tỷ lệ 4/3 (Chiều
dài/Chiều rộng). Theo ñịnh lý Pitago về tam giác vuông, ñường chéo sẽ lấy tỷ
lệ 5 phần (5/4/3: ñường chéo/chiều dài/chiều rộng màn hình); khi ñó ñộ dài thật
là (305/244/183) chiều rộng màn hình 183mm ứng với màn hình CGA 200 ñiểm
ảnh theo chiều dọc. Như vậy, khoảng cách ñiểm ảnh lân cận của CGA 12” là ≈
1mm. Khoảng cách D
8
(p, q) còn gọi là khoảng cách bàn cờ (Chess-Board
Distance) giữa ñiểm ảnh p, q và ñược xác ñịnh như sau:
(
)
tysxqpD −−= ,max),(
8
(1.6)
1.2.6 Các thành phần cơ bản của hệ thống xử lý ảnh
Theo quan ñiểm của quy trình xử lý, chúng ta ñã thể hiện các khối cơ bản trên
Hình 1.1, các khối chi tiết và luồng thông tin trên Hình 1.2. Theo quan ñiểm của hệ
thống xử lý trên máy tính số, hệ thống gồm các ñầu ño (thu nhận ảnh): bộ số hóa,
máy tính số, bộ hiển thị, bộ nhớ. Các thành phần này không nhắc lại ở ñây (ñọc thêm
giáo trình cấu trúc máy tính).
Một hệ thống xử lý ảnh cơ bản có thể gồm: máy tính cá nhân kèm theo vỉ
mạch chuyển ñổi ñồ hoạ VGA hoặc SVGA, ñĩa chứa các ảnh dùng ñể kiểm tra các
thuật toán và một màn hình có hỗ trợ VGA hoặc SVGA. Nếu ñiều kiện cho phép, nên
có một hệ thống như Hình 1.14. bao gồm một máy tính PC kèm theo thiết bị xử lý ảnh.
Nối với cổng vào của thiết bị thu nhận ảnh là một video camera và cổng ra nối với một
Chương 1: Giới Thiệu Xử Lý Ảnh
16
màn hình. Thực tế, phần lớn các nghiên cứu của chúng ta ñược ñưa ra trên ảnh mức
xám (ảnh ñen trắng). Bởi vậy, hệ thống sẽ bao gồm một thiết bị xử lý ảnh ñen trắng và
một màn hình ñen trắng.
Ảnh mức xám ñược áp dụng trong nhiều lĩnh vực như sinh vật học hoặc
trong công nghiệp. Thực tế chỉ ra rằng bất kỳ ứng dụng nào trên ảnh, mức xám cũng
ứng dụng ñược trên ảnh màu. Với lý do ñó, hệ thống ban ñầu nên chỉ bao gồm các
thiết bị thu nhận và hiển thị ảnh ñen trắng. Với ảnh màu, nên sử dụng một hệ thống
mới, trừ trường hợp nếu cần một camera TV màu và một màn hình ña tần số (ví dụ
như NEC MultiSync, Sony Multiscan, hoặc Mitsubishi Diamond Scan) ñể hiển thị ảnh
màu. Nếu khả năng hạn chế, có thể dùng PC kèm theo
vỉ mạch VGA và màn hình
VGA, ñể dựng ảnh ñược.
Hình 1.14 Hệ thống xử lý ảnh
1.3 Những vấn ñề khác trong xử lý ảnh
1.3.1 Biến ñổi ảnh (Image Transform)
Trong xử lý ảnh do số ñiểm ảnh lớn các tính toán nhiều (ñộ phức tạp tính toán
cao) ñòi hỏi dung lượng bộ nhớ lớn, thời gian tính toán lâu. Các phương pháp khoa
học kinh ñiển áp dụng cho xử lý ảnh hầu hết khó khả thi. Người ta sử dụng các phép
toán tương ñương hoặc biến ñổi sang miền xử lý khác ñể dễ tính toán. Sau khi xử lý
Chương 1: Giới Thiệu Xử Lý Ảnh
17
việc thực hiện sẽ dễ dàng hơn, dùng biến ñổi ngược ñể ñưa về miền xác ñịnh ban ñầu,
các biến ñổi thường gặp trong xử lý ảnh gồm:
• Biến ñổi Fourier, Cosin, Sin
• Biến ñổi (mô tả) ảnh bằng tích chập, tích Kronecker.
• Các biến ñổi khác như KL (Karhumen Loeve), Hadamard.
• Một số công cụ xác suất thống kê cũng ñược sử dụng trong xử lý ảnh. Do
khuôn khổ tài liệu hướng dẫn có hạn, sinh viên ñọc thêm các tài liệu tham
khảo ñể nắm ñược các phương pháp biến ñổi và một số phương pháp khác
ñược nêu ở ñây.
1.3.2 Nén ảnh (Image Compression)
Ảnh dù ở dạng nào vẫn chiếm không gian nhớ rất lớn. Khi mô tả ảnh người ta ñã
ñưa kỹ thuật nén ảnh vào. Các giai ñoạn nén ảnh có thể chia ra thế hệ 1, thế hệ 2.
• Mục ñích: giảm không gian lưu trữ, thuận tiện truyền thông trên mạng.
• Phương pháp: nén không mất thông tin, nén mất thông tin
− Nén không mất thông tin (nén chính xác): khai thác các thông tin dư
thừa.
− Nén mất thông tin: khai thác các thông tin dư thừa và các thông tin
không quan trọng.
• Hiện nay có một số chuẩn nén hay dùng: JPEG, MPEG (JPEG-2000,
MPEG-4).