Chương 2: Thu Nhận Ảnh
18
Chương 2
THU NHẬN ẢNH
2.1 Các thiết bị thu nhận ảnh
Hai thành phần cho công ñoạn này là linh kiện nhạy với phổ năng lượng ñiện từ
trường, loại thứ nhất tạo tín hiệu ñiện ở ñầu ra tỷ lệ với mức năng lượng mà bộ cảm
biến (ñại diện là camera); loại thứ hai là bộ số hoá (hình 2.1)
Hình 2.1 Sơ ñồ quá trình xử lý ảnh
2.1.1 Bộ cảm biến ảnh
Máy chụp ảnh, camera có thể ghi lại hình ảnh (phim trong máy chụp,
vidicon trong camera truyền hình). Có nhiều loại máy cảm biến (Sensor) làm việc
với ánh sáng nhìn thấy và hồng ngoại như: Micro Densitometers, Image Dissector,
Camera Divicon, linh kiện quang ñiện bằng bán dẫn. Các loại cảm biến chụp ảnh dạng
số hoá phải là phim âm bản. Camera divicon và linh kiện bán dẫn quang ñiện có thể
cho ảnh ghi trên băng từ hoặc ảnh số hoá. Trong Micro Densitometer phim và ảnh
chụp ñược gắn trên mặt phẳng hoặc cuốn quang trống. Việc quét ảnh thông qua tia
sáng (ví dụ tia Laser) trên ảnh ñồng thời dịch chuyển mặt phim hoặc quang trống
tương ñối theo tia sáng. Trường hợp dùng phim, tia sáng ñi qua phim.
Bây giờ chúng ta ñề cập ñến tất cả các khối trong hệ thống.
a. Thiết bị nhận ảnh
Chức năng của thiết bị này là số hóa một băng tần số cơ bản của tín hiệu
truyền hình cung cấp từ một camera, hoặc từ một ñầu máy VCR. Ảnh số sau ñó
Chương 2: Thu Nhận Ảnh
19
ñược lưu trữ trong bộ ñệm chính. Bộ ñệm này có khả năng ñược ñịa chỉ hóa
(nhờ một PC) ñến từng ñiểm bằng phần mềm. Thông thường thiết bị này có
nhiều chương trình con ñiều khiển ñể có thể lập trình ñược thông qua ngôn ngữ
C. Khi mua một thiết cần chú ý các ñiểm sau:
•
Thiết bị có khả năng số hóa ảnh ít nhất 8 bit (256 mức xám) và ảnh thu ñược phải
có kích thước ít nhất là 512×512 ñiểm hoặc hơn. Thiết bị phải chứa một bộ ñệm
ảnh ñể lưu trữ một hoặc nhiều ảnh có ñộ phân giải 512×512 ñiểm ảnh.
•
Thiết bị phải ñược kèm một bộ ñầy ñủ thư viện các chương trình con có khả năng
giao diện với các chương trình C viết bằng Turbo C hoặc Microsoft C.
•
Sổ tay hướng dẫn sử dụng phải ñược kèm theo, gồm cả dạng chứa trên ñĩa và khi
in.
•
Một số thiết bị cho phép tuỳ chọn sử dụng cả hai chế ñộ văn bản và ñồ hoạ trên
cùng một màn hình hoặc hai màn hình riêng biệt. Mặc dù chi tiết này là không cần
thiết, nhưng nó sẽ rất có giá trị trong trường hợp bị giới hạn về không gian lắp ñặt
hoặc khả năng tài chính.
b. Camera
Tổng quát có hai kiểu camera: kiểu camera dùng ñèn chân không và kiểu
camera chỉ dùng bán dẫn. ðặc biệt là trong lĩnh vực này, camera bán dẫn thường
hay ñược dùng hơn camera ñèn chân không. Camera bán dẫn cũng ñược gọi là
CCD camera do dùng các thanh ghi dịch ñặc biệt gọi là thiết bị gộp (Charge-
Coupled Devices- CCDs). Các CCD này chuyển các tín hiệu ảnh sang từ bộ cảm
nhận ánh sáng bổ trợ ở phía trước camera thành các tín hiệu ñiện mà sau ñó
ñược mã hóa thành tín hiệu TV. Loại camera chất lượng cao cho tín hiệu ít nhiễu
và có ñộ nhạy cao với ánh sáng. Khi chọn camera cần chú ý ñến các thấu kính từ
18 ñến 108 mm.
c. Màn hình video
Một số nhà sản xuất (như Sony) sản xuất các loại màn hình ñen trắng chất
lượng cao. Nên sử dụng loại màn hình chất lượng cao, vì màn hình chất lượng
thấp có thể làm bạn nhầm lẫn kết quả. Một màn hình 9 inch là ñủ cho yêu cầu
làm việc. ðể hiển thị ảnh màu, nên dùng một màn hình ña hệ.
Chương 2: Thu Nhận Ảnh
20
d. Máy tính
Cần có một máy tính P4 hoặc cấu hình cao hơn. ðể chắc chắn, các máy
này phải có sẵn các khe cắm cho phần xử lý ảnh. Các chương trình thiết kế và
lọc ảnh có thể chạy trên bất kỳ hệ thống nào. Các chương trình con hiển thị ảnh
dựng vỉ mạch VGA và có sẵn trên ñĩa kèm theo. Các chương trình con hiển thị
ảnh cũng hỗ trợ cho hầu hết các vỉ mạch SVGA
2.1.2 Hệ tọa ñộ màu
a. Khái niệm
Năm 1931: CIE (Commision Internationale de l’Éclairage) xây dựng màu
cơ sở chuẩn quốc tế:
•
Cho phép các màu khác ñược ñịnh nghĩa như tổng trọng lượng của ba màu
cơ sở.
•
Do không tồn tại 3 màu cơ sở chuẩn trong phổ nhìn thấy ñể tổng hợp màu
mới → CIE sử dụng các màu tưởng tượng.
•
Mỗi màu cơ sở trong CIE ñược xác ñịnh bằng ñường cong phân bổ năng
lượng.
•
Nếu A, B, C là tổng số các màu cơ sở chuẩn cần xác ñịnh màu cho trước
trong phổ nhìn thấy thì các thành phần của màu sẽ là:
;
C
B
A
A
x
++
=
;
C
B
A
B
y
++
=
C
B
A
C
Z
++
=
(2.1)
Nhưng x+y+z=1 cho nên chỉ cần 2 giá trị có thể xác ñịnh màu mới
•
Cho khả năng biểu diễn mọi màu trên biểu ñồ 2D -> Biểu ñồ CIE
b. Biểu ñồ CIE
Khi vẽ các giá trị x, y của màu trong phổ nhìn thấy -> Biểu ñồ CIE là ñường
cong hình lưỡi (còn gọi là biểu ñồ kết tủa – CIE Chromaticity Diagram). Các
ñiểm màu gán nhãn trên ñường cong từ violet (400 nm) ñến red (700 nm). ðiểm
C tương ứng màu trắng (ánh sáng ban ngày). Biểu ñồ CIE là phương tiện lượng
hóa ñộ tinh khiết và bước sóng trội:
•
ðộ tinh khiết của ñiểm màu C1: ñược xác ñịnh bằng khoảng cách tương ñối
của ñoạn thẳng nối C với ñường cong qua C1.
Chương 2: Thu Nhận Ảnh
21
•
Màu bù: biểu diễn bởi 2 ñiểm cuối C3, C4 của ñoạn thẳng ñi qua C.
•
Gam màu xác ñịnh bởi 2 ñiểm: biểu diễn bởi ñoạn thẳng nối hai ñiểm màu
C5, C6.
•
Gam màu xác ñịnh bởi 3 ñiểm: ba ñiểm C7, C8, C9 chỉ xác ñịnh màu trong
tam giác.
Hình 2.2 Hình vẽ biểu ñồ màu
CIE
Tổ chức quốc tế về chuẩn hóa màu CIE cũng ñưa ra một số chuẩn ñể biểu
diễn màu. Các hệ này có các chuẩn riêng. Hệ chuẩn màu CIE-RGB dùng 3 màu
cơ bản R, G, B và ký hiệu RGB
CIE
ñể phân biệt với các chuẩn khác. Như ñã nêu
trên, một màu là tổ hợp của các màu cơ bản theo một tỷ lệ nào ñó. Như vậy, mỗi
pixel ảnh màu ký hiệu P
x
, ñược viết: (T: trong công thức dưới ñây là ký hiệu
chuyển vị)
P
=
[
red
,
green
,
blue
]
T
TT
T
(2.2)
Người ta dùng hệ tọa ñộ ba màu R-G-B (tương ứng với hệ tọa ñộ x-y-z) ñể
biểu diễn màu như sau:
Trong cách bi
ểu
ñỏ + l
ục +
Công thức n
ày g
ba ñường ñứt ño
ạn gọ
tính bởi:
trắng
CIE
=
c. Bi
ến ñổi hệ tọa ñộ m
Hệ tọa ñộ m
àu d
bi
ểu diễn hết các m
người ta ñ
ưa ra các h
Thí dụ:
•
Mô hình màu R
TV.
•
Mô hình HSV: N
•
Mô hình
CYK: M
Vi
ệc chuyển ñổ
nguyên t
ắc sau: Nếu
gian biểu diễn m
àu m
χ’ = Aχ
d. Quan niệm về màu
H
ọa sỹ vẽ tranh
chất màu ñen ñ
ể có s
Chư
22
Hình 2.3 Hệ tọa ñộ RGB
ểu diễn n
ày ta có công thức:
c + l
ơ =1
ày g
ọi là công thức Maxwell. Trong h
ình trê
ạn gọi l
à tam giác Maxwell. Màu tr
ắng trong h
=
(ñỏ
CIE
+ lục
CIE
+ lơ
CIE
) = 1
ộ m
àu
àu do CIE ñ
ề xuất có tác dụng như m
ột hệ q
các m
àu. Trên thực tế, phụ thuộc vào các
ứn
các h
ệ biểu diễn màu khác nhau.
màu RGB: ánh sáng Red, Green và Blue
ứ
ng d
SV: Nh
ận thức của con người.
YK: Máy in.
ển ñổi giữa các không gian biểu diễn m
àu ñư
: Nếu gọi
χ là không gian biểu diễn các m
àu
àu m
ới A là ma tr
ận biểu diễn phép biến ñổi. T
trực giác
ẽ tranh m
àu bằng cách trộn các chất màu v
ới
ể có shade, tint v
à tone khác nhau:b
ắt ñầu từ
Chương 2
: Thu Nhận Ảnh
(2.3)
ình trên, tam giác t
ạo bởi
trong hệ tọa ñộ n
ày ñược
(2.4)
t hệ quy chiếu v
à không
ứng dụng khác nhau
ng d
ụng cho màn hình,
àu ñư
ợc thực hiện theo
àu ban ñ
ầu; χ’ không
ñổi. Ta có quan hệ sau:
(2.5)
ới chất m
àu trắng và
ầu từ m
àu tinh khiết, bổ
Chương 2: Thu Nhận Ảnh
23
sung ñen ñể có bóng (shade) màu. Nếu bổ sung chất màu trắng sẽ có tint khác
nhau. Bổ sung cả chất màu trắng và ñen sẽ có tone khác nhau. Cách biểu diễn
này trực giác hơn mô tả màu bằng ba màu cơ sở. Các bộ chương trình ñồ họa có
cả hai mô hình màu: cho người sử dụng dễ tương tác với màu, các thành phần
màu ứng dụng trên các thiết bị.
ðể tiện biểu diễn, các không gian màu dưới ñây ñều ñược chuẩn hóa về 1
Mọi màu ñược biểu diễn bởi không gian màu RGB ñều là sự pha trộn của 3
thành phần màu cơ bản (Red, Green, Blue).
Mô
hình
màu RGB ñược biểu diễn
bởi khối lập phương với các trục R, G, B
Nhận xét
•
Mô hình này không thể biểu diễn mọi màu trong phổ nhìn thấy
•
ðủ cho các ứng dụng máy tính
•
Màn hình máy tính và TV sử dụng mô hình này
•
ðược sử dụng rộng rãi nhất
•
ðơn giản
Xám hóa ảnh màu RGB
mức xám = 0.299R + 0.587G + 0.114B
Hoặc mức xám = 0.333R + 0.333G + 0.333B
e. Mô hình màu CMY
Gồm 3 thành phần màu cơ bản cyan, magenta, yellow. Là bù màu của
không gian GRB.
Mối quan hệ giữa 2 không gian
C = 1.0 – R
M = 1.0 - G
Y = 1.0 - B
Phương
pháp pha trộn màu trong thực tế
Chương 2: Thu Nhận Ảnh
24
Hình 2.4 Cộng và trừ màu
f. Mô hình màu CMYK
Là sự mở rộng mô hình màu CMK bằng cách thêm vào thành phần màu
Black (K). Bởi vì với thành phần màu Black tinh khiết sẽ cho ta ñộ tương phản
cao hơn.
Hình 2.5 Không gian màu CMYK
Mối quan hệ CMY và CMYK
K = min(C, M, Y)
C = C - K
M = M - K
Y = Y - K
g. Mô hình màu HSV
Thay vì chọn các phần tử RGB ñể có màu mong muốn, người ta chọn các tham
số màu: Hue, Saturation và Value (HSV)
Mô hình HSV s
ñường chéo từ
White
nón HSV.
•
Hue: Bướ
c sóng
góc từ 0
o
ñế
n 360
•
Value: Cườ
ng ñ
ñen. ðỉnh lụ
c giá
•
Saturation: Thư
diễn tỷ lệ ñộ
tinh
Nhận xét:
Mô h
cho trướ
c và V=1, S=
hay bớt ñen cho ñế
n k
2.2 Lấy mẫu và lư
ợng
2.2.1 Giới thiệu
Một ảnh f(x, y) ghi
Ảnh cần chuyển sang d
ạng
một ảnh (hay một hà
m) liê
rời rạc ñược gọi là s
ố hoá ả
•
Bướ
c 1: ðo giá t
•
Bước 2:
Ánh x
mức rời rạc g
ọ
Chư
25
Hình 2.6 Không gian màu HSV
HSV suy di
ễn từ
mô hình RGB: hãy quan sát h
White ñ
ến Black (gốc) → ta có hình lục giác, s
ử
c sóng g
ốc củ
a ánh sáng. Trong mô hình Hue
n 360
o
ng ñ
ộ hay ñộ chói ánh sáng. Value có giá tr
ị
c giác có cư
ờng ñộ màu cực ñại.
: Thư
ớc ño ñộ tinh khiết ánh sáng gố
c. S trong
tinh
khiết của màu sẽ chọn với ñộ tinh khiế
t
Mô hình HSV tr
ực giác hơn mô h
ình RGB. B
=1, S=1). thay ñ
ổi S: Bổ sung hay bớt trắ
ng, th
n khi có màu mong mu
ốn.
ợng tử hóa
ñược từ Camera là ảnh liên tục tạo nên
m
ạng thích h
ợp ñể xử lí bằng máy
tính. Phư
m) liên
tục trong không gian cũng nh
ư theo gi
hoá ảnh. V
iệc biến ñổi này có thể gồm
hai bư
o giá tr
ị trên các khoảng không gian gọi là lấ
y m
nh x
ạ cường ñộ (hoặc giá trị) ño ñược thành
ọ
i là lượng tử hoá.
Chương 2
: Thu Nhận Ảnh
n sát hình h
ộp RGB theo
ử
dụng làm ñỉnh hình
Hue
ñược biểu diễn bằng
ị
[0, 1], V=0 → màu
trong kho
ảng [0, 1]. Biểu
t
cực ñại.
GB. B
ắt ñầu từ Hue (H
ng, thay ñ
ổi V: Bổ sung
m
ặt phẳng hai chiều.
h. Phư
ơng pháp biến ñổi
heo giá tr
ị thành dạng số
ai bư
ớc:
y m
ẫu
một số hữu hạn các
Hìn
2.2.2 Lấy mẫu
(Sampling)
Lấy mẫu là m
ột quá t
ñược chuyể
n thành các gi
chọn:
•
Một là: khoả
ng l
•
Hai là: cách th
ể
Lựa chọn thứ nh
ất
chọn thứ hai liên quan ñ
ến
a. Khoảng lấy m
ẫu (Sam
•
Ảnh lấy mẫu
mẫu trong kh
ôn
mẫu một chi
ều
− )(
0
xx
δ
∫
+∞
∞−
−(
x
x
δ
•
Ti
ếp theo chúng
Chư
26
Hình 2.
6 Sơ ñồ lấy mẫu và lượng tử hóa
pling)
t quá t
rình, qua ñó ảnh ñược tạo nên trên một
vù
các giá t
rị rời rạc theo tọa ñộ nguyên.
Quá trì
ng l
ấy mẫu.
ể hiện dạng
mẫu.
ất
ñược ñảm bảo nhờ lý thuyết lấy m
ẫu
ến ñộ ño (Me
tric) ñược dùng trong miền r
ờ
Hình 2.7 Lấy mẫu ảnh Analog
u (Sampling Inter
val)
có thể ñược mô tả như việc lựa chọn
m
ôn
g gian hai chiều liên tục. ðầu tiên mô
ều
với việc sử dụng hàm
delta:
=∞
≠
=
0
00
xkhi
xkhi
∫
+
−
=−=
0
0
1)()
00
x
x
dxxxdx
x
δ
chúng ta ñịnh nghĩa h
àm răng lư
ợc với các kho
Chương 2
: Thu Nhận Ảnh
vùng có tính liên
tục
uá trình n
ày gồm 2 lựa
ẫu
của Shannon. Lựa
ờ
i rạc.
m
ột tập các vị trí lấy
tả qua quá trình lấy
(2.6)
c khoảng
∆x như sau:
Chương 2: Thu Nhận Ảnh
27
∑
+∞
−∞=
∆−=
r
xrxxComb )()(
δ
(2.7)
với r là số nguyên, ∆x là khoảng lấy mẫu
•
Như vậy, hàm răng lược là chuỗi các xung răng lược từ (-∞ ñến +∞).
Giả sử hàm một
chiều g(x) ñược mô tả (gần ñúng) bằng g(r Δx ) tức là:
(
)
xrgxg
∆
≈
)(
(2.8)
•
Khi ñó tín hiệu lấy mẫu ñược mô hình hoá
∑
+∞
−∞=
∆−==
r
s
xrxxgxcombxgxg )()()()()(
δ
(2.9)
hoặc tương ñương
∑
+∞
−∞=
∆−∆=
r
s
xrxxrgxg )()()(
δ
(2.10)
Trong
thực tế, r không thể tính ñược trong khoảng vô hạn (từ − ∞ ñến + ∞)
mà là một số lượng N∆x mẫu lớn cụ thể. Như vậy, ñể ñơn giản có thể nói hàm
liên tục g(x) có thể biểu diễn trên một miền với ñộ dài N∆x mẫu thành chuỗi như
sau
{
}
))1((), ,2(),(),0()( xNgxgxggxg
∆
−
∆
∆
≈
(2.11)
•
Chú ý 1:
Khoảng lấy mẫu (Sampling Interval) ∆x là một tham số cần phải
ñược chọn ñủ nhỏ, thích hợp, nếu không tín hiệu thật không thể khôi phục
lại ñược từ tín hiệu lấy mẫu.
•
Chú ý 2: Từ lý thuyết về xử lý tín hiệu số, (2.6) là tích chập trong miền
không gian x. Mặt khác (2.6) tương ñương với tích chập trong miền tần số
ω tức là biến ñổi Fourier của gs(x) là G
s
(ω
x
)
∑
+∞
−∞=
∆
−
∆
=
k
xxs
x
k
G
x
G )(
1
)(
ωω
(2.12)
trong ñó ω
x
là giá trị tần số ứng với giái trị x trong miền không gian.
ðiều kiện khôi phục ảnh lấy mẫu về ảnh thật ñược phát biểu từ ñịnh lý lấy
mẫu của Shannon.
Chương 2: Thu Nhận Ảnh
28
Hình 2.8 Khoảng cách lấy mẫu
b. ðịnh lý lấy mẫu của Shannon
Giả sử g(x) là một hàm giới hạn giải (Band Limited Function) và biến ñổi
Fourier của nó là G(ω
x
) = 0 ñối với các giá trị ω
x
> W
x
. Khi ñó g(x) có thể ñược
khôi phục lại từ các mẫu ñược tạo tại các khoảng ∆x ñều ñặn. Tức là:
x
x
ω
2
1
≤∆
(2.13)
•
ðịnh lý lẫy mẫu của Shannon có thể mở rộng cho không gian hai chiều.
Hàm răng lược hai chiều khi ñó ñược xác ñịnh:
)()(),( ymyxnxyxComb
n m
∆−∆−=
∑ ∑
+∞
−∞=
+∞
−∞=
δ
(2.14)
•
Hàm
lấy mẫu hai chiều thu ñược:
)()(),(),(),(),( ymyxnxyxgyxcombyxgyxg
n m
s
∆−∆−==
∑ ∑
+∞
−∞=
+∞
−∞=
δ
(2.15)
Và ∆x, ∆y ñược chọn thoả mãn các ñiều kiện tương ứng theo ñịnh lý lấy
mẫu của Shannon khi ñó sẽ
y
y
x
x
ωω
2
1
;
2
1
≤∆≤∆
(2.16)
•
Tương tự như không gian một chiều, một tín hiệu ảnh hai chiều g(x,y) có
thể xấp xỉ trong khoảng [N, M] có thể ñược ước lượng như sau:
),(),( ymxngyxg
∆
∆
≈
(2.17)
{
}
)1,1(), ,1,1(), ,1,1(),0,1(),1,0(), ,1,0(),0,0(
−
−
−
−
=
MNgNgggNggg
Chương 2: Thu Nhận Ảnh
29
c. Các dạng lấy mẫu (Tesselation)
Dạng lẫy mẫu (Tesselation) ñiểm ảnh là cách bài trí các ñiểm mẫu trong
không gian hai chiều. Một số dạng mẫu ñiểm ảnh ñược cho là dạng chữ nhật, tam
giác, lục giác. Mỗi một mẫu, ngoài việc thể hiện hình dáng còn cho biết ñặc ñiểm
liên thông của chúng. Ví dụ, mẫu chữ nhật có liên thông 4 hoặc 8 (nói về các
mẫu liền kề); mẫu lục giác có liên thông 6; mẫu tam giác có liên thông 3 hoặc 6.
a) Mẫu ñiểm ảnh chữ nhật b) Mẫu ñiểm ảnh tam giác c) Mẫu ñiểm ảnh lục giác
Hình 2.9 Các dạng mẫu ñiểm ảnh
Cần chú ý rằng tài liệu này chỉ xét các mẫu ñiểm ảnh hình chữ nhật, ñặc
biệt là dạng hình vuông. Nhiều trường hợp ứng dụng có dùng ñến các các mẫu
tam giác hoặc lục giác.
2.2.3 Lượng tử hóa (Quantization)
Lượng tử hoá là một quá trình lượng hoá tín hiệu thật dùng chung cho các loại xử
lý tín hiệu trên cơ sở máy tính. Vấn ñề này ñã ñược nghiên cứu kỹ lưỡng và có nhiều
lời giải lý thuyết dưới nhiều giả ñịnh của các nhà nghiên cứu như Panter và Dite
(1951), Max (1960), Panter (1965)
[5].
Hình 2.10 Lượng tử hóa ảnh
Các giá trị lấy mẫu Z là một tập các số thực từ giá trị Zmin ñến lớn nhất Zmax.
Mỗi một số trong các
giá
máy tính lưu trữ hoặc xử
ðịnh nghĩa: Lượng tử
h
dải hữu hạn các s
ố thực. Nó
Hình
Giả sử Z là một
giá
ảnh, và Zmin<=Z’<=Z
ma
trong các mức rời rạc: l
1
ñó, quá trình lượng tử
ho
- Z
min
) thành L khoảng,
khoảng liền kề l
i
. Họ cá
c
ñây, khi ñó sai s
ố của quá t
Z
le
iq
−=
2.3 Một số ph
ương phá
Sau bước số hóa,
ảnh
khi ñề cập ñến vấn ñề
lưu
Chư
30
giá
trị mẫu Z cần phải biến ñổi thành một t
ập
lý.
h
oá là ánh xạ từ các số thực mô tả giá tr
ị
ực. Nói cách khác,
ñó là quá trình số hoá bi
ên
ình 2.
11 Khoảng lượng tử theo L mức xám.
giá
trị lấy mẫu (số thực) tại vị trí nào
max
và giả sử chúng ta muốn lượ
ng hoá gi
1
, l
2
,…l
n
tương ứng với Z
min
ñến Z
m
a
hoá
có thể thực hiện
bằng cách chia toàn
mỗi khoảng là ∆l
và khoảng thứ i ñược
ñ
c
giá trị z ñược thực hiện và mô tả bằng l
i
a quá tr
ình lấy mẫu có thể ñược xác ñịnh theo
:
Z
Hình 2.12 Tín hiệu lượng tử hóa
ng pháp
biểu diễn ảnh
ảnh
sẽ ñược lưu trữ hay chuyển sang giai
ño
lưu tr
ữ ảnh, cần xem xét ảnh sẽ ñược biểu
Chương 2
: Thu Nhận Ảnh
ập
hữu hạn số bit ñể
ị
lấy mẫu thành một
ên
ñộ.
ñó của mặt phẳng
hoá giá tr
ị ñó thành một
a
x
(Hình 2.11). Khi
bộ miền vào (Z
max
ñ
ặt tại ñiểm giữa các
i
theo quá trình trên
:
(2.18)
ño
ạn phân tích. Trước
diễn ra sao trong bộ
Chương 2: Thu Nhận Ảnh
31
nhớ máy tính. Chương 1 ñã giới thiệu tổng quan về các phương pháp biểu diễn ảnh.
Dưới ñây giới thiệu một số phương pháp biểu diễn thường dùng chi tiết và tường minh
hơn:
•
Biểu diễn mã loạt dài (Run-length Code)
•
Biểu diễn mã xích (Chain Code)
•
Biểu diễn mã tứ phân (Quad Tree Code)
2.3.1 Mã loạt dài (Run-length Code)
Phương pháp này hay dùng ñể biểu diễn cho vùng ảnh hay ảnh nhị phân. Một
vùng ảnh R
có thể biểu diễn ñơn giản nhờ một ma trận nhị phân:
≠
∈
=
0
),(1
),(
Rnmkhi
nmu
(2.19)
Với các biểu diễn trên, một vùng ảnh hay ảnh nhị phân ñược xem như chuỗi 0
hay 1 ñan xen. Các chuỗi này ñược gọi là mạch (run). Theo phương pháp này, mỗi
mạch sẽ ñược biểu diễn bởi ñịa chỉ bắt ñầu của mạch và chiều dài mạch theo dạng
{<hàng,cột>, chiều dài}.
Hình 2.13 Mã hóa loạt dài ảnh
2.3.2 Mã xích (Chain Code)
Mã xích thường ñược dùng ñể biểu diễn biên của ảnh. Thay vì lưu trữ toàn bộ
ảnh, người ta lưu trữ dãy các ñiểm ảnh như A, B…M. Theo phương pháp này, 8
hướng của vectơ nối 2 ñiểm biên liên tục ñược mã hóa. Khi ñó ảnh ñược biểu diễn qua
ñiểm ảnh bắt ñầu A cùng với chuỗi các
từ mã. ðiều này ñược minh họa trong hình
dưới ñây:
Chương 2: Thu Nhận Ảnh
32
Hình 2.14 Mã xích
•
Ảnh vào mô tả 8x8 bytes = 64 bytes
•
Hướng và vị trí tương ứng: 0 7 6 6 6 5 5 3 3 2 1 2 1
•
Theo cách biểu diễn mã xích có13 bytes
2.3.3 Mã tứ phân (QuadTree Code)
Theo phương pháp mã tứ phân, một vùng ảnh coi như bao kín một hình chữ
nhật. Vùng này ñược chia làm 4 vùng con (Quadrant). Nếu một vùng con gồm toàn
ñiểm ñen (1) hay toàn ñiểm trắng (0) thì không cần chia tiếp. Trong trường hợp
ngược lại, vùng con gồm cả ñiểm ñen và trắng gọi là vùng không ñồng nhất, ta tiếp
tục chia thành 4 vùng con tiếp và kiểm tra tính ñồng nhất của các vùng con ñó. Quá
trình chia dừng lại khi mỗi vùng con chỉ chứa thuần nhất ñiểm ñen hoặc ñiểm trắng.
Quá trình ñó tạo thành một cây chia theo bốn phần gọi là cây tứ phân. Như vậy, cây
biểu diễn ảnh gồm một chuỗi các ký hiệu b (black), w (white) và g (grey) kèm theo
ký hiệu mã hóa 4 vùng con. Biểu diễn theo phương pháp này ưu việt hơn so với các
phương pháp trên, nhất là so với mã loạt dài. Tuy nhiên, ñể tính toán số ño các hình
như chu vi, mô men là tương ñối khó khăn.
Hình 2.15 Cây tứ phân
Chương 2: Thu Nhận Ảnh
33
2.4 Các ñịnh dạng ảnh cơ bản
2.4.1 Khái niệm chung
Ảnh thu ñược sau quá trình số hóa thường ñược lưu lại cho các quá trình xử lý
tiếp theo hay truyền ñi. Trong quá trình phát triển của kỹ thuật xử lý ảnh, tồn tại nhiều
ñịnh dạng ảnh khác nhau từ ảnh ñen trắng (với ñịnh dạng IMG), ảnh ña cấp xám
cho ñến ảnh màu: (BMP, GIF, JPEG…). Tuy các ñịnh dạng này khác nhau, song
chúng ñều tuân theo một cấu trúc chung nhất. Nhìn chung, một tập ảnh bất kỳ thường
bao gồm 3 phần:
•
Mào ñầu tập (Header)
•
Dữ liệu nén (Data Compression)
•
Bảng màu (Palette Color)
a. Mào ñầu tập:
Mào ñầu tập là phần chứa các thông tin về kiểu ảnh, kích thước, ñộ phân
giải, số bit dùng cho 1 pixel, cách mã hóa, vị trí bảng màu…
b. Dữ liệu nén:
Số liệu ảnh ñược mã hóa bởi kiểu mã hóa chỉ ra trong phần Header.
c. Bảng màu:
Bảng màu không nhất thiết phải có ví dụ khi ảnh là ñen trắng. Nếu có, bảng
màu cho biết số màu dùng trong ảnh và bảng màu ñược sử dụng ñể hiển thị màu
của ảnh. Một số các ñịnh dạng khác, cấu hình, ñặc trưng của từng ñịnh dạng và
các tham số. Sinh viên có thể tham khảo thêm tài liệu khác.
2.4.2 Quy trình ñọc một tập ảnh
Trong quá trình xử lý ảnh, ñầu tiên phải tiến hành ñọc tập ảnh và chuyển vào bộ
nhớ của máy tính dưới dạng ma trận số liệu ảnh. Khi lưu trữ dưới dạng tập, ảnh là một
khối gồm một số các byte. ðể ñọc ñúng tập ảnh ta cần hiểu ý nghĩa các phần trong
cấu trúc của tập ảnh như ñã nêu trên. Trước tiên, ta cần ñọc phần mào ñầu (Header) ñể
lấy các thông tin chung và thông tin ñiều khiển. Việc ñọc này sẽ dừng ngay khi ta
không gặp ñựợc chữ ký (Chữ ký ở ñây thường ñược hiểu là một mã chỉ ra ñịnh dạng
ảnh và ñời (version của nó) mong muốn. Dựa vào thông tin ñiều khiển, ta xác ñịnh
Chương 2: Thu Nhận Ảnh
34
ñựợc vị trí bảng màu và ñọc nó vào bộ nhớ. Cuối cùng, ta ñọc phần dữ liệu nén.
Sau khi ñọc xong các khối dữ liệu ảnh vào bộ nhớ ta tiến hành nén dữ liệu
ảnh. Căn cứ vào phương pháp nén chỉ ra trong phần Header ta giải mã ñược ảnh. Cuối
cùng là khâu hiện ảnh. Dựa vào số liệu ảnh ñã giải nén, vị trí và kích thước ảnh, cùng
sự trợ giúp của bảng màu ảnh ñược hiện lên trên màn hình.
2.5 Các kỹ thuật tái hiện ảnh
2.5.1 Kỹ thuật chụp ảnh
Phương pháp sao chụp ảnh là phương pháp ñơn giản, giá thành thấp, chất lượng
cao. Sau bước chụp là kỹ thuật phòng tối nhằm tăng cường ảnh như mong muốn. Ví
dụ kỹ thuật phòng tối như: phóng ñại ảnh, thu nhỏ ảnh…, tùy theo ứng dụng. Kỹ thuật
chụp ảnh màn hình màu khá ñơn giản. Nó bao gồm các bước sau :
•
ðặt camera trong phòng tối, cách màn hình khoảng 10 feet (1feet=0,3048m)
•
Mở ống kính ñể phẳng mặt cong màn hình, do vậy ảnh sẽ dàn ñều hơn
•
Tắt phím sang tối (Brightness) và phím tương phản (Contrast) của màn hình
ñể tạo ñộ rõ cho ảnh. Các màu chói, cường ñộ cao trên ảnh sẽ giảm ñi.
•
ðặt tốc ñộ ống kính từ 1/8 ñến 1/2 giây.
2.5.2 Kỹ thuật ảnh
Người ta dùng kỹ thuật nửa cường ñộ ñể thể hiện ảnh trên sách báo, tạp chí. Theo
kỹ thuật này, một ảnh tạo nên bởi một chuỗi các ñiểm in trên giấy. Thực chất, mỗi
ñiểm ảnh thường gồm một hình vuông trắng bao quanh một chấm ñen. Do vậy, nếu
chấm ñen càng lớn ảnh sẽ càng xẫm màu. Màu xám có thể coi như chấm ñen chiếm
nửa vùng trắng. Vùng trắng là vùng gồm một chùm các ñiểm ảnh có rất ít hoặc
không có chấm ñen.
Từ ñặc ñiểm cảm nhận của mắt người, sự thay ñổi cường ñộ chấm ñen trong các
phần tử ảnh trắng tạo nên mô phỏng của một ảnh liên tục. Như vậy, mắt người cảm
nhận từ một ảnh mà màu biến ñổi từ ñen qua xám rồi ñến trắng. Tổng số cường ñộ duy
nhất hiện diện sẽ xác ñịnh các kích thước khác nhau của chấm ñen. Thông thường,
báo ảnh tạo ảnh nửa cường ñộ với ñộ phân giải từ 60 ñến 80 dpi (dot per inchs : số
ñiểm ảnh trên một inch), sách có thể in ñến 150 dpi.
Chương 2: Thu Nhận Ảnh
35
Tuy nhiên, các máy in ghép nối với máy tính không có khả năng sắp xếp các
chấm ñen có kích thước khác nhau của ảnh. Do ñó, người ta dùng một số kỹ thuật biến
ñổi như: phân ngưỡng, chọn mẫu, dithering (dithering sẽ ñịnh nghĩa dưới ñây).
a. Phân ngưỡng:
Kỹ thuật này ñặt ngưỡng ñể hiển thị các tông màu liên tục. Các ñiểm trong
ảnh ñược so sánh với ngưỡng ñịnh trước. Giá trị của ngưỡng sẽ quyết ñịnh ñiểm
có ñược hiển thị hay không. Do vậy ảnh kết quả sẽ mất ñi một số chi tiết. Có
nhiều kỹ thuật chọn ngưỡng áp dụng cho các ñối tượng khác nhau:
•
Hiển thị 2 màu: chỉ dùng ảnh ñen trắng có 256 mức xám. Bản chất của
phương pháp này là chọn ngưỡng dựa trên lược ñồ mức xám của ảnh. ðể
ñơn giản có thể lấy ngưỡng với giá trị là 127. Như vậy :
≠
<
=
0
127),(1
),(
nmhkhi
nmu
(2.20)
trong ñó u(m, n) là mức xám tại tọa ñộ i(m, n).
Nhìn chung kĩ thuật này khó
chấp nhận vì ảnh mất khá nhiều chi tiết.
•
Hiển thị 4 màu: hiện 4 màu ñể khắc phục nhược ñiểm của kỹ thuật hiển
thị 2 màu. Một ví dụ của Bảng mã 4 màu ñược cho ở Bảng 1.1
b. Kỹ thuật chọn theo mẫu
Kỹ thuật này sử dụng một nhóm các phần tử trên thiết bị ra (máy in
chẳng hạn) ñể biểu diễn một pixel trên ảnh nguồn. Các phần tử của nhóm quyết
ñịnh ñộ sáng tối của cả nhóm. Các phần tử này mô phỏng các chấm ñen trong kỹ
thuật nửa cường ñộ. Nhóm thường ñược chọn có dạng ma trận vuông. Nhóm n x
Chương 2: Thu Nhận Ảnh
36
n phần tử sẽ tạo nên n
2
+1 mức sáng. Ma trận mẫu thường ñược chọn là ma trận
Rylander. Ma trận Rylander cấp 4 có dạng như Bảng 1.2
Việc chọn kích thước của nhóm như vậy sẽ làm giảm ñộ mịn của ảnh. Vì
vậy kỹ thuật này chỉ áp dụng trong trường hợp mà ñộ phân giải của thiết bị ra lớn
hơn ñộ phân giải của ảnh nguồn. Thí dụ: thiết bị ra có ñộ phân giải 640x480
khi sử dụng nhóm có kích thước 4x4 sẽ chỉ còn 160x120.
c. Kỹ thuật Dithering
Dithering là việc biến ñổi một ảnh ña cấp xám (nhiều mức sáng tối) sang
ảnh nhị phân (hai mức sáng tối). Kỹ thuật Dithering ñựợc áp dụng ñể tạo ra ảnh
ña cấp sáng khi ñộ phân giải nguồn và ñích là như nhau. Kỹ thuật này sử dụng
một ma trận mẫu gọi là ma trận Dither. Ma trận này gần giống như ma trận
Rylander.
ðể tạo ảnh, mỗi phần tử của ảnh gốc sẽ ñược so sánh với phần tử tương
ứng của ma trận Dither. Nếu lớn hơn, phần tử ở ñầu ra sẽ sáng và ngược lại.
2.6 Khái niệm cơ bản ảnh ñen trắng và ảnh màu
Ảnh có thể biểu diễn dưới dạng tín hiệu tương tự hoặc tín hiệu số. Trong biểu
diễn số của các ảnh ña mức xám, một ảnh ñược biểu diễn dưới dạng một ma trận hai
chiều. Mỗi phần tử của
ma trận biểu diễn cho mức xám hay cường ñộ của ảnh tại vị trí
ñó
Chương 2: Thu Nhận Ảnh
37
Hình 2.16 Biểu diễn mức xám của ảnh số.
Trong hình 2.16, một lưới chia ô vuông tưởng tượng ñược ñặt lên ảnh. ðộ lớn
mỗi ô vuông của lưới xác ñịnh kích thước của một ñiểm ảnh. Mức xám của một ñiểm
ñược tính bằng cường ñộ sáng trung bình tại mỗi ô vuông này. Mắt lưới càng nhỏ thì
chất lượng ảnh càng cao. Trong kỹ thuật truyền hình tiên tiến, (mục ñích là cung cấp
cho người xem), hình ảnh cần chất lượng cao với ñộ phân giải gấp hai lần so với các
chuẩn hiện nay.
Trong kỹ thuật tương tự, một bức ảnh thường ñược biểu diễn dưới dạng các dòng
nằm ngang kế tiếp nhau. Mỗi dòng là một tín hiệu tương tự mang theo các thông tin về
cường ñộ sáng dọc theo một ñường nằm ngang trong ảnh gốc. Ảnh trên một chiếc
TV ñược hiện lên qua các dòng quét này. Mặc dù thuật ngữ "tương tự" ñược dùng ñể
mô tả cho các ảnh quét liên tiếp nhưng thực tế ảnh chỉ tương tự dọc theo hướng nằm
ngang. Nó là rời rạc khi xét theo hướng dọc và chính vì vậy mà tín hiệu ảnh là tín hiệu
lai nửa tương tự, nửa số.
Một máy truyền hình ñược thiết kế ñể thu tín hiệu truyền hình mã hoá theo tiêu
chuẩn NTSC của Mỹ có khả năng hiển thị xấp xỉ 525 dòng. Công nghệ truyền hình
tiến bộ nỗ lực ñể cung cấp cho chúng ta số lượng các dòng gấp hai lần, cho ñộ phân
giải tốt hơn là TV màn ảnh rộng. Một TV có màn ảnh lớn hơn 28 inch ñược coi là
một TV có màn ảnh rộng. Một ñiều cần chú ý là TV có khả năng hiện một số dòng
như nhau cho dù nó là 5 inch hay là 50 inch. Màn ảnh lớn nhất của loại TV dòng quét
xen kẽ mà mắt người có khả năng phân biệt ñược từ khoảng cách thông thường vào
khoảng 3 mét.
Chương 2: Thu Nhận Ảnh
38
2.6.1 Ảnh ñen trắng
Ảnh ñen trắng chỉ bao gồm 2 màu: màu ñen và màu trắng. Người ta phân mức
ñen trắng ñó thành L mức Nếu sử dụng số bit B=8 bít ñể mã hóa mức ñen trắng (hay
mức xám) thì L ñược xác ñịnh:
L=2
B
(trong ví dụ của ta L=2
8
= 256 mức) (2.21)
Nếu L bằng 2, B=1, nghĩa là chỉ có 2 mức: mức 0 và mức 1, còn gọi là ảnh nhị
phân. Mức 1 ứng với màu sáng, còn mức 0 ứng với màu tối. Nếu L lớn hơn 2 ta có ảnh
ña cấp xám.
Nói cách khác, với ảnh nhị phân mỗi ñiểm ảnh ñược mã hóa trên 1 bit, còn với
ảnh 256 mức, mỗi ñiểm ảnh ñược mã hóa trên 8 bit. Như vậy, với ảnh ñen trắng: nếu
dùng 8 bit (1 byte) ñể biểu diễn mức xám, số các mức xám có thể biểu diễn ñược là
256. Mỗi mức xám ñược biểu diễn dưới dạng là một số nguyên nằm trong khoảng từ
0 ñến 255, với mức 0 biểu diễn cho mức cường ñộ ñen nhất và 255 biểu diễn cho
mức cường ñộ sáng nhất.
Ảnh nhị phân khá ñơn giản, các phần tử ảnh có thể coi như các phần tử logic.
Ứng dụng chính của nó ñược dùng theo tính logic ñể phân biệt ñối tượng ảnh với nền
hay ñể phân biệt ñiểm biên với ñiểm khác.
2.6.2 Ảnh màu
Ảnh màu theo lý thuyết của Thomas là ảnh tổ hợp từ 3 màu cơ bản: ñỏ (R), lục
(G), lơ (B) và thường thu nhận trên các dải băng tần khác nhau. Với ảnh màu, cách
biểu diễn cũng tương tự như với ảnh ñen trắng, chỉ khác là các số tại mỗi phần tử của
ma trận biểu diễn cho ba màu riêng rẽ gồm: ñỏ (red), lục (green) và lam (blue). ðể
biểu diễn cho một ñiểm ảnh màu cần 24 bit. 24 bit này ñược chia thành ba khoảng 8
bit. Mỗi màu cũng phân thành L cấp màu khác nhau (thường L=256). Mỗi khoảng này
biểu diễn cho cường ñộ sáng của một trong các màu chính.
Do ñó, ñể lưu trữ ảnh màu người ta có thể lưu trữ từng màu riêng biệt, mỗi
màu lưu trữ như một ảnh ña cấp xám. Do ñó, không gian nhớ dành cho một ảnh màu
lớn gấp 3 lần một ảnh ña cấp xám cùng kích cỡ.