1
Xử lý ảnh
Mục tiêu:
Nắm bắt được khái niệm cơ bản về xử lý ảnh, sau đó có thể sử dụng
phần mềm xử lý ảnh, viết được một số thủ tục đơn giản về xử lý ảnh.
CHƯƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH
I-Xử lý ảnh là gì?
Ảnh số là gì:
Ảnh tạo bởi các điểm ảnh, điểm ảnh có vô vàn thứ, ví dụ như: ảnh chân dung, ảnh X-
quang, ảnh thân nhiệt. Điểm ảnh đặc trưng cho một giá trị nào đó là 1 hàm n biến.
Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ sáng. Để có thể xử
lý ảnh bằng máy tính cần thiết phải tiến hành số hoá ảnh. Trong quá trình số hoá,
ngươif ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông qua quá trình lấy mẫu
(rời rạc hoá về không gina) và lượng hoá thành phần giá trị mà về nguyên tắc bừng
mắt thường không phân biệt được 2 điểm kề nhau. Trong quá trình này người ta sử
dụng khái niệm điểm ảnh được gọi từ picture element.
Điểm ảnh hay còn gọi là pixel (picture element, pels, image elements)
được xem như là dấu hiệu hay cường độ sáng tại một toạ độ trong không gian
của đối tượng.
Ảnh được xem như là một tập hợp các điểm ảnh. Khi được số hoá nó
thường được biểu diễn là ma trận 2 chiều a[i][j] mà mỗi phần tử có một giá trị
nguyên hoặc là một véc tơ cấu trúc màu.
- Mức xám (gray level)
Mức xám là kết qu
ả sự mã hoá tương ứng một cường độ sáng của mỗi
điểm ảnh với một giá trị số-kết quả của quá trình lượng hoá.
Ví dụ: xem cả lớp là một ảnh, mỗi người là một điểm ảnh. mỗi người có một đặc
trưng. Nếu xem về đặc trưng giới tính thì ảnh có 2 mức xám là; nam và nữ. Nếu xem
năm cuối của năm sinh thì ảnh có nhiều nhất 10 mức xám.
Khái niệm điểm không có kích thước.
Ảnh Số bit/pixel Số màu
Ảnh đen trắng 1 2
Ảnh đa cấp xám 8 256
Ảnh RGB 24 256
3
Ảnh 32 bit (true
color+độ sâu)
32 256
4
-Kỹ thuật xử lý ảnh: là quá trình biến đổi một hình ảnh thành một hình
ảnh khác bằng máy tính điện tử một cách tự động phụ thuộc vào mục đích của
người sử dụng.
-Hệ thống xử lý ảnh trên máy tính: là tập hợp các kỹ thuật xử lý ảnh
phục vụ cho một mục đích ứng dụng nào đó.
-Đồ hoạ máy tính thiên về tổng hợp hình
ảnh, còn xử lý ảnh thiên về
phân tích hình ảnh.
2
Đồ hoạ máy tính:
đầu vào: là ảnh hoặc không là ảnh
đầu ra: là một ảnh trên máy tính
Xử lý ảnh:
Đầu vào: là ảnh
đầu ra: là ảnh “tốt hơn” (theo nghĩa của người sử dụng)
hoặc một đặc điểm hoặc một dãy đặc điểm
Trong đồ hoạ máy tính, đối tượng xử lý là 2 hoặc 3 chiều. Còn xử lý
ảnh không chỉ làm việc với dữ liệu 2 chiều hay 3 chiều có khi nhiề
u hơn.
- Thị giác máy: là một hệ xử lý ảnh hoàn chỉnh bao gồm thu nhận ảnh,
tăng cường chất lượng ảnh, nhận dạng.
II- Cấu trúc của hệ thống xử lý ảnh
-Thu nhận ảnh:
Ảnh có thể thu nhận qua camera (thường ảnh thu nhận qua camera là
tín hiệu tương tự cũng có thể là tín hiệu số hoá), từ vệ tinh qua các bộ cảm
ứng (sensor) hay ảnh, tranh được quét trên scanner.
Sau đó ảnh được số hoá để biến đổi tín hiệu tương tự sang tín hiệu rời
rạc (lấy mẫu) và số hoá bằng lượng hoá.
-Tiền xử lý (preprocessing): làm tốt các ảnh để nâng cao chất lượng ảnh
(xoá nhiễu, tăng cấp sáng, làm trơn các biên, lọc, tăng độ tương phản…).
Do những nguyên nhân khác nhau; có thể do chất lượng thiết bị thu nhận, do
nguồn sáng hay do nhiễu, ảnh có thể bị suy biến, do vậy cần phải tăng cường và khôi phục
lại ảnh để làm nổi bật một số đặc tính chính của ảnh, hay làm cho ảnh gần giống nhất với
trạng thái gốc- trạng thái trước khi ảnh bị biến dạng
Photoshop dừng ở giai đoạn này.
-Trích chọn dấu hiệu (Feature Extracting): phát hiện các đặc tính như
biên, phân vùng ảnh, trích chọn các đặc tính…tuỳ thuộc vào từng ứng dụng.
Mỗi đối tượng ảnh có đặc trưng riêng phụ thuộc phương pháp nhận dạng, một ứng dụng
có nhiều phương pháp nhận dạng, mỗi phương pháp nhận dạng có nhiều phương pháp
chọn dấu hiệu.
-Nhận dạng: nhận dạng chữ, vân tay,…
Nhận dạng ảnh: là quá trình liên quan đến các mô tả đối tượng mà
người ta muốn đặc tả nó.
III- Các mức độ của hệ thống xử lý ảnh
-Mức độ thấp: chỉ biết sử dụng các kỹ thuật xử lý ảnh đơn giản, thuần
tuý, không có tri thức
Thu nhận ảnh Tiền xử lý
Trích chọn
dấu hiệu
Học
Nhận dạng
Hậu xử lý
3
-Trung bình: có một chút về tri thức (trí tuệ nhân tạo)
-Cao: thu nhận ảnh, xử lý, nhận dạng, phân tích ảnh, ra quyết định.
IV-Ứng dụng của xử lý ảnh
• Văn phòng: hệ thống nhận dạng chữ, nhận dạng tiếng Anh, tiếng
Việt
Image→Table + Text + Image : nhận dạng được cả chữ, ảnh, bảng
Image→f orm
Nhận dạng chữ OCR (Optical charater Recognition),
Nhận dạng nhãn OMR (Optical Mark Recognition)
Nhận dạng tiếng Anh
Omnipage 12.0 của hang Scansoft, Fine Reader 6.0 của hang ABBRY.
Nhận dạng tiếng việt
VN Docr 3.0 của Viện CNTT, Image Scan của công ty Tcapro
• Kiểm tra sản phẩm
So sánh mầu của sản phẩm mẫu với sản phẩm mới
Kiểm tra độ tròn của chai/lọ
• Nhận dạng công nghiệp, y học, thương mại, điều tra khoáng sản
• Địa lý: véc tơ hoá bản đồ.
Các phần mềm chuyển đổi ảnh Raster sang ảnh vector
R2V của hãng Able
MapScan của Viện CNTT
TrixSystem R2V và V2R
• Hoạt hình: biến đổi hình học,
bóp méo hình học
• Quân sự
• Dự báo thời tiết, cháy rừng, lũ
lụt, sâu bệnh, khoáng sản.
• Thiên văn học, vật lý, sinh học
• An ninh
Nhận dạng vân tay,Water Marking
Nhận dạng khuôn mặt người, Nhận dạng tội phạm
Dấu thông tin trong ảnh
Chống bạo lực: dùng camera để phát hiện ra sự an toàn ở nơi công cộng
•
Siêu thị
bar code: nhận dạng mã vạch
Các robot tự động phục vụ.
• Thư viện: Dùng camera để điều khiển robot.
Ngoài ra có ứng dụng trong y học làm nổi các ảnh, trong thiên văn học để
khôi phục lại ảnh do tác động của khí quyển hay nén ảnh trong truyền đi
xa hoặc lưu trữ.
4
CHƯƠNG 2: THU NHẬN ẢNH VÀ MÔ HÌNH THỂ HIỆN ẢNH
I-Thu nhận ảnh và thông tin về ảnh
1. Thu nhận ảnh
-Các thiết bị thu ảnh thông thường gồm Camera cộng với bộ chuyển
đổi tương tự số AD (Analog to Digital), scanner, sensor.
Scaner
A4: ADF (Automatic Document Feeder), Duplex.
A3: Fujitshu, Vííonhape cầm tay
A0: Intergraph 250 µp
-Các thiết bị thu nhận ảnh này có thể cho ảnh đen trắng, đa cấp xám,
ảnh màu, có độ phân giải từ 100 đến 1600 DPI (dot per inch)
-Các thiết bị thu nhận ảnh có 2 loại chính ứng với 2 loại ảnh thông
dụng là Raster (Scaner, camera) và vector (sensor, bàn số hoá, hoặc được
chuyển từ ảnh Raster).
-Nhìn chung các hệ thống thu nhận ảnh thực hiện hai quá trình:
+ Cảm biến: biến đổi năng lượng quang học thành năng lượng điệ
n.
+Tổng hợp năng lượng điện thành năng lượng ảnh
Trong quá trình số hoá, người ta biến đổi tín hiệu liên tục sang tín hiệu
rời rạc thông qua quá trình lấy mẫu và lượng tử hoá thành phần giá trị.
*Cảm nhận màu
Phần nhạy cảm với ảnh: võng mạc (retina)
retina bao gồm hai loại tế bào: rods (dạng hình que) và cones (dạng hình nón)
cone nhạy với màu sắc.
Các tế bào que cho một hình ảnh chung về trường chiếu sáng, nó không nh
ạy
với màu sắc mà nhạy với ánh sáng có mức thấp.
• Biểu diễn màu
Ánh sáng màu là tổ hợp của ánh sáng đơn sắc. Mắt người chỉ có thể cảm
nhận được vài chục màu. Song lại có thể phân biệt tới hàng ngàn màu:
Brightness: sắc màu, còn gọi là độ chói
Hue: sắc lượng hay còn là sắc thái màu
Saturation: độ bão hoà.
Với nguồn sáng đơn sắc, độ hue tương ứng với bước sóng λ ∈[380nm, 780
nm]
5
2. Thông tin về ảnh
• Chiều rộng: số pixel/ dòng ( số byte/dòng)
• Chiều cao: số dòng
• độ phân giải: số pixel/inch thường là 300dpi (dots per inch)
• số bit/ pixel
1 bit↔ đen, trắng (2 màu)
4 bit↔16 màu
8 bit↔256 màu
n bít ↔ 2
n
màu
số bit/ pixel ≤ 8 phải có pallete màu
> 8 dùng màu trực tiếp
header palette
infor R G B
palette
i R G B
data
Pal: palette
Pal[index].R, Pal[index].G, Pal[index].B,
6
16 bit/pixel
1 5 5 5
R G B
24 bit/pixel, mỗi phần màu là một byte
8 8 8
R G B
ảnh có 3 giá trị R=G=B là ảnh đa cấp xám không cần lưu giá trị palatte vì bản
thân nó là giá trị điểm ảnh (pallete đúng bằng chỉ số giá trị điểm ảnh)
II- Mô hình màu
1-Các mô hình màu
Ánh sáng mà con người nhận biết (hay màu khác nhau) là dải tần hẹp trong
quang phổ điện từ
Xét cấu tạo của mắt và việc nhìn thì tất cả các màu đều là liên kết của 3
màu sơ cấp: đỏ (R), lục(B), lam(G). Bước sóng của 3 màu cơ bản là:
B=435,8nm; G=546,1 nm; R=700nm
a) RGB
Mô hình màu RGB được biểu diễn bởi lập phương với các trục R, G, B
Gốc biểu diễn màu đen
Tọa độ (1, 1, 1) biểu diễn màu trắng.
Tọa độ trên các cạnh trục biểu diễn các màu cơ sở.
7
Các cạnh còn lại biểu diễn màu bù cho mỗi màu cơ sở
.
Đường chéo từ (0, 0, 0) đến (1, 1, 1) là biểu diễn màu xám.
Cho 2 điểm ảnh P
1
(r
1
, g
1
, b
1
), P
2
(r
2
, g
2
, b
2
)
khoảng cách Ơcơlit giữa 2 màu
=
222
)21()21()21( bbggrr −+−+−
Khoảng cách Hamono labus
=(x-y)
T
A(x-y)
A là ma trận xác định dương x
T
Ax >0
Biểu đồ RGB thuộc mô hình cộng:
Phát sinh màu mới bằng cách cộng cường độ màu cơ sở
Gán giá trị từ 0 đến 1 cho R, G, B
Red+Blue -> Magenta (1, 0, 1)
Nhận xét
+ Mô hình này không thể biểu diễn mọi màu trong phổ nhìn thấy
+ Đủ cho các ứng dụng máy tính
+ Màn hình máy tính và TV sử dụng mô hình này
+ Được sử dụng rộng rãi nhất
+ Đơn giản
và nó được sử dụng rộng rãi nhất biểu diễn trong hệ nhị phân.
Red=4, Green=2, Blue=1, Magenta=R+B=5, Yellow=R+G=6, Cyan=G+B=3,
Black=0, White=7.
b)
CMY, CMYK:
Mô hình màu xác định bởi các màu cơ sở cyan, magenta và yellow
dành cho máy in màu. Mô hình CMY là bù của mô hình RGB.
Biểu đồ CMY thuộc loại mô hình trừ.
Black (0,0,0)
Green (0,1,0)
Cyan
(0,1,1)
White (1,1,1)
Magenta (1,0,1)
Red (1,0,0)
Blue (0,0,1)
yellow (1,1,0)
8
CMY(cộng tính)
CMYK(trừ tính)
C) HSV H (Hue) bước sóng gốc của ánh sáng
S (Saturation) thước đo độ tinh khiết ánh sáng gốc
Biểu diễn tỷ lệ tinh khiết của màu sẽ chọn với độ tinh khiết cực
đại
V (value) cường độ hay độ chói ánh sáng
Mô hình HSV suy diễn từ mô hình RGB
Hãy quan sát hình hộp RGB theo đường chéo từ White đến Black (gốc) -> ta
có hình lục giác
Sử dụng làm đỉnh hình nón HSV
⎩
⎨
⎧
≤≤
≤≤
1,0
3600
VS
H
V=0,màu đen. Đỉnh lục giác có màu cực đại
Red=(0
0
, 1, 1)
Green=(120
0
, 1, 1)
Blue=(240
0
, 1, 1)
Mô hình HSV trực giác hơn mô hình RGB
+ Bắt đầu từ Hue (H cho trước và V=1, S=1)
+ Thay đổi S: Bổ sung hay bớt trắng
+ Thay đổi V: Bổ sung hay bớt đen
9
+ Cho đến khi có màu mong muốn
Mắt người có thể phân biệt 128 Hues, 130 tints và cực đại 30 shades
(Yellow):
128 x 130 x 30 = 382 720 màu khác nhau
H ↔130 mức
S, V↔ 23 mức
Tổ hợp màu 130x23x23 là khoảng 16 triệu màu. Có thể truyền theo
kênh tivi bằng HSV nhưng trên màn hình là RGB.
d) HSI
Hue 130 mứcH
Red
Cya
Yellow
Magent
Green
White
Blue
RGB
V
S
Tones
(add
B&W)
Black
White
Tints (add
white)
Shades (add
Pure Hue
10
Saturation 23 mức S
Intension 23 mức I (cường độ sáng)
2. Chuyển đổi các mô hình màu
RGB chuyển đổi sang HSV, CMY, HIS và ngược lại.
RGB ↔ CMY
⎪
⎩
⎪
⎨
⎧
=+
=+
=+
1
1
1
YB
MG
CR
CMYK, K=min (C, M, Y )
⎪
⎩
⎪
⎨
⎧
−=
−=
−=
KYY
KMM
KCC
*********************************************************
CHƯƠNG 3: CÁC PHÉP BIẾN ĐỔI KHÔNG PHỤ THUỘC VÀO KHÔNG
GIAN VÀ CÁC PHÉP TOÁN TRÊN ĐA ẢNH
3.1. Giới thiệu
Các phép toán không phụ thuộc không gian là các phép toán toàn cục
không phụ thuộc vào vị trí của điểm ảnh.
+ Tăng giảm độ sáng
+ Điều chỉnh
+ Hiệu chỉnh độ tương phản
+ Phép toán thống kê
+ Loại bỏ nền của ảnh
+ Tách theo ngưỡng và chồng nhiều ảnh
3.2. Các phép toán không phụ thuộc không gian
* Định nghĩa: (Histogram) Biểu đồ tần suất:
Tần suất của cấp xám g là số điểm ảnh có mức xám g trong ảnh
h(g): số điểm ảnh có giá trị bằng g
h(g)= # {P| I(P)= g}
giả sử ta có ảnh I=
⎟
⎟
⎟
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎜
⎜
⎜
⎝
⎛
43210
33211
52341
57231
g 0 1 2 3 4 5 7
h(g) 1 5 4 5 2 2 1
11
0
1
2
3
4
5
6
0123457
g
h(g)
Nếu phát triển đến 256 màu các điểm sẽ liền kề nhau, tạo thành đường cong.
• Kỹ thuật 1: Tăng giảm độ sáng của ảnh
Cộng vào mọi điểm ảnh một giá trị C
I(x, y)←I(x, y) + C
C > 0 ảnh sáng lên
C< 0 ảnh tối đi.
Ví dụ: Ảnh đã bị tối đi và sáng lên
1 4 2 8 5 7 31 34 32 38 35 37
4 2 8 5 7 1 34 32 38 35 37 31
2 8 5 7 1 4
Cộng với
C=30
32 38 35 37 31 34
8 5 7 1 4 2 38 35 37 31 34 32
5 7 1 4 2 8 35 37 31 34 32 38
7 1 4 2 8 5 37 31 34 32 38 35
1 4 2 8 5 7 31 34 32 38 35 37
Chú ý: khi cộng v
ượt qua 255 thì quay lại từ 0
I(x,y) := (I(x,y)+C) MOD 256
*Kỹ thuật 2: Tăng độ tương phản
I(x, y)←α I(x, y) + β
α > 1: Độ tương phản tăng
α < 1: Độ tương phản giảm
12
1 4 2 8 5 7 20 80 40 160 100 140
4 2 8 5 7 1 80 40 160 100 140 20
2 8 5 7 1 4
nhân với
C=20 40 160 100 140 20 80
8 5 7 1 4 2 160 100 140 20 80 40
5 7 1 4 2 8 100 140 20 80 40 160
7 1 4 2 8 5 140 20 80 40 160 100
1 4 2 8 5 7 20 80 40 160 100 140
* Kỹ thuật 3: Hiệu chỉnh gamma
I(x, y)←(I(x, y))
γ
= e
γ ln(I(x, y))
γ> 1: tăng độ giãn của ảnh
γ<1: ảnh gần lại nhau
γ→ 0: ảnh tập trung
Ví dụ:
* Kỹ thuật 4: Tách ngưỡng
θ >0 : ngưỡng
Max nếu I(x, y) > θ
I(x, y)= Min nếu I(x, y) <= θ
e
γ
13
Chia ảnh thành 2 phần nền và vùng. Nếu Min=0, Max =1 thì kỹ thuật
chia ảnh thành ảnh đen trắng
tồn tại sai số
sai số: g
∈
nền, xếp g vào vùng ảnh (dính, bắt nhầm)
g
∉
nền, xếp g vào nền (đứt nét, bỏ sót)
Nhược điểm: Có thể xảy ra các sai sót nền thành ảnh hoặc ảnh thành
nền làm cho ảnh bị đứt nét hoặc dính.
Điều chỉnh θ, θ tăng thì điểm đen tăng, điểm trắng giảm
θ giảm thì điểm đen giảm, điểm trắng tăng
* Kỹ thuật 5: Bó cụm -bunching ( tách theo nhiều ng
ưỡng)
Mục đích: giảm bớt cấp xám của ảnh bằng cách nhóm lại các cấp xám
gần nhau thành cấp xám mới. Trong trường hợp hai nhóm thì chính là tách
ngưỡng
Cho một tập các ngưỡng θ
1
, θ
2
,…,θ
k
θ
i
nếu θ
i
≤ I(x,y) < θ
i+1
I(x, y)= 0 nếu I(x, y) < θ
1
Max nếu I(x, y) > θ
k
Thông thường có nhiều nhóm với kích thước khác nhau, để tổng quát
khi biến đổi người ta sẽ lấy cùng một kích thước.
Cách làm
Chia các nhóm đều nhau có cùng kích thước là bunch_size
I[i, j] = (I[i,j] DIV bunch_size)*bunch_size (đây là phép chia lấy phần
nguyên)
Ví dụ:
⎟
⎟
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎜
⎜
⎝
⎛
=
21214
19627
54312
76421
I
Bunch_size =3, khi đó ta thu được:
14
⎟
⎟
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎜
⎜
⎝
⎛
=
00003
09606
33300
66300
I
[0, 1, 2] [3, 4, 5] [6, 7, 8] [9,…]
0 3 6 9
*Kỹ thuật 6: Tách ngưỡng tự động
Chia dãy cấp xám thành 2 phần: tìm θ chia ảnh thành 2 phần.
Kỹ thuật nhằm tìm ra ngưỡng θ dựạ vào Histogram một cách tự động
theo nguyên lý vật lý. Vật thể tách làm 2 phần nếu tổng độ lệch trong từng
phần là tối thiểu.
•
Vật lý: Khi tách ra 2 phần thì xuất hiện lực hấp dẫn.
•
Cho θ =[1, 255] thì cái nào có lưc hút yếu nhất bị tách ra, do đó tìm vị trí
có lực hút yếu nhất.
•
Mômen quán tính: vị trí làm cho momen quay nhỏ nhất.
•
Hàm: giá trị cực trị địa phương
•
Thống kê: vị trí mà momen bậc 2, bậc 3 histogram bằng nhau.
•
Thông tin: entropy cực đại,
∑
p
i
log p
i
→Max (E nền + E vùng→ max,
số các điểm là cực đại cho 2 phần
• Độ lệch: σ
1
+ σ
2
→min
σ
1
độ lệch các pixel nền
σ
2
độ lệch các pixel vùng
• Đường cong
Điểm chia là điểm lồi hoặc lõm của đường cong.
Gọi t(g) số điểm ảnh có giá trị ≤ g
G là số cấp xám được xét.
P là số điểm ảnh được xét.
m(g) giá trị trung bình các điểm ảnh ≤ g
m(g) = (
∑
=
g
i
iih
0
)(
)/t(g)
i.h(i) là momen quán tính của điểm i
m(g) là moment quán tính trung bình của các điểm có mức xám ≤ g.
A(g)=t(g)/(P-t(g)) P là số điểm ảnh đang xét
B(g)=[m(g)-m(G-1)]
2
( m [G-1], G-1 ở đây là cấp xám lớn nhất)
F(g)=A(g)*B(g) - 1.
Tìm θ sao cho F(θ) = max {F(g), với g≤ G-1}
Ví dụ 1: G=9 hãy tách ngưỡng tự động ảnh này
15
P=42
1 4 2 8 5 7
4 2 8 5 7 1
0 8 5 7 1 4
0 0 7 1 4 2
0 0 0 4 2 8
0 0 0 0 8 5
0 0 0 0 0 7
g h(g) t(g) g*h(g)
∑
i*h(i)
m(g) A(g) B(g) f(g)
0 15 15 0 0 0 0.56 10.1 4.62
1
4 19 4 4 0.21 0.83
8.82
6.28
2 4 23 8 12 0.52 1.21 7.07 7.55
4 5 28 20 32 1.14 2 4.15 7.3
5 4 32 20 52 1.63 3.2 2.42 6.74
7 5 37 35 87 2.35 7.4 0.69 4.08
8 5 42 40 127 3.02 #### 0.02 ####
F(2) cho giá trị lớn nhất vì vậy ngưỡng tự động là 2
Ví dụ 2:
⎟
⎟
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎜
⎜
⎝
⎛
=
10000
21000
32100
43210
I
G=5, P=20
G h(g) t(g) g*h(g)
∑i*h(i)
m(g) A(g) B(g) f(g)
01010 0 0 0110
1 4 14 4 4 0.2857 2.333 0.51 0.19
2 3 17 6 10 0.5882 5.667 0.17 -0.04
3 2 19 6 16 0.8421 19 0.025 -0.53
4 1 20 4 20 1 ##### 0 #####
F(1) =0.19 có giá trị lớn nhất do vậy 1 chính là ngưỡng tự động
* Kỹ thuật 7: Cân bằng histogram
Ý nghĩa: dãn đều ảnh đen, trắng. Kết quả sẽ dễ nhìn hơn nhưng phân
tích khó hơn.
Cân bằng lý tưởng: với mọi g, g’: g ≠ g’ thì h(g)=h(g’).
16
Trong trường hợp không cân bằng, chia Histogram thành các đoạn và
các vùng chia là xấp xỉ bằng nhau (về số điểm trong Histogram)
t(g): là số điểm ≤ g
t(g) = Sum( h(i); 0 ≤i≤ g)
M, N là kích thước của ảnh I
New_level: là số cấp xám cần cân bằng.
f(g)= max (0, round( (t(g)/(M*N))*new_level-1) )
đặt TB=(M*N)/new_level
Khi đó f(g) = max (0, round(t(g)/TB-1))
Ví dụ: Cho I và new_level=6, hãy cân bằng histogram
1 4 2 8 5 7 g h(g) t(g) f(g)
4 2 8 5 7 1 0 15 15 1
0 8 5 7 1 4 1 4 19 2
0 0 7 1 4 2 2 4 23 2
0 0 0 4 2 8 4 5 28 3
0 0 0 0 8 5 5 4 32 4
0 0 0 0 0 7 7 5 37 4
2 3 2 5 4 4 8 5 42 5
3 2 5 4 4 2
1 5 4 4 2 3
1 1 4 2 3 2
1 1 1 3 2 5
1 1 1 1 5 4
1 1 1 1 1 4
III-Thao tác trên đa ảnh
• Kỹ thuật 1: Trừ hai ảnh
Cho hai ảnh I
1
, I
2
(cùng kích thước, tính chất). Ta lấy hiệu hai ảnh bằng
cách trừ từng toạ độ của I
2
cho I
1
.
Chỉ ra sự khác biệt giữa ảnh I
1
và ảnh I
2
I(P)=I
2
(P)-I
1
(P) ∀P (P là toạ độ)
17
Ứng dụng: để nén ảnh, tách ảnh khỏi nền, truyền ảnh, nhận dạng, phân
đoạn, làm nổi đường biên, tách nhiễu khỏi nền. Kỹ thuật này hay được dùng
trong dự báo thời tiết, trong y học, an ninh…
Trong an ninh báo động kẻ đột nhập: cứ sau khoảng thời gian t thì tự
động chụp ảnh, sau đó trừ đi ảnh trước, nếu ảnh mới khác 0 thì báo động.
Một ứng dụ
ng cổ điển của trừ ảnh là làm nổi đường biên trong y học là
mask mode radiography. Trong trường hợp I
1
(x, y) (mặt nạ) là một ảnh quang
tuyến X của một vùng cơ thể người, nhận được bằng camera truyền hình (thay
vì phim quang tuyến X) đặt ngược chiều với nguồn sáng X.
Ảnh I
2
(x,y) là một mẫu của chuỗi các ảnh truyền hình tương tự nhau
của cùng một vùng sau khi tiêm thuốc nhuộm màu vào máu. Hiệu quả của
việc trừ ảnh là chỉ có các vùng khác nhau giữa 2 ảnh xuất hiện trong ảnh ra
được thể hiện như là chi tiết được làm nổi lên.
Cho P là toạ độ
Các kết quả của trừ ảnh có thể là:
I
1
(P)-I
2
(P)
Abs(I
1
(P)-I
2
(P))
Max-abs(I
2
(P)-I
1
(P))
1 4 2 8 5 7 1 4 2 8 5 7
4 2 8 5 7 0 4 2 8 5 7 0
I1= 2 8 5 7 0 0 I2= 2 8 5 7 0 0
8 5 7 0 0 0 8 5 7 0 1 1
5 7 0 0 0 0 5 7 0 1 1 1
7 0 0 0 0 0 7 0 1 1 1 1
0 0 0 0 0 0 8 8 8 8 8 8
0 0 0 0 0 0 8 8 8 8 8 8
abs(I1-
I2) 0 0
0
0 0 0 Max-abs(I1-I2)= 8 8
8
8 8 8
0 0 0 0 1 1 8 8
8
8 7 7
0 0 0 1 1 1 8 8 8 7 7 7
0 0 1 1 1 1 8 8 7 7 7 7
0 0 0 0 0 0 8 8 8 8 8 8
*Kỹ thuật 2: Kỹ thuật cộng ảnh
giả sử ta có 2 ảnh I
1
, I= có cùng kích thước và thuộc tính. Kỹ thuật
cộng ảnh nhằm tạo ra ảnh mới lai ghép giữa I
1
và I
2
cũng có kích thước và
thuộc tính 2 ảnh ban đầu.
I
α
[i,j]=(1-α)I
1
[i, j]+α I
2
[i, j] α
∈
[0,1]
18
Ứng dụng: trong hoạt hình, tái tạo hình ảnh
*Kỹ thuật 3: Lọc trung vị đa ảnh
Định nghĩa1:
Cho dãy x
1
≤ x
2
≤…≤ x
n
Nếu n lẻ thì trung vị của dãy là x
[(n+1)/2]
Nếu n chẵn thì trung vị của dãy x
∈
[x
n/2
, x
[n/2]+1
]
Hay chúng ta có thể có định nghĩa khác
Định nghĩa 2:
x là trung vị của dãy x1, x2, .., xn
#{k| x ≥ x
k
}=#{k| x ≤ x
k
}
Ví dụ: Trung vị của dãy 1, 4, 5,2, 6,8, 7 là 5.
Cho trước dãy ảnh I
1
, I
2
, …, I
n
. Ảnh trung vị của dãy ảnh là ảnh I
Tv
trong đó mỗi I
Tv
(P) là trung vị của dãy I
1
(P), I
2
(P),..,I
n
(P). P là toạ độ của ảnh.
Ứng dụng: để lấy ảnh đặc trưng trong dãy ảnh
Mệnh đề 1
Cho dãy x
1
, x
2
,..,x
n
∑
=
−
n
k
k
xx
1
→ min tại trung vị
Chứng minh
Ø(x)=
∑
=
−
n
k
k
xx
1
)()()( xxxxx
xx
k
xx
k
kk
−+−=
∑∑
>≥
φ
φ(x) đạt min tại giá trị mà đạo hàm của nó bằng 0
011)(' =−=
∑∑
>≥ xxkxkx
x
φ
→ x là trung vị.
Ví dụ:
Trung vị
1 2 3 4 5 6 1 2 3
I1= 4 5 6 I2= 1 2 3 I3= 7 8 9
7 8 9 7 8 9 4 5 6
12 3
I
TV
= 4 5 6
78 9
19
*Kỹ thuật 4: Lọc trung bình đa ảnh
Cho dãy x
1
, x
2
,…, x
n
khi đó trung bình của dãy là x=
∑
=
n
i
i
x
n
1
1
Cho trước dãy ảnh I
1
, I
2
, …, I
n
có cùng kích thước và thuộc tính. Ảnh
trung bình của dãy ảnh là ảnh I
TB
trong đó mỗi I
TB
(P) là trung bình của dãy
I
1
(P), I
2
(P),..,I
n
(P). P là toạ độ của ảnh.
∑
=
=
n
k
kTB
I
n
I
1
1
Ứng dụng: để lấy ảnh đặc trưng trong dãy ảnh
Mệnh đề 2
Cho dãy x
1
, x
2
,..,x
n
()
2
1
∑
=
−
n
k
k
xx
→ min tại giá trị trung bình
Chứng minh
()
∑∑
∑
∑
=
=
=
=⇒=
=−=
−=
n
k
kk
n
k
k
n
k
k
x
n
xxnx
xxx
xxx
1
1
1
2
1
02)('
)()(
φ
φ
Ví dụ:
Trung bình
1 2 3 4 5 6 1 2 3
I1= 4 5 6 I2= 1 2 3 I3= 7 8 9
7 8 9 7 8 9 4 5 6
23 4
I
TB
= 4 5 6
67 8
*Kỹ thuật 5: Trung bình đệ quy
∑∑∑
−
=
−
==
−
−
+=+=
1
1
1
11
1
1
*
111
n
k
k
n
k
n
k
n
k
n
k
I
nn
n
n
I
I
nn
I
I
n
Trung bình đệ quy
TBTB
I
n
n
n
Inew
I
1−
+=
giả sử có dãy I
0
, I
1
,..,I
n
20
}{}
kn
k
n
k
kn
k
n
n
nn
TB
I
n
n
n
I
n
n
n
I
n
n
n
I
n
n
n
I
n
n
n
I
I
−
=
−−
−
∑
∑
⎟
⎠
⎞
⎜
⎝
⎛
−
=
⎟
⎠
⎞
⎜
⎝
⎛
−
=+
−
+=
−
+
⎩
⎨
⎧
−
+=
0
1
2
1
11
11
...
1
.....
11
:
.
*************************************************************
CHƯƠNG 4: CÁC PHÉP TOÁN PHỤ THUỘC KHÔNG GIAN VÀ CÁC
PHÉP BIẾN ĐỔI HÌNH HỌC 2 CHIỀU
I. Giới thiệu
Các phép toán phụ thuộc không gian là các phép toán cục bộ phụ
thuộc vào vị trí của điểm ảnh
Các phép toán cuộn trên cửa sổ, các thao tác tách cạnh
Các phép biến đổi hình học hai chiều: quay tịnh tiến (co, dãn), xê dịch,
biến đổi aphin
Các phép toán phụ thuộc không gian thường được thao tác trên cửa sổ
ảnh.
II. Các phép toán phụ thuộc không gian
Thao tác san nền, l
ọc trung bình, lọc trung vị, mặt nạ
* Kỹ thuật 1: San nền (ground remove)
Chia ảnh thành các khối B
kl.
Cộng vào từng khối các hằng sao cho sau
khi cộng giá trị trung bình cấp xám từng khối bằng nhau.
B
kl
.
)
''
(
)(
)(
)(
''
lk
Bcard
Bp
PI
k
Bcard
Bp
PI
lkkl
∑
∈
=
∑
∈
1 2 3 4 int[tb] 1 2 3 4
7 8 9 2 5 5 7 8 9 2 5 5
5 4 1 5
→
6 5 1 5
3 2 7 8 4 5 4 3 7 8 5 5
21
* Kỹ thuật 2: Mặt nạ (Mask)
Cho ảnh có kích thước MxN
Mặt nạ là cửa sổ kích thước m
x
n << MxN
Thông thường mặt nạ có kích thước 3x3, 5x5, 7x7
Ngoài ra còn có mặt nạ hình chữ thập
Chọn đúng các hệ số và sử dụng mặt nạ tại từng vị trí pixel trong một
ảnh, có thể thay đổi các toán tử ảnh có ích ví dụ như giảm nhiễu, làm mảnh
ảnh, tách đường biên…
Định nghĩa 1:
P
0
, P
1
,..., P
7
là các “8-láng giềng” của P
P
0
, P
2
, P
4
, P
6
là các “4-láng giềng” của P
N
4
={I(i-1, j), I(i+1, j), I(i, j-1), I(i, j+1)}
N
8
=N4
∪
{I(i+1, j-1), I(i-1, j-1), I(i-1, j+1), I(i+1, j+1)}
Định nghĩa 2:
Dãy q
0
, .., q
n
liên thông 4 (liên thông 8) nếu
∀
i: 0≤ i < n thì q
i
và q
i+1
là các 4
(hoặc các 8) láng giềng
Liên thông 4 → liên thông 8. Ngược lại chưa chắc đã đúng.
Quan hệ k liên thông (k=4, 8) là quan hệ phản xạ, đối xứng, bắc cầu→ quan
hệ tương đương.
P3 P2 P1
P4 P P0
P5 P6 P7
Ảnh MxN
Mặt nạ mxn
0
1
23
4
5
6
7
22
Mỗi lớp tương đương của nó là một thành phần k liên thông của nó về
sau ta sẽ gọi mỗi thành phần k liên thông của ảnh là một đối tượng của ảnh.
Định nghĩa 3:
Dãy q
0
,.., q
n
được gọi là chu trình liên thông 4 (hoặc liên thông 8) nếu
nó là liên thông 4 (hoặc liên thông 8) và q
0
= q
n
Mô hình Chain Code (Mã xích)
Nếu có dãy
q
0
q
1
.. q
n
↔
⎯⎯⎯⎯ →⎯
−
⎯⎯⎯ →⎯⎯⎯⎯ →⎯
n
q
n
qqqqq
q
1
....
2110
0
↔ q
0
d
0
d
1
..d
n-1
trong đó các d
i
∈
[0,7] gọi là mã xích.
Mã xích thường dùng để biểu diễn biên của ảnh. Theo phương pháp
này 8 hướng của vecto nối 2 điểm biên liên tục được mã hoá. Khi đó ảnh
được biểu diễn qua điểm bắt đầu cùng với chuỗi các từ mã
A 111 110 001 000 110 101 100 011 011 001
III. Phép cuộn và mẫu
I là ảnh Mx N
T là ma trận mẫu mx n
Lấy (x, y) trên ảnh làm gốc, lấy cửa sổ mxn đặt góc trên trái tại vị trí (x, y)
T(i, j)
*
T(x+i,y+ j)
*
mxn
MxN
A
B
C
D
E F
G
H
I
J
K
7
6
0
1
0
6
5
4
3
3
1
23
T*I(x,y)=
∑∑
−
=
−
=
++
1
0
1
0
),(*),(
m
i
n
j
jyixIjiT
Ví dụ:
T=
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
10
11
I=
⎟
⎟
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎜
⎜
⎝
⎛
2211
7643
8642
7531
⎟
⎟
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎜
⎜
⎝
⎛
2211
7643
8642
7531
*
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
10
11
=
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎝
⎛
15128
211610
20148
Đa số các phép toán trong xử lý ảnh đều dùng phép cuộn
1- Các mẫu thường dùng
T
1
=
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎝
⎛
111
111
111
T
2
=
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎝
⎛
131
3163
131
T
3
=
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎝
⎛
−
−−
−
010
141
010
T
1
dùng để lọc nhiễu T
2
dùng để lọc trơn bề mặt T3 dùng để tách cạnh
(lọc thông thấp) (lọc thông trung bình) -phát hiện ra các điểm
có giá trị thay đổi
hẳn
so với các
giá trị bên cạnh
I T
1
* I
0 0 0 0 0 0 5 8 8 5
0 1 1 1 1 0 10 19 17 10
0 1 2 2 1 0 10 17 17 10
0 1 4 4 1 0 7 12 12 7
0 1 1 1 1 0
0 0 0 0 0 0
T
2
* I
T
3
* I
24
24 31 31 24 2 0 0 2
33 63 63 33 0 0 0 0
37 93 93 37 -2 8 8 -2
26 39 39 26 2 -2 -2 2
2 Mẫu tách cạnh
A=
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
−
−
11
11
B=
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
−−
11
11
I=
⎟
⎟
⎟
⎟
⎟
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎜
⎜
⎜
⎜
⎜
⎝
⎛
333000
333000
333000
000333
000333
000333
A*I=
⎟
⎟
⎟
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎜
⎜
⎜
⎝
⎛
−
−
00600
00600
00000
00600
00600
B*I=
⎟
⎟
⎟
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎜
⎜
⎜
⎝
⎛
−−
00000
00000
66066
00000
00000
A*I+B*I=
⎟
⎟
⎟
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎜
⎜
⎜
⎝
⎛
−−
−
−
00600
00600
66066
00600
00600
IV-Các phép toán khác trên cửa sổ
* Kỹ thuật 1: Lọc trung vị
Với mỗi P, lấy cửa sổ W(P)
Tính trung vị TV(P)= trung vị W(P)
I(P)= I(P) nếu | I(P)- TV(P)| ≤ θ
TV(P) nếu ngược lại
θ là một ngưỡng cho trước
* Kỹ thuật 2: Lọc trung bình
Với mỗi P, lấy cửa sổ W(P)
Tính trung bình TB(P) trong cửa sổ W(P)
I(P)= I(P) nếu | I(P)- TB(P)| ≤ θ
TB(P) nếu ngược lại
θ là một ngưỡng cho trước
25
0 0 0 0 0 0 0 0
0 1 4 2 8 5 7 0
0 4 2 8 5 7 1 0
I
=
0 2 8 5 7 1 4 0
0 8 5 7 1 4 2 0
0 5 7 1 4 2 8 0
0 7 1 4 2 8 5 0
0 0 0 0 0 0 0 0
Lọc trung vị Lọc trung bình
1 4 2 8 5 0 1 4 2 4 5 2
4 2 8 5 7 5 4 2 4 5 7 1
2 8 5 7 1 4 2 8 5 7 1 4
8 5 7 1 4 2 4 5 7 1 4 2
5 7 1 4 2 4 5 7 1 4 2 3
5 5 4 2 8 5 2 1 4 2 3 5
* Kỹ thuật 3: Trung bình k láng giềng gần nhất
giả sử ta có ảnh I, điểm ảnh P, cửa sổ W(P), ngưỡng θ và số k. Khi đó
lọc trung bình theo k giá trị gần nhất bao gồm các bước sau:
B1: tìm k giá trị gần nhất
{I(q)| q
∈
W(P)}→{k giá trị gần I(p) nhất}
B2: tính trung bình {k giá trị gần I(P) nhất}→ TB
k
(P)
B3: tính giá trị
I(P) nếu |I(P)-TB
k
(P)| ≤ θ
I(P)=
TB
k
(P) nếu ngược lại
Ví dụ: W(3, 3), θ=2, k=3
x
1 2 3 2 1 2 3 2
I= 4 16 2 1 I
kq
= 4 8 2 1
4 2 1 1 4 2 1 1
2 1 2 1 2 1 2 1
tại điểm 1: có 4 giá trị vào cửa sổ 1, 2, 4, 16
có 3 giá trị gần 1 nhất là 1, 2, 4 → TB
3
(1)=2,3.
Nhận xét: