Tải bản đầy đủ (.pdf) (65 trang)

Một số kỹ thuật cắt tỉa xương trong xử lý ảnh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.33 MB, 65 trang )

ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CNTT&TRUYỀN THÔNG




Bùi Huy Hùng



MỘT SỐ KỸ THUẬT CẮT TỈA XƢƠNG
TRONG XỬ LÝ ẢNH





LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH






THÁI NGUYÊN - 2012
ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CNTT&TRUYỀN THÔNG



Bùi Huy Hùng




MỘT SỐ KỸ THUẬT CẮT TỈA XƢƠNG
TRONG XỬ LÝ ẢNH


Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH



NGƯỜI HƯỚNG DẪN KHOA HỌC
TS. Đào Nam Anh


THÁI NGUYÊN - 2012
LỜI CẢM ƠN
Trước tiên, con xin bày tỏ lòng biết ơn đến cha mẹ đã sinh thành, nuôi
dạy con khôn lớn để con có được thành quả như ngày hôm này.
Em xin chân thành cảm ơn TS. Đào Nam Anh - người luôn chỉ bảo,
trực tiếp hướng dẫn, cung cấp những tài liệu quý báu, nhận xét giúp đỡ em
trong lựa chọn hướng nghiên cứu cũng như quá trình hoàn thành luận văn.
Em cảm ơn các thầy cô giáo Viện Công nghệ Thông tin - Viện Khoa
học và Công nghệ Việt Nam, Trường Đại học Công nghệ thông tin và
Truyền thông - Đại học Thái Nguyên. Các bạn học viên lớp Cao học CK09
đã luôn động viên tôi trong quá trình học tập và hoàn thành luận văn.
Xin cảm ơn các đồng nghiệp tại Trường Đại Học Dân Lập Hải Phòng
đã giúp đỡ, hỗ trợ trong suốt quá trình học tập, công tác.


LỜI CAM ĐOAN
Tôi xin cam đoan luận văn này do tôi tự nghiên cứu, tìm hiểu và tổng
hợp từ nhiều nguồn tài liệu khác nhau. Luận văn tốt nghiệp là kết quả của
quá trình học tập, nghiên cứu và thực hiện hoàn toàn nghiêm túc, trung thực
của bản thân. Tất cả các tài liệu tham khảo đều có xuất xứ rõ ràng và được
trích dẫn hợp pháp.
Tôi xin hoàn toàn chịu trách nhiệm về nội dung và sự trung thực trong
luận văn tốt nghiệp Thạc sĩ của mình.
i
MỤC LỤC
DANH MỤC CÁC THUẬT NGỮ, CÁC TỪ VIẾT TẮT iii
DANH MỤC CÁC BẢNG iv
DANH MỤC CÁC HÌNH v
MỞ ĐẦU 1
CHƢƠNG 1: TỔNG QUAN VỀ RÚT GỌN VÀ BIỂU DIỄN ĐỐI TƢỢNG 3
1.1 Một số khái niệm Xử lý ảnh 3
1.1.1 Ảnh và điểm ảnh 3
1.1.2 Lân cận của điểm ảnh 4
1.1.3 Mối liên kết điểm ảnh 4
1.1.4 Đo khoảng cách giữa các điểm ảnh 5
1.1.5 Mức xám 5
1.2 Biên và các phương pháp tìm biên 6
1.2.1 Phát hiện biên trực tiếp 6
1.2.2 Phát hiện biên gián tiếp 7
1.3 Các phép toán hình thái học cơ bản 7
1.3.1 Định nghĩa phép giãn (Dilation) 7
1.3.2 Định nghĩa phép co (Erosion) 8
1.3.3 Định nghĩa phép mở (Open) 8
1.3.4 Định nghĩa phép đóng (Close) 9

1.4 Biểu diễn hình dạng đối tượng 9
1.4.1 Kỹ thuật biểu diễn hình dạng dựa trên biên 11
1.4.2 Kỹ thuật biểu diễn hình dạng dựa trên vùng 11
1.5 Xương và các phương pháp tìm xương 12
ii
1.5.1 Phương pháp tìm xương dựa trên làm mảnh 13
1.5.2 Phương pháp tìm xương không dựa trên làm mảnh 15
CHƢƠNG 2: MỘT SỐ KỸ THUẬT CẮT TỈA XƢƠNG 16
2.1 Kỹ thuật cắt tỉa xương Discrete Curve Evolution (DCE) 17
2.1.1 Giải pháp 18
2.1.2 Độ phức tạp của DCE 27
2.2 Kỹ thuật cắt tỉa xương Discrete Skeleton Evolution (DSE) 28
2.2.1 Giải pháp 29
2.2.1 Độ phức tạp của DSE 32
2.3 Kỹ thuật cắt tỉa xương Bending Potential Ratio (BPR) 33
2.3.1 Giải pháp 34
2.3.2 Cắt tỉa xương với BPR 40
CHƢƠNG 3: THỬ NGHIỆM CẮT TỈA XƢƠNG 44
3.1 Môi trường cài đặt thử nghiệm 44
3.2 Thử nghiệm cắt tỉa xương 45
3.2.1 Kỹ thuật DCE 45
3.2.2 Kỹ thuật DSE 47
3.2.3 Kỹ thuật BPR 49
3.3 Một vài so sánh giữa DCE, DSE và BPR 51
3.4 Nhận xét chung 54
KẾT LUẬN 55
TÀI LIỆU THAM KHẢO 56


iii

DANH MỤC CÁC THUẬT NGỮ, CÁC TỪ VIẾT TẮT
CÁC THUẬT NGỮ
Close
Phép đóng
Dilation
Phép giãn
Erosion
Phép co
Fourier transform
Chuỗi Fourier
Gray level
Mức xám
Open
Phép mở
Pixel
Điểm ảnh
Resolution
Độ phân giải
Shape
Hình dạng

iv
CÁC TỪ VIẾT TẮT
BPR
Bending Potential Ratio
DCE
Discrete Curve Evolution
DSE
Discrete Skeleton Evolution
IP

Information preserving
NIP
Non Information preserving
XLA
Xử lý ảnh



DANH MỤC CÁC BẢNG
Bảng 3.1: Một số ảnh được sử dụng trong thực nghiệm 44
Bảng 3.2: So sánh xương hình móng ngựa 51
Bảng 3.3: So sánh xương Thằn lằn 52
Bảng 3.4: So sánh xương Lạc đà 53


v
DANH MỤC CÁC HÌNH
Hình 1.1: Phân loại các kỹ thuật mô tả hình dạng 10
Hình 1.2: Ví dụ về ảnh và xương 12
Hình 1.3: Minh họa về trục trung vị 15
Hình 2.1: Nhánh xương thừa phát sinh bởi nhiễu đường biên 16
Hình 2.2: Xương ban đầu và xương sau khi cắt tỉa với DCE 17
Hình 2.3: Đường đậm liên tục là cung ban đầu [x,y]. Cung [a,b] chính là
arc(s,[x, y])=[a,b]. Xương là các đường đậm cách quãng 19
Hình 2.4: Tính toán các đỉnh lồi trên đường bao 20
Hình 2.5: Đa giác đơn giản với 8 đỉnh 21
Hình 2.6: Bộ xương của lá với các ngưỡng khác nhau 22
Hình 2.7: Minh họa cắt tỉa xương 23
Hình 2.8: Minh họa quá trình tìm xương 24
Hình 2.9: Minh họa cắt tỉa xương với DCE 25

Hình 2.10: Loại bỏ đỉnh lồi không quan trọng tạo ra xương tối ưu 26
Hình 2.11: Các điểm xương cuối (a) và mong muốn (b) 28
Hình 2.12: Nhánh xương ít ý nghĩa màu đỏ (a) được loại bỏ (b) 28
Hình 2.13: Các điểm xương cuối (đỏ), các điểm giao (xanh) 30
Hình 2.14: Khôi phục lại hình dạng gốc từ xương 30
Hình 2.15: Định nghĩa của điểm ghost và BPR 35
Hình 2.16: Vùng của điểm ghost 36
Hình 2.17: Hình chữ nhật với cùng một đỉnh thêm vào đường biên 39
Hình 2.18: Xương chân của một con Lạc đà 41
Hình 3.1: DCE với các ngưỡng khác nhau 45
Hình 3.2: Xương Bạch tuộc sau cắt tỉa 46
Hình 3.3: Cắt tỉa xương với DSE 47
Hình 3.4: Cắt tỉa BPR với các ngưỡng khác nhau 49
Hình 3.5: Nhánh xương cuối bị ngắn do ngưỡng không phù hợp 50
Hình 3.6: Minh họa mức độ đóng góp khác nhau 50
1
MỞ ĐẦU
Mục đích quan trọng trong phân tích ảnh là đối sánh và nhận dạng đối
tượng. Việc này có thể được thực hiện thông qua một vài cách, sử dụng màu
sắc, kết cấu, hình dạng, momen và vị trí. Hình dạng là yếu tố quan trọng của
đối tượng và cũng là hướng nghiên cứu quan trọng trong phân lớp và nhận
dạng. Hình dạng của đối tượng phẳng có thể được mô tả dựa trên đường bao
hoặc dựa trên xương của chúng.
Khi sử dụng đường bao trong phân lớp và nhận dạng, những lớp hình
dạng có thay đổi lớn về hình dạng toàn cục do có biến đổi cấu trúc hoặc yếu
tố nào đó thường gây ra khó khăn cho quá trình nhận dạng [4]. Những
phương pháp đối sánh hình dạng đích với các hình dạng mẫu được lưu trữ
trong cơ sở dữ liệu thì đòi hỏi một số lượng lớn các mẫu được lưu trữ [5].
Hơn nữa những phương pháp dựa trên mô hình và ví dụ rất khó quản lý được lớp
đối tượng có phần khác nhau mà không phân tách thành các lớp con riêng biệt.

Xương (còn được gọi là trục trung vị) lần đầu tiên được xác định bởi
tác giả Blum năm 1976 [7,1], là cách mô tả hình dạng rất hữu ích và quan
trọng cho nhận dạng đối tượng vì nó chứa các đặc trưng hình dạng của đối
tượng gốc. Hình dạng tương tự dựa trên đối sánh xương thường thực hiện
nhanh hơn đường biên [3]. Do vậy, xương được sử dụng để biểu diễn và phân
tích hình dạng trong nhiều lĩnh vực ứng dụng như hệ thống tra cứu ảnh dựa
trên nội dung, hệ thống nhận dạng ký tự Những thập kỷ qua, có rất nhiều
phương pháp trích chọn xương đã được đề xuất [6,7].
Hầu hết các phương pháp tìm xương hiện tại đều có một hạn chế chung
đó là nhạy cảm cao đối với nhiễu đường biên: những biến đổi nhỏ trên đường
biên của đối tượng có thể làm thay đổi đáng kể xương nhận được. Do các
2
phương pháp này thường tạo ra các nhánh xương “giả”, ảnh hưởng tới việc
nhận dạng đối tượng dựa trên cấu trúc xương. Do đó, có thể nói việc nghiên
cứu các phương pháp cắt tỉa xương nhằm nâng cao hiệu quả biểu diễn đối
tượng phục vụ cho đối sánh và nhận dạng đối tượng dựa trên Shape là hết sức
cần thiết. Đó cũng là cơ sở cho việc thực hiện đề tài “Một số phƣơng pháp
cắt tỉa xƣơng trong xử lý ảnh”.
Luận văn có ba chương:
Chương 1: Tổng quan về rút gọn và biểu diễn đối tượng
Chương 2: Một số kỹ thuật cắt tỉa xương
Chương 3: Thử nghiệm cắt tỉa xương
3



CHƢƠNG 1: TỔNG QUAN VỀ RÚT GỌN VÀ BIỂU DIỄN ĐỐI TƢỢNG
1.1 Một số khái niệm Xử lý ảnh
Xử lý ảnh số là một lĩnh vực tin học ứng dụng. Xử lý dữ liệu bằng đồ
họa đề cập đến những ảnh nhân tạo, các ảnh này được xem xét như là một cấu

trúc dữ liệu và được tạo ra bởi các chương trình. Xử lý ảnh số bao gồm các
phương pháp và kỹ thuật biến đổi, để truyền tải hoặc mã hóa các ảnh tự nhiên.
Quá trình biến đổi từ một ảnh ban đầu sang một ảnh mới thường có hai
mục đích chính:
 Cải thiện chất lượng phục vụ cho quan sát.
 Chuẩn bị các điều kiện cho việc trích chọn các đặc trưng phục vụ
cho việc nhận dạng và ra quyết định.
1.1.1 Ảnh và điểm ảnh
Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ
sáng chúng được biểu diễn bằng một hàm 2 biến thực hoặc phức kí hiệu là f(x,
y). Trong đó x, y là các giá trị tọa độ không gian và giá trị của f sẽ tỷ lệ với độ
sáng của ảnh tại điểm này.
Để có thể xử lý ảnh bằng máy tính cần thiết phải tiến hành số hóa ảnh.
Trong quá trình số hóa, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc
thông qua quá trình lấy mẫu (rời rạc hóa về không gian) và lượng tử hóa
thành phần giá trị mà về nguyên tắc bằng mắt thường không phân biệt được
hai điểm kề nhau. Trong quá trình này, người ta sử dụng khái niệm Picture
element mà ta quen gọi hay viết tắt là pixel – phần tử ảnh. Như vậy, mỗi ảnh
là một tập hợp các pixel.
4



Ảnh số là ảnh xử lý bằng máy tính thu được từ ảnh liên tục bởi quá
trình số hóa, thường được biểu diễn bởi mảng hai chiều I(n, p): n dòng và p
cột. Người ta thường kí hiệu I(x, y) để chỉ một pixel. Một pixel có thể được
lưu trữ bằng 1, 4, 8, 16 hay 24 bit. Thường được kí hiệu là I[m, n].
Độ phân giải (Resolution) là mật độ của ảnh được ấn định trên ảnh số
khi hiển thị. Như vậy khoảng cách giữa các điểm ảnh được chọn sao cho mắt
người vẫn thấy được sự liên tục của ảnh. Việc chọn này tạo nên mật độ phân

bổ đó chính là độ phân giải được phân bổ liên tục theo x, y.
1.1.2 Lân cận của điểm ảnh
Giả sử một ảnh số được biểu diễn bằng hàm f(x, y), p và q là cặp điểm
ảnh có quan hệ với nhau, điểm ảnh p có tọa độ (x, y). Định nghĩa các lân cận
của điểm ảnh.
Lân cận 4 của p kí hiệu N
4
(p):
- N
4
(p) = {(x-1, y); (x, y-1); (x, y+1); (x+1, y)}
Lân cận chéo của p kí hiệu N
p
(p):
- N
p
(p) ={(x+1, y+1); (x+1, y-1); (x-1, y+1); (x-1, y-1)}
Lân cận 8 của p kí hiệu N
8
(p):
- N
8
(p) = N
4
(p) + N
p
(p)
1.1.3 Mối liên kết điểm ảnh
Các mối liên kết được sử dụng để xác định giới hạn của đối tượng hoặc
xác định vùng trong một ảnh. Một liên kết được đặc trưng bởi tính liền kề

giữa các điểm và mức xám của chúng.

5



Có ba loại liên kết:
- Liên kết 4: Hai điểm ảnh p và q được gọi là liên kết 4 nếu q thuộc
N
4
(p)
- Liên kết 8: Hai điểm ảnh p và q được gọi là liên kết 8 nếu q thuộc
N
8
(p)
- Liên kết m (liên kết hỗn hợp): Hai điểm ảnh p và q được gọi là liên kết
hỗn hợp nếu q thuộc N
4
(p) hoặc q thuộc N
8
(p)
1.1.4 Đo khoảng cách giữa các điểm ảnh
Khoảng cách D(p, q) giữa hai điểm ảnh p có tọa độ (x, y), q có tọa độ
(s, t) là hàm khoảng cách (Distance) nếu:
- D(p, q) ≥ 0 (Với D(p, q)=0 khi và chỉ khi p=q)
- D(p, q) = D(q, p)
- D(p, z) ≤ D(p, q) + D(q, z); z là một điểm ảnh khác
Khoảng cách Euclide giữa hai điểm ảnh p(x, y) và q(s, t) được định
nghĩa như sau:
D

e
(p, q) = [(x - s)
2
+ (y - t)
2
]
1/2
(1.1)
1.1.5 Mức xám
Mức xám (Gray level): Giá trị I[x, y] biểu diễn cường độ sáng được mã
hóa của mỗi điểm ảnh (x, y). Giá trị đó còn được gọi là mức xám I[x, y] có giá
trị rời rạc và để tiện xử lý, ta coi giá trị của I[x, y] là nguyên: I[x, y]  {0, 1,
…, L-1} với L là mức xám tối đa dùng để biểu diễn. Ảnh có nhiều mức xám
gọi là ảnh đa cấp xám. Ảnh chỉ có 2 mức xám 0 và 1 gọi là ảnh nhị phân.
6



Cách mã hóa kinh điển thường dùng là 16, 32 hay 64 mức. Mã hóa 256
mức là phổ dụng nhất do lý do kỹ thuật. Vì 2
8
= 256 (0, 1, , 255), nên với
256 mức mỗi pixel sẽ được mã hóa bởi 8 bit.
Ảnh nhị phân, mỗi pixel mã hóa trên 1 bit; còn ảnh 256 màu, mỗi pixel
mã hóa trên 8 bit.
Ảnh màu là ảnh tổ hợp từ 3 màu cơ bản: đỏ (Red), lục (Green), lam
(Blue) và thường thu nhận trên các dải băng tần khác nhau. Để biểu diễn cho
mỗi điểm ảnh màu cần 3 byte để mô tả 24 bit màu.
Ảnh xám là trường hợp đặc biệt của ảnh màu. Mỗi điểm ảnh màu có 3
giá trị (Red, Green, Blue), nếu 3 giá trị này bằng nhau thì ta có ảnh xám.

1.2 Biên và các phƣơng pháp tìm biên
Biên là vấn đề quan trọng trong trích chọn đặc điểm nhằm tiến tới hiểu
ảnh. Cho đến nay chưa có định nghĩa chính xác về biên, trong mỗi ứng dụng
người ta đưa ra các độ đo khác nhau về biên, một trong các độ đo đó là độ đo
về sự thay đổi đột ngột về cấp xám. Ví dụ: Đối với ảnh đen trắng, một điểm
được gọi là điểm biên nếu nó là điểm đen có ít nhất một điểm trắng bên cạnh.
Tập hợp các điểm biên tạo nên biên hay đường bao của đối tượng. Xuất phát
từ cơ sở này người ta thường sử dụng hai phương pháp phát hiện biên cơ bản.
1.2.1 Phát hiện biên trực tiếp
Phương pháp này làm nổi biên dựa vào sự biến thiên mức xám của ảnh. Kỹ
thuật chủ yếu dùng để phát hiện biên ở đây là kỹ thuật lấy đạo hàm. Nếu lấy đạo
hàm bậc nhất của ảnh ta có các kỹ thuật Gradient, nếu lấy đạo hàm bậc hai của
ảnh ta có kỹ thuật Laplace, ngoài ra còn có một số các tiếp cận khác.
7



1.2.2 Phát hiện biên gián tiếp
Nếu bằng cách nào đó ta phân được ảnh thành các vùng thì ranh giới
giữa các vùng đó gọi là biên. Kỹ thuật dò biên và phân vùng ảnh là hai bài
toán đối ngẫu nhau vì dò biên để thực hiện phân lớp đối tượng mà khi đã phân
lớp xong nghĩa là đã phân vùng được ảnh và ngược lại, khi đã phân vùng ảnh
đã được phân lớp thành các đối tượng, do đó có thể phát hiện được biên.
Phương pháp phát hiện biên trực tiếp tỏ ra khá hiệu quả và ít chịu ảnh
hưởng của nhiễu, song nếu sự biến thiên độ sáng không đột ngột, phương
pháp tỏ ra kém hiệu quả, phương pháp phát hiện biên gián tiếp tuy khó cài
đặt, song lại áp dụng khá tốt trong trường hợp này. Sự khác biệt cơ bản giữa
hai phương pháp này là:
 Phương pháp phát hiện biên trực tiếp cho ta kết quả là ảnh biên.
 Phương pháp phát hiện biên trực tiếp cho ta kết quả là đường biên.

1.3 Các phép toán hình thái học cơ bản
Hình thái có nghĩa là cấu trúc hay topology của đối tượng, là một cách
để mô tả đối tượng ảnh số. Hai phép toán hình thái cơ bản là; phép giãn
(Dilation) và phép co (Erosion).
Các phép toán này được định nghĩa như sau: Giả thiết ta có đối tượng X
và phần tử cấu trúc (mẫu) B trong không gian Euclide hai chiều. Kí hiệu Bx là
dịch chuyển của B tới vị trí x.
1.3.1 Định nghĩa phép giãn (Dilation)
Phép giãn của X theo mẫu B là hợp của tất cả các B
x
với x thuộc X. Ta có:
X

B =

Xx
x
B

(1.2)
8



1.3.2 Định nghĩa phép co (Erosion)
Phép co của X theo B là tập hợp tất cả các điểm x sao cho B
x
nằm trong
X. Ta có:
X


B = {x : B
x

X} (1.3)
Ví dụ: Ta có tập X như sau: X =
X  B = và XB =
1.3.3 Định nghĩa phép mở (Open)
Phép toán mở của X theo cấu trúc B là tập hợp các điểm của ảnh X sau
khi đã co và giãn nở liên liếp theo B. Ta có:
OPEN(X, B) = (X

B)

B (1.4)
Ví dụ: Với tập X và B trong ví dụ trên ta có
OPEN(X, B) =(XB)  B =



















0xxx0
00000
00xx0
0xx00
xx000

















00
000
000

00
00
xxx
xx
xx
xxx
xxx
















xxxx
xxxx
xxx
xxxxx
xxxx
0
0

00
0
















000
00000
0000
0000
0000
xx
x
x
x
B =



x
9



1.3.4 Định nghĩa phép đóng (Close)
Phép đóng của X theo cấu trúc B là tập hợp các điểm của ảnh X sau khi
đã giãn nở và co liên tiếp theo B. Ta có:
CLOSE(X,B) = (X

B)

B (1.5)
Theo ví dụ trên ta có:
CLOSE(X,B) = (X  B)  B =



















0xxx0
0xxx0
00xx0
xxxxx
xxxx0

1.4 Biểu diễn hình dạng đối tƣợng
Các phương pháp biểu diễn hình dạng phổ biến nhất là dựa trên việc sử
dụng các điểm biên hình dạng và điểm vùng. Biểu diễn hình dạng cũng có thể
được phân biệt giữa miền không gian và miền đặc trưng. Phương pháp trong
miền không gian so sánh các hình dạng dựa trên điểm (hoặc điểm đặc trưng)
cơ sở, còn phương pháp miền đặc trưng so sánh các hình dạng dựa trên đặc
trưng vector cơ sở.
Một cách phân loại các kỹ thuật biểu diễn hình dạng khác là dựa trên cơ
sở bảo quản thông tin. Phương pháp cho phép xây dựng lại chính xác một
hình dạng từ mô tả của nó được gọi là lưu trữ thông tin (Information
preserving - IP), còn phương pháp chỉ có khả năng xây dựng lại một phần
hoặc mô tả không rõ ràng được gọi là sự không lưu trữ thông tin (Non
Information preserving - NIP).
10



Các phương pháp biểu diễn hình dạng được phân loại theo các cấp bậc,
đầu tiên phương pháp phân loại dựa trên đường biên và phương pháp phân
loại dựa trên vùng căn cứ vào đặc trưng hình dạng được trích chọn từ đường
biên hay toàn bộ các phân vùng hình dạng. Trong mỗi lớp, các phương pháp

khác nhau được tiếp tục phân biệt thành cấu trúc và toàn cục dựa vào việc
hình dạng được biểu diễn theo toàn bộ hay theo các thành phần con. Sau đó,
tiếp tục phân ra các phương pháp cụ thể như mô tả trong sơ đồ hình 1.1.

Hình 1.1: Phân loại các kỹ thuật mô tả hình dạng
Hình dạng

Hình dạng

Hình dạng

Hình dạng

Hình dạng

Hình dạng

Hình dạng

Hình dạng
Dựa trên biên

Dựa trên biên

Dựa trên biên

Dựa trên biên

Dựa trên biên


Dựa trên biên

Dựa trên biên

Dựa trên biên
Dựa trên vùng

Dựa trên vùng

Dựa trên vùng

Dựa trên vùng

Dựa trên vùng

Dựa trên vùng

Dựa trên vùng

Dựa trên vùng
Cấu trúc

Cấu trúc

Cấu trúc

Cấu trúc

Cấu trúc


Cấu trúc

Cấu trúc

Cấu trúc
Toàn cục

Toàn cục

Toàn cục

Toàn cục

Toàn cục

Toàn cục

Toàn cục

Toàn cục
Toàn cục

Toàn cục

Toàn cục

Toàn cục

Toàn cục


Toàn cục

Toàn cục

Toàn cục
Cấu trúc

Cấu trúc

Cấu trúc

Cấu trúc

Cấu trúc

Cấu trúc

Cấu trúc

Cấu trúc
Mã chuỗi
Phân tích đa giác
Phương pháp tỉ lệ
Mô tả đơn giản
Dấu hiệu hình
dạng
Momen biên
Bất biến momen
hình học
Bất biến momen

đại số
Phương pháp lưới
Bề mặt lồi
Trục trung vị
11



1.4.1 Kỹ thuật biểu diễn hình dạng dựa trên biên
Kỹ thuật biểu diễn hình dạng dựa trên biên chỉ khai thác thông tin trên
biên. Có hai loại phương pháp tiếp cận rất khác nhau cho kỹ thuật dựa trên
biên: phương pháp tiếp cận liên tục hay toàn cục và phương pháp tiếp cận rời
rạc theo cấu trúc.
Phương pháp tiếp cận liên tục không phân chia hình dạng thành các
phần mà sử dụng một vector đặc trưng có gốc từ đường biên để mô tả hình
dạng. Thước đo sự giống nhau về hình dạng là dựa trên sự đối sánh các điểm
đặc biệt hoặc dựa trên đặc trưng.
Phương pháp tiếp cận rời rạc chia đường biên thành các phân đoạn
bằng cách sử dụng một tiêu chuẩn cụ thể. Biểu diễn cuối cùng thường là một
chuỗi hoặc một đồ thị (hoặc cây), các biện pháp tương tự được thực hiện bằng
cách kết hợp chuỗi hoặc đồ thị một cách phù hợp.
1.4.2 Kỹ thuật biểu diễn hình dạng dựa trên vùng
Trong phương pháp biểu diễn dựa trên vùng phải kể đến tất cả những
pixel trong vùng hình dạng thu được trong biểu diễn hình dạng. Phương pháp
biểu diễn vùng thường sử dụng các momen để mô tả hình dạng. Một số
phương pháp khác thường sử dụng gồm: phương pháp lưới, bề mặt lồi và trục
trung vị.
Biểu diễn hình dạng dựa trên vùng xem xét đến toàn bộ vùng hình dạng
và sử dụng hiệu quả thông tin của toàn bộ pixel chứa trong vùng. Những
phương pháp này đo sự phân phối pixel của vùng hình dạng, chúng ít có khả

năng giả tạo bởi nhiễu và biến dạng. Phương pháp vùng phổ biến là những
phương pháp moment. Ở mức thấp thứ tự moment hay bất biến moment mang
12



theo những ý nghĩa vật lý kết hợp với sự phân phối pixel. Tuy nhiên nó rất
khó khăn để kết hợp thứ tự moment cao hơn với sự giải thích vật lý.
Phương pháp lưới là dựa trên khả năng trực quan quan sát hình dạng,
nó không phản ánh sự thống kê phân bổ của vùng hình dạng và bị ảnh hưởng
bởi nhiễu và không cô đọng như bất biến moment.
1.5 Xƣơng và các phƣơng pháp tìm xƣơng
Xương được coi như hình dạng cơ bản của một đối tượng, với số ít các
điểm ảnh cơ bản. Ta có thể khôi phục các thông tin về hình dạng nguyên bản
của một đối tượng thông qua xương. Một định nghĩa xúc tích về xương dựa
trên tính continuum (tương tự như hiện tượng cháy đồng cỏ) được đưa ra bởi
Blum (1976) như sau:
Giả thiết rằng đối tượng là đồng nhất được phủ bởi cỏ khô và sau đó
dựng lên một vòng biên lửa. Xương được định nghĩa như nơi gặp của các vệt
lửa và tại đó chúng được dập tắt [1].

(a) Ảnh gốc

(b) Xương
Hình 1.2: Ví dụ về ảnh và xương
Có một số định nghĩa toán học khác nhau về xương trong các tài liệu
kỹ thuật và có nhiều thuật toán khác nhau cho tính toán chúng. Trong các tài
13




liệu kỹ thuật, khái niệm về xương và trục trung vị thường được sử dụng thay
thế cho nhau ở một số tác giả, trong khi một số tác giả khác lại xem chúng chỉ
liên quan với nhau mà không giống nhau.
Tương tự, các khái niệm về tìm xương và làm mảnh cũng được coi là
như nhau với một số tác giả và khác nhau đối với một số tác giả khác.
Xương được sử dụng nhiều trong ứng dụng lĩnh vực máy tính, phân
tích hình ảnh, và xử lý hình ảnh số, bao gồm nhận dạng ký tự quang học, nhận
dạng vân tay, kiểm tra thị giác, nhận dạng mẫu, nén ảnh nhị phân.
Phương pháp tìm xương luôn là chủ đề nghiên cứu trong xử lý ảnh
những năm gần đây. Mặc dù có những nỗ lực cho việc phát triển các thuật
toán tìm xương, nhưng các phương pháp được đưa ra đều bị mất mát thông
tin. Có thể chia thành hai loại thuật toán tìm xương cơ bản:
 Các thuật toán tìm xương dựa trên làm mảnh.
 Các thuật toán tìm xương không dựa trên làm mảnh.
1.5.1 Phương pháp tìm xương dựa trên làm mảnh
Làm mảnh thông thường là bước chuẩn bị cho các bước tiếp theo xử lý
một đối tượng của ảnh. Các bước tiếp theo làm việc trên các thuộc tính cần
thiết của xương.
Thuật toán làm mảnh ảnh số nhị phân là một trong các thuật toán quan
trọng trong xử lý ảnh và nhận dạng. Xương chứa những thông tin bất biến về
cấu trúc của ảnh, giúp cho quá trình nhận dạng hoặc vector hóa sau này.
Thuật toán làm mảnh là quá trình lặp duyệt và kiểm tra tất cả các điểm
thuộc đối tượng. Trong mỗi lần lặp tất cả các điểm đối tượng sẽ được kiểm
tra: nếu như chúng thỏa mãn điều kiện xóa nào đó tùy thuộc vào mỗi thuật
toán thì nó sẽ bị xóa đi. Quá trình cứ lặp lại cho đến khi không còn điểm biên
nào được xóa. Đối tượng được bóc dần lớp biên cho đến khi nào bị thu mảnh
lại chỉ còn các điểm biên.
14




Về làm mảnh ta cần lưu ý: Không phải tất cả các đối tượng đều có thể
làm mảnh. Làm mảnh chỉ hữu dụng với các đối tượng là đường, nghĩa là
chúng chỉ thẳng hoặc cong và nó không có tác dụng với các đối tượng có hình
dạng đóng trong một vùng.
Một số thuật toán làm mảnh:
Thuật toán làm mảnh song song: các điểm được xử lý cùng một lúc.
Giá trị của mỗi điểm sau một lần lặp chỉ phụ thuộc vào giá trị của các láng
giềng bên cạnh (thường là 8 – láng giềng) mà giá trị của các điểm này đã
được xác định trong một lần lặp trước đó. Trong những máy tính có nhiều bộ
vi xử lý thì mỗi vi xử lý sẽ xử lý một vùng của đối tượng, nó có quyền đọc
các điểm ở vùng khác nhau nhưng chỉ được ghi trên vùng của nó xử lý.
Thuật toán làm mảnh tuần tự: các điểm thuộc đối tượng sẽ được
kiểm tra theo một thứ tự nào đó (chẳng hạn các điểm được xét từ trái qua
phải, từ trên xuống dưới). Giá trị của điểm sau mỗi lần lặp không những phụ
thuộc vào giá trị của các láng giềng bên cạnh mà c̣ n ph ụ thuộc vào các điểm
đã được xét trước đó trong chính lần lặp đang xét.
Chất lượng của thuật toán làm mảnh được đánh giá theo các tiêu chuẩn
được liệt kê dưới đây nhưng không nhất thiết phải thỏa mãn đồng thời tất cả
các tiêu chuẩn:
 Bảo toàn tính liên thông của đối tượng và phần bù của đối tượng
 Sự tương hợp giữa xương và cấu trúc của ảnh đối tượng
 Bảo toàn các thành phần liên thông
 Bảo toàn các điểm cụt
 Xương chỉ gồm các điểm biên, càng mảnh càng tốt
 Bền vững đối với nhiễu
 Xương cho phép khôi phục ảnh ban đầu của đối tượng
 Xương thu được ở chính giữa đường nét của đối tượng được làm mảnh
 Xương nhận được bất biến với phép quay

15



1.5.2 Phương pháp tìm xương không dựa trên làm mảnh
1.5.2.1 Trục trung vị
Tập hợp những điểm là tâm vòng tròn tiếp tuyến nội tiếp chứa hai điểm
khác nhau thuộc biên có khoảng cách bằng nhau nhỏ nhất.

Hình 1.3: Minh họa về trục trung vị
MAT = {p|d(p,
1
) = d(p, 
2
) = 




(, 

)} (1.6)
Trong đó:
d( ):
là khoảng cách Euclide, B:
là đường bao đối tượng

1.5.2.2 Thuật toán tìm trục trung vị
 Bước thứ nhất, tính khoảng cách từ mỗi điểm ảnh của đối tượng đến
điểm biên gần nhất. Như vậy cần phải tính toán khoảng cách tới tất

cả các điểm biên của ảnh.
 Bước thứ hai, khoảng cách của ảnh đã được tính toán và các điểm
ảnh có giá trị lớn nhất được xem là nằm trên xương của đối tượng.
Ngoài ra còn có một vài thuật toán duyệt các điểm biên 2 bên mẫu, tính
điểm trung tâm các đường nối giữa các điểm biên đó và xương thu được là tâp
hợp các điểm trung tâm đó (Line Following) hoặc các phương thức sử dụng
chuỗi Fourier (Fourier transform).

16



CHƢƠNG 2: MỘT SỐ KỸ THUẬT CẮT TỈA XƢƠNG
Một trong hai nhược điểm của xương là nhạy cảm đối với nhiễu đường
biên của đối tượng, một ít nhiễu hoặc vài sự thay đổi của nhỏ trên đường biên
cũng dẫn đến tạo ra những nhánh xương thừa hoặc làm cho vị trí điểm xương
thiếu chính xác có thể làm ảnh hưởng nghiêm trọng tới hình dạng cơ bản của
đồ thị xương.
Ví dụ như xương trong hình 2.1 có nhiều nhánh xương thừa được phát
sinh ra bởi nhiễu đường biên.

Hình 2.1: Nhánh xương thừa phát sinh bởi nhiễu đường biên
Để giải quyết vấn đề trên, nhiều kỹ thuật của các tác giả, nhóm tác giả
đã được đề xuất. Có hai hướng chính đang được tập trung nghiên cứu là kỹ
thuật dựa trên làm trơn đường bao và kỹ thuật dựa trên độ đo ý nghĩa của
điểm xương.
Các kỹ thuật làm trơn đường bao trước khi tính toán các điểm xương,
nhằm mục đích loại bỏ nhiễu không mong muốn trên đường bao. Tuy nhiên,
làm trơn đường bao có thể làm thay đổi vị trí đường bao và do đó vị trí của
xương có thể bị dịch chuyển, đó là khó khăn trong việc phân biệt nhiễu từ các

thông tin hình dạng tần số thấp trên đường bao. Một số khác gán độ đo có ý

×