Tải bản đầy đủ (.pdf) (68 trang)

Điểm bất động và ứng dụng trong nhận dạng đối tượng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.89 MB, 68 trang )




1

CÁC THUẬT NGỮ VÀ CÁC TỪ VIẾT TẮT


Auto-correlation matrix
Ma trận tương quan tự động
Co-variance matrix
Ma trận đồng biến
CSDL
Cơ sở dữ liệu
Differentiation Scale
Tỷ lệ vi phân
DoG
Difference-of-Gaussian
Integration Scale
Tỷ lệ tích phân
LoG
Laplacian-of-Gaussian
Scale
Tỷ lệ
Second moment matrix
Ma trận moment cấp hai
SIFT
Scale Invariant Feature Transform

2


DANH MỤC CÁC HÌNH VẼ



Hình 1.1. Sơ đồ tổng quát một hệ nhận dạng 8
Hình 1.2. Hai đối tượng trên mặt phẳng 9
Hình 1.3. Các tứ giác và hình tròn trên mặt phẳng hai chiều 9
Hình 1.4. Ví dụ về các bất biến hình học đối phép quay và tịnh tiến 13
Hình 2.1. Một thể hiện đa tỷ lệ của một tín hiệu 25
Hình 2.2. Các mức khác nhau trong một thể hiện không gian tỷ lệ 26
Hình 2.3. Ví dụ về các tỷ lệ đặc trưng 29
Hình 2.4. Phát hiện điểm quan tâm bất biến tỷ lệ 32
Hình 2.5. Điểm quan tâm bất biến tỷ lệ trong các ảnh bị biến đổi affine 33
Hình 2.6. Biểu đồ giải thích phép chuẩn hóa affine 36
Hình 2.7. Phát hiện lặp lại của một điểm quan tâm bất biến affine 42
Hình 2.8. Phát hiện điểm quan tâm bất biến affine 43
Hình 2.9. Xây dựng một thể hiện không gian tỷ lệ 45
Hình 2.10. Các giá trị cực đại và cực tiểu của các ảnh DoG 45
Hình 2.11. Các giai đoạn lựa chọn các điểm khóa 48
Hình 2.12. Bộ mô tả điểm khóa 51
Hình 3.1. Ví dụ về bài toán nhận dạng đối tượng: xác định xem đối tượng 54
trong ảnh (b) có trong ảnh (a) không? 54
Hình 3.2. Sơ đồ chức năng nhận dạng đối tượng 55
Hình 3.3. Giao diện chương trình 58
Hình 3.4. (a) Ảnh truy vấn chứa nhiều đối tượng; (b) Ảnh huấn luyện; 59
(c) Kết quả nhận dạng 59
Hình 3.5. (a) Ảnh truy vấn chứa nhiều đối tượng; 60
(b) Ảnh chứa đối tượng cần nhận dạng; (c) Kết quả nhận dạng 60
Hình 3.6. Không nhận dạng được đối tượng 61
3


MỞ ĐẦU

Trong cuộc sống hằng ngày, chúng ta thường xuyên cần phải nhận dạng và
phân biệt vô số các đối tượng kể cả các đối tượng quen thuộc và các đối tượng
mới lạ. Các đối tượng này có thể biến đổi đôi chút về hình thức, màu sắc, kết
cấu, v.v… Các đối tượng được nhận dạng từ nhiều tư thế khác nhau (từ phía
trước, bên cạnh hoặc phía sau), ở nhiều nơi và trong nhiều kích thước khác
nhau. Các đối tượng thậm chí có thể được nhận dạng khi chúng bị che khuất một
phần bởi các đối tượng khác. Vì vậy, việc nhận dạng đối tượng một cách tự
động là một vấn đề hết sức thiết thực trong một xã hội hiện đại.
Ngày nay, với sự phát triển mạnh mẽ của ngành Khoa học máy tính cũng
như sự bùng nổ của lĩnh vực Công nghệ thông tin đã đẩy nhanh sự phát triển của
nhiều lĩnh vực xã hội như quân sự, y học, giáo dục, kinh tế, giải trí v.v… Sự
phát triển của phần cứng cả về phương diện thu nhận, hiển thị, cùng với tốc độ
xử lý đã mở ra nhiều hướng mới cho sự phát triển phần mềm, đặc biệt là Công
nghệ xử lý ảnh phát triển nhanh. Nó có thể giải quyết được bài toán phát hiện,
nhận dạng tự động các loại đối tượng trong thực tế, chẳng hạn có thể tạo ra hệ
thống phát hiện kẻ gian đột nhập vào các cơ quan cần được giám sát sau giờ
hành chính như các Kho bạc, Ngân hàng v.v thay vì cần phải có những đội bảo
vệ canh gác cẩn thận. Nhận dạng mặt người trong một bức ảnh cũng đã có rất
nhiều ý nghĩa trong quân sự, an ninh v.v Rõ ràng bài toán phát hiện đối tượng
cũng như nhận dạng đối tượng ngày càng quan trọng đối với sự phát triển của xã
hội, đặc biệt rất quan trọng cho xã hội Việt Nam.
Bài toán nhận dạng đối tượng là một trong những bài toán cốt yếu trong các
lĩnh vực nhận dạng hay thị giác máy, nó là cơ sở cho nhiều ứng dụng quan
trọng. Nhận dạng đối tượng có rất nhiều cách tiếp cận để giải quyết, mặc dù mỗi
một loại đối tượng sẽ có một kỹ thuật cụ thể, song chúng vẫn có một cơ sở
chung. Một trong những nguyên nhân quyết định cho chất lượng nhận dạng đối
tượng trong ảnh đó chính là việc trích chọn đặc trưng. Các đặc trưng được trích

chọn thường dựa vào các đặc trưng bất biến.
Lý thuyết về điểm bất động đã được nghiên cứu nhiều trong toán học và vật
lý. Việc nghiên cứu áp dụng lý thuyết này để trích chọn đặc điểm phục vụ cho
4

nhận dạng trong xử lý ảnh là hướng tiếp cận mới và có nhiều hứa hẹn nhất là đối
với các đối tượng có sự biến đổi về kích thước, hình dạng, các đối tượng bị che
khuất một số bộ phận hoặc đối tượng chuyển động v.v Như vậy bài toán nhận
dạng đối tượng dựa vào các đặc trưng bất biến mà nền tảng là dựa vào các điểm
bất động là một cách tiếp cận mới trong khoa học nhận dạng, là cơ sở để xây
dựng nhiều ứng dụng quan trọng và cần thiết.
Trên đây đã điểm qua tầm quan trọng của bài toán nhận dạng đối tượng,
đặc biệt là các đối tượng bị biến đổi đã cho ta thấy rõ tính cần thiết cũng như
tính thời sự đồng thời là ý nghĩa khoa học và thực tiễn của vấn đề. Nhận thức
được điều này, tôi đã chọn đề tài luận văn: “Điểm bất động và ứng dụng trong
nhận dạng đối tượng”.
Bố cục của luận văn bao gồm phần mở đầu, phần kết luận và ba chương nội
dung được tổ chức như sau:
Chương 1: Tổng quan về bất biến và nhận dạng đối tượng
Chương này trình bày định nghĩa các loại bất biến, lý thuyết điểm bất động,
cũng như bài toán nhận dạng đối tượng và cách giải quyết.
Chương 2: Các phương pháp xác định điểm bất động trong ảnh
Chương này trình bày các kỹ thuật xác định các điểm bất động trong ảnh để
xây dựng các đặc trưng bất biến của đối tượng và sử dụng các đặc trưng này cho
việc so khớp nhận dạng đối tượng.
Chương 3: Ứng dụng điểm bất động trong nhận dạng đối tượng
Trong phần này luận văn trình bày ứng dụng nhận dạng đối tượng dựa vào
các đặc trưng bất biến được xây dựng từ các điểm bất động, cài đặt thử nghiệm
một phương pháp đã trình bày ở chương 2.
5


Chƣơng 1 –

TỔNG QUAN VỀ BẤT BIẾN VÀ NHẬN DẠNG
ĐỐI TƢỢNG

Chương này trình bày tổng quan về bài toán nhận dạng đối tượng trong
ảnh, đề cập đến hai vần đề chính là các dạng bất biến trong ảnh và lý thuyết
điểm bất động.
1.1 Tổng quan về nhận dạng
Trong lý thuyết nhận dạng nói chung và nhận dạng ảnh nói riêng có 3 cách
tiếp cận khác nhau:
- Nhận dạng dựa vào phân hoạch không gian
- Nhận dạng cấu trúc
- Nhận dạng dựa vào kỹ thuật mạng nơron
Hai cách tiếp cận đầu là các kỹ thuật kinh điển. Các đối tượng ảnh được
quan sát và thu nhận được phải trải qua giai đoạn tiền xử lý nhằm tăng cường
chất lượng, làm nổi các chi tiết, tiếp theo là trích chọn và biểu diễn các đặc trưng
và cuối cùng mới qua giai đoạn nhận dạng. Cách tiếp cận thứ ba hoàn toàn khác.
Nó dựa vào cơ chế đoán nhận, lưu trữ và phân biệt đối tượng mô phỏng theo
hoạt động của hệ thần kinh con người. Do cơ chế đặc biệt, các đối tượng thu
nhận bởi thị giác người không cần qua giai đoạn cải tiến mà chuyển sang giai
đoạn tổng hợp, đối sánh các mẫu đã lưu trữ để nhận dạng.
Nhận dạng là quá trình phân loại các đối tượng được biểu diễn theo một mô
hình nào đó và gán cho chúng một lớp (gán cho đối tượng một tên gọi) dựa theo
các quy luật và các mẫu chuẩn. Quá trình nhận dạng dựa vào những mẫu học
biết trước gọi là nhận dạng có thầy hay học có thầy; trong trường hợp ngược lại
gọi là học không có thầy.
6


1.1.1 Không gian biểu diễn đối tƣợng, không gian diễn dịch
1.1.1.1 Không gian biểu diễn đối tƣợng
Các đối tượng khi quan sát hay thu nhận được, thường được biểu diễn bởi
tập các đặc trưng hay đặc tính. Như trong trường hợp xử lý ảnh, ảnh sau khi
được tăng cường để nâng cao chất lượng, phân vùng và trích chọn đặc tính được
biểu diễn bởi các đặc trưng như biên, miền đồng nhất, v.v Người ta thường
phân các đặc trưng này theo các loại như: đặc trưng tôpô, đặc trưng hình học và
đặc trưng chức năng. Việc biểu diễn ảnh theo đặc trưng nào là tùy thuộc vào
từng ứng dụng.
Ở đây ta đưa ra một cách hình thức cho việc biểu diễn các đối tượng. Giả
sử đối tượng X được biểu diễn bởi n thành phần (n đặc trưng): X={x
1
, x
2
,…,x
n
};
mỗi x
i
biểu diễn một đặc trưng. Không gian biểu diễn đối tượng thường gọi tắt là
không gian đối tượng X được định nghĩa:
X = { X
1
, X
2
,…, X
m
}
trong đó mỗi X
i

biểu diễn một đối tượng. Không gian này có thể là vô hạn. Để
xem xét chúng ta chỉ xét tập X là hữu hạn.
1.1.1.2 Không gian diễn dịch
Không gian diễn dịch là tập các tên gọi của đối tượng. Kết thúc quá trình
nhận dạng ta xác định được tên gọi cho các đối tượng trong tập không gian đối
tượng hay nói cách khác là đã nhận dạng được đối tượng. Một cách hình thức
gọi  là tập tên đối tượng:
 = {w
1
, w
2
, …, w
k
} với w
i
, i = 1, 2,…, k là tên của các đối tượng
Quá trình nhận dạng đối tượng f là một ánh xạ f: X   với f là tập các
quy luật để định một phần tử trong X ứng với một phần tử trong .
1.1.2 Mô hình và bản chất của quá trình nhận dạng
1.1.2.1 Mô hình
Việc lựa chọn một quá trình nhận dạng có liên quan mật thiết đến kiểu mô
tả mà người ta sử dụng để đặc tả đối tượng. Trong nhận dạng, người ta phân chia
làm hai họ lớn:
7

- Họ mô tả theo tham số
- Họ mô tả theo cấu trúc
Cách mô tả được lựa chọn sẽ xác định mô hình của đối tượng. Như vậy, chúng
ta sẽ có hai loại mô hình: mô hình theo tham số và mô hình theo cấu trúc.
* Mô hình tham số: sử dụng một vectơ để đặc tả đối tượng. Mỗi phần tử của

vectơ mô tả một đặc tính của đối tượng. Ví dụ trong các đặc trưng chức năng,
người ta sử dụng các cơ sở trực giao để biểu diễn. Và như vậy, ảnh sẽ được biểu
diễn bởi một chuỗi các hàm trực giao. Giả sử C là đường bao của ảnh và C(i,j) là
điểm thứ i trên đường bao, i = 1, 2,…, N (đường bao gồm N điểm).
Giả sử tiếp:
0i
1
1
xx
N
N
i




0i
1
1
yy
N
N
i



là tọa độ tâm điểm. Như vậy, moment trung tâm bậc p, q của đường bao là:
N
pq
pq i 0 i 0

1
1
μ (x -x ) (y -y )
N
i



Vectơ tham số trong trường hợp này chính là các moment 
ij
với i = 1, 2,…, p
và j = 1, 2,…, q. Còn trong số các đặc trưng hình học, người ta sử dụng chu tuyến,
đường bao, diện tích và tỷ lệ T = 4S/p
2
, với S là diện tích, p là chu tuyến.
Việc lựa chọn phương pháp biểu diễn sẽ làm đơn giản cách xây dựng. Tuy
nhiên, việc lựa chọn đặc trưng nào là hoàn toàn phụ thuộc vào ứng dụng.
* Mô hình cấu trúc: cách tiếp cận của mô hình này dựa vào việc mô tả đối
tượng nhờ một số khái niệm biểu thị các đối tượng cơ sở trong ngôn ngữ tự
nhiên. Để mô tả đối tượng, người ta dùng một số dạng nguyên thủy như đoạn
thẳng, cung, v.v… Trong mô hình này, người ta sử dụng một bộ ký hiệu kết thúc
V
t
, một bộ ký hiệu không kết thúc gọi là V
n
. Ngoài ra có dùng một tập các luật
sản xuất để mô tả cách xây dựng các đối tượng phù hợp dựa trên các đối tượng
đơn giản hoặc các đối tượng nguyên thủy (tập V
t
). Trong cách tiếp cận này, ta

chấp nhận một khẳng định là: cấu trúc một dạng là kết quả của việc áp dụng luật
sản xuất theo những nguyên tắc xác định bắt đầu từ một dạng gốc bắt đầu. Một
8

cách hình thức, ta có thể coi mô hình này tương đương một văn phạm G = (V
t
,
V
n
, P, S) với:
- V
t
là bộ ký hiệu kết thúc,
- V
n
là bộ ký hiệu không kết thúc,
- P là luật sản xuất,
- S là dạng (ký hiệu bắt đầu).
1.1.2.2 Bản chất của quá trình nhận dạng
Quá trình nhận dạng gồm 3 giai đoạn chính:
- Lựa chọn mô hình biểu diễn đối tượng
- Lựa chọn luật ra quyết định (phương pháp nhận dạng) và suy diễn quá
trình học.
- Học nhận dạng.
Khi mô hình biểu diễn đối tượng đã được xác định, có thể là định lượng
(mô hình tham số) hay định tính (mô hình cấu trúc), quá trình nhận dạng chuyển
sang giai đoạn học. Học là giai đoạn rất quan trọng. Thao tác học nhằm cải
thiện, điều chỉnh việc phân hoạch tập đối tượng thành các lớp.
Việc nhận dạng chính là tìm ra quy luật và các thuật toán để có thể gán đối
tượng vào một lớp hay nói cách khác gán cho đối tượng một tên.

Nhìn chung, dù là mô hình nào và kỹ thuật nhận dạng ra sao, một hệ thống
nhận dạng có thể tóm tắt theo sơ đồ sau:





Hình 1.1. Sơ đồ tổng quát một hệ nhận dạng
1.1.3 Bài toán nhận dạng đối tƣợng ảnh
Cho trước các đối tượng hai chiều. Tồn tại nhiều bài toán nhận dạng khác
nhau đối với các đối tượng ảnh hai chiều.
Trích chọn đặc trƣng
biểu diễn đối tƣợng
Phân lớp
ra quyết định

Đánh giá
Quá trình tiền xử lý
Khối nhận dạng
trả lời
9

Bài toán 1: Cho hai đối tượng ảnh hai chiều trong Hình 1.2. Hãy so sánh
xem chúng có giống nhau hay không?

Hình 1.2. Hai đối tƣợng trên mặt phẳng
Bài toán này con người có thể giải quyết một cách nhanh chóng (Hai đối
tượng này có diện tích giống nhau và chỉ khác nhau một lỗ hổng). Nhưng đối
với máy thì việc giải bài toán này không dễ dàng gì.
Bài toán 2: Cho hai đối tượng ảnh có kích thước khác nhau và đặt tùy ý

trên mặt phẳng. Hãy so sánh xem chúng có “giống nhau” hay không?
Để giải bài toán này con người đặt chúng lại theo vị trí thích hợp sao cho
hướng nằm của chúng giống nhau. Sau đó dùng các độ đo khác nhau để so sánh
hai đối tượng này. Chẳng hạn, khi đặt các đối tượng theo các vị trí mới cần sử
dụng các phép biến đổi như quay, tịnh tiến. Trong các hoàn cảnh khác nhau
người ta có thể xem rằng hai đối tượng đồng dạng là giống nhau. Do đó, trong
quá trình giải bài toán này con người đã tự mã hóa các thông số của các đối
tượng ảnh bất biến theo vị trí, hướng và tỷ lệ. Đây là một việc rất khó khăn.
Bài toán 3: Cho các đối tượng trong Hình 1.3. Hãy phân loại chúng thành
hai lớp.
Để giải bài toán này con người có thể phân chia các đối tượng thành hai lớp
đó là tứ giác {b,c,e} và hình tròn {a,d}. Người ta cũng có thể chia thành hai lớp
các đối tượng có diện tích bằng nhau {a,b,c} và {d,e}.

a
b
c
d
e


Hình 1.3. Các tứ giác và hình tròn trên mặt phẳng hai chiều
10

Bài toán nhận dạng các đối tượng hai chiều rất phức tạp, nó liên quan đến
các ràng buộc giữa các đặc trưng hình học. Trong hình có các biểu diễn như
cạnh, đỉnh, các góc. Hai đối tượng được coi là giống nhau nếu chúng thỏa mãn
ràng buộc nào đó. Các ràng buộc này rất phức tạp.
Bài toán 4: Cho tập hữu hạn các đối tượng, được gọi là mẫu. Hãy so sánh
một đối tượng mới xem chúng có giống một trong các đối tượng mẫu hay không?

Rõ ràng để giải quyết bài toán này thì các đối tượng cần phải được mã hóa
thành các tham số. Cần so sánh các tham số của đối tượng với các tham số mẫu.
Do đó xuất hiện nhu cầu cho việc mã hóa các đối tượng mẫu. Các đặc trưng
được mã hóa của các đối tượng là các moment bất biến không phụ thuộc vào vị
trí, tỷ lệ, hướng quay của các đối tượng.
1.2 Tổng quan về bất biến và vai trò của bất biến trong nhận dạng
Phần này trình bày tổng quan một số dạng bất biến và các ứng dụng của nó
trong nhận dạng ảnh. Bất biến của ảnh là tập các thuộc tính mà chúng không
thay đổi đối với các phép biến đổi ảnh. Một trong những phép biến đổi tuyến
tính đó là phép quay, tịnh tiến và co dãn ảnh. Có các kiểu bất biến sau:
Bất biến thống kê: Dựa vào các điểm ảnh để tính toán các đặc trưng thống
kê, chẳng hạn các moment, độ lệch chuẩn của tập ảnh hay các độ đo thống kê
khác mà chúng không phụ thuộc vào các phép biến đổi tuyến tính.
Bất biến hình học: Số đo của các đối tượng ảnh.
Bất biến tôpô: Biểu diễn các cấu trúc tôpô của các ảnh như số điểm đỉnh,
số lỗ hổng v.v
Bất biến đại số: Dựa vào việc tổ hợp các tham số tính được từ ảnh để tạo ra
tham số mới có tính chất bất biến.
1.2.1 Bất biến moment thống kê
Cho một vùng ảnh bằng cách cho các điểm của nó, các moment có thể
được sử dụng để mô tả đặc trưng bất biến của ảnh đối với các phép biến đổi ảnh:
dịch chuyển, quay và co dãn ảnh. Hàm f(x,y) xác định trên miền bị chặn D. Đối
với ảnh nhị phân thì ảnh được biểu diễn bởi hàm đặc trưng như sau:
11

f x y( , ) 





1, nếu (x,y) D
0, nếu khác đi
Khi đó các moment bậc (p+q) của hàm f(x,y) trong miền D tồn tại và
được xác định như sau:
m f x y x y dxdy
pq
p q







( , )
với p, q = 0, 1, 2, (1.1)
Moment tâm bậc (p+q) của hàm f(x,y) được tính như sau:

pq
p q
f x y x x y y dxdy  






( , )( ) ( )

trong đó

x
m
m

10
00

y
m
m

01
00
là hoành độ và tung độ của trọng tâm ảnh.
Bằng cách tổ hợp các moment bậc 3, ta thu được các moment bất biến như sau:

1
=(
20
+
02
)

2
=(
20
-
02
)
2

+4
11


3
=(
30
-3
12
)
2
+ (
03
-3
21
)
2


4
=(
30
+
12
)
2
+ (
03
+
21

)
2


5
=(
30
-3
12
)(
30
+
12
)[(
30
+
12
)
2
-3(
21
+
03
)
2
]
+(
03
-3
21

)(
03
+
21
)[(
03
+
21
)
2
-3(
12
+
30
)
2
]

6
=(
20
-
02
)[(
30
+
12
)
2
-(

21
+
03
)
2
]+4(
30
+
12
)(
03
+
21
)

7
=(3
21
-
03
)(
30
+
12
)[(
30
+
12
)
2

-3(
21
+
03
)
2
]
+(
30
-3
21
)
2
(
21
+
03
)[(
03
+
21
)
2
-3(
30
+
12
)
2
]

Khi tính các moment 
pq
theo tọa độ cực bằng cách thay x=rcos, y=rsin
và dxdy=rdrd vào (1.1) suy ra:
     

pq
p q
f r r d




cos sin ( cos , sin )
0
2
.
Đặt g(r,) = f(rcos, rsin)
12

 
r
k
k g r g r dr( , ) ( , )




    


( , , ) cos sin ( , )p q r g r d
p q





    

( , , , ) ( , )cos sink p q g r g r d dr
k p q





0
2

 

( ) ( , , )g 0 0 g

Khi đó

pq
có thể được viết như sau:
    

pq

p q p p
r g r d
 




1
0
cos sin ( , )

Trong hệ tọa độ cực các bất biến 
1
, 
2
,, 
7
được viết lại như sau:
  
1
= ( , ( ))
r
g3
;
  


2
= ( , ( ))
r

j
ge3
2
2

  


3
3
2
= (4, ( ))
r
j
ge

  


4
2
= (4, ( ))
r
j
ge

    





5
3 3
4        RP ge ge
r
j
r
j
( )


    




6
2 2
3        RP ge ge
r
j
r
j
( )


   





7
3 3
4         IP ge ge
r
j
r
j
( )


ở đây RP, IP là các phép toán lấy phần thực và phần ảo của một số phức.
Từ các đẳng thức trên dễ thấy rằng với k, l cho trước thì các hàm
|
r
(k,

(ge
jl

))|
2

bất biến đối với phép quay và đối xứng đối với , khi r biến đổi từ 0 tới +.
Nếu r là số thực dương thì biểu thức sau là bất biến:
 

 
r
(1, (e ge

- r jl
))
2

13

Như vậy hàm trọng số r
k
có thể thay bằng hàm tham số mũ và các hàm
tương tự như trên, biểu thức sau bất biến đối với phép quay:
 

 
r
(0, (e ge
- r jl
)
2

1.2.2 Bất biến hình học
Các moment hình học là số đo kích thước của các ảnh. Các số đo hình học
bất biến đối với phép quay, phép tịnh tiến. Một số trong các số đo hình học là:
1) Diện tích của ảnh
S =
i j f i j
j
N
i
M
0 0

11
00
( , )


 

2) Chu vi của ảnh P.
3) Bán kính lớn nhất Rmax, nhỏ nhất Rmin từ tâm của ảnh tới biên của ảnh.
4) Số lỗ hổng, tổng diện tích của các lỗ hổng, diện tích trung bình, độ lệch
bình phương trung bình của diện tích các lỗ hổng.
5) Độ com păc của ảnh (được tính bằng
P
S
2
4
).
Ví dụ 1.1: Trong hình có một lỗ hổng. Đường kính hình tròn lớn là 3.5cm,
Đường kính hình tròn con là 1.5 cm, Rmin = 0.25cm và Rmax= 1.75, diện tích
của hình là 2.53125, diện tích lỗ hổng là 0.5625.






Hình 1.4. Ví dụ về các bất biến hình học đối phép quay và tịnh tiến
6) Các trục quán tính
Các moment cấp 2 
20

, 
11
, 
02
có một vai trò đặc biệt trong việc tìm trục
chính. Khi quay các trục tọa độ quanh trọng tâm, các moment trung tâm sẽ thay
đổi tương ứng và quán tính của ảnh sẽ đạt cực đại tại một góc quay  nào đó.


Lỗ hổng
Rmax
Rmin
14

Các trục tọa độ mới ứng với  được gọi là các trục chính. Có thể tìm được các
trục tọa này nhờ các vectơ riêng V
min
, V
max
của ma trận moment quán tính:
 
 
20 11
11 02







,
như sau:
   
V
min
    
1
2
1
2
4
20 02 20 02
2
11
    
,

   
V
max
    
1
2
1
2
4
20 02 20 02
2
12
    


Góc quay  của ảnh tương ứng với 
11
, 
20
, 
02
có thể tính theo công thức sau:
sin
( )
2
2
4
11
11
2
20 02
2
 
 

  

cos
( )
2
4
20 02
11
2

20 02
2
 

 
 
  

Từ đó suy ra



 


1
2
2
11
20 02
artg

7) Kích thước của hình chữ nhật nhỏ nhất bao quanh ảnh có các cạnh song
song với các trục quán tính cực đại và cực tiểu l
1
và l
2
.
Ví dụ 1.2: Đối với hình chữ nhật kích thước a, b thì
R

a b
R
a b
S ab l a l b
max min
,
min( , )
, , , ,

   
2 2
1 2
2 2

V
a b
a b
V
a b
a b
min max
min( , )
max( , )
,
max( , )
min( , )
 
12 12

Ví dụ 1.3: Đối với hình vuông có cạnh là a thì

R
a
R
a
S a l a l a
max min
, , , , ,    
2
2
2
1 2

V V
min
,
max
 
1
12
1
12

15

Ví dụ 1.4: Đối với hình elip
x
a
y
b
2

2
2
2
1 
thì
R a b R a b S ab l a l b
max min
max( , ), min( , ), , , ,    
1 2

V
a b
a b
V
a b
a b
min
,
max
min( , )
max( , )
max( , )
min( , )
 
4 4 

Ví dụ 1.5: Hình tròn bán kính R
R R R S R l l R V V
max min min max
, , ,     


2
1 2
1
4

1.2.3 Bất biến đại số
Các bất biến đại số thường được xác định bằng cách tổ hợp các hệ số của đa
thức mô tả đối tượng ảnh (chẳng hạn chu tuyến, phân bố của các điểm ảnh, v.v ).
Định nghĩa 1.1:
Đa thức n biến đẳng cấp bậc m có dạng:
f x x x
m
i i i
a x x x
N
n
i i i
i i
n
i
i i i m
n
n
n
( , , , )
!
! ! !



.
1 2
1 2
1 2
1 2
1 2
1 2

   


Gọi
a
i i i
n1 2

là các hệ số của đa thức f. Ký hiệu a=( a
m0 0
, , a
0 0m
) là vectơ
hệ số của đa thức f.
Đa thức có 2 biến đẳng cấp bậc m gọi là dạng nhị thức bậc m:
f(x
1
, x
2
) =
a
C

x x
i,m i
m
i
1
i
2
m i


 

0 i m

Tam thức bậc m là đa thức có 3 biến đẳng cấp bậc m:
f x a
m!
p!q!r!
x x x
pqr
p q
r
p+q+r=m
( , x , x ) =
1 2 3 1 2 3


Trong đó p, q, r là các số tự nhiên.
Định nghĩa 1.2: Cho trước một đa thức f, và I(f) là hàm số phụ thuộc vào
các hệ số của đa thức f. Gọi  là phép biến đổi tọa độ (x'

1
,x'
2
,,x'
n
)=
(x
1
,x
2
,,x
n
). I được gọi là bất biến đối với phép biến đổi  nếu và chỉ nếu:
I(f(x)) = 

I(f((x)))
16

ở đây 

là hằng số chỉ phụ thuộc vào phép biến đổi .
1.2.4 Vai trò của bất biến trong nhận dạng
Vấn đề cơ bản trong bài toán nhận dạng ảnh là xác định các đối tượng
không phụ thuộc vào vị trí, kích thước và hướng. Các moment và các hàm
moment đã được ứng dụng như các đặc trưng toàn thể của một ảnh trong nhận
dạng. Các bức ảnh rất phức tạp nên cần phân loại, phân tích chúng để tìm ra các
moment bất biến hay các đặc trưng giúp cho việc xử lý ảnh trên máy tính có thể
thực hiện được. Thông thường những đặc trưng bất biến độc lập đối với các
phép dịch chuyển, quay và co dãn ảnh. Có nhiều dạng bất biến để mô tả một đối
tượng ảnh như bất biến thống kê, đại số, tôpô, hình học, v.v Nếu lưu ảnh theo

kiểu bitmap thì dung lượng nhớ rất lớn, nên trong quá trình lưu trữ phải tìm cách
lưu các đặc trưng quan trọng nhằm giảm dung lượng bộ nhớ một cách đáng kể.
Các bất biến biểu diễn đặc trưng của các ảnh. Việc trích chọn tốt các bất biến
giúp cho việc nhận dạng các đối tượng ảnh chính xác, tăng tốc độ tính toán và
giảm khối lượng bộ nhớ lưu trữ. Tùy theo các ứng dụng cụ thể mà chọn các bất
biến thích hợp.
Các bất biến được sử dụng để:
 Nhận dạng chữ.
 Nhận dạng các đối tượng ảnh công nghiệp (dùng các bất biến hình học,
tôpô, đại số, thống kê).
 Nhận dạng các cấu trúc mạch điện tử (sử dụng các bất biến tôpô).
 Nhận dạng vân tay (dựa vào các bất biến địa phương như chỗ điểm xoáy
của vân tay, tam phân điểm, hình tròn hay hình ô van).
 Nhận dạng các ký hiệu trên bản đồ (sử dụng các bất biến như màu sắc,
histogram, bất biến thống kê, hình học).
 Nhận dạng chữ trên bản đồ (dùng các bất biến thống kê, đại số kết hợp
với các phương pháp khác).
 Nhận dạng các cấu trúc sông (dùng bất biến cấu trúc tôpô, thống kê chẳng
hạn như số điểm kỳ dị của đoạn sông trên đơn vị độ dài hay diện tích).
17

 Nhận dạng các hình bàn tay (dựa vào các bất biến thống kê, hình học kết
hợp với cách tính histogram).
 Nhận dạng các kiểu ám hiệu bằng tay (cho phép giao tiếp người  máy
hoặc thông qua mạng lưới máy tính với người khác bằng cử chỉ tay).
1.3 Điểm bất động và vai trò của điểm bất động trong nhận dạng
1.3.1 Lý thuyết điểm bất động
Các định lý điểm bất động đã cung cấp nhiều điều kiện để tìm ra các giải
pháp cho các bài toán về ánh xạ (các ánh xạ đơn hoặc ánh xạ nhận đa giá trị).
Bản thân lý thuyết này là một sự pha trộn tốt đẹp của hình học tôpô phân tích và

hình học. Năm mươi năm gần đây lý thuyết về các điểm bất động đã được khám
phá như một công cụ rất quan trọng và có tác động mạnh mẽ trong việc nghiên
cứu các hiện tượng phi tuyến tính. Trong thực tế các kỹ thuật điểm bất động đã
và đang được áp dụng trong nhiều lĩnh vực khác nhau như sinh vật học, hóa học,
kinh tế, lý thuyết game và vật lý. Gần đây, ứng dụng của lý thuyết điểm bất
động trong xử lý ảnh cũng đã được phân tích.
Một số định lý điểm bất động kinh điển được sử dụng rộng rãi được phát
biểu như sau:
* Định lý điểm bất động của Brouwer:
Trong toán học, định lý điểm bất động Brouwer là một định lý quan trọng
áp dụng cho các không gian hữu hạn chiều và hình thành cơ sở cho các định lý
điểm bất động tổng quát hơn.
Phát biểu định lý: với một ánh xạ liên tục f : S  S của một đơn hình n-
chiều vào chính nó tồn tại ít nhất một điểm x  S mà f(x)=x.
Định lý điểm bất động của Brouwer phát biểu rằng nếu một tập không
rỗng, compact, lồi của một không gian tích trong thực hữu hạn chiều được ánh
xạ liên tục vào chính nó, thì có ít nhất một trong các điểm của nó vẫn không
thay đổi.
Định lý này có thể được minh họa bằng một ví dụ thú vị như sau: lấy hai tờ
giấy có cùng kích thước và đặt lên chúng trong một hệ tọa độ, đặt tờ giấy thứ nhất
lên bàn, vò nhàu tờ giấy thứ hai và đặt tờ giấy này lên trên tờ giấy thứ nhất. Khi đó
18

sẽ có ít nhất một điểm của tờ giấy đã vò nhàu ở vị trí chính xác với điểm tương ứng
của tờ giấy trên bàn (tức là điểm này vẫn giữa nguyên tọa độ). Đây là một hệ quả
của trường hợp n = 2 được áp dụng cho một ánh xạ liên tục để gán tọa độ của mỗi
điểm của tờ giấy đã vò nhàu với tọa độ của điểm thuộc tờ giấy phẳng ở dưới nó.
* Định lý điểm bất động của Banach:
Định lý điểm bất động của Banach (được biết như định lý ánh xạ co hoặc
nguyên lý ánh xạ co) là một công cụ quan trọng trong lý thuyết không gian

metric; nó bảo đảm sự tồn tại và tính duy nhất của các điểm bất động của các
ánh xạ vào chính nó của không gian metric, và cung cấp một phương pháp suy
diễn để tìm ra các điểm cố định đó.
Lấy (X, d) là một không gian metric đầy đủ không rỗng. Cho T : X → X là
một ánh xạ co trên X, tức là: có một số thực không âm q < 1 để
( , ) . ( , )d Tx Ty qd x y
với mọi x, y thuộc X. Khi đó ánh xạ T nhận được một và chỉ
một điểm cố định x
*
trong X (điều này có nghĩa là Tx
*
= x
*
). Hơn nữa, điểm bất
động này có thể được tìm thấy như sau: bắt đầu với một phần tử bất kỳ x
0
trong
X và xác định một chuỗi lặp x
n
= Tx
n-1
với n = 1, 2, 3, thì chuỗi này hội tụ, và
giới hạn của nó là x
*
. Bất đẳng thức sau mô tả tốc độ hội tụ:
*
10
( , ) ( , )
1
n

n
q
d x x d x x
q



Tương đương:
*
11
( , ) ( , )
1
n
nn
q
d x x d x x
q





**
1
( , ) ( , )
n
n
d x x qd x x




Chú ý rằng điều kiện d(Tx, Ty) < d(x, y) với x và y khác nhau thì không đủ
để đảm bảo sự tồn tại của một điểm cố định, như được thể hiện bởi ánh xạ
T : [1,∞) → [1,∞) với T(x) = x + 1/x, nó không có một điểm cố định nào cả. Tuy
nhiên, nếu không gian X là compact, thì giả định lỏng lẻo này đưa đến tất cả các
phát biểu của định lý này. Khi sử dụng định lý này trong thực tế, nhiệm vụ khó
nhất là xác định tập X một cách đúng đắn để T ánh xạ thực sự các phần tử từ X
vào X, tức là để Tx luôn là một phần tử của X.
19

1.3.2 Vai trò của điểm bất động trong nhận dạng đối tƣợng
Lý thuyết điểm bất động đóng một vai trò cơ bản trong nhiều lĩnh lực của
khoa học máy tính, cấu trúc và các đặc tính của các điểm bất động đã được
nghiên cứu trong nhiều framework khác nhau và đã được ứng dụng trong nhiều
lĩnh vực của xử lý ảnh. Chúng ta thấy rằng các thuật toán lặp hội tụ cho việc
phục hồi ảnh có thể được xem xét trong phạm vi lớp thuật toán điểm bất động.
Tiếp đến là ứng dụng của lý thuyết này trong việc xử lý ảnh màu như nhận dạng
đối tượng.
Nhiều thuật toán về khôi phục ảnh đã sử dụng tính lặp đi lặp lại của các
điểm bất động để làm tăng độ chính xác cho sự phục hồi ảnh.
Còn trong nhận dạng đối tượng, căn cứ vào các điểm bất động ta có thể
trích chọn được các đặc trưng bất biến để nhận dạng đối tượng tốt hơn, đây là
một hướng nghiên cứu mới. Khi đối tượng được thu nhận ở các tỷ lệ khác nhau,
góc quay camera có thể thay đổi hoặc có sự biến đối đôi chút về hình dạng thì
chúng vẫn giữ lại một số điểm nhất định không thay đổi, dựa vào các điểm bất
biến này của đối tượng ta vẫn có thể nhận dạng được đối tượng.
1.3.2.1 Trích chọn các đặc trƣng bất biến từ các điểm bất động
Một trong những ứng dụng quan trọng của điểm bất động trong nhận dạng
đó là trích chọn đặc trưng, vì điểm bất động là một dạng của bất biến nên các đặc
trưng được trích chọn dựa vào các điểm bất động cũng bất biến nên nó thuận tiện

trong việc so khớp và nhận dạng. Sau khi phát hiện các điểm quan tâm bất biến
trong ảnh, bước tiếp theo là tính toán các đặc trưng dựa vào vị trí của các điểm bất
động, bằng cách tạo ra các bộ mô tả cho các điểm này. Bộ mô tả điểm khóa được
xây dựng như sau:
Sau khi đã xác định được vị trí, tỷ lệ cho mỗi điểm khóa. Các tham số này
áp đặt cho hệ tọa độ 2D cục bộ để mô tả vùng ảnh cục bộ. Bước tiếp theo là tính
toán một bộ mô tả cho một vùng ảnh cục bộ xung quanh điểm khóa để có thể bất
biến đối với các thay đổi còn lại như thay đổi độ sáng hoặc điểm nhìn 3D.
Các bộ mô tả điểm khóa là các đạo hàm Gaussian được tính trong một vùng
lân cận cục bộ xung quanh các điểm khóa. Để tính toán bộ mô tả điểm khóa, đầu
tiên các độ lớn và hướng gradient ảnh được lấy mẫu quanh vị trí điểm khóa, sử
dụng tỷ lệ của điểm khóa để lựa chọn mức mờ Gaussian cho ảnh. Để đạt được
20

sự ước lượng ổn định về hướng gradient, ta sử dụng hướng gradient trung bình
trong một vùng lân cận của điểm khóa. Sự bất biến đối với các biến đổi về
cường độ affine được đạt đến bằng việc chia các đạo hàm bậc cao hơn thành các
đạo hàm bậc nhất. Như vậy, chúng ta thu được các bộ mô tả với số chiều hữu
hạn biểu diễn các đặc trưng được trích chọn từ các điểm bất động.
1.3.2.2 So khớp đặc trƣng
Nhận dạng đối tượng được thực hiện bằng việc so khớp mỗi đặc trưng một cách
độc lập tới một cơ sở dữ liệu các đặc trưng được trích chọn từ các ảnh huấn luyện.
Một so khớp ứng cử tốt nhất cho mỗi đặc trưng được tìm thấy bằng việc
xác định láng giềng gần nhất của nó trong một cơ sở dữ liệu các đặc trưng. Láng
giềng gần nhất được xác định bởi đặc trưng có khoảng cách Euclidean nhỏ nhất.
Giả sử các đặc trưng được mô tả thành các vectơ trong không gian Euclide
R
n
thì khoảng cách Euclide giữa hai đặc trưng P = (p
1

, p
2
, , p
n
) và Q = (q
1
, q
2
, ,
q
n
) được định nghĩa như sau:
2 2 2 2
1 1 2 2
1
( ) ( ) ( ) ( )
n
n n i i
i
p q p q p q p q

       


Ngoài ra, người ta cũng thường sử dụng khoảng cách Mahalanobis để lựa
chọn cho mỗi đặc trưng trong ảnh thứ nhất một đặc trưng tương tự nhất trong
ảnh thứ hai. Nếu khoảng cách này nhỏ hơn một ngưỡng cho trước thì so khớp đó
chính xác một cách tiềm tàng.
Khoảng cách Mahalanobis là một cách hữu ích cho việc xác định độ tương
tự của một tập các mẫu chưa biết tới một tập các mẫu đã biết. Khác với khoảng

cách Euclide, khoảng cách Mahalanobis tính đến các độ tương quan của tập dữ
liệu và nó bất biến tỷ lệ, tức là không phụ thuộc vào tỷ lệ của các phép đo.
Chính thức, khoảng cách Mahalanobis từ một nhóm giá trị với giá trị trung
bình
1 2 3
( , , , , )
T
p
    

và ma trận đồng biến  cho một vectơ đa biến
1 2 3
( , , , , )
T
p
x x x x x
được định nghĩa như sau:
1
( ) ( ) ( )
T
M
D x x x


   

Khoảng cách Mahalanobis cũng có thể được định nghĩa như độ đo tính
21

không đồng dạng giữa hai vectơ ngẫu nhiên

x


y

của cùng phân phối với ma
trận đồng biến :
1
( , ) ( ) ( )
T
d x y x y x y

   
     

Nếu ma trận đồng biến là ma trận đơn vị thì khoảng cách Mahalanobis sẽ
dần tới khoảng cách Euclide. Nếu ma trận đồng biến là chéo thì độ đo khoảng
cách kết quả được gọi là khoảng cách Euclide chuẩn hóa:
2
2
1
()
( , )
p
ii
i
i
xy
d x y








Khoảng cách Mahalanobis được dùng rộng rãi trong phân tích cụm và các
kỹ thuật phân lớp khác.


22

Chƣơng 2 –

CÁC PHƢƠNG PHÁP XÁC ĐỊNH ĐIỂM BẤT ĐỘNG
TRONG ẢNH


Chương này trình bày một số phương pháp được sử dụng hiệu quả trong
cách tiếp cận để xác định các điểm bất động trong ảnh nhằm trích chọn các đặc
trưng bất biến của đối tượng và sử dụng các đặc trưng này trong việc so khớp,
nhận dạng đối tượng.
Trong những năm gần đây việc sử dụng các đặc trưng cục bộ đã trở thành
một trong những hướng tiếp cận có ảnh hưởng lớn trong việc nhận dạng đối
tượng dựa vào nội dung ảnh. Việc phát hiện các điểm đặc biệt là bước đầu tiên
trong quá trình so khớp và nhận dạng. Vì vậy, một thuật toán đáng tin cậy cho
việc trích chọn các điểm bất biến là rất cần thiết cho nhiều ứng dụng. Chương
này trình bày một số phương pháp mới cho việc xác định các điểm bất động
trong ảnh. Các hướng tiếp cận này bất biến đối với các phép biến đổi hình học
và phép biến đổi trắc quang. Ở đây cũng nhấn mạnh vấn đề bất biến đối với

phép biến đổi affine.
2.1 Phƣơng pháp Harris
Phát hiện góc (corner detection) hoặc một thuật ngữ tổng quát hơn là phát
hiện điểm quan tâm (interest point detection) là một hướng tiếp cận được sử dụng
trong các hệ thống thị giác máy tính để trích chọn các loại đặc trưng và suy luận ra
các nội dung của một ảnh. Việc phát hiện góc được dùng thường xuyên trong phát
hiện, theo dõi chuyển động, mô hình 3D và nhận dạng đối tượng.
Một góc được xác định bởi nơi giao nhau của hai cạnh. Một góc cũng có thể
được xác định như một điểm có hai hướng khác nhau trong một vùng cục bộ của
điểm đó. Một điểm quan tâm là một điểm trong ảnh có vị trí được xác định tốt và
có thể được phát hiện nhanh chóng. Điều này có nghĩa là một điểm quan tâm có thể
là một góc nhưng cũng có thể là một điểm đơn có giá trị cường độ cực đại hoặc cực
tiểu cục bộ, các điểm kết thúc của đường thẳng hoặc một điểm trên một đường
23

cong mà ở đó độ cong là tối đa cục bộ. Thực tế, hầu hết các phương pháp phát hiện
góc phát hiện các điểm hơn là các góc nói riêng.
Phương pháp phát hiện góc Harris [5] là một phương pháp phát hiện điểm
quan tâm phổ biến vì nó bất biến đối với phép quay, thay đổi độ sáng và tạp nhiễu
ảnh. Phương pháp này dựa trên hàm tương quan tự động cục bộ của một tín hiệu;
ở đó hàm tương quan tự động cục bộ đo các thay đổi cục bộ của tín hiệu với các
mảnh ảnh được dịch chuyển một lượng nhỏ theo các hướng khác nhau.
Cho trước sự dịch chuyển (x,y) và một điểm (x,y), hàm tương quan tự
động được định nghĩa như sau:
2
W
( , ) [ ( , ) ( , )]
i i i i
c x y I x y I x x y y     


(2.1)
trong đó I(·,·) biểu thị hàm ảnh và (x
i
,y
i
) là các điểm trong cửa sổ W đặt ở vị trí
(x,y). Ảnh được dịch chuyển được xấp xỉ bởi phép khai triển Taylor được lượt
bớt thành các hạng thức bậc nhất:
( , ) ( , ) [ ( , ) ( , )]
xy
i i i i i i i i
x
I x x y y I x y I x y I x y
y





   

(2.2)
ở đây I
x
(·,·) và I
y
(·,·) biểu thị các đạo hàm từng phần tương ứng theo x và y.
Thế công thức (2.2) vào (2.1), ta được:
2
W

( , ) [ ( , ) ( , )]
i i i i
c x y I x y I x x y y     



2
W
( , ) ( , ) [ ( , ) ( , )]
i i i i x i i y i i
x
I x y I x y I x y I x y
y








  




2
W
[ ( , ) ( , )]
x i i y i i

x
I x y I x y
y













2
WW
2
WW
( ( , )) ( , ) ( , )

( , ) ( , ) ( ( , ))
x x y
i i i i i i
x y x
i i i i i i
I x y I x y I x y
x
xy

y
I x y I x y I x y










  





( , )
x
C x y
y
xy










ở đây ma trận C(x,y) bắt giữ cấu trúc cường độ của một vùng lân cận cục bộ
quanh điểm (x,y). Lấy 
1
, 
2
là các giá trị riêng của ma trận C(x,y). Các giá trị
24

riêng này tạo nên một sự mô tả bất biến đối với phép quay. Có 3 trường hợp cần
được xét:
1. Nếu cả 
1
, 
2
đều nhỏ, để hàm tương quan tự động cục bộ không thay
đổi (tức là ít thay đổi tại c(x,y) theo bất kỳ hường nào) thì vùng ảnh nằm trong
cửa sổ gần như không thay đổi về cường độ. Tức là trong trường hợp này, không
có điểm quan tâm nào được tìm thấy tại điểm ảnh (x,y).
2. Nếu một giá trị riêng là lớn và một giá trị riêng là nhỏ, thì chỉ có các dịch
chuyển cục bộ theo một hướng (dọc theo đỉnh đó) tạo ra một sự thay đổi nhỏ ở
c(x,y) và thay đổi đáng kể ở hướng trực giao, điều này biểu thị cho một cạnh.
3. Nếu cả hai giá trị riêng đều lớn, thì sự dịch chuyển theo bất kỳ hướng
nào cũng sẽ đưa đến kết quả là làm tăng đáng kể cường độ; điều này biểu thị cho
một góc.
Thuật toán này đơn giản dễ hiểu, phát hiện được nhanh chóng các điểm
quan tâm trong ảnh. Tuy nhiên phương pháp này không bất biến đối với việc
thay đổi tỷ lệ và các phép biến đổi affine.
2.2 Phƣơng pháp Harris-Laplace

Mục này trình bày một phương pháp mới trong việc phát hiện các điểm
quan tâm bất biến tỷ lệ, phương pháp này kết hợp phương pháp Harris tin cậy và
sự lựa chọn tỷ lệ tự động.
2.2.1 Sự thể hiện không gian tỷ lệ
Một đặc tính vốn có của các đối tượng thế giới thực là chúng tồn tại như
các thực thể đầy ý nghĩa trên khắp các tỷ lệ khác nhau. Một ví dụ đơn giản là
khái niệm một nhánh cây, nó chỉ có nghĩa ở tỷ lệ từ một vài centimet tới nhiều
nhất là vài mét, vì vậy thật vô nghĩa khi thảo luận khái niệm “cây” ở mức
nanomet hoặc kilomet. Với cơ sở lập luận này, thì các đối tượng trong thế giới
xuất hiện theo các cách khác nhau tùy thuộc tỷ lệ quan sát nếu người ta nhằm
vào việc mô tả chúng. Vì vậy khái niệm tỷ lệ là cực kỳ quan trọng.
Đặc biệt, sự cần thiết đối với việc thể hiện đa tỷ lệ nảy sinh khi thiết kế các
phương pháp phân tích tự động và thu nhận thông tin từ các phép đo thế giới thực.
Để có thể trích chọn bất kỳ thông tin nào từ dữ liệu ảnh, rõ ràng người ta phải

×