Tải bản đầy đủ (.pdf) (6 trang)

MultiBooks - Tổng hợp IT - PC part 15 ppsx

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (198.76 KB, 6 trang )

d(x,x)=0
Gọi d
Obj
là hàm khoảng cách trong không gian mọi đối tượng. Tuy nhiên, chương
trước cho ta thấy đối tượng được xem như tập các điểm trong không gian k-chiều
với k=n+2. Do vậy việc tính toán cho d
Obj
là khá phức tạp.

Error!



Thí dụ, hãy xem xét tập Obj gồm các ảnh với kích thước (256x256), có ba thuộc
tính (red, green, blue) được gán giá trị từ tập {0, , 7}. Ta định nghĩa hàm khoảng
cách d
1
giữa hai ảnh như sau:
Rõ ràng tính toán trên là tiến trình khá nặng nề bởi vì tổng kép này dẫn tới 65536
phép tính. Ngay việc sử dụng cấu trúc dữ liệu cây R hay cây tứ phân nào đó cũng
không cho kết quả khả quan.
Để giải quyết vấn đề này, nhiều nhà nghiên cứu đã gợi ý kỹ thuật quan trọng khác
thay thế. Các kỹ thuật này hình thành dựa trên việc sử dụng hàm tách đặc trưng
“tốt” có tên fe (Feature Extraction Function). Thí dụ các hàm này có thể là DFT và
DCT. Dựa trên quan điểm này, hàm fe ánh xạ các đối tượng vào các điểm đơn
trong không gian s-chiều, trong đó s thông thường hơi nhỏ so với (n+2). Do vậy có
thể có hai rút gọn có thể đạt được:
1. Hãy nhớ lại rằng đối tượng o là tập các điểm trong không gian (n+2) chiều.
Ngược lại, fe(o) là điểm đơn.
2. fe(o) là điểm trong không gian s chiều và s<<(n+2).
Hình 3.7 biểu diễn tiệm cận thước đo. Ý tưởng cơ bản là trước hết ánh xạ các đối


tượng vào các điểm trong không gian s chiều, sau đó tổ chức mọi đối tượng nhờ
cấu trúc dữ liệu không gian như cây R. Tuy nhiên, bằng trực giác thì ánh xạ có thể
bảo toàn khoảng cách: Nếu o
1
, o
2
, o
3
là các đối tượng mà d(o
1
, o
2
)£d(o
1
, o
3
) thì
d’(fe(o
1
), fe(o
2
))£d’(fe(o
1
), fe(o
3
)), trong đó d là thước đo trong không gian gốc
n+2 chiều và d’ là thước đo trong không gian mới s chiều. Nói cách khác, ánh xạ
tách đặc trưng có thể bảo toàn quan hệ khoảng cách trong không gian gốc.

Error!



Kết quả là, cho trước đối tượng truy vấn o, ta chuyển đổi o sang fe(o) và thử tìm ra
điểm p trong không gian s-d sao cho d’(p,fe(o)) nhỏ nhất có thể. Thuật toán hình
thức dưới đây sử dụng ký pháp d làm thước đo trong không gian (n+2)-d và d’ là
thước đo trong không gian s ít chiều hơn.
Thuật toán 3.2 IndexCreation
Input: Obj - tập các đối tượng.
1. T=NIL. (* T là cây tứ phân hay cây R rỗng cho dữ liệu s-chiều*)
2. if Obj=Æ then return T and Halt
3. else
a. Compute fe(o).
b. Insert fe(0) into T.
c. Obj=Obj-{0}.
d. Go to 2.
Tiến trình hình thức để tìm câu trả lời tốt nhất khi truy vấn đối tượng thể hiện bằng
giải thuật sau:
Thuật toán 3.3 FindMostSimilarObject
Input: Cây T có kiểu đã mô tả trên đây, đối tượng o.
1. bestnode=NIL;
2. if T=NIL then return bestnode. Halt
3. else
tìm láng giềng trong T gần fe(o) nhất nhờ kỹ thuật tìm kiếm láng giềng
gần nhất. Nếu tồn tại nhiều láng giềng như vậy thì trả lại tất cả chúng.
Để tìm mọi đối tượng tương tự khi truy vấn đối tượng trong khoảng cho trước e, ta
có thể sử dụng tiệm cận trên cơ sở truy vấn khoảng. Giả sử rằng o
1
, o
2
trong Obj ta


d(o
1
, o
2
) £ d’(fe(o
1
),fe(o
2
))
Giải thuật 3.4 FindSimilarObjects
Input: Cây T có kiểu như trên. Đối tượng o. Dung sai 0< e£ 1.
1. Thực hiện truy vấn khoảng trên cây T với tâm fe(o) và bán kính e.
2. Gọi p
1
, ,p
r
là các điểm cho lại.
3. for i=1 to r do
a. if d(o, fe
-1
(p
i
)) £e then print fe
-1
(p
i
).
Giải thuật trên đây của Faloutsos chỉ làm việc khi thước đo khoảng cách trong
không gian có kích thước nhỏ (thí dụ, không gian s) lớn hơn hoặc bằng thước đo

khoảng cách d.
3.4.2 Tiệm cận biến đổi
Tiệm cận trên cơ sở biến đổi là tổng quát hơn tiệm cận thước đo. Cho trước hai đối
tượng o
1
, o
2
, mức không tương tự giữa chúng tương ứng với giá (tối thiểu) của biến
đổi đối tượng o
1
vào o
2
, hoặc ngược lại.
Trong mô hình này tồn tại tập các toán tử biến đổi to
1
, ,to
r
. Trong trường hợp ảnh,
các toán tử này có thể là dịch chuyển, quay và co dãn. Toán tử mở rộng cũng có
thể được bao gồm việc sửa đổi một hình dạng bằng cách thêm hình dạng mới vào
nó. Toán tử cắt có thể lựa chọn hình dạng từ đối tượng đang tồn tại. Người sử dụng
có thể lựa chọn ra tập con của các toán tử để sử dụng. Hơn nữa họ có thể bổ sung
toán tử mới nếu họ muốn. Mỗi toán tử có một hàm đánh giá (cost) kết hợp. Chi phí
(cost) càng cao thì thao tác càng ít có cơ hội được sử dụng.Thí dụ ta có hàm tên là
paint với bốn đối số: paint(color1, val1, color2, val2), giá của hàm này được xác
định như sau:
cost(paint(color1, val1, color2, val2))=diff(color1, color2)
3
+(val1-val2)
2


trong đó, diff(red, green)=3=diff(green, red),
Biến đổi đối tượng o thành đối tượng o’ là trật tự các thao tác biến đổi to
1
, ,to
r

trật tự các đối tượng o
1
, ,o
r
sao cho
1. to
1
(o)=o,
2. to
i
(o
i-1
)=o
i
, và
3. to(o
r
)=o’.


Error!




Chi phí của trình tự biến đổi trên đây (Transformation Sequence – TS) được tính
như sau:

Error!



Chú ý rằng có thể có 1, 2, nhiều hay không có trình tự biến đổi nào cho phép ta
chuyển đổi đối tượng o thành đối tượng o’. Giả sử TSeq(o,o’) là tập các trình tự
biến đổi để chuyển đổi từ o sang o’. Tính không đồng dạng (dissimilarity) giữa o
và o’, ký hiệu là dis(o,o’), đối với tập toán tử biến đổi TR và tập hàm chi phí CF
được xác định như sau:

Thí dụ ta xem xét hai đối tượng o, o’ trên hình 3.8. Hãy khảo sát một vài cách biến
đổi từ đối tượng này sang đối tượng khác.
1. TS
1
: Trình tự biến đổi này bao gồm thao tác co dãn (co phần tô vạch ngang
50%), tiếp theo thực hiện thao tác co dãn khác (dãn phần tô dọc 100%). Thao tác
thứ ba là tô (paint) để tô hai pixel tô dọc sử dụng mẫu tô ô vuông. Hình 3.9 mô tả
từng bước của cách làm này.
2. TS
2
: Trình tự biến đổi theo cách này bao gồm thao tác co dãn (co phần tô
ngang 50%). Sau đó áp dụng thao tác paint để tô vùng sọc đứng sử dụng mẫu tô ô
vuông. Cuối cùng áp dụng thao tác co dãn (dãn phần gạch ô vuông 100%). Hình
3.10 mô tả các bước này.
Nếu hàm giá (cost function) kết hợp với co dãn không đồng nhất là độc lập với
màu và thao tác paint chỉ đơn thuần đếm tổng số pixel đang được tô, thì dễ dàng

thấy rằng biến đổi TS
2
bao gồm các biến đổi với giá rẻ hơn (vì tô ít hơn TS
1
một
pixel).
Mô hình biến đổi có độ mềm dẻo cao hơn mô hình thước đo theo hai lý do sau đây:
1. Người sử dụng có thể đưa ra quan điểm về tính tương tự bằng cách chỉ ra các
toán tử biến đổi nào được sử dụng hay không được sử dụng.
2. Người sử dụng có thể kết hợp với mỗi thao tác biến đổi một hàm giá để đánh
giá mỗi thao tác được áp dụng, phụ thuộc vào các đối số của tóan tử biến đổi. Điều
này cho phép người sử dụng có thể có quan điểm cá nhân về tương tự theo nhu cầu
của họ.

Mô hình trên cơ sở thước đo có hai lợi thế: Trước hết, bắt buộc người sử dụng chỉ
sử dụng một thước đo tính tương tự (hay tính khác biệt), hệ thống có thể dễ dàng
chỉ số hóa dữ liệu để tối ưu thao tác tìm kiếm đối tượng láng giềng gần nhất. Lợi
thế thứ hai, việc tính toán để hiệu quả là tương đối dễ.
3.5 Các hình mẫu khác của CSDL ảnh
Phần này phải trả lời câu hỏi: Tập ảnh được lưu trữ như thế nào để hỗ trợ các thao
tác truy vấn ảnh? Tổng quát thì có nhiều cách biểu diễn CSDL ảnh:
· Biếu diễn IDB (Image Database) như các quan hệ: Cách dễ làm nhất là biểu
diễn IDB như tập các quan hệ.
· Biểu diễn IDB bằng các cấu trúc dữ liệu không gian: Ý tưởng cơ bản của kỹ
thuật này khá đơn giản. Nếu mọi đối tượng được biểu diễn bằng chữ nhật (hay khái
quát hóa chữ nhật thành không gian có số chiều cao hơn), thì ta có thể biểu diễn tập
chữ nhật nhờ các cấu trúc dữ liệu không gian như cây R
· Biểu diễn IDB bằng biến đổi ảnh: Ý tưởng cơ bản của phương pháp này xuất
phát từ số lượng pixel trọng yếu trong ảnh (thí dụ,1024x1024) là rất lớn. Tuy
nhiên, có thể tồn tại tính tương tự giữa các phần khác nhau của ảnh. Ta có thể biểu

diễn ảnh bằng nén nội dung cơ bản thành véctơ đơn có giá trị thực với độ dài k
(người thiết kế lựa chọn k)? Thông thường, k nhỏ hơn 100 hay 200, thủ tục tính
các giá trị véctơ được thực hiện thông qua biến đổi như DFT hat DCT.
Khi truy vấn ảnh, tính chất ảnh phụ thuộc vào các hệ số như điều kiện ánh sáng, vị
trí máy chụp, vị trí vật thể Thí dụ trong CSDL ảnh mặt người đang khảo sát, hai
ảnh của cùng một người có thể khác nhau, nó phụ thuộc vào các hệ số thực tế như
thời gian chụp, ánh sáng, máy ảnh
Do vậy, CSDL ảnh phải có khả năng truy vấn dữ liệu trên cơ sở tính tương tự giữa
ảnh truy vấn và ảnh chứa trong CSDL ảnh.

×