ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
NGUYỄN HỒNG PHÚC
ỨNG DỤNG CỦA PHỨC WITNESS
VÀO PHÂN TÍCH DỮ LIỆU ẢNH
Chuyên ngành: ĐẠI SỐ VÀ LÝ THUYẾT SỐ
Mã số: 60 46 05
LUẬN VĂN THẠC SĨ TOÁN HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC
TS. NGUYỄN PHÚC SƠN
Tp. Hồ Chí Minh - 2012
Lời cảm ơn
Tôi xin bày tỏ lòng biết ơn sâu sắc tới thầy Nguyễn Phúc Sơn. Nhờ sự hướng
dẫn và chỉ bảo tận tình của thầy mà luận văn đã hoàn thành một cách khoa học
và đúng tiến độ. Xin cảm ơn các thầy cô công tác tại trường Khoa Học Tự Nhiên
đã trực tiếp giảng dạy và quan tâm, cảm ơn các bạn bè và gia đình đã động viên
giúp đỡ tôi trong suốt thời gian học tập và nghiên cứu.
Mặc dù có nhiều cố gắng, song luận văn có thể vẫn còn khiếm khuyết, tôi rất
mong sự phê bình góp ý từ phía các thầy cô và các bạn.
Tp.HCM, ngày 25 tháng 8 năm 2012
Học viên
Nguyễn Hồng Phúc
Mục lục
Lời nói đầu 6
1 Kiến thức chuẩn bò 7
1.1 Các đơn hình . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2 Phức simplicial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.2.1 Phức simplicial trừu tượng S . . . . . . . . . . . . . . . . . 9
1.2.2 Xấp xỉ simplicial . . . . . . . . . . . . . . . . . . . . . . . . 10
1.3 Phức
˘
Cech, phức Rips . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3.1 Phức
˘
Cech . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3.2 Phức Rips . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2 Ứng dụng của phức witness vào phân tích dữ liệu ảnh 15
2.1 Phức witness . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.1.1 Cách chọn landmark trong phức witness . . . . . . . . . . . 15
2.1.2 Phức witness mạnh và phức witness yếu . . . . . . . . . . . 17
2.1.3 Cách xây dựng các phiên bản của phức witness yếu . . . . 17
2.2 Đồng điều persistent . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.2.1 Số Betti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
4
Trang 5
2.2.2 Dãy lọc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.2.3 Đònh nghóa đồng điều persistent . . . . . . . . . . . . . . . 23
2.3 Thống kê ảnh tự nhiên . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.3.1 Hình cầu S
2
. . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.3.2 Thống kê ảnh tự nhiên . . . . . . . . . . . . . . . . . . . . 28
Kết luận 34
Phụ lục 35
Tài liệu tham khảo 38
Chỉ mục 39
Nguyễn Hồng Phúc - Cao học Đại số K20
Chương 1
Kiến thức chuẩn bò
1.1 Các đơn hình
Cho a
0
, a
1
, a
2
, , a
p
, p ∈ R, là những điểm trong R
d
.
Một điểm x =
p
j=0
λ
j
a
j
là một tổ hợp affine của a
j
nếu
p
j=0
λ
j
= 1,
λ
j
∈ R.
Tổ hợp affine, x =
p
j=0
λ
j
a
j
, là một tổ hợp lồi nếu λ
j
≥ 0, với 0 ≤ j ≤ p.
Bao lồi của a
j
là tập hợp tất cả các tổ hợp lồi của nó.
Một p − simplex (xem hình 1.1), là bao lồi của p + 1 điểm độc lập affine, ký
hiệu
σ = conv{a
0
, a
1
, a
2
, , a
p
}
Khi đó ta nói a
j
span σ và dimσ = p.
Bất kỳ tập con nào của tập các điểm độc lập affine cũng độc lập affine, do đó
cũng đònh nghóa một simplex.
Mặt của σ là bao lồi của một tập hợp con khác rỗng của tập hợp gồm các điểm
a
j
, j = 0, 1, , p.
Một mặt là mặt thực sự nếu mặt đó là bao lồi của một tập con thật sự.
7
Trang 8
Hình 1.1: 0-simplex, 1-simplex, 2-simplex, 3-simplex lần lượt được gọi là vertex,
edge, triangle, tetrahedron.
Biên của σ, ký hiệu bdσ, là phần hợp của tất cả các mặt thực sự trong σ.
Phần trong của σ, ký hiệu intσ = σ − bdσ.
Với mỗi điểm x =
p
j=0
λ
j
a
j
∈ σ, ta có x ∈ intσ khi và chỉ khi mọi λ
j
> 0,
j = 0, 1, , p.
1.2 Phức simplicial
Khái niệm 1.2.1. Một phức simplicial K (xem hình 1.2), là tập hợp hữu hạn các
đơn hình trong K thỏa mãn:
-Với σ ∈ K và τ ⊆ σ thì τ ∈ K.
-Với σ, σ
0
∈ K thì σ ∩ σ
0
⊆ σ, σ
0
. (với σ, σ
0
là những đơn hình trong K.)
Số chiều của K là số chiều cao nhất của các đơn hình trong K.
Cho L ⊆ K là một phức simplicial, khi đó L được gọi là phức con của K.
j-skeleton là tập hợp gồm tất cả các đơn hình trong K có số chiều j hoặc nhỏ
hơn j,
K
j
= {σ ∈ K|dimσ ≤ j}
Ứng dụng của phức witness vào phân tích dữ liệu ảnh
Trang 9
Hình 1.2: (A) là phức simplicial, (B) không phải là phức simplicial vì đoạn giao
nhau của hai mặt không thuộc một trong hai mặt đó, (C) không là phức simplicial
vì một mặt của nó bò khuyết cạnh.
0-skeleton là một tập đỉnh, ký hiệu vertK = K
(0)
; 1-skeleton là tập hợp gồm
tất cả các đơn hình 0-chiều và 1-chiều.
1.2.1 Phức simplicial trừu tượng S
Phức simplicial trừu tượng được xem như là phần mô tả hình học của phức
simplicial.
Đònh nghóa 1.2.2. Cho K là một phức simplicial, phức simplicial trừu tượng S
của K là tập hợp hữu hạn các đơn hình trong K thỏa mãn: nếu σ ∈ K và τ ⊆ σ
thì τ ∈ K.
Chú ý 1.2.3. Ta có:
i) Tập φ thuộc mọi phức simplicial trừu tượng.
ii) Tập đỉnh Z của phức simplicial trừu tượng S, vertZ = {a
0
, a
1
, , a
p
}, p ∈ R.
iii) Nếu p-simplex σ = [a
0
a
1
a
p
] ∈ S, thì tất cả các mặt của σ đều thuộc S. Ở
đây các đỉnh a
0
, a
1
, , a
p
trong Z là phân biệt.
Nguyễn Hồng Phúc - Cao học Đại số K20
Trang 10
1.2.2 Xấp xỉ simplicial
Từ không gian tôpô X, lấy một tập điểm bất kỳ. Từ tập điểm ấy, ta xây dựng
phức simplicial K xấp xỉ cấu trúc tôpô của X.
Ví dụ 1.2.1. Quét tia laser qua một vật rắn X có hình vòng tròn, ta sẽ thu được
một tập gồm vô số điểm trên mặt phẳng:
Hình 1.3: Tập điểm trên mặt phẳng
Chọn ra một mẫu bất kỳ từ tập điểm trên hình 1.3 ta được hình 1.4. Ta sẽ đi
xây dựng phức simplicial K xấp xỉ vòng tròn X đã cho.
Hình 1.4: Landmark của hình 1.3
Nhận xét 1.2.4. Xét hai landmark được trích từ tập điểm của một đường tròn
(hình 1.5). Hai trường hợp (A) và (B) đều được xem là xấp xỉ của đường tròn. Mặc
dù ở trường hợp (B), sự xấp xỉ có vẻ rất thô nhưng nó vẫn đảm bảo các tính chất
của tôpô.
Ứng dụng của phức witness vào phân tích dữ liệu ảnh
Trang 11
Hình 1.5: Landmark
1.3 Phức
˘
Cech, phức Rips
1.3.1 Phức
˘
Cech
Tập đỉnh là tập dữ liệu Z ⊂ R
d
.
Đường kính: R > 0, R ∈ R.
Đònh nghóa:
˘
Cech(Z, R) gồm tất cả các p-simplex σ = [a
0
a
1
a
p
], p = 0, 1, ,
sao cho các hình cầu đóng B(a
j
, R/2), j = 0, 1, , p, giao nhau khác φ.
˘
Cech(Z, R) = {σ ⊆ Z|
a
j
∈σ
B(a
j
, R/2) = φ, j = 0, 1, 2, , p} [1]
Chú ý 1.3.1. Cho F là một tập hợp hữu hạn trong không gian ơclid.
Nerve của F là tập hợp các tập con khác rỗng của F mà giao của họ tập con
này là một tập không tầm thường.
NrvF = {X ⊆ F|
X = φ}
Đònh lý 1.3.2. (Nerve) Cho F là một tập lồi, đóng trong không gian ơclid. Khi đó
NrvF và hợp của các tập con trong F có kiểu đồng điều giống nhau.
Từ đònh ngóa Nerve, ta có phức
˘
Cech là Nerve của tập {B(a, R/2), a ∈ Z}.
Vì các quả cầu B(a, R/2) là lồi nên ta có
˘
Cech tương đương đồng luân với
phần hợp của các quả cầu này.
Nguyễn Hồng Phúc - Cao học Đại số K20
Trang 12
1.3.2 Phức Rips
Tập đỉnh là tập dữ liệu Z ⊂ R
d
.
Đường kính: R > 0, R ∈ R.
Đònh nghóa: Rips(Z, R) là tập hợp tất cả các p-simplex σ = [a
0
a
1
a
p
],
p = 0, 1, , sao cho các cạnh [a
j
a
k
], 0 ≤ j < k ≤ p, có |a
j
− a
k
| ≤ R.
Rips(Z, R) là phức simplicial lớn nhất có cùng số 1-skeleton với
˘
Cech(Z, R).
Những simplex có số chiều lớn hơn hoặc bằng 1 thuộc Rips(Z, R) khi và chỉ
khi mọi cạnh của nó cũng thuộc Rips(Z, R).
Nếu khoảng cách |a
j
−a
k
| được đo trong không gian l
∞
thì phức Rips là Nerve
của tập hợp các siêu lập phương có cạnh là 2R . Khi đó Rips(Z, R) tương đương
đồng luân với phần hợp của những siêu lập phương này.
Ví dụ 1.3.1.
Hình 1.6:
˘
Cech, Rips
Cho một tập hợp gồm nhiều điểm như hình 1.6(A). Ta vẽ các đường tròn có
cùng bán kính, với tâm là những điểm đã cho, thì được hình 1.6(B).
Ứng dụng của phức witness vào phân tích dữ liệu ảnh
Trang 13
Phức
˘
Cech ở hình 1.6(C) được vẽ như sau:
Hai đường tròn có phần giao khác rỗng, như c
1
∩ c
2
= φ, khi đó ta nối tâm
của hai đường tròn lại với nhau thì được một cạnh O
1
O
2
, làm tương tự các trường
hợp còn lại.
Ba đường tròn có phần giao khác rỗng, như c
3
∩ c
4
∩ c
5
= φ, khi đó ta nối tâm
của ba đường tròn lại với nhau và tô đặc tam giác O
3
O
4
O
5
, ta có một mặt tam
giác O
3
O
4
O
5
. Làm tương tự các trường hợp còn lại.
Ba đường tròn c
6
, c
7
, c
8
có c
6
∩ c
7
= φ, c
7
∩ c
8
= φ, c
6
∩ c
8
= φ nhưng
c
6
∩ c
7
∩ c
8
= φ do đó ta chỉ có tam giác "rỗng ruột" O
6
O
7
O
8
. Làm tương tự các
trường hợp còn lại.
Phức Rips ở hình 1.6(D) được vẽ như sau:
Giống như khi xây dựng
˘
Cech, hai đường tròn có phần giao khác rỗng, như
c
1
∩ c
2
= φ, khi đó ta nối tâm của hai đường tròn lại với nhau thì được một cạnh
O
1
O
2
, làm tương tự các trường hợp còn lại.
Xây dựng phức Rips đơn giản hơn so với phức
˘
Cech, chỉ cần ba đường tròn
c
6
, c
7
, c
8
có c
6
∩ c
7
= φ, c
7
∩ c
8
= φ, c
6
∩ c
8
= φ thì nối O
6
O
7
, O
7
O
8
và O
6
O
8
rồi tô đặc tam giác O
6
O
7
O
8
.
Chú ý 1.3.3. Ta có:
i) Đònh nghóa của phức
˘
Cech và phức Rips được áp dụng đối với mọi không gian
metric.
ii) Cả hai cấu trúc
˘
Cech và Rips đều không thực sự hiệu quả. Thật vậy, khi bán
kính R tăng đến một giá trò nhất đònh, ta sẽ nhận được một khối dày đặc, lúc
đó không thể phân biệt được
˘
Cech và Rips. (hình 1.7)
Nguyễn Hồng Phúc - Cao học Đại số K20
Trang 14
Hình 1.7: Phức
˘
Cech, Rips
Hai phức
˘
Cech và Rips cho ta những hình dung về tính chất hình học của
dữ liệu ảnh rất tốt, nhưng có nhược điểm là cần rất nhiều cell trong quá trình
tính toán. Một công cụ rất hiệu quả, khắc phục được những nhược điểm của phức
˘
Cech và Rips mà ta sẽ đề cập đến đó là phức witness.
Ứng dụng của phức witness vào phân tích dữ liệu ảnh
Chương 2
Ứng dụng của phức witness vào
phân tích dữ liệu ảnh
Trong chương này , mục 2.1 sẽ trình bày về phức witness, đây là công cụ chính
được sử dụng để phân tích dữ liệu ảnh nêu trong mục 2.3. Chúng ta đã biết rằng
đồng điều cổ điển chỉ có tác dụng tính toán trên lý thuyết, làm việc trên tập dữ
liệu không nhiễu. Đối với tập dữ liệu xuất hiện nhiễu thì kết quả mà đồng điều cổ
điển mang lại không chính xác nên không có tác dụng trên thực tiễn vì hầu hết
các dữ liệu thu từ thực tế luôn bò nhiễu. Mục 2.2 sẽ giới thiệu một công cụ rất ưu
việt, một trong những khâu xử lý dữ liệu, đó là đồng điều persistent. Dữ liệu sau
khi xử lý sẽ được đưa vào phân tích cho ra kết quả ở mục 2.3.
2.1 Phức witness
2.1.1 Cách chọn landmark trong phức witness
Landmark là tập hợp điểm được chọn ra để làm witness.
Có hai cách phổ biến để chọn landmark, đó là cách chọn maxmin và cách chọn
ngẫu nhiên.
15
Trang 16
1) Phương pháp maxmin: được minh họa ở hình 2.1. Cho Z là tập hợp N điểm
trong không gian ơclid, gọi n là số điểm landmark. D = (n × N) là ma trận
khoảng cách. Chọn theo quy tắc quy nạp:
Bước 1: Chọn ngẫu nhiên điểm a
1
∈ Z.
Bước 2: Giả sử đã chọn được các điểm a
1
, a
2
, , a
j−1
∈ Z, ta tiến hành chọn
a
j
∈ Z \ {a
1
, a
2
, , a
j−1
}. Với mỗi x ∈ Z, ta có các khoảng cách
D(x, a
1
), D(x, a
2
), , D(x, a
j−1
). a
j
được chọn theo tiêu chuẩn sau:
a
j
= max
x∈Z
min{D(x, a
1
), D(x, a
2
), , D(x, a
j−1
)}
Bước 3: Lập lại bước 2 cho đến khi có tập L = {a
1
, a
2
, , a
n
} của n điểm
landmark được chọn.
2) Phương pháp chọn ngẫu nhiên: được minh họa ở hình 2.1
Hình 2.1: Landmark
Nhận xét 2.1.1. Ta có:
i) Cách chọn maxmin có ưu điểm là chọn được landmark phân bố đều trên toàn
bộ tập dữ liệu.
ii) Nhược điểm của cách chọn maxmin là thường bò ảnh hưởng nặng nếu dữ liệu
có nhiễu.
Ứng dụng của phức witness vào phân tích dữ liệu ảnh
Trang 17
2.1.2 Phức witness mạnh và phức witness yếu
Gọi L ⊂ R
d
là tập hợp hữu hạn điểm a
0
, a
1
, , a
p
, σ = [a
0
a
1
a
p
] là một
p-simplex.
Đònh nghóa 2.1.2. Điểm x ∈ R
d
được gọi là witness mạnh đối với σ trong L nếu
và chỉ nếu x có khoảng cách tới các điểm a
0
, a
1
, , a
p
đều bằng nhau và là khoảng
cách nhỏ nhất trong L. (Hình 2.2)
Hình 2.2: Witness mạnh và witness yếu
Đònh nghóa 2.1.3. Điểm x ∈ R
d
được gọi là witness yếu đối với σ trong L nếu và
chỉ nếu
|x − a
j
| ≤ |x − a|
∀j = 0, 1, , p và a ∈ L \ {a
0
, a
1
, , a
p
}. (Hình 2.2)
Chú ý 2.1.4. Tập hợp có số lượng winess càng nhỏ thì khả năng tồn tại witness
mạnh càng thấp, có khi không tồn tại witness mạnh.
Đònh lý 2.1.5. Cho L ∈ R
d
là tập hợp hữu hạn các điểm a
0
, a
1
, , a
p
. Khi đó
σ = [a
0
a
1
a
p
] có witness mạnh trong L khi và chỉ khi σ và tất cả các đơn hình
con của nó có witness yếu trong L.
2.1.3 Cách xây dựng các phiên bản của phức witness yếu
Cho D là ma trận khoảng cách n × N, trong đó n là số điểm landmark và
N là kích cỡ mẫu của dữ liệu đang xét. Khi đó ta có khái niệm về phức witness
W
∞
(D) như sau:
Nguyễn Hồng Phúc - Cao học Đại số K20
Trang 18
Khái niệm 2.1.6. Ta có:
Tập đỉnh: {a
1
, a
2
, , a
n
} là tập n điểm landmark.
Cạnh σ = [ab] ∈ W
∞
(D) khi và chỉ khi tồn tại i, 1 ≤ i ≤ N , sao cho D(a, i)
và D(b, i) là các khoảng cách nhỏ nhất trong cột thứ i của ma trận D.
Cho p-simplex σ = [a
0
a
1
a
p
], p ≥ n − 1, giả sử tất cả các mặt của σ đều
nằm trong W
∞
(D), khi đó σ ∈ W
∞
(D) khi và chỉ khi tồn tại i, 1 ≤ i ≤ N, sao
cho D(a
0
, i), D(a
1
, i), , D(a
p
, i) là (p + 1) khoảng cách nhỏ nhất trong cột thứ
i của ma trận D. Ta gọi i là witness chứng tỏ sự tồn tại của σ.
Khái niệm 2.1.7. Phức W
1
(D):
Tập đỉnh: {a
1
, a
2
, , a
n
} là tập n điểm landmark.
Cạnh σ = [ab] nằm trong phức witness W
1
(D) khi và chỉ khi tồn tại i,
1 ≤ i ≤ N, sao cho D(a, i) và D(b, i) là các khoảng cách nhỏ nhất trong cột thứ
i của ma trận D.
p-simplex σ = [a
0
a
1
a
p
] nằm trong W
1
(D) khi và chỉ khi tất cả các cạnh của
nó đều thuộc W
1
(D).
Ví dụ 2.1.1. Cho tập hợp điểm như hình 2.3, chọn landmark gồm {a
0
, a
1
, , a
8
}.
Sau khi quan sát, ta có khoảng cách từ a
0
đến điểm mà ta đặt là i, D(a
1
, i), là
Hình 2.3: Phức witness W
∞
(D)
nhỏ nhất, rồi đến các khoảng cách D(a
2
, i), D(a
0
, i). Khi đó, nối ba điểm a
0
, a
1
,
a
2
thành mặt tam giác a
0
a
1
a
2
. Ta nói σ
1
= [a
0
a
1
a
2
] ∈ W
∞
(D) với witness i.
Ứng dụng của phức witness vào phân tích dữ liệu ảnh
Trang 19
Tương tự, ta cũng có σ
2
= [a
2
a
3
a
4
] ∈ W
∞
(D) với witness j, σ
3
= [a
5
a
6
] ∈
W
∞
(D) với witness k.
Sự hình thành của hai phức W
1
(D) và W
∞
(D) khác nhau! Ta thấy rõ sự khác
biệt đó ở ví dụ 2.1.2 sau đây
Ví dụ 2.1.2. Cho tập hợp điểm như hình 2.4, chọn landmark gồm {a
0
, a
1
, a
2
, a
3
, a
4
}
Hình 2.4: Phức witness W
1
(D)
Sau khi quan sát, điểm mà ta đặt là i có khoảng cách đến a
0
và a
2
là gần nhất,
do đó ta có cạnh a
0
a
2
bằng cách nối hai điểm a
0
, a
2
. Khi đó i được gọi là witness
của σ
1
= [a
0
a
2
] ∈ W
1
(D). Tương tự, ta có j là witness của σ
2
= [a
0
a
1
] ∈ W
1
(D),
k là witness của σ
3
= [a
1
a
2
] ∈ W
1
(D).
Khi đã nối được ba cạnh a
0
a
1
, a
0
a
2
và a
1
a
2
, W
1
(D) cho phép ta tô đặc tam
giác a
0
a
1
a
2
. Khi đó, 3-simplex σ = [a
0
a
1
a
2
] ∈ W
1
(D). Tương tự với trường hợp
còn lại.
Nhận xét 2.1.8. Ta có:
i) Ta có: W
1
(D) ⊇ W
∞
(D).
ii) W
1
(D) là phức simplicial lớn nhất có cùng số 1-skeleton với W
∞
(D). W
1
(D)
còn được viết là W (D).
iii) Trong thực tế, người ta ít khi sử dụng W
∞
(D), vì sự tính toán trong đó phức
tạp và kỳ công hơn trong W (D).
Khái niệm 2.1.9. Cho v là một số nguyên không âm, các họ phức lồng nhau của
phức simplicial, ký hiệu W (D, R, v), R ∈ [0, ∞), được xác đònh như sau:
Nguyễn Hồng Phúc - Cao học Đại số K20
Trang 20
Tập đỉnh của W (D, R, v) là {a
0
, a
1
, , a
n
}.
Cho đoạn σ = [ab], ta có σ = [ab] ∈ W (D, R, v) nếu tồn tại witness
i ∈ {1, 2, , N } sao cho:
max(D(a, i), D(b, i)) ≤ R + m
i
(∗)
Cho p-simplex σ = [a
0
a
1
a
p
], ta có σ = [a
0
a
1
a
p
] ∈ W (D, R, v) nếu và chỉ
nếu tất cả các cạnh của nó thuộc trong W (D, R, v), điều này tương đương với việc
tồn tại witness i, 1 ≤ i ≤ N sao cho:
max(D(a
0
, i), D(a
1
, i), , D(a
p
, i)) ≤ R + m
i
m
i
được xác đònh như sau:
• Nếu v = 0 thì ∀i = 1, 2, , N, ta đònh nghóa m
i
= 0. Lúc này:
(∗) ↔ max(D(a, i), D(b, i)) ≤ R
• Nếu v = 1 thì ∀i = 1, 2, , N, ta đònh nghóa m
i
là phần tử nhỏ nhất ở cột thứ
i của D. Ta có:
max(D(a, i), D(b, i)) ≤ R + m
i
- Nếu R = 0 thì i có khoảng cách đến a và b là bằng nhau và là khoảng cách
nhỏ nhất. Cụ thể i sẽ là trung điểm đoạn [ab].
- Khi cho R tăng thì i sẽ di chuyển trên đường trung trực của đoạn [ab].
• Nếu v = 2 thì ∀i = 1, 2, , N, ta đònh nghóa m
i
là phần tử nhỏ nhì ở cột thứ i
của D. Ta có:
max(D(a
0
, i), D(a
1
, i), , D(a
p
, i)) ≤ R + m
i
- Nếu R = 0, ta có: W(D, 0, 2) = W (D).
- Khi cho R tăng ta xây dựng được dãy lọc.
Một cách tiếp cận khác đó là sử dụng phân chùm, tham khảo trong [2]. Nhưng
theo kinh nghiệm của những người từng sử dụng thì cách này không thực sự hiệu
quả, vì phương pháp phân chùm tạo thêm các đặc tính vốn không có trong dữ liệu
gốc.
Ứng dụng của phức witness vào phân tích dữ liệu ảnh
Trang 21
2.2 Đồng điều persistent
2.2.1 Số Betti
Trong phần này ta sẽ tìm hiểu về số betti của đồng điều cổ điển.
Số betti được dùng để phân biệt các không gian tôpô. Số betti là một số tự
nhiên hoặc +∞.
Đònh nghóa 2.2.1. Số betii thứ p của không gian X, ký hiệu β
p
(X), là hạng của
nhóm giao hoán H
p
(X).
Ý nghóa hình học của số betti :
β
0
là số thành phần liên thông.
β
1
là số các lỗ 2-chiều.
β
2
là số các lỗ 3-chiều.
Ví dụ 2.2.1. Torus ở hình 2.5 có: β
0
= 1, β
1
= 2, β
2
= 1
Hình 2.5: Torus
2.2.2 Dãy lọc
Cho K là một phức simplicial. Hàm giá trò của K là một đơn cấu f được xác
đònh như sau:
f : K −→ R
σ −→ f(σ), σ là đơn hình trong K
Ở đây f(σ) được gọi là giá trò của σ.
Nguyễn Hồng Phúc - Cao học Đại số K20
Trang 22
Với r là một số thực bất kỳ, ta gọi level của r là tập ảnh ngược f
−1
(r)
f
−1
(r) = {σ ∈ K|f(σ) = r}
Tập level con được xác đònh như sau:
K(r) = f
−1
(−∞, r] = {σ ∈ K|f(σ) ≤ r}
Đònh nghóa 2.2.2. Cho K là một phức simplicial, chọn dãy r
1
< r
2
< < r
n
,
r
0
= ∞, với r
j
, j = 1, 2, , n , là các số thực. Khi đó ta có các K
j
:= K(r
j
),, là
các phức con của K và
φ = K
0
⊆ K
1
⊆ ⊆ K
n
= K (∗)
Ta gọi dãy các phức (∗) là dãy lọc.
Ví dụ 2.2.2. Cho φ = K
0
, K
1
, , K
7
= K là các phức con của K. Ta có dãy lọc
φ = K
0
⊆ K
1
⊆ ⊆ K
7
= K
như hình 2.6
Ứng dụng của phức witness vào phân tích dữ liệu ảnh
Trang 23
Hình 2.6: Dãy lọc của phức simplicial K
2.2.3 Đònh nghóa đồng điều persistent
Cho K là một phức simplicial, K
j
là các phức con của K, với mỗi j ≤ k =
{0, 1, 2, }, từ đơn cấu K
j
−→ K
k
cảm sinh ra đồng cấu:
f
j,k
p
: H
p
(K
j
) −→ H
p
(K
k
) ,p là số chiều của đồng điều
Ta có dãy các nhóm đồng điều, ứng với số chiều p, tương ứng với dãy lọc (∗):
0 = H
p
(K
0
)
f
0,1
p
−−−−→ H
p
(K
1
)
f
1,2
p
−−−−→
f
n−1,n
p
−−−−→ H
p
(K
n
) = H
p
(K)
Đònh nghóa 2.2.3. Nhóm đồng điều persistent thứ p là ảnh của đồng cấu cảm sinh
f
j,k
p
:
H
j,k
p
= imf
j,k
p
với: 0 ≤ j ≤ k ≤ n
Đònh nghóa 2.2.4. Số betti persistent thứ p của các phức K là hạng của các nhóm
đồng điều persistent thứ p của K:
β
j,k
p
= rankH
j,k
p
Nguyễn Hồng Phúc - Cao học Đại số K20
Trang 24
Lưu ý rằng: H
j,j
p
= H
p
(K
j
).
Nhóm đồng điều persistent H
j,k
p
bao gồm những lớp đồng điều trong K
j
mà
vẫn còn tồn tại trong K
k
, nghóa là:
H
j,k
p
= Z
p
(K
j
)/(B
p
(K
k
) ∩ Z
p
(K
j
))
Gọi γ là một lớp trong H
p
(K
j
):
-Lớp γ được sinh ra ở K
j
nếu γ /∈ H
j−1,j
p
.
-Lớp γ "chết" khi vào K
k
nếu nó nối kết với một lớp khác cũ hơn khi được
ánh xạ từ K
k−1
vào K
k
, cụ thể như sau:
f
j,k−1
p
(γ) /∈ H
j−1,k−1
p
, nhưng
f
j,k
p
(γ) ∈ H
j−1,k
p
. Điều này được mô tả trong hình 2.7
Hình 2.7: Sự tồn tại của lớp γ trong H
p
(K
j
)
Ứng dụng của phức witness vào phân tích dữ liệu ảnh
Trang 25
Ví dụ 2.2.3. Cho K = K
14
là một phức simplicial và K
0
, K
1
, , K
14
là các phức
con của K. (Hình 2.8)
Hình 2.8: Tính số betti
Ta có dãy lọc φ = K
0
⊂ K
1
⊂ ⊂ K
14
= K.
Ta tính được số betti ứng với mỗi phức con của K. Ở đây, β
0
là hạng của
H
0
(K), β
1
là hạng của H
1
(K), β
2
là hạng của H
2
(K).
Sau đây ta sẽ dùng mã vạch để hình dung về đồng điều persistent. (Hình 2.9)
Xét lớp simplex γ
1
∈ H
1
(K) trong ví dụ 2.2.3, ta thấy lớp γ
1
xuất hiện ở K
6
,
vì ở K
6
: β
1
= 0, γ
1
tiếp tục tồn tại ở K
7
và K
8
. Nhưng đến K
9
, β
1
= 0, khi đó
ta nói lớp γ
1
chết. Vậy thời gian tồn tại của lớp simplex γ
1
được biểu diễn trong
bảng mã vạch là một đoạn thẳng kéo dài liên tục từ K
6
đến K
8
.
Nguyễn Hồng Phúc - Cao học Đại số K20
Trang 26
Hình 2.9: Mã vạch
Xét lớp simplex γ
2
∈ H
1
(K), γ
2
sinh ra ở K
10
, tồn tại đến K
12
và chết ở K
13
nên đoạn thẳng kéo dài liên tục từ K
10
đến K
12
trong bảng mã vạch là thời gian
tồn tại của γ
2
.
Các trường hợp khác xét tương tự như trên.
Vậy nhóm đồng điều persistent của K bao gồm những lớp đồng điều xuất hiện
ở K
j
mà vẫn còn tồn tại đến K
k
.
2.3 Thống kê ảnh tự nhiên
2.3.1 Hình cầu S
2
Cho hình cầu đơn vò S
2
⊂ R
3
, trên đó lấy mẫu ngẫu nhiên 500 điểm theo ma
trận phân bố Gausian. Từ đây, 12 điểm landmark được chọn theo 2 cách: phương
pháp ngẫu nhiên và phương pháp maxmin. Lần lượt tính các giá trò: phức Rips,
phức witness đối với metric ơclid (ứng với mỗi v = 0, 1, 2) và phức witness đối với
metric đồ thò (ứng với mỗi v = 0, 1, 2).
Ứng dụng của phức witness vào phân tích dữ liệu ảnh
Trang 27
12 ĐIỂM LANDMARK ĐƯC CHỌN MỘT CÁCH NGẪU NHIÊN
Rips Witness: metric ơclid Witness: metric đồ thò
v = 0 v = 1 v = 2 v = 0 v = 1 v = 2
% success 54 51 99 99 53 100 97
median relative dominance 0.038 0.059 0.620 0.808 0.062 0.600 0.798
median absolute dominance 0.034 0.047 0.347 0.163 0.046 0.318 0.152
median relative dominance 208 199 86 94 208 92 92
12 ĐIỂM LANDMARK ĐƯC CHỌN THEO PHƯƠNG PHÁP MAXMIN
Rips Witness: metric ơclid Witness: metric đồ thò
v = 0 v = 1 v = 2 v = 0 v = 1 v = 2
% success 100 100 100 100 100 100 100
median relative dominance 0.184 0.215 0.752 0.924 0.216 0.744 0.922
median absolute dominance 0.161 0.162 0.519 0.252 0.153 0.466 0.209
median relative dominance 74 78 66 79 82 66 80
Trong bảng trên, thực hiện 100 lần thử nghiệm cho mỗi phương pháp trên
landmark đã được chọn. Kết quả thu được sau các lần thử nghiệm cho ta bốn hằng
số R
0
, R
1
, K
0
và K
1
, cụ thể như sau:
(β
0
, β
1
, β
2
) = (1, 0, 1), khi R ∈ [R
0
, R
1
).
(β
0
, β
1
, β
2
) = (1, 0, 1), khi R ≥ R
1
và R = R − .
(β
0
, β
1
, β
2
) = (1, 0, 0), khi R = K
0
.
Khi R = K
1
đánh dấu thời điểm khi các phức riêng lẻ trở thành 12-simplex
chứa tất cả các cell có thể.
Từ bảng trên, ta có các khái niệm:
% success là số lần thử nghiệm thành công, nghóa là khi đó đồng điều của
hình cầu S
2
được phục hồi một cách chính xác từ một vài cạnh với giá trò R xác
đònh.
Khoảng hoạt động của đồng điều là đoạn [0, K
0
], đánh dấu các giá trò của
bán kính R khi đồng điều của phức thay đổi.
Khoảng hoạt động của cell là đoạn [0, K
1
], đánh dấu các giá trò của bán
kính R khi số lượng cell của phức thay đổi.
Nguyễn Hồng Phúc - Cao học Đại số K20