Tải bản đầy đủ (.pdf) (16 trang)

Giáo trình - Công nghệ viễn thám - chương 6 ppt

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (451.77 KB, 16 trang )


Công nghệ viễn thám
Dùng cho học viên cao học Trắc địa
111
Chơng VI
kỹ thuật phân loại trong viễn thám

Đ.6.1 phân loại có sự trợ giúp của máy tính
1. Khái niệm về công tác phân loại ảnh viễn thám
Phân loại trong xử lý t liệu viễn thám là gán các khoảng cấp độ xám
nhất định thuộc một nhóm đối tợng nào đó có các tính chất tơng đối đồng
nhất nhằm phân biệt các nhóm đó với nhau trong khuôn khổ ảnh cho trớc.
Quá trình phân loại có thể đợc thực hiện theo phơng pháp giải đoán bằng
mắt hoặc nhờ sự trợ giúp của máy tính.
Với phong pháp giải đoán trực tiếp bằng mắt với sự tham gia của tri
thức con ngời thì mức độ đầy đủ, độ chính xác của kết quả phụ thuộc rất
nhiều vào khả năng của ngời giải đoán, hiệu quả kinh tế thấp và tốn kém
nhiều về các chi phí điều tra ngoại nghiệp.
Còn kỹ thuật phân loại nhờ sự trợ giúp của máy tính ngày càng đợc áp
dụng trong thực tế với hai phơng pháp cơ bản là phân loại có kiểm định và
phân loại không kiểm định.
Phơng pháp phân loại có kiểm định là một hình thức kết hợp giữa giải
đoán nhờ sự trợ giúp của máy tính với kết quả điều tra thực địa. Phơng pháp
này đợc ứng dụng phổ biến trên thế giới. Độ chính xác của nó phụ thuộc vào
diện tích, mật độ phân bố và độ chính xác của các mẫu chọn trên khu vực
nghiên cứu.
Phơng pháp phân loại không kiểm định là một phơng pháp chỉ sử
dụng thuần túy thông tin ảnh, quá trình xử lý hoàn toàn ở trong phòng. Đây là
một phơng pháp cho hiệu quả kinh tế cao nhng độ tin cậy của thành quả
thấp.
Cơ sở để thực hiện bài toán phân loại ảnh viễn thám là đặc trng phổ và


đặc trng về cấu trúc của ảnh. Và thực tế ngời ta thờng thực hiện bài toán
phân loại dựa trên đặc trng phổ của ảnh đa phổ.
2. Các trờng hợp có thể xảy ra khi phân loại theo phổ
Nh chúng ta đã biết các đặc trng trên ảnh thuộc các đối tợng cùng
loại trên mặt đất sẽ có phổ tơng tự nên cần phải đa về một điểm trong
không gian phổ. Tuy nhiên trong thực tế điều này sẽ không thể xảy ra và ta chỉ
có thể thu đợc sự phân bố các nhóm cùng tính chất theo phơng thức xác

Công nghệ viễn thám
Dùng cho học viên cao học Trắc địa
112
suất thống kê nào đó. Có thể xẩy ra ba trờng hợp nh ở hình 6.1a, hình 6.1b
và hình 6.1c.







Hình 6.1a. Trờng hợp lý
tởng







Hình 6.1b. Trờng hợp đặc thù

a. Trờng hợp lý tởng
Các nhóm đồng tính chất khác nhau có thể đợc giữ trọn vẹn trong
không gian phụ nhỏ nhất (trong một band riêng rẽ).
b. Trờng hợp đặc thù
Các nhóm đồng chất khác nhau có thể không đợc phân chia nguyên
vẹn trong bất kỳ không gian phụ nào nhng có thể thực hiện (phân chia đợc)
trong không gian đa chiều.
c. Trờng hợp tổng quát
Hoặc là trong không gian phụ
hoặc là trong không gian đa chiều
luôn tồn tại sự chồng phủ giữa hai
nhóm đồng chất khác nhau. Vì tâm
các nhóm đồng tính chất có thể đợc
xác định và đờng bao của các nhóm
có thể khó xác định với dạng đờng
gạch chéo đã từng xuất hiện. Nó sẽ
cho chúng ta các băng thực hiện phân
loại trên máy tính nhờ việc sử dụng
hàm suy đoán nào đó.








Hình 6.1c. Trờng hợp tổng quát
3. Quá trình phân loại
Quá trình phân loại ảnh viễn thám theo phổ có thể thực hiện theo các

bớc sau:
x
2
x
1
A
B
A
B
x
2

x
1
x
2
x
1
A
B

Công nghệ viễn thám
Dùng cho học viên cao học Trắc địa
113
a. Định nghĩa các lớp
Các lớp phân loại cần đợc định nghĩa rõ ràng về mặt chỉ tiêu. Các chỉ
tiêu này cần đợc lựa chọn phụ thuộc vào đặc thù của t liệu ảnh (hình 6.2).











b. Lựa chọn các đặc tính
Các thuộc tính phổ hoặc cấu trúc cho phép tách biệt các lớp với nhau
cần đợc tập hợp.
c. Chọn vùng mẫu
Các tệp mẫu đợc lựa chọn dựa trên kết quả của bớc 1 và bớc 2. Các
số liệu lấy đợc trên cơ sở tệp mẫu có ý nghĩa quyết định trong việc thành lập
các chỉ tiêu phân loại hiện đang đợc sử dụng có thể có nhiều nh: Phân loại
hình hộp, phân loại theo khoảng cách ngắn nhất, phân loại theo xác suất cực
đại Ta có thể áp dụng nhiều phơng pháp phân loại khác nhau trong khuôn
khổ tệp mẫu và so sánh kết quả đạt đợc nhằm chọn ra phơng pháp tối u
nhất cho kết quả chính xác nhất.
Từ vùng phân tích sẽ đa ra các chỉ tiêu thống kê nh sau:
- Giá trị trung bình.
- Các cực trị: Xmin, Xmax.
- Tính độ lệch chuẩn.
- Lập ma trận phơng sai - hiệp phơng sai.
d. Tiến hành phân loại
Dựa vào các phơng pháp đã lựa chọn và các chỉ tiêu đã thiết lập, các
A
A
B
B
C

C
Giá trị của Pixel
Phân loại
Chọn vùng mẫu
H
ình 6.2. Định nghĩa lớp
T liệu gốc

Công nghệ viễn thám
Dùng cho học viên cao học Trắc địa
114
Pixel sẽ đợc phân loại tuần tự vào các lớp đã chọn.
e. Kiểm tra kết quả
Kiểm tra nhằm đánh giá độ chính xác và độ tin cậy. Nếu kết quả kiểm
tra không thỏa mãn thì ta cần phải thay đổi hoặc điều chỉnh các chỉ tiêu phân
loại một cách phù hợp nhằm đạt kết quả tốt hơn.
Đ.6.2. Lý thuyết BAYES
Lý thuyết Bayes là một trong những cơ sở lý thuyết cơ bản để
xây dựng bài toán phân loại ảnh viễn thám. Dới đây sẽ trình bày một số vấn
đề cơ bản của lý thuyết này



















Giả sử chúng ta đo một vài đặc trng của cảnh quan (độ xám của các
Pixel) và có thể chỉ ra Pixel nào thuộc về hai lớp. Đây là mảng một chiều đối
với việc phân loại hai lớp trong vùng đặc trng của ảnh, nếu số lợng Pixel có
khả năng đại diện cho từng lớp (hình 6.3a và hình 6.3b).
P(x/i)
Lớp 1
Lớp 2
Đặc trng X

H
ình 6.3a. Cân bằng xác suất tiền nghiệm
H
ình 6.3b. Không cân bằng xác suất tiền nghiệm
P(x/i) P(i)
Lớp 1
Lớp 2
Đặc trng X

P(1) = P(2)
P(1) < P(2)
P(1) > P(2)


Công nghệ viễn thám
Dùng cho học viên cao học Trắc địa
115
Chúng ta có thể tính toán Histogram xuất hiện quan hệ đặc trng cho
từng lớp và coi nh xấp xỉ với hàm mật độ xác suất của các mẫu vô hạn mật
độ xác suất có điều kiện.
P(x/1); P(x/2) này có diện tích đơn vị và mô tả xác suất của Pixel có giá
trị đặc trng X; chỉ ra các Pixel này sẽ thuộc về lớp 1 hoặc lớp 2 riêng biệt.
Mỗi hàm mật độ xác suất có thể đợc tỷ lệ hóa nhờ xác suất tiên
nghiệm
P(i) - có nghĩa là lớp i này xuất hiện ở vùng quan tâm của ảnh. Tỷ lệ
hàm xác suất P(x/i), P(i) này tơng ứng với Pixel có giá trị xác suất X và ở lớp
i. Trong viễn thám xác suất tiên nghiệm có thể đợc ớc định từ các thông tin
về cảnh quan nh quan sát vùng nghiên cứu, các bản đồ hiện trạng hoặc các số
liệu lịch sử.
Để tiến hành phân loại các Pixel, chúng ta cần biết xác suất về sau tức
là Pixel thuộc về lớp nào đã chọn có giá trị đặc trng X.
Xác suất P(i/x) có thể tính theo quy tắc Bayes.

()()
(
)
()
xP
iP
ixPxiP .// =

(6.1)
Khi đó:


() ( ) ()

=
=
2
1
./
i
iPixPxP
(6.2)
Quy tắc suy đoán đợc tạo thành theo xác suất về sau (6.1)
Pixel có giá trị X thuộc về lớp 1 nếu P(1/x) > P(2/x); tơng tự:
Pixel thuộc về lớp 2 nếu P(2/x) > P(1/x).
Nếu P(x) giống cả hai lớp trong phơng trình (6.1) sẽ không đợc xét
đến trong khi so sánh và ta có thể viết công thức:
Pixel thuộc về lớp 1 nếu P(x/1) . P(1) > P(x/2) . P(2)
Pixel thuộc về lớp 2 nếu P(x/2) . P(2) > P(x/1) . P(1)
Có trờng hợp hai xác suất về sau bằng nhau, nghĩa là:

(
)
(
)
xPxP /2/1
=

(6.3)
hoặc
()
(

)
(
)
(
)
Px P Px P/. / .11 21
=

Việc phân loại không thể làm đợc từ các lớp xác suất.
Điểm dừng của quá trình phải đợc sử dụng, nh khi sử dụng sự phân

Công nghệ viễn thám
Dùng cho học viên cao học Trắc địa
116
loại các điểm lân cận Pixel phân loại trớc đây hoặc chọn ngẫu nhiên hoặc
thuộc lớp 1 hoặc lớp 2. Nó có thể đợc chỉ ra rằng công thức suy đoán Bayes
giảm tối thiểu giá trị xác suất trung bình của sai số trong toàn bộ tập hợp dữ
liệu đã phân loại nếu tất cả hàm xác suất mật độ phân loại là bình thờng.
Thực tế, độ tin cậy xác suất tiên nghiệm khó đạt đợc kết quả, vì thế nó
đợc thừa nhận nh nhau. Sự phân loại chính xác hơn có thể có nếu nó đợc
ớc định chính xác từ dữ liệu bên ngoài.
Công thức Bayes có thể đợc viết lại từ đầu nh sau:
Pixel thuộc về lớp 1 nếu D1(x) > D2(x)
Pixel thuộc về lớp 2 nếu D1(x) > D2(x)
Di(x) đợc gọi là hàm biệt thức và:
()
(
)
(
)

Dx PxiPi
i
=
/.

(6-4)














Trên hình 6.5 điểm giao nhau x
D
của hai hàm là điểm suy đoán ranh
giới hoặc chia lớp.
Về phía phải của ranh giới đợc u đãi cho lớp 2 và về phía trái của
ranh giới đợc u đãi cho lớp 1. Đặt D
1
bằng xác suất về sau, kết quả phân
loại Bayes là tốt nhất, nhng nó không chỉ chọn có cùng kết quả. Hàm biệt
H

ình 6.4. Dạng đơn giản nhấ
t
D(x)
D
2
=P(x/2) P(2)
D
1
=P(x/1) P(1)
Đặc trng X

Hình 6.5 Đặc tính chung

D
(
x
)

D
2
(x)
D
1
(x)
Đặc trn
g
X
X
D


Công nghệ viễn thám
Dùng cho học viên cao học Trắc địa
117
thức khác có thể nhận đợc, nếu lu ý rằng việc suy đoán biên là nh nhau
nên sử dụng hàm đơn điệu của D. Ví dụ:

()
(
)
(
)
[
]
Dx aPxiPi b
i
=+/.
(6.5)
hoặc
()
(
)
(
)
[
]
Dx PxiPi
i
= ln / .
(6.6)
Đây là hai hàm biệt thức hợp lý. Nếu sự phân bố xác suất chuẩn, trong

thực tế ta sử dụng:
()
(
)
Px i
x
i
i
/.exp=









1
2
2
2
2
2




(6.7)
Hàm biệt thức tốt nhất cho lớp I là:

() ( ) ()
[]
()
[]
()
()
(
)
Dx PxiPi Pi
x
ii
i
i
==

ln / . ln ln ln
1
2
2
1
2
2
2
2
2




(6.8)

Đây là dạng tính toán hiệu quả bởi vì số hạng cuối chỉ phụ thuộc vào x
và là hàm bậc đơn giản.
Ranh giới giữa hai lớp đợc tính theo công thức:
() ()
Dx Dx
12
=

Và giải cho x, điều này tơng đơng với:
()
(
)
[]
(
)
(
)
[
]
ln / . ln / .Px P Px P11 2 2=
(6.9)
()
(
)
(
)
(
)
Px P Px P/. / .11 2 2
=


(6.10)
Tổng số xác suất của sai số phân loại là phần đè lên nhau của hàm xác
suất hậu nghiệm. Tổng số sai số xác xuất bằng tổng của các xác suất mà phân
loại không đúng của các lớp đợc phân ra. Dễ dàng nhận thấy rằng việc loại
bỏ các phần chia về phía trái hay phía phải sẽ bao gồm cả vùng rộng hoặc của
một lớp riêng biệt, do đó sẽ tăng tổng số sai số.
Đ.6.3. Một số phơng pháp phân loại đa phổ
1.Phân loại theo xác suất cực đại (Maximum Likehood lassifier)
Phân loại theo xác suất cực đại đợc sử dụng nhiều trong xử lý ảnh viễn
thám, đây là phơng pháp phân loại có kiểm định, mỗi Pixel đợc tính xác
xuất thuộc vào một lớp nào đó và nó đợc gán vào lớp mà xác suất thuộc vào
lớp đó là lớn nhất.

Công nghệ viễn thám
Dùng cho học viên cao học Trắc địa
118
Biến số x là điểm tơng ứng với giá trị đặc trng của Pixel trên ảnh đen
trắng một chiều, trở thành véc tơ x trong K thành phần tơng ứng.









Hình 6.6 thể hiện tập hợp độ xám các Pixel trên tập hợp ảnh đa phổ.
Hàm xác suất P(x/i) trở thành hàm đa biến và các lớp đợc chia ra bởi các

đờng cong trong không gian hai chiều. Các bề mặt trong mảng 3 chiều và các
siêu bề mặt trong mảng k chiều xem nh là kết quả của sự phân bố chuẩn.
Trong mảng một chiều, phân bố chuẩn theo phơng trình (6.7) và yêu chỉ có 2
tham số, giá trị trung bình lớp
, phơng sai
2
chỉ rõ hàm số đủ.
Tơng tự, chỉ có các thông số của sự phê chuẩn hai chiều M và ma trận
phơng sai - hiệp phơng sai
chỉ ra các thông số sự phân bố chuẩn mảng hai
chiều, giá trị

1

2
là các giá trị trung bình của lớp giá trị phơng sai
11


22
là số hạng đờng chéo của ma trận. Thành phần chính của ma trận phơng
sai - hiệp phơng sai còn có các phần tử là

12

21
.
(
)
[]

(
)
[
]
()


12
112 2
1
11
1
i
ii
i
N
xx
N
=



=

(6.11)

X
1
(l) và x
2

(l) là hai giá trị đặc trng mẫu l.
Véc tơ trung bình:
M =








1
2

Ma trận phơng sai - hiệp phơng sai:

=









1
2
12
21 2

2

P(x/i) P(i)
Lớp 2
Lớp 1
P
E
(
2/1
)
P
E
(
1/2
)
Đặc trng X
H
ình 6.6. Xác suất sai số P
E
cho phân loại theo xác suất cực đại

Công nghệ viễn thám
Dùng cho học viên cao học Trắc địa
119
Hệ số tơng quan:
=
12
/(
1


2
)
1/2
=







=










11 12
21 22
1
2
12
21 2
2
ii

ii
ii
ii

(6.12)

Nếu
12i
=
21i
thì ma trận phơng sai - hiệp phơng sai là đối xứng.
Tính chất này cũng đúng cho số chiều lớn hơn. Cần chú ý rằng vì nguyên tố
đờng chéo là khác nhau của những sự phân bố theo những chiều khác nhau.

11i
=
1i
2
nó sẽ luôn dơng và chỉ không dơng nếu nguyên tố nằm
ngoài đờng chéo.
ý nghĩa của số hạng nằm ngoài đờng chéo của ma trận phơng sai -
hiệp phơng sai đợc đánh giá theo sự xác định hệ số tơng quan giữa hai
chiều nh:
()



12
12
11 22

12
i
i
ii
=
.
/

(6.13)
Trong dạng chuẩn hóa này

12i
chỉ có giá trị giữa dấu trừ và dấu cộng.
Hình dáng của sự phân bố hai chiều bình thờng cho các giá trị khác nhau của

12i
đợc chỉ ra ở hình 6.6.
Chú ý rằng, giá trị của

12i
gần với dấu cộng hoặc dấu trừ bao gồm sự
phụ thuộc tuyến tính chắc chắn trong dữ liệu hai chiều. Vì vậy nếu

12i
0 thì
sự phụ thuộc giữa hai chiều là rất ít.
Dạng tổng quát đa biến cho sự phân bố chuẩn K chiều thờng đợc mô
tả:
()
()

()()
Px i
i
XM XM
K
i
T
ii
/.exp.
//
=









1
2
1
2
12 2
1


(6.14)
Trong đó: x : Là véc tơ ảnh.

M
i
: Véc tơ trung bình của lớp i.


I
: Ma trận phơng sai - hiệp phơng sai.


I
-1
: Ma trận nghịch đảo.

|
i
| : Định thức của ma trận phơng sai - hiệp phơng sai.
k : Số kênh phổ
Hàm biệt thức tốt nhất Bayes k chiều:
() () ()
[]
()()
Dx Pi
k
XM XM
iii
T
ii
=








ln ln ln
2
2
1
2
1
2
1


(6.15)

Công nghệ viễn thám
Dùng cho học viên cao học Trắc địa
120
Hàm số biệt thức Bayes tốt nhất trong mảng k chiều đợc biểu diễn theo
biểu thức (6.15) là phơng trình của phơng pháp phân loại theo xác suất cực
đại. Bốn số hạng trong phơng trình này tơng tự nh trong phơng trình
(6.8). Phơng trình (6.15) là cơ sở toán học của phơng pháp phân loại theo
xác suất cực đại, dạng của nó phụ thuộc vào mối quan hệ giữa các trị trung
bình và các ma trận phơng sai - hiệp phơng sai của các lớp khác nhau.
2.Phân loại theo khoảng cách ngắn nhất (K-Nearest neghbour
Classifier)
Phân loại theo khoảng cách ngắn nhất đợc sử dụng để phân loại các
đối tợng trong không gian phổ đa chiều. Khoảng cách giữa các Pixel đợc sử

dụng nh thớc đo đánh giá sự thuộc về một lớp nào đó của Pixel đang khảo
sát.
Với thuật toán này, mỗi giá trị Pixel ẩn số của véc tơ đặc trng X sẽ
đợc phân về lớp có giá trị véc tơ trung bình M
i
gần với X. Thêm vào đó, sự
xuất hiện trực quan rõ ràng, tính toán đơn giản của sự tiếp cận này, nếu chúng
ta giả sử rằng ma trận phơng sai - hiệp phơng sai của tất cả các lớp là bằng
nhau.

i
=
j
=
0
(6.16)
Và xác suất tiên nghiệm bằng nhau:
P(i) = P(j) = P(0) (6.17)
Hàm biệt thức (6.17) sẽ là:

()
()()
Dx A X M X M
ii
T
i
=

1
2

0
1
.

(6.18)

ở đây hằng số A là:

[]
()
[]
AP
k
= ln ln ln
00
2
2
1
2



(6.19)
Và ta có thể bỏ đi sự so sánh của D
i
cho các lớp khác nhau và đại
lợng dm
i
đợc tính tính:


()()
dM XM XM
ii
T
i
=

1
2
0
1
.

(6.20)
Khoảng cách này là khoảng cách Mahalanobis.
Khai triển của dạng phơng trình này dẫn đến phơng trình bậc hai
của X. Dạng bậc hai này là dạng độc lập của i và vì vậy nó có thể đợc liên
hợp với A.

Công nghệ viễn thám
Dùng cho học viên cao học Trắc địa
121
Nếu các ma trận phơng sai - hiệp phơng sai đợc nén về dạng đờng chéo,
nghĩa là các đặc trng không tơng đơng, khi đó:

i
=









0
2
0
2
0
0

(6.21)
Và:
()
(
)
(
)
Dx A
XM XM
i
i
T
i
=
.
2
0
2



(6.22)
Đại lợng (X - M
i
)
T
.(X - M
i
) là vô hớng của tổng các số hạng bình
phơng:
()()( )
(
)
(
)
dXMXMXX XX XM
ii
T
ii iKki2
2
11
2
22
22
= = + + .

(6.23)
Đây là công thức bình phơng khoảng cách
ơcơlit giữa véc tơ X

và M
i
.
Công thức (6.23) biểu diễn hàm biệt thức của phơng pháp phân loại
theo nguyên lý khoảng cách tối thiểu.
D
i
(x) sẽ lớn nhất đối với lớp i khi khoảng cách d
2i
là nhỏ nhất trong lớp
này, nghĩa là lớp này có giá trị trung bình gần nhất. Một cách sử dụng khác
của khoảng cách này là khoảng cách City Block khoảng cách này đợc xác
định:
()
dXMXM XM
iiiKki11122
=+++
(6.24)













X
1
-

1

x
2

d
1
= X
1
-
1
+X
2
-
2

d
2
= [(X
1
-
1
)
2
+(X
2

-
2
)
2
]
1/2

M

X
2
-

2

d
2
X
x
1

Hình 6.7. Khoảng cách City Block (d
1
)
Khoảng cách "ơcơlít" trong mảng 2 chiều



Công nghệ viễn thám
Dùng cho học viên cao học Trắc địa

122
Để mô tả sự khác nhau về suy đoán các đờng biên bằng hai phơng
thức: Khoảng cách tối thiểu và khoảng cách City Block với việc đo khoảng
cách d
1
và d
2
theo tập hợp của 3 phân bố chuẩn trong mảng 2 chiều nh hình
6.7.
Hàm mật độ xác suất có giá trị trung bình khác nhau và khác nhau các
giá trị ngoài đờng chéo của ma trận phơng sai - hiệp phơng sai nhng xác
suất tiên nghiệm lại bằng nhau. Ranh giới suy đoán từ các thuật toán khác
nhau đợc nêu ra ở hình (6.8).










Từ đó ta có một số nhận xét sau:
1- Phơng pháp phân loại theo xác suất cực đại và khoảng cách ngắn
nhất suy đoán ranh giới là hoàn toàn khác nhau. Chúng có thể đợc nhận ra
nếu các điều kiện đầu (6.23) hoàn toàn thỏa mãn.
2- Thuật toán khoảng cách ngắn nhất có những ranh giới suy đoán
khác nhau với hai hàm khoảng cách d
1

và d
2
.
Khi sử dụng khoảng cách d
1
, các đờng ranh giới có dạng tuyến tính
từng phần và xấp xỉ với ranh giới tuyến tính khi sử dụng khoảng cách d
2
.
3- Vùng tách rời đợc chia ra cho 2 lớp. Trong trờng hợp khoảng
cách ngắn nhất chỉ ra rằng xác suất cho lớp 2 là lớn hơn trong vùng, nó chỉ ra
sự cần thiết đối với ranh giới, loại bỏ đi sự phân loại không hợp lý của nguyên
tắc chung, nghĩa là các véc tơ đặc trng của các Pixel khác xa với bất kỳ véc
tơ trung bình của lớp xác định.
Tóm lại, phơng pháp khoảng cách ngắn nhất đa đến thuật toán đơn
giản có thể đợc lập trình hóa có kết quả, đặc biệt khi sử dụng khoảng cách d
1
.
Hình 6.8 Ranh giới cho 3 lớp, tập hợp hai chiều

b/ Thuật toán xác suất cực đại
a/ Thuật toán khoảng cách tối thiểu
d
1
Lớp 3
Lớp 1

Lớp 2
x
2

x
1

d
2

Lớp 2
Lớp 3

Lớp 1
Lớp 2


Công nghệ viễn thám
Dùng cho học viên cao học Trắc địa
123
Tuy nhiên, không giống nh phơng pháp phân loại theo xác suất cực
đại, nó không đợc sử dụng trong lý thuyết sai số. Phân loại trung bình tối
thiểu chỉ sử dụng khi đúng khoảng cách d
2
(trờng hợp ma trận phơng sai -
hiệp phơng sai bị nén về dạng đờng chéo).
3. Phân loại hình hộp (Box Classfier)











Phân loại hình hộp thuộc vào nhóm phơng pháp phân loại có kiểm
định đơn giản nhất. Trong phơng pháp này mỗi trục phổ đợc chia thành
nhiều lớp dựa trên các giá trị tối đa, tối thiểu của tập mẫu tơng ứng. Hay nói
cách khác là trong không gian phổ này ta xác định các hộp bao bọc một
nhóm cùng tính chất. Các Pixel nằm trong hộp không gian giới hạn bởi các
miền xác định trên trục phổ nh vậy sẽ đợc phân loại vào nhóm tơng ứng.
Phơng pháp này tốc độ thực hiện cao nhng độ chính xác còn hạn chế. Bản
chất hình học đợc mô tả trên hình 6.9.
Quá trình phân loại theo phơng pháp hình hộpđợc tiến hành nh
sau:
1. Xác định đờng bao cho tất cả các hộp đặc trng theo các vùng liên
tục (vùng lấy mẫu). Tức là vùng có đặc tính đặc trng xác định nh nớc, đất,
thực vật trên ảnh gốc và đã đợc xác định nêu ở thực địa. Đối với từng lớp
liên tục đó có giá trị trung bình (
) và có phơng sai
2
của sự phân bố độ đen
cần thiết để tính toán:



ij
i
ij
k
n
n

x
i
=

=
1
1

50
40
30
20
10

70
Đất cát
50
60
Đất nông nghiệp

40
Vùng nớc

30
Đất ở
20
Đất hoang
10

0 10 20 30 40 50 60 70

H
ình 6.9 Bản chất hình học của phân loại hình hộp

Công nghệ viễn thám
Dùng cho học viên cao học Trắc địa
124

()

ij
i ijk ijk
k
n
k
n
ii
nx x
nn
ii
2
2
1
2
1
1
=











==
(6.25)
(i=1, 2 n
i
; j=1, 2, N
B
).
Trong đó:
i - Số thứ tự của lớp trong tổng N lớp.
j - Số thứ tự của băng trong tổng N
B
băng.
k - Số thứ tự của pixel trong tổng N
i
pixel.
Khi sử dụng

ij

ij
cho các vùng bao của từng hộp, ta có thể dùng
biểu thức sau:
(X
min

)
ij
=

ij
- k

ij

(X
max
)
ij
=

ij
+ k

ij


ở đây k là hệ số tỷ lệ đợc lựa chọn, (X
min
)
ij
, (X
max
)
ij
là giới hạn thống

nhất và cao nhất của vùng bao lớp i trên băng ảnh j.
2. Đối với tất cả các pixel trên ảnh gốc, việc việc giải đoán các đặc
trng sẽ thực hiện theo điều kiện sau:
Nếu (X
min
)
ij
X
ik
(X
max
)
ij
, (j = 1,2, N
B
) thì pixel k thuộc lớp j và
ngợc lại pixel k không thuộc lớp i.
3. Trong quá trình xử lý, kết qủa phân loại ảnh có thể thứ tự lớp đợc
gán cho từng pixel.
Đ.6.4. Đánh giá độ chính xác phân loại đa phổ
Phân loại đa phổ là quá trình tách gộp thông tin dựa trên các tính chất
phổ không gian và thời gian của đối tợng. Phân loại đa phổ để tách các thông
tin cần thiết phục vụ cho việc theo dõi các đối tợng hay thành lập bản đồ
chuyên đề là khâu then chốt của việc khai thác các t liệu viễn thám. Đánh giá
độ chính xác phân loại là vấn đề đang đợc các chuyên gia viễn thám chú ý
đến. Ngày nay cha có phơng pháp nào đơn giản và chuẩn mực đợc chấp
nhận đại trà để xác định độ chính xác phân loại. Có hai phơng pháp đợc sử
dụng phổ biến nhất để đánh giá độ chính xác công tác phân loại đa phổ. Cả
hai đều so sánh các kết quả thu đợc từ cách phân loại bằng số đối với các đặc
tính "đã biết" của mặt đất trong các vùng thử nghiệm từ các tài liệu tham

khảo. Các khu vực thử nghiệm này đợc đại diện điển hình bằng một hoặc tổ
hợp của:


Công nghệ viễn thám
Dùng cho học viên cao học Trắc địa
125
- Các khu vực thử nghiệm đồng nhất do ngời phân tích lựa chọn.
- Các khu vực thử nghiệm hoặc các pixel đợc chọn ngẫu nhiên.
1. Phơng pháp thứ nhất
Ta đã biết cách sử dụng một bảng ngẫu nhiên làm công cụ đánh giá độ
chính xác phân loại của khu vực mẫu. Cần nhớ rằng phơng thức này chỉ nêu
ra các số liệu thống kê lấy ra từ các khu vực có thể sử dụng tốt để phân loại
cũng các khu vực đó. Nếu các kết quả tốt, thì điều đó chứng tỏ khu vực mẫu là
đồng nhất, cách phân loại đang sử dụng có thể phục vụ tốt trong các khu vực
mẫu. Điều này trợ giúp trong quá trình chọn lọc bộ mẫu nhng nó ít chỉ ra yếu
tố đợc phân loại ra sao trên khu vực khác.
Các khu vực thử nghiệm là những khu vực có lớp phủ mặt đất đại diện
đồng nhất khác và rộng lớn hơn các vùng mẫu. Chúng thờng đợc bố trí
trong giai đoạn lấy mẫu để phân loại có kiểm định bằng cách chọn thêm các
vùng mẫu dự trữ nhiều hơn so với yêu cầu để nghiên cứu xây dựng thống kê
phân loại. Khi đó, một phần của chúng có thể đợc giữ lại để đánh giá độ
chính xác sau khi phân loại và lại dùng một bảng ngẫu nhiên để biểu thị các
kết quả. Độ
chính xác thu đợc trong các khu vực này biểu thị gần đúng chất
lợng phân loại trên toàn bộ khu vực. Tuy nhiên, vì là đồng nhất nên các diện
tích thử nghiệm có thể không đa ra một sự chỉ dẫn có giá trị về độ chính xác
phân loại cho từng pixel riêng biệt của sự biến động mặt đất.
Một phơng pháp có thể dùng để đánh giá độ chính xác là so sánh kết
quả phân loại lớp phủ mặt đất tại mỗi pixel trong ảnh với tài liệu tham khảo.

Trong lúc các so sánh có thể có giá trị trong các điều kiện nghiên cứu thì việc
thu thập thông tin lớp phủ mặt đất tham khảo cho một khu vực khá tốn kém.
2. Phơng pháp thứ 2
Việc lấy mẫu một cách ngẫu nhiên các pixel đã khắc phục các nhợc
điểm trên, nhng nó bị ảnh hởng do số lợng mẫu có hạn. Trớc hết, do việc
thu thập các tài liệu tham khảo cho một số lợng lớn các mẫu đại diện cho các
điểm phân bố ngẫu nhiên thờng rất khó khăn và tốn kém. Chẳng hạn, khoảng
cách đi lại và việc tiếp cận các điểm lấy mẫu ngẫu nhiên có thể bị cản trở. Hai
là, giá trị của việc lấy mẫu ngẫu nhiên phụ thuộc vào khả năng ghi lại chính
xác các tài liệu tham khảo làm căn cứ cho tài liệu ảnh. Điều này thờng khó
thực hiện. Biện pháp để khắc phục nhợc điểm này là chỉ lấy mẫu tại những
pixel mà đặc điểm nhận dạng chúng không bị ảnh hởng của các sai số ghi
chép (chẳng hạn các điểm cách xa ranh giới giữa các vùng ít nhất vài pixel).

Công nghệ viễn thám
Dùng cho học viên cao học Trắc địa
126
Các pixel thử nghiệm phải chọn một cách ngẫu nhiên nhng phải đại
diện về mặt địa lý cho tập hợp dữ liệu phân tích. Việc chọn mẫu ngẫu nhiên
phải theo các lớp, mà tại đó mỗi loại đất có thể xem là một lớp đợc sử dụng.

vậy, phơng pháp lấy mẫu thích hợp cho việc thống kê nông nghiệp sẽ
khác với phơng pháp lấy mẫu để thành lập bản đồ vùng đầm lầy
. Ngoài ra,
khi thiết kế vùng mẫu cần phải chú ý đến diện tích khu vực đợc nghiên cứu
và loại lớp phủ cần đợc phân loại
. Một cách phổ biến để thực hiện việc lấy
mẫu ngẫu nhiên là chồng các dữ liệu kết quả phân loại lên một lới ô
vuông.
Sau đó sẽ chọn ngẫu nhiên các ô

thử nghiệm. Các lớp phủ mặt đất hiện có
đợc xác định thông qua việc kiểm tra ngoài thực địa (hoặc nguồn dữ liệu
tham khảo khác) và so sánh với các dữ liệu đã phân loại. Sau đó sẽ ghi các kết
quả vào trong một bảng ngẫu nhiên.
Trong việc xác định độ chính xác phân loại, điều quan trọng không chỉ
nêu lên tỉ lệ các pixel đợc phân loại đúng mà còn cần xác định tính chất các
sai sót phạm phải của từng loại một. Chỉ tiêu Kappa này nằm trong phạm vi từ
0 đến 1 và biểu thị sự giảm theo tỉ lệ về sai số đợc thực hiện bằng một yếu tố
phân loại hoàn toàn ngẫu nhiên. Do
vậy, giá trị 0,75 sẽ chỉ ra rằng yếu tố phân
loại đã tránh đợc 75% các sai số mà một quá trình hoàn toàn ngẫu nhiên có
thể sinh ra. Kích thớc của mẫu cũng phải đợc cân nhắc cẩn thận trong việc
xây dựng và giải thích độ chính xác phân loại. Để đánh giá độ chính xác trung
bình của một loại với sai số +
5% cần phải có nhiều hơn 250 pixel thử nghiệm.
Khi số lợng pixel thử nghiệm đợc lấy mẫu ít hơn, thì độ chính xác sẽ bị
giảm đáng kể
. Tóm lại số lợng các điểm cần lấy mẫu phụ thuộc vào quy trình
lấy mẫu đợc sử dụng, độ chính xác của việc ớc tính, số lợng pixel có mặt
trong một chủng loại và độ chính xác phân loại đòi hỏi.
Ngoài ra khi đánh giá độ chính xác phân loại cần phải lu ý đến hai
vấn đề: thứ nhất là chất lợng của bất kỳ việc đánh giá độ chính xác nào cũng
chỉ tốt khi thông tin đợc sử dụng để thiết lập loại đất "thực" có mặt trong các
vùng thử nghiệm. Với một chừng mực nào đó, số sai số ớc lợng có mặt
trong tài liệu tham khảo phải đợc đa vào trong quá trình đánh giá độ chính
xác. Thứ hai là quy trình đánh giá độ chính xác phải đợc thiết kế sao cho
phản ánh đúng mục đích của việc phân loại đó. Chẳng hạn, một pixel đơn lẻ bị
phân loại sai là "đầm lầy" nằm giữa một vùng trồng mầu có thể không có ý
nghĩa trong việc xây dựng kế hoạch sử dụng ruộng đất của một vùng. Tuy
nhiên, chính sai sót này lại không thể bỏ qua nếu việc phân loại đó dùng làm

cơ sở để đánh thuế đất đai.

×