ĐẠI HỌC QUỐC GIA TP. HCM
TRƢỜNG ĐẠI HỌC BÁCH KHOA
SO SÁNH MỘT SỐ PHƢƠNG PHÁP
PHÂN LOẠI ẢNH TRONG VIỄN THÁM
Môn: Xử lý ảnh số trong Viễn thám
Giảng viên
PGS.TS. Lê Văn Trung
Học viên thực hiện
Huỳnh Thị Mai Đình
Mã số học viên
12103003
Tp.HCM, ngày 5 tháng 06 năm 2013
Mục lục
1. Đặt vấn đề ...................................................................................................................... 1
2. Dữ liệu và phương pháp thực hiện ................................................................................ 2
2.1. Dữ liệu..................................................................................................................... 2
2.2. Phương pháp và quy trình thực hiện ....................................................................... 2
3. Khái quát về các phương pháp phân loại ảnh trong viễn thám ..................................... 3
4. Nội dung thực hiện ........................................................................................................ 3
4.1. Xác định các đối tượng phân loại ........................................................................... 3
4.2. Giải đoán ảnh bằng mắt .......................................................................................... 4
4.3. Xử lý ảnh ................................................................................................................. 4
4.4. Xây dựng bộ dữ liệu mẫu huấn luyện ..................................................................... 6
4.5. Ước tính thống kê vùng mẫu................................................................................... 7
4.6. Phân loại ảnh ........................................................................................................... 9
4.7. Đánh giá kết quả phân loại.................................................................................... 11
5. Kết quả và thảo luận .................................................................................................... 13
1
So sánh một số phương pháp phân loại ảnh trong Viễn thám
1. Đặt vấn đề
Công nghệ viễn thám được sử dụng để cung cấp dữ liệu không gian cho nhiều ứng
dụng trong thực tế và thường có thể được thực hiện với chi phí thấp hơn so với nhiều
phương pháp truyền thống khác. Ưu điểm nổi bật của công nghệ này thể hiện ở khả năng
chiết tách thông tin của các đối tượng trên bề mặt đất theo diện rộng qua thời gian, thậm
chí tại những nơi con người khơng thể tiếp cận được [3]. Khả năng này được thực hiện
thơng qua việc giải đốn và phân loại ảnh viễn thám mà đặc biệt là ảnh được cung cấp từ
các vệ tinh. Ảnh sau khi được phân loại được ứng dụng trong nhiều lĩnh vực đặc biệt là
trong lĩnh vực mơi trường.
Hiện nay, trong kĩ thuật viễn thám có nhiều phương pháp phân loại ảnh, mỗi
phương pháp đều có những ưu điểm và hạn chế nhất định. Tùy vào việc lựa chọn và sử
dụng phương pháp phân loại mà kết quả phân loại là khác nhau. Do đó, việc nghiên cứu
và đánh giá kết quả phân loại của từng phương pháp là cần thiết nhằm lựa chọn phương
pháp thích hợp cho từng dữ liệu ảnh nhất định. Mục tiêu của bài tiểu luận này là so sánh
kết quả phân loại trên cùng dữ liệu mẫu để đánh giá các thuật toán phân loại của hai
phương pháp sau: phương pháp phân loại gần đúng nhất (Maximum Likelihood Classifier
– MLC) và khoảng cách ngắn nhất (Milimum Distance).
2
So sánh một số phương pháp phân loại ảnh trong Viễn thám
2. Dữ liệu và phƣơng pháp thực hiện
2.1.
Dữ liệu
Dữ liệu ảnh được sử dụng cho tiểu luận là ảnh Landsat TM 7. Ảnh đã được hiệu
chỉnh hình học với hệ tọa độ WGS 84, vùng 48.
Khu vực ảnh giải đốn ( tổ hợp màu 5,4,2)
2.2.
Phương pháp và quy trình thực hiện
Phương pháp phân loại có giám định được thực hiện trong tiểu luận này. Như đã
trình bày trong phần mở đầu, đề tài chỉ thực hiện so sánh hai phương pháp: phương pháp
phân loại gần đúng nhất (Maximum Likelihood Classifier – MLC) và khoảng cách ngắn
nhất (Milimum Distance).
Về phương pháp chọn mẫu: Dữ liệu mẫu huấn luyện và mẫu kiểm tra sẽ được
chọn theo phương pháp ngẫu nhiên. Bên cạnh các phương pháp tăng cường chất lượng
ảnh,đề tài sử dụng cơng cụ Google Earth với ảnh vệ tinh có độ phân giải cao hơn ảnh
Landsat (30m) nhằm hỗ trợ cho việc giải đoán và chọn mẫu hiệu quả.
3
So sánh một số phương pháp phân loại ảnh trong Viễn thám
Quy trình giải đốn và phân loại ảnh như sau:
3. Khái quát về các phƣơng pháp phân loại ảnh trong viễn thám
Kỹ thuật phân loại có giám định dùng thuật toán phân loại gần đúng nhất (MLC) là
phương pháp được sử dụng khá phổ biến. MLC được xây dựng trên cơ sở hàm mật độ xác
xuất tuân theo luật phân bố chuẩn. Theo đó, mỗi pixel sẽ được tính xác suất thuộc một
loại nào đó và nó được chỉ định gán vào tên loại mà xác suất thuộc vào loại đó là lớn nhất.
Phân loại khoảng cách ngắn nhất sử dụng khoảng cách không gian phổ từ pixel
được xét đến vector đặc trưng của trung bình từng loại như chỉ số đánh giá xác định sự
thuộc về một loại nào đó. Các khoảng cách khơng gian phổ hay được sử dụng trong
phương pháp này là khoảng cách Euclid; khoảng cách Euclid chuẩn hóa; khoảng cách
Mahalanobis.
4. Nội dung thực hiện
4.1.
Xác định các đối tượng phân loại
Mục đích phân loại ảnh là thành lập bản đồ sử dụng đất, các loại cần được xác định
trên bản đồ bao gồm:
4
So sánh một số phương pháp phân loại ảnh trong Viễn thám
TT
1
2
3
4
5
6
7
8
4.2.
Loại đất
Đất trồng lúa giai đoạn 1
Đất trồng lúa giai đoạn 2
Đất trồng cây ăn quả
Đất nuôi trồng thủy sản
Đất rừng ngập mặn
Đất đơ thị
Đất sơng ngịi, kênh, rạch suối
Mây
Giải đoán ảnh bằng mắt
Giải đoán ảnh bằng mắt giúp cho việc nhận định thông tin về sự phân bố của các
đối tượng trên ảnh một cách tổng quát trước khi đi vào phân tích và phân loại ảnh bằng
các phương pháp được thực hiện tự động bằng máy tính. Dựa vào sự hiển thị màu hay độ
sáng, hình dạng, kích thước, cấu trúc… của từng đối tượng trên ảnh là các khóa giải đốn
khi thực hiện giải đốn bằng mắt. Trong đó, việc tổ hợp màu đóng vai trị quan trọng.
Sự hiển thị màu của từng đối tượng trên ảnh là kết quả của sự phản xạ của bước
sóng điện từ đối với bề mặt đất. Tùy theo từng bước sóng với từng lớp phủ khác nhau trên
bề mặt đất mà kết quả hiển thị là khác nhau. Nói cách khác, mỗi đối tượng trên bề mặt đất
đều có đặc trưng về phổ riêng, mà ta có thể dựa vào đặc tính này để xác định các kênh
phổ thích hợp tham gia tổ hợp màu nhằm phục vụ cho q trình giải đốn bằng mắt hiệu
quả.
4.3.
Xử lý ảnh
Có rất nhiều kỹ thuật để xử lý ảnh trước khi phân loại nhằm nâng cao chất lượng
kết quả phân loại ảnh. Trong đó, kỹ thuật phân tích thành phần chính (PCA) thường được
thực hiện. Đây là kỹ thuật được sử dụng để làm giảm số kênh phổ mà vẫn giữ lượng
thông tin không bị thay đổi đáng kể. Kỹ thuật phân tích thành phần chính áp dụng trong
viễn thám trên cơ sở thực tế là ảnh chụp ở các kênh phổ gần nhau có sự tương quan phổ
rất cao, vì vậy mà thơng tin của chúng có phần trùng lắp rất lớn (ảnh đa phổ chứa nhiễu
5
So sánh một số phương pháp phân loại ảnh trong Viễn thám
cũng như dư thừa thông tin). Nhờ vào ưu điểm này mà ta thường sử dụng kết quả ảnh sau
khi thực hiện phân tích thành phần chính để tiến hành chọn mẫu và phân loại ảnh.
Ma trận tương quan giữa các kênh phổ
Kênh 1
Kênh 1
Kênh 2
Kênh 3
1 0.942403 0.900939
Kênh 2 0.942403
-0.32807
-0.27066
Kênh 5
Kênh 7
-0.32807 0.163119 0.357983
1 0.942913
Kênh 3 0.900939 0.942913
Kênh 4
Kênh 4
-0.27066 0.226043 0.403178
1
-0.30114 0.288703 0.483381
-0.30114
1 0.677257 0.487048
Kênh 5 0.163119 0.226043 0.288703 0.677257
1 0.947248
Kênh 7 0.357983 0.403178 0.483381 0.487048 0.947248
1
Ma trận tương quan sau khi phân tích PCA
Kênh 1
Kênh 2
Kênh 3
Kênh 4
Kênh 5
Kênh 7
Kênh 1
1
0
0
0
0
0
Kênh 2
0
1
0
0
0
0
Kênh 3
0
0
1
0
0
0
Kênh 4
0
0
0
1
0
0
Kênh 5
0
0
0
0
1
0
Kênh 7
0
0
0
0
0
1
Ta thấy rằng, giá trị xung quanh đường chéo chính đều bằng 0, chứng tỏ khơng cịn
sự tương quan giữa các kênh sau khi phân tích PCA.
Nếu ảnh gốc có k kênh, thì sau khi biến đổi cũng sẽ nhận được k kênh, nhưng 3
thành phần đầu tiên chiếm hết 90% lượng thông tin chứa trong ảnh gốc, từ kênh thứ 3 trở
đi, nội dung thông tin bị giảm dần. Ta có thể sử dụng 3 kênh đầu này để tổ hợp màu phục
vụ cho việc giải đoán ảnh bằng mắt. Tuy nhiên, nhược điểm của PCA là khó chỉ định
kênh nào vào màu nào cho phù hợp với giải đoán, vì ảnh PCA là một hàm bước sóng
6
So sánh một số phương pháp phân loại ảnh trong Viễn thám
của ảnh gốc. Do đó, cần tìm mối tương quan giữa ảnh gốc và ảnh PCA để chỉ định màu
ứng với từng bước sóng một cách phù hợp.
PCA1
Ma trận tương quan giữa ảnh gốc và ảnh PCA
Kenh 1 Kenh 2 Kenh 3 Kenh 4 Kenh 5 Kenh 7
0.006
0.015
0.036
0.564
0.763
0.314
PCA2
PCA3
PCA4
PCA5
PCA6
-0.356
-0.241
-0.469
0.637
-0.321
-0.293
-0.514
-0.353
-0.45
-0.513
0.358
0.129
-0.649
0.059
0.651
0.022
0.11
-0.372
-0.307
-0.136
0.233
0.108
-0.417
0.805
-0.304
0.891
-0.313
-0.025
-0.028
0.115
Vì ảnh PCA là một hàm bước sóng
của ảnh gốc, nên ta cần chuyển đổi các giá trị
pixel từ số thực về số nguyên bằng kĩ thuật histogram. Sau đó, dùng các ảnh đã chuyển
đổi này để tạo ảnh tổ hợp màu.
Ảnh tổ hợp màu 3 kênh ảnh PCA
4.4.
Xây dựng bộ dữ liệu mẫu huấn luyện
Khác với kỹ thuật phân loại phi giám định, trong kỹ thuật phân loại có giám định,
cần chọn các vùng mẫu cho mỗi loại theo yêu cầu đã xác định. Số lượng pixel tối thiểu
yêu cầu phải thu thập cho mỗi mẫu là k + 1 đến 10k pixel (k: số kênh phổ của ảnh vệ
tinh dùng để phân loại).
7
So sánh một số phương pháp phân loại ảnh trong Viễn thám
4.5.
Ước tính thống kê vùng mẫu
Các mẫu sau khi được xây dựng được tính tốn thống kê các tham số như giá trị
trung bình mẫu, ma trận phương sai, hiệp phương sai…của hàm phân bố chuẩn. Đặc biệt
với phương pháp phân loại khoảng cách gần đúng nhất, việc kiểm tra xem sự phân bố của
dữ liệu huấn luyện ứng với từng vùng mẫu có phù hợp với luật phân bố chuẩn hay không
là rất quan trọng để cho ra kết quả hiệu quả khi thực hiện phương pháp này.
Tham số thống kê tương ứng với từng vùng mẫu
Đối với lớp phủ là Đất trồng lúa giai đoạn 1
Min
Band 1
Band 2
Band 3
Band 4
Band 5
Band 7
Max
57
25
18
88
64
20
68
31
24
128
94
31
Mean
61.60274
28.12329
20.42466
112.0548
78.47945
25.20548
Stdev
2.520691
1.641013
1.580417
8.017152
6.446596
2.788662
89
48
67
91
157
73
Mean
78.78261
39.04348
51.26087
64.85507
118.2029
55.56522
Stdev
4.620509
5.217152
10.43559
14.5716
28.26533
12.00059
Đối với lớp phủ là Đất trồng lúa giai đoạn 2
Min
Band 1
Band 2
Band 3
Band 4
Band 5
Band 7
Max
69
28
27
34
50
27
Đối với lớp phủ là Đất trồng cây ăn quả
Min
Band 1
Band 2
Band 3
Band 4
Band 5
Band 7
55
Max
Mean
Stdev
66 60.18868 2.922437
22
29 25.32076 2.190658
17
26 21.30189 2.635446
63
86 75.45283 5.614425
33
70
9
47.4717 9.471828
26 15.37736 4.211826
8
So sánh một số phương pháp phân loại ảnh trong Viễn thám
Đối với lớp phủ là Đất nuôi trồng thủy sản
Min
Band 1
Band 2
Band 3
Band 4
Band 5
Band 7
Max
66
Mean
Stdev
77 69.69014 2.201243
29
38
29
44 34.49296 2.857938
35
47 39.69014 2.718148
26
59 44.69014 7.023616
9
27 19.19718 3.717218
31.8169 1.799284
Đối với lớp phủ là Đất rừng ngập mặn
Min
Band 1
Band 2
Band 3
Band 4
Band 5
Band 7
Max
69
28
27
34
50
27
89
48
67
91
157
73
Mean
78.78261
39.04348
51.26087
64.85507
118.2029
55.56522
Stdev
4.620509
5.217152
10.43559
14.5716
28.26533
12.00059
Đối với lớp phủ là Đất đô thị
Min
Band 1
Band 2
Band 3
Band 4
Band 5
Band 7
62
Max
Mean
Stdev
123 79.35714 11.42841
26
63 38.57143 7.238931
24
75
42
75 55.89286 9.608404
50
125 84.89286 15.20317
20
83 46.60714 12.90518
44.5 10.19622
9
So sánh một số phương pháp phân loại ảnh trong Viễn thám
Đối với lớp phủ là Đất sơng ngịi, kênh, rạch suối
Min
Band 1
Band 2
Band 3
Band 4
Band 5
Band 7
Max
58
Mean
Stdev
93 70.72131 6.143102
26
45 33.65574 4.082014
21
55
35.4918 7.603997
14
66
29.4918 12.22514
5
41 15.73771 9.049681
1
15 6.622951 3.131368
Đối với lớp phủ là Mây
Min
Band 1
Band 2
Band 3
Band 4
Band 5
Band 7
4.6.
Max
49
Mean
Stdev
255 97.48276 59.70108
17
171
12
207 48.51724 46.52494
10
198 66.18966 52.45297
4
255 70.91379 74.69171
1
158 37.91379 44.45549
45.5 36.28651
Phân loại ảnh
Hai phương pháp phân loại được sử dụng để phân loại ảnh là phương pháp phân
loại gần đúng nhất và phương pháp khoảng cách gần đúng nhất. Như đã trình bày ở phần
[3.], mỗi phương pháp đều dựa trên thuật tốn khác nhau, do đó, ứng với từng phương
pháp, kết quả ảnh phần loại nhận được là khác nhau. Để so sánh độ chính xác của hai
phương pháp này, cần đưa vào tính tốn với cùng chung một bộ dữ liệu mẫu và dữ liệu
kiểm tra.
10
So sánh một số phương pháp phân loại ảnh trong Viễn thám
Kết quả ảnh sau khi phân loại của hai phương pháp này như sau:
Ảnh phân loại bằng phương pháp phân loại gần đúng nhất
11
So sánh một số phương pháp phân loại ảnh trong Viễn thám
Ảnh phân loại bằng phương pháp khoảng cách ngắn nhất
4.7.
Đánh giá kết quả phân loại
Đánh giá kết quả phân loại là việc so sánh sự phù hợp giữa những loại thực vật
trên mặt đất và những loại giải đoán bằng các phương pháp phân loại. Trong tiểu luận
này, hai phương pháp được sử dụng là khoảng cách gần đúng nhất và khoảng cách ngắn
nhất. Dữ liệu kiểm tra hai phương pháp này cũng phải cùng một bộ dữ liệu.
Kết quả thống kê trên ma trận sai số ta được các chỉ tiêu đánh giá của hai phương pháp
như sau:
12
So sánh một số phương pháp phân loại ảnh trong Viễn thám
Phương pháp phân loại theo khoảng cách ngắn nhất
Mây
Độ chính xác
người sản xuất
Độ chính xác
người sử dụng
Đất trồng lúa
giai đoạn 1
Đất trồng lúa giai
đoạn 2
Đất trồng cây
ăn quả
78.26
75
68.97
60
62.5
78.13
63.33
80
100
75
60
57
89.29
70.37
71.43
51.61
0
25
28.57
40
42.31
10.71
29.63
28
21.74
25
40
37.5
21.88
36.67
31.03
20
Đất trồng lúa
giai đoạn 1
Đất trồng lúa giai
đoạn 2
Đất trồng cây
ăn quả
Đất ni trồng
thủy sản
Đất rừng
ngập mặn
Đất đơ
thị
Đất sơng ngịi,
kênh, rạch suối
Mây
82.61
100
70
54.17
59.38
60
72.41
0
95
5
17.39
54.05
45.95
0
38.89
27.59
27.59
59.09
61.11
30
100
40.91
45.38
56.25
0
0
72.41
43.75
40
0
100
100
Sai số bỏ sót
Sai số thực hiện
Độ chính xác
tồn cục
Hệ số Kappa
Đất ni trồng
thủy sản
Đất rừng
ngập mặn
Đất đơ
thị
Đất sơng ngịi,
kênh, rạch suối
Mây
70.707%
0.6645
Phương pháp phân loại gần đúng nhất
Mây
Độ chính xác
người sản xuất
Độ chính xác
người sử dụng
Sai số bỏ sót
Sai số thực hiện
Độ chính xác
tồn cục
Hệ số Kappa
62.62%
0.5727
13
So sánh một số phương pháp phân loại ảnh trong Viễn thám
5. Kết quả và thảo luận
Với cùng một bộ dữ liệu huấn luyện và cùng bộ dữ liệu kiểm tra,từ kết quả phân
loại ta nhận thấy kết quả so sánh từ hai phương pháp phân loại như sau:
Độ chính xác toàn cục
Hệ số Kappa
Phương pháp phân loại gần
Phương pháp phân loại theo
đúng nhất
khoảng cách ngắn nhất
70.707%
62.62%
0.6645
0.5727
Độ chính xác tồn cục và hệ số Kappa của phương pháp phân loại gần đúng nhất
đều cao hơn phương pháp phân loại theo khoảng cách ngắn nhất. Kết quả so sánh cho
thấy, thuật toán của phương pháp phân loại gần đúng nhất ưu điểm hơn phương pháp
phân loại theo khoảng cách ngắn nhất. Tuy nhiên, kết quả phân loại dựa vào phương pháp
phân loại gần đúng nhất chỉ hiệu quả đối với dữ liệu mẫu theo phân bố chuẩn, do đó, khi
sử dụng phương pháp này, cần cẩn thận khi chọn và thống kê các tham số vùng mẫu trước
khi thực hiện phân loại.
14
So sánh một số phương pháp phân loại ảnh trong Viễn thám
Tài liệu tham khảo
1. Lê Văn Trung, 2010, Viễn Thám, Nhà xuất bản Đại học quốc gia Tp. Hồ Chí Minh.
2. Lê Văn Trung, 2006, Thực hành Viễn Thám, Nhà xuất bản Đại học quốc gia Tp.
Hồ Chí Minh.
3. F. S. Al-Ahmadi
và A. S. Hames, 2007, Comparison of Four Classification
Methods to Extract Land Use and Land Cover from Raw Satellite Images for Some
Remote Arid Areas, Kingdom of Saudi Arabia, King Abdulaziz University.