Luận văn nghiên cứu kỹ thuật phân loại dữ liệu lidar

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (4.7 MB, 47 trang )

1

MỞ ĐẦU

1. Đặt vấn đề
Từ những năm đầu của thập niên 60 của thế kỷ 20, sự ra đời của bộ khuếch đại
ánh sáng bằng phát xạ kích thích – laser đã mở rất nhiều ứng dụng mới, trong đó phải
kể đến kỹ thuật khảo sát từ xa sử dụng nguồn kích thích bằng tia laser gọi là LiDAR
(Light Detection And Ranging). Hệ thống LiDAR là một hệ thống tích hợp từ 3 thành
phần chính: Hệ thống thiết bị Laser (Light amplification by stimulated emission of
radiation), hệ thống định vị vệ tinh GNSS (Global Navigation Sattelite System) và hệ
thống đạo hàng quán tính INS (Inertial Navigation System). Tổ hợp các thiết bị này
trong mối quan hệ hữu cơ, tác động chi phối lẫn nhau, tạo nên hệ thống LiDAR.
Bản chất của công nghệ LiDAR là kỹ thuật đo dài laser, định vị không gian
GPS/INS và sự nhận biết cường độ phản xạ ánh sáng. Xung của laser được phát hướng
xuống mặt đất trên một độ cao nào đó. Sóng laser được phản hồi từ mặt đất hay từ
các bề mặt đối tượng như là cây, đường hoặc nhà ..., với mỗi xung sẽ đo được thời
gian đi và về của tín hiệu, tính được khoảng cách từ nguồn phát laser tới đối tượng.
Ở mỗi thời điểm phát xung laser, hệ thống định vị vệ tinh GNSS sẽ xác định vị trí
khơng gian của điểm phát, và hệ thống đạo hàng qn tính sẽ xác định các góc định
hướng trong khơng gian của tia quét. Với các giá trị đo tổng hợp đó tính được vị trí
(tọa độ khơng gian) của các điểm trên bề mặt đất.
Công nghệ LiDAR là một công nghệ tiên tiến hàng đầu trong hệ thống các công
nghệ thu thập dữ liệu không gian trên thế giới. Với khả năng trực tiếp thu nhận đám
mây điểm 3D với độ chính xác cao, LiDAR được áp dụng rộng rãi trong việc thành
lập mơ hình số độ cao (Digital Elevation Model - DEM) của bề mặt địa hình, dựa vào
đó có thể theo dõi được dịng chảy của nước hay giám sát di chuyển khối, thành lập
bản đồ và viễn thám. Công nghệ LiDAR là sự phát triển và ứng dụng các thiết bị
laser, định vị vệ tinh và đo quán tính để thu thập dữ liệu địa lý trên bề mặt trái đất. So
sánh với các phương pháp thu nhận và xử lý trắc địa ảnh truyền thống, xử lý dữ liệu

2

LiDAR dễ dàng hơn, thành lập chính xác mơ hình DEM. Hơn thế nữa, xung laser có
thể xuyên qua các địa hình, địa vật như lá, mặt đất dưới tán cây.
Để thành lập ra được DEM từ tập hợp điểm này, ta phải phân biệt được điểm
mặt đất và điểm khơng mặt đất. Q trình này gọi là phân loại dữ liệu LiDAR. Việc
phân loại dữ liệu tự động của đám mây điểm được thực hiện bằng phép giải các bài
toán lọc điểm, trên cơ sở kết hợp sử dụng ảnh cường độ, kết quả đo vẽ các bãi kiểm
định chuẩn trên thực địa và ảnh số chụp được (nếu có trong cơng nghệ có lắp thêm
hệ thống máy chụp ảnh kỹ thuật số).
Bài toán phân loại đám mây điểm LiDAR thuộc vào bài toán lọc và phân tách
đưa các điểm về các lớp riêng biệt. Việc phân loại dữ liệu tự động của đám mây điểm
phải tách được đám mây dữ liệu thành các lớp khác nhau theo các tính chất riêng như:
Lớp chứa điểm mặt đất, Lớp chứa điểm thực phủ, Lớp chứa điểm trên mái nhà tường
nhà và các cơng trình xây dựng, Lớp chứa các điểm trên không, Lớp chứa các điểm
bị lỗi, Lớp chứa các điểm trên mặt nước …. Từ đó xây dựng ra lớp Ground và NonGround. Trên thế giới có nhiều chương trình lọc điểm theo các thuật tốn khác nhau
đã được giới thiệu và áp dụng. Trong số đó có Vosselman và Sithole (Hà Lan) có
thuật tốn “mơ hình góc nghiêng di động” hay mơ hình “độ chênh cao cực đại”,
Axelsson đưa ra thuật tốn “mơ hình TIN di động “, Kraus (Áo) đưa ra thuật toán lọc
theo lý thuyết nội suy thống kê, hãng ToyEye (Thụy Điển), TopoSys (Đức) có chương
trình lọc đám mây điểm của LiDAR cung cấp kèm với hệ thống thiết bị… Hiện nay,
với các thuật toán lọc ngày càng hồn thiện, cơng tác lọc điểm đã tự động hóa được
khoảng 90-95%, tuy nhiên để đánh giá, so sánh chất lượng giữa các thuật tốn thì cịn
nhiều vấn đề phải tranh luận và kiểm chứng trong thực tế sản xuất. Các phần mềm xử
lý dữ liệu LiDAR rất đắt được bán kèm theo thiết bị, hoàn toàn là phần mềm thương
mại đóng như ENVI LiDAR.
Với mục đích nghiên cứu, tìm hiểu các thuật tốn hiện đang được sử dụng trong
việc phân loại dữ liệu LiDAR, đồng thời thử nghiệm các kỹ thuật phân loại dữ liệu

3

LiDAR trên những bộ dữ liệu cụ thể, học viên lựa chọn nội dung: “Nghiên cứu kỹ
thuật phân loại dữ liệu LiDAR” làm đề tài thực hiện khóa luận thạc sĩ của mình.
2. Những nội dung nghiên cứu chính
Ngồi phần mở đầu trình bày lý do chọn đề tài và phần kết luận trình bày các
kết quả đạt được của luận văn này, nội dung nghiên cứu chính được trình bày trong
ba chương như sau:
Chương 1: Trình bày khái quát về công nghệ LiDAR và các ứng dụng, phát
biểu bài tốn phân loại dữ liệu LiDAR.
Chương 2: Trình bày phương pháp phân loại dữ liệu LiDAR với 2 thuật toán
MCC (Multiscale Curvature Classification) và thuật toán K-Means.
Chương 3: Xây dựng chương trình thử nghiệm phân loại dữ liệu LiDAR bao
gồm: Giới thiệu bài toán thử nghiệm, lựa chọn thuật toán phân loại và dữ liệu thử
nghiệm, môi trường và các cơng cụ sử dụng để xây dựng chương trình, phát triển
chương trình và đánh giá kết quả thu được.

4

CHƯƠNG 1:
GIỚI THIỆU VỀ CÔNG NGHỆ LIDAR VÀ CÁC ỨNG DỤNG

1.1 Tổng quan về công nghệ LiDAR
1.1.1 Cấu trúc hệ thống LiDAR
LiDAR, Light Detection And Ranging, là thuật ngữ để chỉ một công nghệ viễn
thám mới, chủ động, sử dụng các loại tia laser để khảo sát đối tượng từ xa. Dữ liệu
thu được của hệ thống là tập hợp đám mây điểm phản xạ 3 chiều của tia laser từ đối
tượng được khảo sát. Công nghệ này cũng mới được áp dụng tại Việt Nam, nó cho

phép đo đạc độ cao chi tiết địa hình một cách chính xác và nhanh chóng.
Hệ thống LiDAR bao gồm bộ đầu quyết (bộ cảm biến), hệ thống đo quán tính
(IMU), hệ thống GPS, hệ thống quản lý bay, hệ thống camera số và hệ thống các thiết
bị lưu trữ dữ liệu.
Bộ máy quét Laser (bộ cảm biến): Gồm hai bộ phận được gắn vào bên dưới máy
bay; một bộ phận có vai trò phát xung laser hẹp đến bề mặt trái đất trong khi máy bay
di chuyển với tốc độ nhất định. Một máy thu gắn trên máy bay sẽ thu nhận phản hồi
của những xung này khi chúng đập vào bề mặt trái đất và quay trở lại thiết bị thu trên
máy bay. Hầu hết các hệ thống LiDAR đều sử dụng gương quét để tạo ra một dải
xung. Sóng Laser nằm trong dải sóng cận hồng ngoại để phục vụ cơng tác đo đạc địa
hình, bề mặt trái đất, cịn với laser dải sóng xanh lá cây phục vụ cơng tác đo sâu mặt
nước. Độ rộng của dải quét phụ thuộc vào góc dao động của gương, và mật độ điểm
mặt đất phụ thuộc vào các yếu tố như tốc độ máy bay và tốc độ gương. Tốc độ dao
động được xác định bằng cách tính tốn tổng thời gian tia laser rời máy bay, đi đến
mặt đất và trở lại bộ cảm biến.
Hệ thống xác định quán tính IMU: Các giá trị góc xoay, góc nghiêng dọc, nghiêng
ngang, hướng bay quét của hệ thống LiDAR được xác định chính xác bằng thiết bị
đạo hàng, góc quay gương tức thời và các khoảng cách thu nhận và dữ liệu GPS được
dùng để tính tốn toạ độ ba chiều của các điểm LiDAR.

5

Hệ thống GPS: Dữ liệu LiDAR được kết hợp với các thơng tin vị trí chính xác
thu nhận từ thiết bị GPS và hệ thống thiết bị xác định các thơng số định hướng góc
xoay, góc nghiêng dọc, nghiêng ngang cùng đặt trên máy bay. Các thông tin này được
lưu trữ và xử lý, để xác định giá trị toạ độ (x,y,z) chính xác của mỗi điểm trên mặt
đất. Hệ thống GPS gồm một máy thu đặt trên máy bay và một máy thu đặt tại mặt
đất, quá trình xử lý dữ liệu này cho ra kết quả vị trí điểm có độ chính xác cao (+/- vài
cm đến vài chục cm).

Hệ thống quản lý bay: Cho phép lập kế hoạch, thiết kế tuyến bay và theo dõi quá
trình bay quét LiDAR.

Hình 1. 1: Tổng quan về hệ thống LiDAR
1.1.2 Đặc điểm cơ bản của công nghệ LiDAR
Bản chất của công nghệ LiDAR là kỹ thuật đo dài laser, định vị không gian
GPS/INS và sự nhận biết cường độ phản xạ ánh sáng [3]. Xung của laser được phát
hướng xuống mặt đất trên một độ cao nào đó. Sóng laser được phản hồi từ mặt đất
hay từ các bề mặt đối tượng như là cây, đường hoặc nhà ..., với mỗi xung sẽ đo được
thời gian đi và về của tín hiệu, tính được khoảng cách từ nguồn phát laser tới đối
tượng. Ở mỗi thời điểm phát xung laser, hệ thống định vị vệ tinh GNSS sẽ xác định

6

vị trí khơng gian của điểm phát, và hệ thống đạo hàng qn tính sẽ xác định các góc
định hướng trong không gian của tia quét. Với các trị đo tổng hợp đó tính được vị trí
(tọa độ khơng gian) của các điểm trên bề mặt đất.
Cơng nghệ LiDAR có nhiều tính năng vượt trội so với các cơng nghệ đo đạc
truyền thống, nó có những đặc điểm cơ bản như:
-

Độ chính xác xác định vị trí khơng gian của các đối tượng địa lý rất cao. Độ
chính xác độ cao < 20cm, độ chính xác mặt phẳng < 25cm.

-

Thời gian thu thập và xử lý dữ liệu cực nhanh. Thời gian bay quét LiDAR với
khoảng 1000km2 là khoảng 25-30 giờ, thời gian xử lý tạo DEM với 1000km2
là khoảng 10 ngày.

-

Không giống như các phương pháp đo ảnh hay đo đạc ngồi trời khác, cơng
nghệ LiDAR chủ yếu là tự động hóa, ít có sự can thiệp trực tiếp của con người.
Thành quả dữ liệu rất khách quan, mức độ tin cậy cao.

-

Hệ thống LiDAR thu thập dữ liệu khơng phụ thuộc vào ánh sáng mặt trời, có
thể thực hiện cả ngày và đêm, điều kiện thời tiết không đòi hỏi khắt khe.

-

Xung ánh sáng của hệ thống LiDAR có thể đi qua đối tượng vịm như tán cây,
mặt nước, mái che kính, tấm ni lơng mỏng … và phản xạ tới 4 lần. Mỗi lần
phản xạ là một mức truyền khác nhau và ghi nhận một giá trị tọa độ (XYZ)
khác nhau. Đây là một tính năng đặc biệt mà công nghệ đo vẽ ảnh khác không
thể thực hiện được. Với tính năng này việc thực hiện bay qt ở vùng rừng cây
hoặc nơi có thực phủ khơng q dày đặc vẫn có thể thi cơng và thể hiện được
bề mặt đất.

-

Điểm phân giải điểm đo chi tiết cao, khi đầu phát đạt 150.000 xung trên 1 giây,
độ cao bay 1000m thì mật độ khoảng 3 điểm trên 1m2. Hiện nay có nhiều hệ
thống LiDAR có đầu phát đạt 240.000 xung trên 1 giây. Công nghệ LiDAR
với khả năng đo điểm trực tiếp ngoại nghiệp mật độ rất cao, độ chính xác lớn,
tốc độ nhanh.

-

Điểm khống chế mặt đất rất ít, có thể chỉ 1 điểm cho mục đích cải chính DGPS.
Cơng nghệ LiDAR đặc biệt lợi ích là cơng cụ lý tưởng khi nó được áp dụng

7

cho các vùng xa xăm, hẻo lánh khi mà con người rất khó tiếp cận trong triển
khai đo đạc ngoại nghiệp.
-

Công nghệ LiDAR ghi nhận được các giá trị mức phản xạ ánh sáng của các
đối tượng trên mặt đất, dữ liệu này có thể được dùng để tạo ra ảnh cường độ
xám, phân loại đối tượng, chiết xuất đối tượng trên mặt đất. Đây là một đặc
tính có giá trị gia tăng của dữ liệu LiDAR.

-

Một số hệ thống LiDAR ngồi chức năng đo qt trên mặt đất, cịn có thể thực
hiện chức năng đo sâu (hiện nay có thể đo sâu đến 40m).

-

Tổ chức thi công đơn giản, gọn nhẹ hơn các phương pháp khác, số người cần
tham gia rất ít (khoảng 10-15 người).

-

Hiệu quả kinh tế rất cao khi ứng dụng cơng nghệ LiDAR cho mục đích thu

thập dữ liệu không gian với yêu cầu thời gian ngắn, độ chính xác cao và mật
độ dày đặc [3].

1.2. Khả năng ứng dụng của LiDAR
Công nghệ LiDAR đã thể hiện nhiều ưu thế vượt trội hơn với các công nghệ
khác trong việc đo đạc thành lập bản đồ, xây dựng cơ sở dữ liệu hay mô phỏng không
gian ba chiều. Các nguồn dữ liệu thu nhận được có thể được ứng dụng trong nhiều
lĩnh vực khác nhau như giáo dục, viễn thông, theo dõi đánh giá khai thác mỏ, quân
sự, nghiên cứu lập bản đồ khu vực ngập lụt, dự báo thảm hoạ, bản đồ địa hình dải ven
biển, quy hoạch đô thị, lập bản đồ đường dây tải điện,…
a) Khảo sát địa hình và lập bản đồ:
Kết quả đầu ra cơ bản là các mơ hình số địa hình (DEM – Digital Elavation
Model) và mơ hình số bề mặt (DSM – Digital Surface Model) với độ phân giải và độ
chính xác cao, LiDAR rất phù hợp để ứng dụng trong việc thành lập bản đồ tỷ lệ lớn,
các ứng dụng liên quan đến phát triển hoặc quản lý duy trì hạ tầng cơ sở.

8

Hình 1. 2: Ứng dụng LiDAR trong khảo sát địa hình và lập bản đồ
b) Lâm nghiệp:
Trong lĩnh vực lâm nghiệp, công nghệ LiDAR chủ yếu được sử dụng để đánh
giá, thống kê, phân tích điều kiện sống hoang dã, tương quan của các yếu tố như tán,
độ dày tán, dạng lá,… hay sản lượng gỗ rừng; ước tính sinh khối, trữ lượng gỗ và các
tham số lâm nghiệp khác.

Hình 1. 3: Ứng dụng LiDAR trong lâm nghiệp
c) Lập bản đồ ngập úng:
Dữ liệu LiDAR được sử dụng hiệu quả trong xây dựng các mơ hình ngập úng,
xác định ranh giới ngập úng, cung cấp thêm nhiều thông tin về các đối tượng/địa vật

chịu ảnh hưởng; từ đó thành lập bản đồ nguy cơ ngập úng, vùng ưu tiên sơ tán.

9

Hình 1. 4: Ứng dụng LiDAR trong lập bản đồ ngập úng
d) Các ứng dụng cho đới duyên hải:
Do dữ liệu LiDAR có độ chính xác cao cùng mật độ điểm dữ liệu dày đặc
trong thời gian thu thập dữ liệu ngắn. Dữ liệu này rất phù hợp cho các ứng dụng để
quản lý và dự báo xói mịn bờ biển; giúp đánh giá và dự báo bồi lắng, quan trắc cũng
như lập dự báo ngập lụt ven biển…

Hình 1. 5: Ứng dụng LiDAR cho đới duyên hải
e) Địa hình ven biển:
Cơng nghệ LiDAR có thể giúp lập bản đồ địa hình đáy biển độ sâu tới 70m,
hữu ích trong các dự án xác định luồng lạch tàu vào, thiết kế quy hoạch cảng và các
kênh giao thông thuỷ.

10

Hình 1. 6:Ứng dụng LiDAR trong lập bản đồ địa hình ven biển
f) Trượt lở:
LiDAR có thể sử dụng để quan trắc và dự báo trượt lở, đặc biệt với ác sườn
dốc, nhờ đặc điểm thu thập dữ liệu nhanh chóng với độ chính các cao và mật độ dữ
liệu dày đặc. Cơng nghệ này cũng có thể được sử dụng để đánh giá nhanh thiệt hại và
thiết lập bản đồ thể hiện tình trạng hậu trượt lở nhanh chóng chính xác.

Hình 1. 7: Ứng dụng LiDAR trong quan trắc dự báo trượt lở
g) Các tuyến truyền tải:

LiDAR được áp dụng trong việc lập bản đồ các tuyến truyền tải trải dài, giúp
thể hiện chính xác vị trí các tháp truyền tải hoặc cột điện, phân định địa hình của hành
lang truyền tải và các loại đối tượng tồn tại trong hành lang (cây xanh…) giúp điều
chỉnh, sửa chữa duy tu và thiết kế nâng cấp.

11

Hình 1. 8: Ứng dụng LiDAR trong lập bản đồ tuyến truyền tải
h) Lập bản đồ giao thông:
Công nghệ LiDAR thường được sử dụng để: quan trắc, giám sát, duy tu bảo
dưỡng và quản lý các đối tượng như đường sắt, đường bộ, hệ thống tín hiệu biển báo,
các trạm dừng đỗ, nhà ga bến cảng, sự xuống cấp mặt đường, điểm tai nạn, mật độ
giao thông, bùng binh,… mà khơng cần làm gián đoạn các dịch vụ liên quan.

Hình 1. 9: Ứng dụng LiDAR trong lập bản đồ tuyến truyền tải

12

i)Mạng điện thoại di động:
Một trong những yêu cầu của việc quy hoạch và quản lý các mạng điện thoại
di động đó là cần có thơng tin bề mặt địa hình, lớp phủ thực vật, các tồ nhà và cơng
trình một cách chi tiết. Công nghệ LiDar xác định cơ sở dữ liệu chính xác và chi tiết
các thơng tin về các chướng ngại vật tự nhiên và nhân tạo là cực kỳ quan trọng.

Hình 1. 10: Ứng dụng LiDAR trong quy hoạch và quản lý mạng điện thoại di động
j) Lập mơ hình đơ thị và mơ phỏng đơ thị:
Lidar thường được ứng dụng để tạo ra mơ hình thành phố ảo với nền địa lý và
các cơng trình xây dựng, kiến trúc, như đơ thị thực. Mơ hình này có thể được khai

thác phục vụ rất nhiều đối tượng từ quy hoạch kiến trúc, xây dựng, giao thông. Mơ
hình này cũng được chia sẻ dưới các cách linh động khác nhau như: ứng dụng
desktop, ứng dụng web, sử dụng các chuẩn mở, dễ trao đổi và dễ cấu hình phù hợp
với từng đối tượng sử dụng.

Hình 1. 11: Ứng dụng LiDAR trong lập mơ hình đơ thị và mô phỏng đô thị

13

1.3. Bài toán phân loại dữ liệu LiDAR

1.3.1 Khái niệm
Bản chất của công nghệ LiDAR là kỹ thuật đo dài laser, định vị không
gian GPS/INS và sự nhận biết cường độ phản xạ ánh sáng. Xung của laser được
phát hướng xuống mặt đất trên một độ cao nào đó. Sóng laser được phản hồi từ
mặt đất hay từ các bề mặt đối tượng như là cây, đường hoặc nhà ..., với mỗi
xung sẽ đo được thời gian đi và về của tín hiệu, tính được khoảng cách từ
nguồn phát laser tới đối tượng. Ở mỗi thời điểm phát xung laser, hệ thống định
vị vệ tinh GNSS sẽ xác định vị trí khơng gian của điểm phát, và hệ thống đạo
hàng qn tính sẽ xác định các góc định hướng trong không gian của tia quét.
Với các giá trị đo tổng hợp đó sẽ tính được vị trí (tọa độ khơng gian) của các
điểm trên bề mặt đất. Một tín hiệu phát đi, sẽ có một hay nhiều tín hiệu phản
xạ. Kết quả cuối cùng, sẽ có được đám mây điểm.
Dữ liệu điểm của LiDAR sẽ được tiền xử lý sau khi hệ thống thu nhận
được hệ tọa độ x, y, z có độ chính xác cao của đối tượng bằng cách phân tích
thời gian tia qt phản xạ, góc qt, vị trí thu nhận từ GPS, và thơng tin INS.
Thuộc tính của dữ liệu LiDAR ghi nhận được cho mỗi xung bao gồm: cường
độ, số lượng xung phản hồi, giá trị điểm phân loại, góc quét của đường bay
chụp, giá trị RGB, thời gian định vị, góc quét và hướng quét.

Bảng 1. Thuộc tính của dữ liệu LiDAR

STT Tên thuộc tính
1

Cường độ

Mơ tả
Độ đậm nhạt của xung dữ liệu LiDAR phản xạ ghi
nhận được từ điểm LiDAR.

14

2

Số lượng xung Tổng số lượng xung phản hồi.
phản xạ

3

Điểm phân loại

Mọi điểm LiDAR đều được phân loại trong quá
trình tiền xử lý để xác định được loại đối tượng
phản xạ.

4

Góc của đường Các điểm sẽ được ký hiệu với giá trị 0 và 1. Những

quét

điểm theo đường góc quét sẽ được gán giá trị là 1,
những điểm còn lại được gán giá trị là 0

5

RGB

Dữ liệu LiDAR có thể được gán với kênh phổ R,
G, B. Giá trị này thường được thu nhận từ ảnh
cùng thời gian với đo LiDAR

6

Thời gian định vị Giờ được thu nhận từ hệ thống GPS được phát ra
từ hệ thống khơng vận

7

Góc qt

Giá trị của góc quét thường từ - 900 đến + 900

8

Hướng quét

Hướng quét là hướng gương chụp laser đang di
chuyển tại thời điểm xung laser phát ra

9

x, y, z

Tọa độ và độ cao của điểm phản xạ

Dữ liệu đám mây điểm LiDAR thường rất lớn, từ vài ngàn đến vài chục triệu
điểm tùy thuộc vào độ rộng của khu vực đo vẽ và sự phức tạp của khu vực đo vẽ.
Định dạng đám mây điểm thường là .las hay .laz.
1.3.2 Cơ bản về tệp tin .LAS
Bộ dữ liệu LAS lưu trữ một hoặc nhiều tệp LAS trên đĩa, cũng như các tính
năng bề mặt bổ sung. Tệp LAS là định dạng nhị phân chuẩn công nghiệp để lưu trữ

15

dữ liệu LiDAR trong khơng khí. Bộ dữ liệu LAS cho phép kiểm tra các tệp LAS, ở
định dạng gốc, nhanh chóng và dễ dàng, cung cấp số liệu thống kê chi tiết và vùng
phủ sóng của dữ liệu LiDAR chứa trong các tệp LAS.Một tập dữ liệu LAS cũng có
thể lưu trữ tham chiếu đến các lớp đối tượng có chứa các ràng buộc bề mặt. Các ràng
buộc bề mặt là đường nét, đa giác nước, ranh giới khu vực, hoặc bất kỳ loại tính năng
bề mặt nào khác được thực thi trong bộ dữ liệu LAS.
Bộ dữ liệu LAS cung cấp quyền truy cập ngay vào dữ liệu LiDAR mà không
cần chuyển đổi hoặc nhập dữ liệu. Các thuộc tính điểm LAS có thể được sử dụng để
lọc ra nội dung và tượng trưng cho các điểm trong 2D và 3D. Ngoài ra, dữ liệu LiDAR
thường xuất hiện dưới dạng một nhóm tệp, tập dữ liệu LAS cung cấp khả năng xác
định tập hợp các tệp LAS hợp lý để làm việc trong các dự án được bản địa hóa.

Hình 1. 12: Hiển thị dữ liệu trong tệp tin LAS

Bộ dữ liệu LAS tương tự như một tập dữ liệu địa hình với các chế độ xem trên
bề mặt, nhưng nó cũng có thể được sử dụng để xem điểm và không yêu cầu tiền xử
lý. Người dùng khơng bắt buộc phải thực hiện bất kỳ q trình xử lý nào để nhanh
chóng hiểu dữ liệu LiDAR đang làm việc. Có thể làm việc trực tiếp trên các tệp LAS,
dưới dạng tập hợp hoặc dưới dạng tệp riêng lẻ. Bộ dữ liệu LAS hỗ trợ đường viền
hoặc các ràng buộc bề mặt khác sẽ được thêm vào mô hình bề mặt. Nó được hiển thị

16

như một bề mặt hoặc một đám mây điểm, cho phép nhanh chóng đánh giá và hiểu dữ
liệu LiDAR.
Có thể hiển thị bất kỳ sai sót hoặc vấn đề dữ liệu nào một cách nhanh chóng
do hiển thị nhanh và phân tích thống kê. Phân tích có thể được tiến hành trên mỗi và
mọi tập tinLAS hoặc trên toàn bộ tập dữ liệu LAS. Nếu có lỗi trong phân loại, có thể
sửa đổi việc phân loại các tập tin LAS bằng cách sử dụng LAS Dataset 2D Profile
View.
Bộ dữ liệu LAS có thể mở rộng, cho phép làm việc với các đám mây điểm lớn
một cách nhanh chóng và hiệu quả. Đại diện bộ dữ liệu LAS tự động cập nhật khi
xoay và thu phóng xung quanh màn hình. Bộ dữ liệu LAS là một bổ sung tuyệt vời
cho luồng cơng việc cho bộ dữ liệu địa hình và bộ dữ liệu mosaic, có thể xem nhanh
các tệp LiDAR trước khi nhập, phân tích hoặc chia sẻ dữ liệu LiDAR.
1.3.3 Phân loại đám mây điểm LiDAR trong tập tin LAS
Dữ liệu LiDAR được lưu trong tệp tin LAS thường là đám mây điểm. Các đám
mây điểm là tập hợp các điểm thể hiện hình dạng hoặc tính năng 3D. Mỗi điểm có
tập hợp các tọa độ X, Y, Z riêng và trong một số trường hợp có thêm các thuộc tính
bổ sung. Các điểm LiDAR được lưu trữ trong các tệp LAS thường được phân thành
các loại khác nhau bằng cách sử dụng các công cụ phân loại chuyên biệt bên ngoài
ArcGIS. Phân loại này thường được hoàn thành bằng cách đặt thơng số dựa trên địa
hình, sau đó chạy thuật toán trên đám mây điểm để xác định loại đối tượng được liên

kết với mỗi điểm. Mã phân loại được gán cho mỗi điểm được ghi vào tệp LAS và,
trong hầu hết các trường hợp, tuân theo tiêu chuẩn ASPRS. Khi phân loại tự động
được thực hiện trên dữ liệu LiDAR, chúng thường khơng phân loại hồn tồn tất cả
các điểm một cách chính xác nhưng thường chính xác đến khoảng 90 phần trăm của
các điểm. Để đảm bảo rằng 100% các điểm LiDAR được phân loại chính xác, cần
phân loại thủ công và dọn sạch dữ liệu. Đây là một công việc rất tốn thời gian, và một
số nhà cung cấp có thể u cầu một chi phí bổ sung để thực hiện phân loại thủ công.

17

Hình 1. 13: Ví dụ về đám mây điểm LiDAR được hiển thị dưới dạng 3D
Phân loại đám mây điểm là quá trình phân chia các điểm thành các lớp điểm
chuyên biệt như mặt đất, nước, thảm thực vật, xây dựng, đường dây điện…Phân loại
có thể là một hoạt động chuyên sâu xử lý và nhiều bộ dữ liệu LIDAR đã trải qua phân
loại hạn chế. Mặt đất hầu như ln được bao gồm trong một tệp LAS, vì nó là cần
thiết để tạo ra một DTM. Các phiên bản thường dùng của định dạng LAS (1.2 và 1.3)
có 8 loại phân loại được xác định trước và có thể xử lý lên đến 32; phiên bản mới hơn
(1.4), vẫn chưa được sử dụng rộng rãi, có khoảng 20 lớp được định trước và có thể
xử lý 256.

18

Việc phân loại đám mây điểm LiDAR thường được thực hiện theo quy trình
sau:

Đám mây
điểm

Tiền xử lý

Lọc điểm

Lựa chọn
thuật tốn

Phân loại

Đánh giá độ
chính xác

LiDAR

Hình 1. 14: Quy trình phân loại đám mây điểm LiDAR
Sau quá trình phân loại đám mây điểm LiDAR sẽ được sử dụng để
thành lập DEM/DTM và được ứng dụng trong những bài toán cụ thể.
1.4 Kết chương:
Với mục đích sử dụng triệt để các dữ liệu quét LiDAR, việc phân loại các lớp
điểm theo từng lớp đặc trưng, theo mục đích nghiên cứu từng loại đối tượng, việc
“Nghiên cứu phương pháp phân loại dữ liệu LiDAR” sẽ góp phần mở rộng ứng
dụng cơng nghệ LiDAR trong nghiên cứu cấu trúc không gian của lớp phủ mặt đất.
Điều này là hồn tồn cần thiết và mang tính thực tiễn cao, đặc biệt có ý nghĩa khi sử
dụng công nghệ LiDAR trong nghiên các thảm thực vật, nghiên cứu sinh khối và tầng
thứ của rừng đa tầng nhiệt đới, nghiên cứu bờ biển hay thay đổi của bề mặt phủ.

19

CHƯƠNG 2:

MỘT SỐ KỸ THUẬT PHÂN LOẠI DỮ LIỆU LIDAR

2.1 Nghiên cứu liên quan đến sử dụng thuật toán MCC (Multiscale
Curvature Classification) và K-Means trong phân loại dữ liệu LiDAR
2.1.1 Thuật toán MCC (Multiscale Curvature Classification)
Thuật toán MCC (Multiscale Curvature Classification) là thuật toán được sử
dụng để phân loại đám mây điểm LiDAR 3D được phát triển bởi Moscow Forestry
Sciences Laboratory, sử dụng chủ yếu để phân loại các tia phản xạ LiDAR trong mơi
trường rừng. Thuật tốn này được sử dụng để phân loại các điểm thành hai lớp là mặt
đất (ground) và không mặt đất (non-ground). Đây là thuật toán phân loại đám mây
điểm LiDAR tự động. MCC là thuật toán lặp đa tỉ lệ để phân loại tín hiệu phản xạ
LiDAR mà vượt quá ngưỡng độ cong của bề mặt, cách tiếp cận đa tỉ lệ sẽ xác định
độ lệch của các điểm cần phân loại với bề mặt trung bình và loại bỏ dần những điểm
trên bề mặt khỏi nhóm mặt đất. Q trình phân loại bắt đầu bằng việc xác định xem
các điểm thuộc những tia phản xạ đơn hay phản xạ cuối cùng cũng như phản xạ đầu
tiên từ thực vật. Thuật toán MCC sẽ tính tốn bề mặt trung bình từ những điểm mặt
đất đặc trưng bằng phép lặp TPS (Thin Plate Spline), sau đó sẽ hiệu chỉnh nó thơng
qua một lõi lọc. Những tính năng của thuật tốn MCC sử dụng để phân loại đám mây
điểm LiDAR hỗ trợ cho quá trình lặp để tìm kiếm bề mặt thật của Trái đất với độ
phân giải tương ứng với mẫu.
Có bai cải tiến của thuật tốn, đó là:
-

Phép lặp TPS (Thin Plate Spline)

-

Sử dụng cách tiếp cận đa tỉ lệ với bề mặt chuẩn được nội suy với các độ
phân giải khác nhau

-

Lũy tiến độ cong mở [6]

20

Thuật tốn MCC có hai tham số là s (scale - biểu thị cho tỉ lệ) và t là ngưỡng
độ cong (curvature threshold), trong đó tham số tỉ lệ là hàm của tỉ lệ các đối tượng
trên mặt đất và khoảng lấy mẫu (khoảng cách sau) của dữ liệu LiDAR [9].
Thuật tốn MCC được mơ tả như sau:
Input: đám mây điểm LiDAR
Output: điểm sau phân loại với hai lớp mặt đất và không mặt đất
Initial: U0 đám mây điểm LiDAR
U = {P1, P2, …, Pn} – chứa các điểm chưa được phân loại
Pj(xj, yj, zj) – điểm LiDAR rời rạc
int l[1 … 3] – miền tỉ lệ
tl – độ cong cho miền tỉ lệ l – khởi tạo bởi người dùng
l – độ phân giải cho l
Procedure:
Phân loại những điểm có độ cao trong U0 và gán chúng vào lớp khơng
mặt đất
For l = 1 to 3
Repeat
Lặp tìm S = TPS(U, l, f)
Lặp tìm S’ = 3x3
For each Pj Ỵ U
If zj > S’(xj, yj) + tli then
Phân Pj vào lớp không mặt đất
Loại Pj khỏi U

Untill điểm không thuộc U < 10% tổng số điểm
của nó
Phân lớp các điểm còn lại của U vào lớp mặt đất
End

21

2.1.2 Thuật tốn K-Means
Thuật tốn K-means là tìm phương pháp phân nhóm các đối tượng (objects)
đã cho vào K cụm (K là số các cụm được xác định trước, K > 0) sao cho tổng bình
phương khoảng cách giữa các đối tượng đến tâm nhóm là nhỏ nhất. Thuật tốn Kmeans được mơ tả trên hình 2.1 và hình 2.2.

Hình 2. 1: Mơ tả thuật tốn K-Means

22

Hình 2. 2: Ví dụ phân loại với K-Means
Trong bài toán phân loại dữ liệu, thuật toán K-means được triển khai theo các bước:
Bước 1: Chọn K cụm trọng tâm khởi tạo, z1, z2, z3, …, zn, với 0 < K ≤ n
Bước 2: Phân phối mẫu trong K-means. Mẫu thường được gán với cụm trung tâm
gần nhất theo công thức: x Ỵ Si(n) nếu |x – zi(n)| ≤ |x – zj(n)| với j = 1, 2, 3, …, k; i
≠ j; Si(n) là bộ mẫu của trọng tâm zi(n), trong đó n chỉ số bước lặp của bài tốn.
Bước 3: Tính tốn trọng tâm cụm mới từ mỗi cụm Si(n). Tìm giá trị mới cho mỗi zi.
Trọng tâm cụm mới, zi(n+1) sẽ là giá trị trung bình của các điểm trong Si(n) như:
zi(n+1) = (1/𝑐) ∑𝑥 𝜖𝑆𝑖(𝑛) 𝑥
Trong đó ci là tập điểm thuộc về cụm thứ i
Bước 4: So sánh zi(n) và zi(n+1) với mọi i.
Tính tốn khoảng cách giữa mỗi cặp điểm trong mỗi lần lặp liên tiếp:

23

a. Nếu khơng có sự thay đổi đáng kể, kết thúc phương pháp, một vài tiêu chí cho kết
thúc như:
+ Nếu |zi(n+1) – zi(n)| < T với mọi i
+ N ế u ∑ 𝑘𝑗 = 1 | 𝑧 𝑖 ( 𝑛 + 1 ) − 𝑧 𝑖 ( 𝑛 ) | < 𝑇 với mọi i
b. Nếu khơng thì tiếp tục lặp các lần lặp tiếp theo từ bước 2.
Trong thuật toán K-means việc chọn được giá trị k sẽ có thể giúp tăng tốc được thuật
tốn, tối ưu và cải tiến thuật tốn tốt hơn. Có nhiều phương pháp để có thể lựa chọn
được giá trị k như sử dụng ý kiến của chun gia, thử mơ hình với các giá trị của k
và từ đó chọn k tốt nhất hay sử dụng kỹ thuật CV (Cross - Validation), ….
2.2. Đánh giá kết quả phân loại LiDAR
2.2.1 Thuật toán MCC
Trên thế giới, các nghiên cứu được công bố về MCC trong phân loại dữ liệu
LiDAR tương đối hạn chế, trong đó nổi bật nhất là nghiên cứu của tác giả Jeffrey
S.Evans và Andrew T.Hudak sử dụng phương pháp MCC trong phân loại tín hiệu
phản hồi LiDAR trong mơi trường rừng. Thuật toán MCC được các tác giả giới thiệu
sử dụng phép lặp TPS để loại bỏ những điểm không thuộc nhóm mặt đất để từ đó có
thể thành lập được DEM của khu vực khảo sát. TPS là phép lặp cho phép đánh giá
trạng thái giữa các điểm, tuân thủ các dữ liệu đầu vào và kiểm soát khoảng cách các
điểm mẫu ảnh hưởng đến bề mặt ước lượng [6].
Triển khai thuật toán MCC các tác giả định nghĩa một vevtor Z(s) chứa giá trị
tọa độ của tất cả các điểm LiDAR. Vector này sẽ được sử dụng trong phép lặp bề mặt
raster sử dụng phép lặp TPS với độ phân giải theo tỉ lệ l. Một lõi lọc có kích thước
3x3 duyệt qua tất cả các phép lọc để tìm một vector mới x(s). Miền tỉ lệ l là mơ hình
lặp được thiết lập với tham số của mơ hình chạy đến khi hội tụ. l và t sẽ được định
nghĩa bởi người dùng [6].

24

Dung sai độ cong t sẽ được thêm vào x(s), và các điểm sẽ được phân lớp vào
lớp không mặt đất bằng việc sử dụng điều kiện
If Z(s) > c then phân lớp khơng mặt đất
Trong đó c là độ cong của miền tỉ lệ l.
Tiến trình phân loại sử dụng MCC được các tác giả sử dụng thể hiện trong sơ
đồ khối sau:

Hình 2. 3: Sơ đồ khối của giải thuật MCC trong phân lớp dữ liệu LiDAR
Để đánh giá thuật toán, các tác giả đã sử dụng bộ dữ liệu thu được từ phía Bắc
của Idaho. Đây là khu vực rừng phức tạp với diện tích 88ha, với các loại rừng khác
nhau như rừng trồng, rừng tư nhân, ….

25

Hình 2. 4: Khu vực thực nghiệm trong nghiên cứu
Thuật tốn MCC khi áp dụng vào phân loại tín hiệu phản hồi LiDAR được
thực hiện một cách tự động, kết quả tín hiệu phản hồi LiDAR được phân thành hai
loại mặt đất và không mặt đất. Lỗi khi phân loại điểm mặt đất được đánh giá qua 204
điểm trong đó có 165 điểm GPS, 39 điểm của NOAA, và sử dụng sai số trung bình
để đánh giá số điểm bị mất trong q trình phân loại. Cơng thức tính tốn sai số trung
bình được thể hiện [6]:
𝑅𝑀𝑆𝐸 = 0

:
∑;
8<=(354 678 )

>6?

(1)

Với các tham số được lựa chọn lần lượt là l = 1.5, t = 0.3, với ba miền tỉ lệ để
phân loại điểm, kết quả được các tác giả thực nghiệm:

Hình 2. 5: Tỉ lệ các điểm thuộc hai lớp sau phân loại
Trong đó, sai số trung bình RMSE với hai khu vực thực nghiệm là 0.306 và
0.166. Kết quả chỉ ra rằng, MCC giúp cực tiểu sai số, trong khi vẫn còn tồn tại tỉ lệ
cao của điểm mặt đất và độ tin cậy cao của các điểm được cung cấp.

Luận văn nghiên cứu kỹ thuật phân loại dữ liệu lidar

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về