Tải bản đầy đủ (.pdf) (80 trang)

Nghiên cứu một số thuật toán phân cụm dữ liệu lidar

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.44 MB, 80 trang )

ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THƠNG

HỒNG XN THƯƠNG

NGHIÊN CỨU MỘT SỐ THUẬT TỐN
PHÂN CỤM DỮ LIỆU LIDAR

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

THÁI NGUYÊN – 2021


ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THƠNG

HỒNG XN THƯƠNG

NGHIÊN CỨU MỘT SỐ THUẬT TỐN
PHÂN CỤM DỮ LIỆU LIDAR
Chuyên ngành: Khoa học máy tính
Mã số: 8 48 01 01

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Giáo viên hướng dẫn: PGS.TS. Đặng Văn Đức

THÁI NGUYÊN - 2021


i



LỜI CAM ĐOAN
Tôi xin cam đoan luận văn là công trình nghiên cứu của riêng cá nhân tơi,
kết quả của luận văn hoàn toàn là kết quả của tự bản thân tơi tìm hiểu, nghiên
cứu dưới sự hướng dẫn của giáo viên hướng dẫn PGS.TS. Đặng Văn Đức.
Tơi hồn tồn chịu trách nhiệm về tính pháp lý q trình nghiên cứu
khoa học của luận văn này.
Cẩm Phả, ngày … tháng … năm 2021
Học viên

Hoàng Xuân Thương


ii

LỜI CẢM ƠN
Lời đầu tiên, em xin gửi lời biết ơn sâu sắc đến PGS .TS Đặng Văn Đức
– Viện Cơng nghệ thơng tin Hà Nội người đã tận tình hướng dẫn, chỉ bảo,
giúp đỡ em trong suốt quá trình làm luận văn.
Em cũng xin gửi lời cảm ơn đến cô TS Nguyễn Thị Hữu Phương – Đại
học mỏ địa chất Hà Nội, các thầy cô giáo trường Đại học Công nghệ thông
tin và truyền thông - Đại học Thái Nguyên đã truyền đạt những kiến thức và
giúp đỡ em trong suốt quá trình học của mình.
Và học viên cũng xin gửi lời cảm ơn tới các đồng nghiệp, gia đình và
bạn bè những người đã ủng hộ, động viên tạo mọi điều kiện giúp đỡ để học
viên có được kết quả như ngày hôm nay.


iii
MỤC LỤC

LỜI CAM ĐOAN .............................................................................................. i
LỜI CẢM ƠN ................................................................................................... ii
MỤC LỤC ........................................................................................................ iii
DANH MỤC BẢNG BIỂU ............................................................................. vi
DANH MỤC HÌNH ẢNH .............................................................................. vii
MỞ ĐẦU .......................................................................................................... 1
1. Đặt vấn đề...................................................................................................... 1
2. Những nội dung nghiên cứu chính ................................................................ 4
CHƯƠNG 1: TỔNG QUAN VỀ CƠNG NGHỆ LIDAR VÀ BÀI TỐN
PHÂN CỤM ..................................................................................................... 5
1.1 Tổng quan về công nghệ LiDAR ................................................................ 5
1.1.1 Cấu trúc hệ thống LiDAR......................................................................... 5
1.1.2 Đặc điểm cơ bản của công nghệ LiDAR .................................................. 7
1.2. Thu nhận dữ liệu LiDAR ........................................................................... 9
1.3. Xử lý dữ liệu LiDAR ............................................................................... 12
1.3.1. Quy trình xử lý dữ liệu LiDAR .............................................................. 12
1.3.2. Thuộc tính dữ liệu LiDAR ..................................................................... 12
1.3.3. Phương pháp xử lý dữ liệu LiDAR ........................................................ 14
1.4. Khả năng ứng dụng của LiDAR............................................................... 16
1.5. Bài toán phân cụm dữ liệu LiDAR .......................................................... 18
1.5.1 Khái niệm phân cụm dữ liệu ................................................................. 18
1.5.2 Các kiểu dữ liệu và độ đo tương tự ........................................................ 19
1.5.3 Các kỹ thuật tiếp cận trong phân cụm dữ liệu ....................................... 24
1.5.4 Các ứng dụng phân cụm dữ liệu ............................................................ 27
1.5.5 Phân cụm dữ liệu LiDAR ....................................................................... 28
1.6. Kết chương ............................................................................................... 29


iv
CHƯƠNG 2: MỘT SỐ THUẬT TOÁN PHÂN CỤM DỮ LIỆU LIDAR

......................................................................................................................... 30
2.1 Thuật toán MCC ........................................................................................ 30
2.2 Thuật toán EM........................................................................................... 34
2.3 Thuật toán K-Means .................................................................................. 39
2.4 Thuật toán H - Kmeans ............................................................................. 43
2.5 Đánh giá các thuật toán và lựa chọn thuật toán để thực nghiệm .............. 49
2.6 Đánh giá kết quả phân cụm dữ liệu LiDAR của MCC và K-Means ........ 50
2.6.1 Thuật toán MCC ..................................................................................... 50
2.6.2 Thuật toán K-Means ............................................................................... 52
2.7. Kết chương ............................................................................................... 55
CHƯƠNG 3: XÂY DỰNG CHƯƠNG TRÌNH PHÂN CỤM DỮ LIỆU
LIDAR ............................................................................................................ 56
3.1 Giới thiệu bài toán thử nghiệm ................................................................. 56
3.2 Lựa chọn thuật toán phân cụm và dữ liệu thử nghiệm.............................. 56
3.3 Môi trường và các công cụ sử dụng để xây dựng chương trình ............... 58
3.3.1 Ngơn ngữ C# .......................................................................................... 58
3.3.2 LASTool .................................................................................................. 59
3.4 Phát triển chương trình .............................................................................. 60
3.4.1 Các bước thực hiện ................................................................................ 60
3.4.2 Giao diện và các chức năng của chương trình ...................................... 61
3.5 Đánh giá kết quả thu được ........................................................................ 63
3.5.1 Phân loại với MCC ................................................................................ 63
3.5.2 Phân loại đám mây điểm với K-means .................................................. 64
3.5.3 Đánh giá ................................................................................................. 65
KẾT LUẬN .................................................................................................... 68
TÀI LIỆU THAM KHẢO ............................................................................ 69


v
DANH MỤC CHỮ VIẾT TẮT

LiDAR:

Light Detection And Ranging

Laser:

Light amplification by stimulated emission of radiation

GNSS:

Global Navigation Sattelite System

INS:

Inertial Navigation System

IMU:

Inertial measurement unit

DEM:

Digital Elevation Model

DSM:

Digital Surface Model

DTM:


Digital terrain model

MCC:

Multiscale Curvature Classification

EM:

Expectation Maximization

CURE:

Clustering Using Representatives

BIRCH:

Balanced Interative Reducing and Clustering Hierarchies

ALS:

Aerial Scanning Laser

PCDL

Phân cụm dữ liệu

H-Kmeans Hierarchical – Kmeans (Kmeans phân cấp)


vi

DANH MỤC BẢNG BIỂU
Bảng 1.1: Thuộc tính dữ liệu LiDAR ............................................................. 14
Bảng 3.1 Thông số của file las ...................................................................... 57
Bảng 3.2: Thống kê sự thay đổi tỉ lệ % phân loại ứng với mỗi miền tỉ lệ ...... 64
Bảng 3.3: Số lượng điểm của mỗi cụm ........................................................... 65
Bảng 3.4: So sánh với kết quả phân cụm với trang Opentopo ........................ 65
Bảng 3.5: So sánh với kết quả phân loại của trang Opentopo với K-Means .. 65


vii
DANH MỤC HÌNH ẢNH
Hình 1.1: Hệ thống LiDAR ........................................................................ 5
Hình 1.2: Tổng quan và nguyên lý hoạt động của hệ thống LiDAR............ 6
Hình 1.3: Cách phát và thu nhận tín hiệu phản hồi ..................................... 9
Hình 1.4: Tia laser phản xạ khi đi qua mục tiêu ....................................... 10
Hình 1.5: Quy trình tổng quát xử lý dữ liệu LiDar ................................... 12
Hình 1.6: Ví dụ về đám mây điểm LiDAR được hiển thị dưới dạng 3D ... 15
Hình 1.7: Quy trình phân loại đám mây điểm LiDAR .............................. 15
Hình 1.8: Ứng dụng trong khảo sát địa hình và lập bản đồ ....................... 16
Hình 1.9: Ứng dụng trong lâm nghiệp ...................................................... 16
Hình 1.10: Ứng dụng trong lập bản đồ ngập úng ...................................... 16
Hình 1.11: Ứng dụng cho đới duyên hải ................................................... 17
Hình 1.12:Ứng dụng trong lập bản đồ địa hình ven biển .......................... 17
Hình 1.13: Ứng dụng trong quan trắc dự báo trượt lở ............................... 17
Hình 1.14: Ứng dụng trong lập bản đồ tuyến truyền tải ............................ 17
Hình 1.15: Ứng dụng trong lập bản đồ tuyến truyền tải ............................ 18
Hình 1.16: Ứng dụng trong quy hoạch và quản lý mạng điện thoại di động
................................................................................................ 18
Hình 1.17: Ứng dụng trong lập mơ hình và mơ phỏng đơ thị .................... 18
Hình 1.18: Tác vụ của Khai phá dữ liệu ................................................... 19

Hình 1.19 : Một số hình dạng cụm dữ liệu khám phá được bởi kỹ thuật
PCDL dựa trên mật độ ............................................................ 26
Hình 1.20: Mơ hình cấu trúc dữ liệu lưới ................................................. 27
Hình 2.1: Tiến trình phân cụm sử dụng MCC ........................................... 32
Hình 2.2: Mơ tả thuật toán EM trong phân loại đám mây điểm LiDAR .... 35
Hình 2.3: Phân cụm các đối tượng trên bề mặt đo vẽ ............................... 35
Hình 2.4: Tiến trình của thuật tốn EM .................................................... 37
Hình 2.5: Mơ tả thuật tốn K-Means ........................................................ 40


viii
Hình 2.6: Ví dụ phân loại với K-Means .................................................... 41
Hình 2.7: Pseudo code của thuật tốn K-means ........................................ 43
Hình 2.8: Seeded-Kmeans khởi tạo 3 cụm ban đầu .................................. 47
Hình 2.9: Dùng 2-KMeans để chia các cụm cha thành hai cụm con ......... 47
Hình 2.10: Áp dụng tiêu chuẩn BIC ......................................................... 47
Hình 2.11: Kết quả có 4 cụm .................................................................... 47
Hình 2.12: Khu vực thực nghiệm trong nghiên cứu .................................. 50
Hình 2.13: Tỉ lệ các điểm thuộc hai lớp sau phân loại .............................. 51
Hình 2.14: Kết quả phân loại với K=5 ...................................................... 52
Hình 2.15: Kết quả phân loại với K=7 ...................................................... 53
Hình 3.1: Thông tin file .las sau khi xử lý bằng lasinfo của LASTools ..... 57
Hình 3.2: Đám mây điểm khu vực khảo sát .............................................. 58
Hình 3.3: Ảnh vệ tinh của khu vực đo vẽ ................................................. 58
Hình 3.4: Giao diện GUI của LasTool ...................................................... 60
Hình 3.5: Giao diện chương trình ............................................................. 61
Hình 3.6: Cửa sổ Setting thiết lập thơng số cho MCC và K-Means .......... 61
Hình 3.7: Dữ liệu file *.txt chứa toạ độ (x, y, x) của các điểm ................. 62
Hình 3.8: Phân loại với MCC ................................................................... 62
Hình 3.9: Phân loại với K-Means (K = 2) ................................................. 63

Hình 3.10: Tham số được lựa chọn trong giải thuật MCC ........................ 63
Hình 3.11: Các điểm được gán nhãn sau phân loại với MCC ................... 64
Hình 3.12: Kết quả phân loại với K-means ............................................... 64
Hình 3.13: Mơ hình số địa hình khu vực thử nghiệm................................ 66
Hình 3.14: Mơ hình số bề mặt khu vực thử nghiệm .................................. 67
Hình 3.15: Mơ hình địa hình kỹ thuật số khu vực thử nghiệm .................. 67


1
MỞ ĐẦU
1. Đặt vấn đề
Cuộc cách mạng công nghiệp lần thứ 3 đã chấm dứt khi cuộc khủng
hoảng tài chính Châu Á nổ ra vào năm 1997 và làn sóng thứ 4 đã diễn ra từ
đầu thế kỷ 21 với các cuộc cách mạng số, những công nghệ mới như trí tuệ
nhân tạo (AI), hệ thống tự động kết nối cao (Internet of Thing), công nghệ
nano, sinh học, vật liệu mới, năng lượng mới...
Công nghệ viễn thám thu thập dữ liệu dưới dạng ảnh chụp (ảnh hàng
không) hoặc dưới dạng ảnh quét (ảnh vệ tinh) dựa trên việc ghi nhận năng lượng
bức xạ (đối với ảnh hàng không và ảnh vệ tinh) hoặc ghi nhận sóng phản hồi
phát ra từ vật thể khi khảo sát (đối với ảnh radar). Để thu nhận thông tin của các
đối tượng, hiện tượng trên bề mặt trái đất qua ảnh viễn thám, cần sử dụng các kỹ
thuật xử lý, phân tích hình ảnh để có thể chiết xuất được càng nhiều thơng tin
càng tốt. Hiện nay, ảnh viễn thám quang học là loại ảnh dữ liệu dễ tiếp cận, dễ
tìm kiếm, các kỹ thuật phân tích cũng đã đa dạng, dễ thực hiện, giảm thiểu thời
gian xử lý và ngày càng chính xác hơn.
Từ những năm đầu của thập niên 60 của thế kỷ XX, sự ra đời của bộ
khuếch đại ánh sáng bằng phát xạ kích thích – laser đã mở ra rất nhiều ứng
dụng mới, trong đó phải kể đến kỹ thuật khảo sát từ xa sử dụng nguồn kích
thích bằng tia laser gọi là LiDAR. Trong công tác thu nhận dữ liệu không gian
địa lý công nghệ LiDAR là một trong hai phương pháp mang lại hiệu quả rất

cao [3].
LiDAR là công nghệ viễn thám mới, chủ động của ngành Trắc địa –
Bản đồ, kể từ khi được áp dụng rộng rãi vào những năm 90 của thế kỉ trước,
LiDAR đang ngày càng chứng tỏ được ưu thế của mình trong việc thu thập
thông tin về những đối tượng trên bề mặt địa hình. Với khả năng trực tiếp
thu nhận đám mây điểm 3D với độ chính xác cao, LiDAR được áp dụng
rộng rãi cho mục đích thành lập mơ hình số độ cao (DEM), mơ hình số địa


2
hình (DTM) hay mơ hình số bề mặt (DSM) [2]. Công nghệ LiDAR là sự
phát triển và ứng dụng các thiết bị laser, định vị vệ tinh và đo quán tính để
thu thập dữ liệu địa lý trên bề mặt trái đất. So sánh với các phương pháp thu
nhận và xử lý trắc địa ảnh truyền thống, xử lý dữ liệu LiDAR dễ dàng hơn,
thành lập chính xác mơ hình DEM. Để thành lập ra được DEM từ dữ liệu
đám mây điểm LiDAR, phải tiến hành phân loại dữ liệu thành hai lớp phản
xạ đầu tiên (hay điểm không mặt đất – Non - Ground) và phản xạ cuối cùng
(điểm mặt đất - Ground), quá trình này gọi là phân loại dữ liệu LiDAR [4].
Việc phân loại dữ liệu tự động của đám mây điểm được thực hiện bằng phép
giải các bài toán lọc điểm, trên cơ sở kết hợp sử dụng ảnh cường độ, kết quả
đo vẽ các bãi kiểm định chuẩn trên thực địa và ảnh số chụp được (nếu có
trong cơng nghệ có lắp thêm hệ thống máy chụp ảnh kỹ thuật số).
Bề mặt Trái đất có hình dạng gồ ghề, phức tạp, gồm các đại dương, lục
địa và hải đảo. Địa hình của Trái đất tại mỗi lục địa và vị trí là khác nhau. Địa
hình trên bề mặt Trái đất ln thay đổi do có sự tác động của nội lực và ngoại
lực, hai quá trình này ảnh hưởng đến nhau một cách nhất định, trong đó, nội
lực đóng vai trị chủ yếu trong hình thành các yếu tố địa hình lớn, cịn ngoại
lực đóng vai trị trong hình thành các yếu tố địa hình nhỏ. Các đối tượng trên
bề mặt trái đất gồm: Địa vật, thủy hệ, điểm dân cư, mạng lưới giao thông và
đường dây liên lạc, dáng đất, lớp phủ thực vật và đất, ranh giới hành

chính….[4]
LiDAR là cơng nghệ viễn thám có khả năng thu nhận dữ liệu về một
vùng rộng lớn, không bị hạn chế về thời tiết, đo được vào ban đêm, có khả
năng đi xuyên qua nước và mặt đất, dữ liệu thu được từ hệ thống LiDAR là
vơ cùng lớn và có giá trị trong nghiên cứu bề mặt trái đất [4]. Phân cụm bề
mặt Trái đất là quá trình chia bề mặt Trái đất thành các lớp phủ mặt đất. Lớp
phủ mặt đất là lớp phủ quan sát được khi nhìn từ mặt đất hoặc thơng qua một
số phương pháp đo đạc như viễn thám, quang học như thực vật (tự nhiên hoặc


3
nhân tạo), các cơng trình xây dựng trên đất (nhà, cơng trình giao thơng,…),
mặt nước,…. Trên thực tế, mỗi khu vực trên Trái đất đều có loại hình lớp phủ
mặt đất đặc trưng và mỗi đối tượng chịu sự tác động của tự nhiên, con người
là khác nhau, chính sự tác động này làm cho lớp phủ mặt đất luôn biến đối.
Để nghiên cứu và tìm hiểu về khu vực đo vẽ, tìm hiểu được loại lớp phủ và
đặc trưng của nó giúp cho cơng việc thuận lợi hơn. Để thu thập được thông tin
về lớp phủ mặt đất tại khu vực đo vẽ phương pháp sử dụng tư liệu viễn thám
là phương pháp hiện đại, giúp trích xuất thơng tin về lớp phủ nhanh chóng,
hiệu quả và cơng nghệ LiDAR là công nghệ viễn thám được sử dụng để phân
loại lớp phủ mặt đất [4]. Những khu vực có kết cấu phức tạp như đô thị,
thường phân loại lớp phủ mặt đất khá phức tạp do có nhiều đối tượng, nhiều
thuộc tính lựa chọn, gây khó khăn cho các nhà nghiên cứu trong q trình
chọn lựa và trích xuất đối tượng.
Hiện nay, có nhiều thuật tốn để phân cụm dữ liệu LiDAR như: EM
(Expectation Maximization), MCC (Multiscale Curvature Classification), KMeans, K-Medoids, K-Means phân cấp, CURE (Clustering Using
REpresentatives), BIRCH (Balanced Interative Reducing and Clustering
Hierarchies)…, với mỗi thuật tốn đều có ưu hay nhược điểm riêng, việc hiểu
biết sâu sắc và ứng dụng hiệu quả các thuật tốn này có vai trò quan trọng.
Học viên lựa chọn nội dung: “Nghiên cứu một số thuật toán phân cụm dữ liệu

LiDAR” làm đề tài thực hiện khóa luận thạc sĩ của mình với mục đích ứng
dụng các kỹ thuật phân cụm, cụ thể trong phạm vi đề tài: học viên tập trung
nghiên cứu các thuật toán EM, MCC, K-Means và K-Means phân cấp, lựa
chọn 02 trong số 04 thuật toán trên để nghiên cứu kĩ về thuật toán (đánh giá
về thuật toán, kết quả phân cụm dữ liệu LiDAR), từ đó có định hướng vận
dụng giải quyết bài toán thực nghiệm đặt ra.


4
2. Những nội dung nghiên cứu chính
Ngồi phần mở đầu trình bày lý do chọn đề tài và phần kết luận trình bày
các kết quả đạt được của luận văn này, nội dung nghiên cứu chính được trình
bày trong ba chương như sau:
Chương 1: Trình bày khái qt về cơng nghệ LiDAR và các ứng dụng,
bài toán phân cụm dữ liệu LiDAR.
Chương 2: Trình bày phương pháp phân cụm dữ liệu LiDAR với 4 thuật
toán MCC, EM, K-Means và K-Means phân cấp.
Chương 3: Xây dựng chương trình thử nghiệm phân loại dữ liệu LiDAR
bao gồm: Giới thiệu bài toán thử nghiệm, lựa chọn thuật toán phân loại và dữ
liệu thử nghiệm, môi trường và các công cụ sử dụng để xây dựng chương
trình, phát triển chương trình và đánh giá kết quả thu được.


5
CHƯƠNG 1:
TỔNG QUAN VỀ CƠNG NGHỆ LIDAR VÀ BÀI TỐN PHÂN CỤM
1.1 Tổng quan về công nghệ LiDAR
1.1.1 Cấu trúc hệ thống LiDAR
LiDAR là một thuật ngữ để chỉ một công nghệ viễn thám mới, chủ động,
sử dụng các loại tia laser để khảo sát đối tượng từ xa. Dữ liệu thu được của hệ

thống là tập hợp đám mây điểm phản xạ 3 chiều của tia laser từ đối tượng
được khảo sát. Đây là công nghệ mới được áp dụng tại Việt Nam, cho phép
đo đạc độ cao chi tiết địa hình một cách nhanh chóng và chính xác.
Hệ thống LiDAR bao gồm bộ đầu quyết (bộ cảm biến), hệ thống đo quán
tính IMU, hệ thống GPS, hệ thống quản lý bay, hệ thống camera số và hệ
thống các thiết bị lưu trữ dữ liệu.

Hình 1.1: Hệ thống LiDAR

Bộ máy quét Laser (bộ cảm biến): Gồm hai bộ phận được gắn vào bên
dưới máy bay; một bộ phận có vai trò phát xung laser hẹp đến bề mặt trái đất
trong khi máy bay di chuyển với tốc độ nhất định; một máy thu gắn trên máy
bay sẽ thu nhận phản hồi của những xung này khi chúng đập vào bề mặt trái
đất và quay trở lại thiết bị thu trên máy bay. Hầu hết các hệ thống LiDAR đều
sử dụng gương quét để tạo ra một dải xung. Sóng Laser nằm trong dải sóng
cận hồng ngoại để phục vụ cơng tác đo đạc địa hình, bề mặt trái đất, còn với


6
laser dải sóng xanh lá cây phục vụ cơng tác đo sâu mặt nước. Độ rộng của dải
quét phụ thuộc vào góc dao động của gương, mật độ điểm mặt đất phụ thuộc
vào các yếu tố như tốc độ máy bay và tốc độ gương. Tốc độ dao động được
xác định bằng cách tính tốn tổng thời gian tia laser rời máy bay, đi đến mặt
đất và trở lại bộ cảm biến.
Hệ thống xác định quán tính IMU: Các giá trị góc xoay, góc nghiêng dọc,
nghiêng ngang, hướng bay quét của hệ thống LiDAR được xác định chính xác
bằng thiết bị đạo hàng, góc quay gương tức thời và các khoảng cách thu nhận và
dữ liệu GPS được dùng để tính tốn toạ độ ba chiều của các điểm LiDAR.
Hệ thống GPS: Dữ liệu LiDAR được kết hợp với các thơng tin vị trí
chính xác thu nhận từ thiết bị GPS và hệ thống thiết bị xác định các thông số

định hướng góc xoay, góc nghiêng dọc, nghiêng ngang cùng đặt trên máy
bay. Các thông tin này được lưu trữ và xử lý, để xác định giá trị toạ độ (x,y,z)
chính xác của mỗi điểm trên mặt đất. Hệ thống GPS gồm một máy thu đặt
trên máy bay và một máy thu đặt tại mặt đất, quá trình xử lý dữ liệu này cho
ra kết quả vị trí điểm có độ chính xác cao (+/- vài cm đến vài chục cm).
Hệ thống quản lý bay: Cho phép lập kế hoạch, thiết kế tuyến bay và theo
dõi quá trình bay quét LiDAR.

Hình 1.2: Tổng quan và nguyên lý hoạt động của hệ thống LiDAR


7
Ngồi các thiết bị chính, hệ thống LiDAR cịn bao gồm các thiết bị ngoại
vi khác như hệ thống lưu trữ, giao diện điều khiển thiết bị, điều khiển máy
bay, bộ cấp nguồn. Một hệ thống LiDAR cịn có thể được gắn kèm máy ảnh
số để đồng thời thu thập ảnh viễn thám (không ảnh) của khu vực khảo sát,
cung cấp nguồn dữ liệu rất chi tiết và đầy đủ. Các tiến bộ khoa học kỹ thuật
đã nhanh chóng và mạnh mẽ cải tiến hệ thống LiDAR, làm cho công nghệ này
ngày càng trở lên phổ biến và hiệu quả.
1.1.2 Đặc điểm cơ bản của công nghệ LiDAR
Bản chất của công nghệ LiDAR là kỹ thuật đo dài laser, định vị không
gian GPS/INS và sự nhận biết cường độ phản xạ ánh sáng [4]. Xung của laser
được phát hướng xuống mặt đất trên một độ cao nào đó. Sóng laser được phản
hồi từ mặt đất hay từ các bề mặt đối tượng như là cây, đường hoặc nhà ..., với
mỗi xung sẽ đo được thời gian đi và về của tín hiệu, tính được khoảng cách từ
nguồn phát laser tới đối tượng. Ở mỗi thời điểm phát xung laser, hệ thống
định vị vệ tinh GNSS sẽ xác định vị trí không gian của điểm phát và hệ thống
đạo hàng quán tính sẽ xác định các góc định hướng trong khơng gian của tia
quét. Với các trị đo tổng hợp đó tính được vị trí (tọa độ khơng gian) của các
điểm trên bề mặt đất.

Cơng nghệ LiDAR có nhiều tính năng vượt trội so với các công nghệ đo
đạc truyền thống, nó có những đặc điểm cơ bản như:
Hệ thống LiDAR bao gồm các thiết bị kỹ thuật tiên tiến nhất hiện nay trong
lĩnh vực định vị khơng gian, đó là thiết bị định vị vệ tinh GPS, đo xa laser, điều
khiển đạo hàng quán tính INS .… Hoạt động của hệ thống và sản phẩm tạo ra gắn
liền với công nghệ tin học, các dữ liệu được quản lý và lưu trữ đều ở dạng số.
- Độ chính xác xác định vị trí khơng gian của các đối tượng địa lý rất cao.
Độ chính xác độ cao < 20cm, độ chính xác mặt phẳng < 25cm.
- Thời gian thu thập và xử lý dữ liệu cực nhanh. Thời gian bay quét LiDAR
với khoảng 1000km2 là khoảng 25-30 giờ, thời gian xử lý tạo DEM với 1000km2
là khoảng 10 ngày.


8
- Không giống như các phương pháp đo ảnh hay đo đạc ngồi trời khác,
cơng nghệ LiDAR chủ yếu là tự động hóa, ít có sự can thiệp trực tiếp của con
người. Thành quả dữ liệu rất khách quan, mức độ tin cậy cao.
- Hệ thống LiDAR thu thập dữ liệu khơng phụ thuộc vào ánh sáng mặt
trời, có thể thực hiện cả ngày và đêm, điều kiện thời tiết khơng địi hỏi khắt khe.
- Xung ánh sáng của hệ thống LiDAR có thể đi qua đối tượng vịm như
tán cây, mặt nước, mái che kính, tấm ni lơng mỏng … và phản xạ tới 4 lần. Mỗi
lần phản xạ là một mức truyền khác nhau và ghi nhận một giá trị tọa độ (XYZ)
khác nhau. Đây là một tính năng đặc biệt mà công nghệ đo vẽ ảnh khác khơng
thể thực hiện được. Với tính năng này việc thực hiện bay quét ở vùng rừng cây
hoặc nơi có thực phủ khơng q dày đặc vẫn có thể thi cơng và thể hiện được bề
mặt đất.
- Điểm phân giải điểm đo chi tiết cao, khi đầu phát đạt 150.000 xung trên
1 giây, độ cao bay 1000m thì mật độ khoảng 3 điểm trên 1m2. Hiện nay có nhiều
hệ thống LiDAR có đầu phát đạt 240.000 xung trên 1 giây. Cơng nghệ LiDAR
với khả năng đo điểm trực tiếp, ngoại nghiệp mật độ rất cao, độ chính xác lớn,

tốc độ nhanh.
- Công nghệ LiDAR ghi nhận được các giá trị mức phản xạ ánh sáng của
các đối tượng trên mặt đất, dữ liệu này có thể được dùng để tạo ra ảnh cường độ
xám, phân loại đối tượng, chiết xuất đối tượng trên mặt đất. Đây là một đặc tính
có giá trị gia tăng của dữ liệu LiDAR.
- Một số hệ thống LiDAR ngoài chức năng đo quét trên mặt đất, cịn có
thể thực hiện chức năng đo sâu (hiện nay có thể đo sâu đến 40m).
- Tổ chức thi cơng đơn giản, gọn nhẹ hơn các phương pháp khác, số người
cần tham gia rất ít (khoảng 10-15 người).
- Hiệu quả kinh tế rất cao khi ứng dụng công nghệ LiDAR cho mục đích
thu thập dữ liệu khơng gian với u cầu thời gian ngắn, độ chính xác cao và mật
độ dày đặc [6].


9
1.2. Thu nhận dữ liệu LiDAR

Hình 1.3: Cách phát và thu nhận tín hiệu phản hồi

LiDAR cho phép đo khoảng cách D từ máy bay đến điểm địa vật hay địa
hình. Thiết bị laser có thể qt tuyến địa hình với độ rộng từ vài chục mét tới vài
trăm mét, nhờ tấm gương quay. Tia laser hoạt động theo nguyên lý xung điện
(có loại theo nguyên lý sóng) có tần số lớn tới vài kHz phát ra từ nguồn sáng
laser. Phần năng lượng phản hồi từ bề mặt địa hình hay địa vật qua hệ thống
quang học được ghi thu lại. Trên cơ sở biết thời gian (t) phản hồi của tín hiệu từ
bề mặt địa hình về thiết bị ghi thu và tần số của xung điện (v) chúng ta sẽ xác
định được khoảng cách D từ điểm địa hình hay địa vật đến máy bay tại thời điểm
quét. Thiết bị đo dài laser hoạt động trong dải phổ hồng ngoại, cận hồng ngoại
với bước sóng tới 1540nm. Độ chính xác đo khoảng cách bằng laser có thể đạt
với sai số 𝑚𝐷 = ±1𝑐𝑚. Hoạt động đồng thời với thiết bị quét laser là hệ thống

thu GPS nhằm xác định vị trí khơng gian X, Y, Z của thiết bị quét laser đặt trên
máy bay tại thời điểm quét.
Cùng làm việc với thiết bị quét laser và hệ thống thu GPS là hệ thống điều
khiển đạo hàng quán tính INS. Hệ thống INS thực hiện nhiệm vụ đo gia tốc theo
3 hướng X, Y, Z và góc nghiêng của máy bay, cho phép xác định góc phương vị
(ψ) của tia quét laser tại thời điểm quét. Toạ độ không gian X, Y, Z của điểm địa
vật hay địa hình sẽ được xác định dựa vào độ dài (D) và góc phương vị tương


10
ứng (ψ), trong hệ thống toạ độ lựa chọn GPS. Một tín hiệu phát đi, sẽ có một hay
nhiều tín hiệu phản xạ. Số lượng điểm phụ thuộc vào tính không gian của các đối
tượng trên bề mặt đất. Kết quả cuối cùng, sẽ có được đám mây điểm.
Bộ thu phát LiDAR tự nó khơng di chuyển, nhưng một cụm gương quét
được gắn bên dưới bộ thu phát. Gương gập 450 phản chiếu các xung laser lên
một gương chuyển động, điều hướng các xung laser đến trái đất. Ánh sáng laser
phản xạ từ mặt đất đi theo con đường quang học ngược và được hướng vào một
kính thiên văn nhỏ. Gương di chuyển tạo ra một mẫu lấy mẫu hình nón bên dưới
máy bay trên một dải rộng 300, cho phép thu thập thơng tin địa hình trên một dải
rộng khoảng 300 mét từ độ cao thu thập dữ liệu 600 mét [5].

Hình 1.4: Tia laser phản xạ khi đi qua mục tiêu

Các xung laser phát ra từ một hệ thống xoay tròn phản chiếu từ các vật thể
cả trên và trên mặt đất: thảm thực vật, tòa nhà, cây cầu, v.v. Một xung laser
phát ra có thể quay trở lại cảm biến LiDAR khi một hoặc nhiều xung trở về.
Bất kỳ xung laser phát ra nào gặp phải nhiều bề mặt phản xạ khi nó di chuyển
xuống mặt đất đều được chia thành nhiều lần trở lại như có các bề mặt phản
chiếu[5].
Xung laser được trả lại đầu tiên là sự trở lại đáng kể nhất và sẽ được liên

kết với tính năng cao nhất trong cảnh quan như ngọn cây hoặc đỉnh của tòa nhà.
Sự trở lại đầu tiên cũng có thể đại diện cho mặt đất, trong trường hợp đó chỉ có


11
một sự trở lại sẽ được phát hiện bởi hệ thống LiDAR. Nhiều trả về có khả năng
phát hiện độ cao của một số vật thể trong vết laser của xung laser đi qua. Những
tia phản xạ ở giữa được sử dụng cho cấu trúc thảm thực vật, và phản xạ cuối
cùng cho các mơ hình địa hình thật của Trái đất [5].
Thiết bị LiDAR chỉ thu thập dữ liệu độ cao và cùng với dữ liệu GPS và
INS được đặt cùng với máy bay. Điều này được thực hiện vì cảm biến LiDAR
thu thập các điểm dữ liệu, vị trí của dữ liệu được ghi lại cùng với cảm biến
GPS. Dữ liệu được yêu cầu để xử lý thời gian trả lại cho mỗi xung phản hồi và
tính tốn khoảng cách thay đổi từ cảm biến hoặc thay đổi trên bề mặt phủ đất.
Sau mỗi lần quét, dữ liệu được tải xuống và xử lý bằng phần mềm máy tính
được thiết kế đặc biệt. Sản phẩm cuối là chính xác, kinh độ, vĩ độ và độ cao đã
đăng ký theo địa lý hoặc các vị trí x, y và z cho mọi điểm dữ liệu. Dữ liệu
LiDAR bao gồm các phép đo độ cao của bề mặt và được thu thập thơng qua
các khảo sát địa hình trên khơng. Định dạng tệp được sử dụng để chụp và lưu
trữ dữ liệu LiDAR là một tệp văn bản đơn giản và được gọi là "x, y và z", trong
đó x là kinh độ, y là vĩ độ và z là độ cao, những điểm này được lưu trong file có
định dạng .LAS hoặc .LAZ (file nén). Dữ liệu điểm sau xử lý được gọi là đám
mây điểm. Các đám mây điểm ban đầu là các tập hợp lớn các điểm độ cao 3D,
bao gồm x, y và z, cùng với các thuộc tính bổ sung như tem thời gian GPS. Các
đặc điểm bề mặt cụ thể mà các lần chạm laser được phân loại sau khi đám mây
điểm đầu tiên được xử lý sau. Độ cao cho mặt đất, các tòa nhà, tán rừng, cầu
vượt đường cao tốc và bất cứ thứ gì khác mà chùm tia laser gặp phải trong cuộc
khảo sát tạo thành dữ liệu đám mây điểm. Sử dụng đám mây điểm LiDAR có
thể tạo bản đồ địa hình chi tiết. Với những điểm dữ liệu này, chúng cho phép
tạo ra một mơ hình độ cao kỹ thuật số của mặt đất[5].



12
1.3. Xử lý dữ liệu LiDAR
1.3.1. Quy trình xử lý dữ liệu LiDAR
Tổng quan quy trình xử lý dữ liệu LiDar gồm 4 công đoạn:
1. Thiết lập ban đầu và xử lý dữ liệu thô
2. Tạo và phân loại đám mây điểm
3. Xây dựng bản đồ số (DEM, DTM)
4. Lưu trữ và khai thác

Hình 1.5: Quy trình tổng quát xử lý dữ liệu LiDar

1.3.2. Thuộc tính dữ liệu LiDAR
Thuộc tính dữ liệu LiDAR có thể khác nhau, tùy thuộc vào cách dữ liệu
được thu thập và xử lý. Ta có thể xác định những thuộc tính nào có sẵn cho
mỗi điểm cuối cùng bằng cách xem siêu dữ liệu. Tất cả các điểm dữ liệu trên
đỉnh sẽ có giá trị X, Y và Z (độ cao) được liên kết. Hầu hết các điểm dữ liệu
LiDAR sẽ có giá trị cường độ, biểu thị lượng năng lượng ánh sáng được cảm
biến ghi lại.
Thông tin bổ sung được lưu trữ cùng với mọi giá trị x, y và z. Các thuộc
tính điểm cuối cùng được duy trì cho từng xung laser được ghi lại như: cường
độ, số lần trả về, giá trị phân loại điểm, các điểm nằm ở rìa của đường bay,


13
giá trị RGB (đỏ, xanh lục và xanh lam), thời gian GPS, góc qt và hướng
qt. Bảng sau đây mơ tả các thuộc tính có thể được cung cấp với mỗi điểm
LiDAR [6].
STT

1

2

3

4

5

6

7

Tên thuộc tính

Mơ tả

Cường độ

Độ mạnh của tia phản xạ của xung laser tạo ra
điểm LiDAR

Số tia phản hồi

Một xung laser phát ra có thể có tối đa năm trả
về tùy thuộc vào các tính năng mà nó được phản
ánh và khả năng của máy quét laser được sử dụng
để thu thập dữ liệu. Trả về đầu tiên sẽ được gắn
cờ là trả về số một, thứ hai là trả về số hai, v.v.


Số lượng phản hồi

Số lượng phản hồi là tổng số lần phản hồi cho
một xung đã cho. Ví dụ: một điểm dữ liệu laser có
thể được trả về 2 (số trả về) trong tổng số 5 trả về.

Phân loại điểm

Mỗi điểm LiDAR được xử lý sau có thể được
phân loại để định nghĩa loại đối tượng của tia
phản hồi.. Các điểm có thể được phân loại thành
một số loại bao gồm: đất trống hoặc mặt đất,
đỉnh của tán cây và nước. Các lớp khác nhau
được định nghĩa bằng cách sử dụng mã số
nguyên trong các tệp LAS

Góc bay

Các điểm sẽ được ký hiệu dựa trên giá trị 0
hoặc 1. Điểm được gắn cờ ở rìa đường bay sẽ
được cho giá trị là 1 và tất cả các điểm khác sẽ
được cho giá trị 0.

Màu sắc (RGB)

Dữ liệu LiDAR có thể được quy cho các dải
RGB (đỏ, xanh lá cây và xanh dương). Sự quy
kết này thường xuất phát từ hình ảnh được thu
thập cùng với cuộc khảo sát.


Thời gian GPS

Thời gian GPS tại đó điểm laser được phát ra từ
máy bay. Thời gian tính bằng giây GPS trong
tuần.


14

8

9

Góc quét

Góc quét là một giá trị theo độ trong khoảng từ
-900 đến +900. Ở 00, xung laser nằm ngay bên
dưới máy bay ở nadir. Ở -900, xung laser nằm ở
phía bên trái của máy bay, trong khi ở mức +900,
xung laser nằm ở phía bên phải của máy bay
theo hướng bay. Hầu hết các hệ thống flipar hiện
tại ít hơn ± 300.

Hướng quét

Hướng quét là hướng mà gương quét laser đang
truyền đi tại thời điểm phát xung laser đầu ra. Giá
trị 1 là hướng quét dương và giá trị 0 là hướng
quét âm. Giá trị dương cho biết máy quét đang di

chuyển từ phía bên trái sang bên phải của hướng
bay theo dõi và giá trị âm là ngược lại.
Bảng 1.1: Thuộc tính dữ liệu LiDAR

1.3.3. Phương pháp xử lý dữ liệu LiDAR
Các tổ chức thu thập ảnh LiDAR thường sử dụng các hệ thống xử lý
chuyên biệt để thực hiện một dự án LiDAR với mục đích nhất định. Các hệ
thống xử lý ảnh LiDAR thường phải đủ mạnh để xử lý một khối lượng rất
lớn dữ liệu của mỗi nhiệm vụ LiDAR. Tùy từng nhiệm vụ, một số thiết bị
đặc biệt được sử dụng và các công việc xử lý phải thay đổi cho phù hợp với
nhiệm vụ đó.
Các thao tác xử lý ảnh LiDAR như:
*Lọc: Loại bỏ các điểm ngoại lệ, điểm thấp, điểm cô lập, điểm khơng
khí, phân loại mặt đất, loại bỏ bề mặt bên dưới.
*Phân loại, phân cụm đối tượng: Phân loại theo lớp, phân loại theo độ cao.
Dữ liệu LiDAR được lưu trong tệp tin LAS thường là đám mây điểm.
Các đám mây điểm là tập hợp các điểm thể hiện hình dạng hoặc tính năng 3D.
Mỗi điểm có tập hợp các tọa độ X, Y và Z riêng và trong một số trường hợp
cịn có các thuộc tính bổ sung.


15

Hình 1.6: Ví dụ về đám mây điểm LiDAR được hiển thị dưới dạng 3D

Phân loại đám mây điểm là quá trình phân chia các điểm thành các lớp
điểm chuyên biệt như mặt đất, nước, thảm thực vật, cơng trình xây dựng,
đường dây điện,…. Phân loại là một hoạt động xử lý chuyên sâu, đa phần các
bộ dữ liệu LiDAR đã được phân loại nhưng còn hạn chế. Mặt đất hầu như
ln có trong một tệp LAS, vì nó là cần thiết để tạo ra một DTM.

Quy trình phân loại đám mây điểm LiDAR thường được thực hiện theo
quy trình sau:
Đám mây
điểm
LiDAR

Tiền xử lý

Lọc điểm

Lựa chọn
thuật tốn

Phân loại

Đánh giá
độ chính
xác

Hình 1.7: Quy trình phân loại đám mây điểm LiDAR

Sau quá trình phân loại đám mây điểm LiDAR sẽ được sử dụng
để thành lập DEM/DTM và được ứng dụng trong những bài toán cụ thể.
Với sự gia tăng của ảnh LiDAR, DEM dần được coi là mơ hình mặc định
để xử lý dữ liệu LiDAR. Dữ liệu LiDAR có thể được nội suy để tạo một
DEM, mơ hình này hiển thị tốt chi tiết và chính xác cao, khắc phục được các
hạn chế của phương pháp đo đạc bằng hình ảnh (thường gặp phải khó khăn
trong biểu diễn khu vực địa hình bao phủ bởi rừng rậm và có mặt đất phức
tạp như gần sơng suối hay dịng chảy thốt nước).



×