Báo cáo " BÀN LUẬN VỀ VẤN ĐỀ DỮ LIỆU ĐA NGUỒN VÀ KINH NGHIỆM TRONG TRIỂN KHAI THU THẬP DỮ LIỆU GIS – NHẬN ĐỊNH TỪ MỘT NGUỒN DỮ LIỆU TẠI QUẬN 7, TP. HỒ CHÍ MINH " pot

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (489.51 KB, 9 trang )

HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011

326

BÀN LUẬN VỀ VẤN ĐỀ DỮ LIỆU ĐA NGUỒN VÀ KINH NGHIỆM
TRONG TRIỂN KHAI THU THẬP DỮ LIỆU GIS – NHẬN ĐỊNH
TỪ MỘT NGUỒN DỮ LIỆU TẠI QUẬN 7, TP. HỒ CHÍ MINH
(MULTI ESTABLISHED GIS DATA SOURCES PROBLEMS AND SOME
EXPERIMENTS ON LOCATING ACQUISITION SPATIAL DATA - STUDY CASE ON
ONE DATA SOURCE OF DISTRICT 7
TH
IN HOCHIMINH CITY)

Khưu Minh Cảnh, Trần Quang Trường Hinh, Lâm Quang Hà, Trịnh Xuân Hoàng
Trung tâm Ứng dụng Hệ thống thông tin Địa lý, TPHCM

Abstract: Data are establish during data collecting processing. So, many sources may be
deviated in locating spatial objects. The causes could be the data getting time, the details of
data collection as well as the process. These differents will affects strongly to spatial locating
in the synthesis and unified process. We could use some experiment design factors to explore
the spatial rules and help matching spatial objects with their seperated information.
Keywords: GIS, geocoding, statistics, locating process.

1. MỞ ĐẦU
Hiện nay, dữ liệu bản đồ và GIS được trực tiếp thành lập từ các đơn vị có thẩm quyền về
Khoa học và Công nghệ; Tài nguyên và Môi trường hoặc các đơn vị trực thuộc. Dữ liệu (có yếu
tố không gian) thường được chuẩn hóa các trường dữ liệu và các thông tin mô tả (metadata).
Việc chuẩn hóa đem lại nhiều lợi ích trong các hệ thống cơ sở dữ liệu (CSDL). Tuy nhiên, trong
nhiều dự án GIS, để xây dữ liệu chuẩn hóa theo CSDL hiện hữu là điều khó vì lực lượng thu
thập dữ liệu chưa hẵn có hoặc trình độ hoặc ý thức hoặc chưa được tập huấn kỹ về vấn đề xây
dựng dữ liệu. Mặt khác, sự thay đổi trên thực tế theo thời gian hoặc phương pháp thu thập cũng

là một nguyên nhân gây ra sự lệch giữa các dữ liệu chuyên đề và dữ liệu nền.
Bỏ qua một số lỗi cơ bản như chính tả, tiếng địa phương, hoặc viết tắt trong dữ liệu hai
nguồn khác nhau (minh họa là thông tin chủ nhà: ‘Huỳnh An Khương’ so với ‘Quỳnh An
Khương’), việc định vị các dữ liệu trên thực tế sẽ rất khó khăn trong những khu vực có nhiều
biến động. Với lớp bài toán định vị phục vụ quản lý đô thị, cụ thể là định vị liên quan đến số
nhà - dữ liệu số nhà được xem là rời rạc và hình thành theo khu vực: hẻm, địa danh, các nhân
tố ảnh hưởng đến thường xuất phát từ qui trình khai thác dữ liệu. Trong bài báo này, chúng tôi
nghiên cứu thực nghiệm việc định vị dữ liệu nhà tại khu vực Quận 7, thành phố Hồ Chí Minh
trên cơ sở dữ liệu nhà do Phòng Tài nguyên Môi trường Quận 7 cung cấp và dữ liệu thu gom
rác do các phường thuộc địa bàn Quận 7 cung cấp.
2. VẤN ĐỀ ĐỊNH VỊ KHÔNG GIAN TỪ DỮ LIỆU GIS ĐA NGUỒN
2.1. Phát biểu bài toán và một số nguyên nhân
Dữ liệu GIS và dữ liệu phục vụ GIS ngày càng được phong phú và tạo bởi nhiều tổ chức
khác nhau. Trong các khu đô thị mới thành lập, việc triển khai các dự án GIS phục vụ là điều
bắt buộc nhằm tăng cường thể chế quản lý. Từ thực tế đó, dữ liệu GIS sẽ có nhiều nguồn và
bắt đầu phát sinh ra những lệch và khác biệt lẫn nhau. Sự sai khác sẽ gây rất phiền phức trong
các công tác tổng hợp và thống kê. Cụ thể hơn, khi chúng ta không thể tìm được vị trí không
HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011

327
gian cho một căn nhà về thu gom rác, ngay khi đó, việc thống kê sẽ bị thiếu hoặc thừa.
Nguyên nhân chính là mỗi đơn vị luôn quan tâm đến dữ liệu của mình và do đó, việc tích hợp
dữ liệu là một khâu phức tạp và chiếm thời gian.

Hình 1: Minh họa về dữ liệu trong một hệ thống đa nguồn cung cấp với sự sai lệch
về thời gian gây khó khăn cho việc định vị

Dưới đây là một số nguyên nhân gây khó khăn và lệch trong việc định vị các nguồn dữ
liệu, trong điều kiện hiện nay:
¾ Thời điểm thu thập dữ liệu khác nhau: các đơn vị thành lập dữ liệu chuyên đề thường

dựa trên khảo sát thực tế tại thời điểm thực hiện dự án. Trong khi đó, bản đồ nền
thường được thành lập trước đó và được tổng hợp cập nhật toàn bộ theo định kì. Do
đó, những khu vực có biến động nhiều sẽ gây ra khó khăn trong việc định vị không
gian dữ liệu chuyên đề dựa trên dữ liệu nền.
¾ Đối tượng thu thập: một số phương pháp thu thập thông qua việc phỏng vấn. Do đó,
cùng một căn hộ, đơn vị phân phối báo chí có thể sẽ thu thập người nhận báo (có thể
là người chồng) khác với đơn vị cung cấp gas gia đình (có thể là người vợ)… Sự
khác nhau về đối tượng sẽ dẫn đến sự khác nhau về dữ liệu và là điều cản trở cho
việ
c định vị không gian khi chúng ta không có thông tin chính xác.
¾ Ảnh hưởng bởi các qui trình khác: thực tế, dữ liệu có thể không được so khớp do các
qui trình thực tế không cùng lúc được cập nhật trên dữ liệu. Ví dụ: một thửa đất có
thể sở hữu bởi chủ sử dụng khác. Tuy nhiên, trong dữ liệu không ghi nhận thực tế
này do các quá trình thực hiện. Trong trường hợp trên có thể do những người chủ
giao dịch nhà đất thông qua các cam kết ch
ưa tuân theo qui trình mua bán hoặc
chuyển nhượng của cơ quan chức năng nhà nước.
¾ Vấn đề không gian 2 và 3 chiều: Hiện tại, các dữ liệu địa chính được xây dựng trên
2D. Do đó, việc tìm kiếm và định vị những dữ liệu thực tế như hộ trên tầng 2, 3, là
không thể. Do đó, việc quản lý sẽ gặp những bất cập nhất định trong các bước về
hiển thị hoặc những vấn đề liên quan đến, như: chữa cháy, cứu hộ…
¾ Chuẩn hóa về mô tả không gian: dữ liệu thành lập chung thường ít thông tin chi tiết
hơn dữ liệu của một đơn vị riêng. Thông thường các dữ liệu chuyên đề do người
HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011

328
ngoài ngành tạo dựng, do đó, một số thông tin liên quan đến địa vật hay địa danh
thường gọi được đưa vào. Trong khi đó, dữ liệu trong hệ thống thường được chuẩn
hóa nên không bổ sung các địa danh riêng (các tên thường gọi).

Hình 2: Minh họa việc sử dụng nhiều địa danh tại một khu vực quận 7, TPHCM

¾ Vấn đề tác động khách quan hoặc nội tại từ bài toán: (như dữ liệu “da beo” trong bài
toán thu gom rác). Trên thực tế, việc quản lý và thực hiện các chuyên đề chưa đạt
được tối ưu, và do đó, khi thu thập dữ liệu, hiện tượng “da beo” sẽ xuất hiện. Và bài
toán thu gom rác là vấn đề điển hình về bài toán giảm thiểu hiện tượng “da beo”. Cụ
thể: khu vực gồm 10 căn nhà nhưng một người thu gom rác có thể chỉ thu gom 3 đến
4 căn nhà và số lượng còn lại do người hoặc các nhóm khác thu gom. Vấn đề “da
beo” trên thực tế gây cản trở việc định vị không gian do dữ liệu sẽ có nguy cơ về mất
tính liên tục trong định vị.
2.2. Những nhân tố mấu chốt của dữ liệu GIS đa nguồn
Hầu hết các vấn đề định vị không gian thường dựa trên một cơ sở lí luận, trong đó, các
đại lượng là duy nhất, không đổi và duy nhất (trên lý thuyết). Ví dụ, trong bài toán phục vụ
định vị nhà với dữ liệu được liệt kê trong bảng tính Microsoft Excel bao gồm thông tin thu
gom rác, định vị thuộc tính không gian thường dựa trên một bộ gồm ba thông số: (tên
phường, tên đường, số nhà). Khi đó, chúng ta thiết lập các thông tin bổ sung trong mẫu bao
gồm họ tên chủ hoặc đại diện chủ nhà được thu gom.

Hình 3: Một mẫu dữ liệu chuyên đề thu gom rác tại Quận 7 TP.HCM
HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011

329
Tuy nhiên, đối với các khu dân cư mới, hoặc các đô thị phát triển, tên chủ hộ là yếu tố
thường xuyên thay đổi. Mặt khác, tuy số nhà là đối tượng ít thay đổi đồng loạt nhưng đối với
những khu vực mới, điển hình là dữ liệu Quận 7 thành phố Hồ Chí Minh, việc cập nhật bản
đồ cần một thời gian để đồng bộ toàn bộ dữ liệu giữa thực tế và trong CSDL GIS phía Quận.
Do đó, để định vị chính xác, chúng ta phải dựa thêm những nhân tố dưới đây:
a) Nhân tố về tính liên tục trong dữ liệu thu thập: yếu tố này là một tính chất quan trọng
trong việc xác định không gian. Ví dụ: những người đảm nhận công tác thu thập dữ liệu về

chuyên đề thu gom rác sẽ mô tả tuần tự thứ tự nhà thu gom theo trật tự đầu hẻm đến cuối
hẻm, hoặc đầu đường đến cuối đường. Thứ tự sẽ là yếu tố giúp giải đoán tốt nhất địa chỉ kế
tiếp trong trường hợp chúng ta có cơ sở về các thông tin tìm thấy. Tuy nhiên, nhược điểm của
phương pháp này là các hệ thống như thu gom rác hiện tại đang có hiện tượng “da beo” đã
nêu trong mục 2.1).
b) Nhân tố về thông tin không gian và phi không gian của các nhà lân cận: dữ liệu có
thể được “giải đoán” nếu lân cận ít thay đổi. Điển hình là trong một dãy nhà, một hoặc vài căn
nhà được lấy làm “chuẩn” là điều hoàn toàn có thể. Những căn nhà đó sẽ tìm được một khi
các vector mô tả dữ liệu trùng nhau ở các nguồn dữ liệu khác nhau. Trong bài toán về định vị
nhà ở, ta có vector định vị tối thiểu bao gồm các thông số: (số nhà, tên đường, phường, quận);
và dễ thấy rằng dữ liệu về “tên chủ sở hữu” chỉ là tham số mang tính chất tham khảo vì tham
số này thay đổi thường xuyên hơn các tham số còn lại.
2.3. Phân tích và tìm kiếm những nhân tố hỗ trợ mang tính thống kê
Từ những phân tích bên trên, giả sử chúng ta cần xây dựng dữ liệu chuyên đề từ hai
nguồn dữ liệu được thu thập từ thực tế: dữ liệu nền và dữ liệu chuyên đề. Khi đó, việc định vị
dữ liệu chuyên đề từ hai nguồn dữ liệu sẽ thực hiện theo qui trình như sau:
- Bước 1: Định vị vị trí dữ liệu từ dữ liệu nền. Ví dụ: tìm địa chỉ nhà theo số nhà,
đường, phường.
- Bước 2: Thiết lập dữ liệu chuyên đề từ kết quả tìm kiếm trên.
Khi đó, với mỗi bước trên, các trường hợp sau đây sẽ xảy ra:
i. Định vị dữ liệu nền/chuyên đề tốt.
ii. Định vị dữ liệu nền/chuyên đề theo lân cận gần.
iii. Định vị dữ liệu nền/chuyên đề theo các lân cận xa.
iv. Không thể định vị hoặc tìm kiếm dữ liệu nền/chuyên đề.
Vì việc thực hiện tuần tự bước 1 Æ bước 2, và mặt khác, nếu giả
định việc thay đổi trên
thực tế dữ liệu nền (như thay đổi quyền sở hữu, xây nhà mới, tách thửa, hợp thửa,…) là những
thay đổi ngẫu nhiêu, thì chúng ta có mô tả xác xuất như sau:
Bảng 1: Mô tả trạng thái định vị đối tượng chuyên đề theo dữ liệu nền
Bước 1 \ Bước 2 Æ Dữ liệu chuyên đề

Dữ liệu nền [i] [ii] [iii] [iv]
Định vị tốt [i] 1 0 0 0
Định vị theo lân cận gần [ii] p
1
q
1
r
1
s
1

Định vị theo lân cận xa [iii] p
2
q
2
r
2
s
2

Không thể định vị [iv] 0 0 0 1

HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011

330
Theo nguyên lý xác suất, ta có tổng các dòng p
i
+q
i
+r

i
+s
i
= 1. Trong bảng trên, dễ dàng
ta có nếu việc định vị dữ liệu nền tốt thì xác suất định vị dữ liệu chuyên đề là 1 (ô [i,i] trong
bảng) và ngược lại, nếu chúng ta không thể định vị dữ liệu nền thì chúng ta sẽ không thể định
vị dữ liệu chuyên đề (trường hợp ô [iv,iv]). Với hai trường hợp [ii] và [iii], các xác suất p, q, r,
s thể hiện khả năng định vị dữ liệu theo các đối tượng ở xa hoặc gần so với vị trí của dữ liệu
chuyên đề. Do đó, chúng ta xác định các giá trị xác suất theo không gian: lân cận gần và lân
cận xa. Hai khái niệm trên được xây dựng dựa theo phương pháp thiết lập bản đồ nền. Ví dụ
trong bài toán định vị thông qua số nhà. Chúng ta có thể định nghĩa lân cận gần là việc xác
định nhà thông qua một số số lượng nhà lân cận xác định trong dãy nhà có số tăng hoặc giảm
liên tục; trong khi đó, xác định lân cận xa được định nghĩa là việc xác định nhà thông qua các
nhà đầu hẻm, các nhà tham chiếu hoặc thông qua các địa vật tham chiếu khác, như: nhà trong
một khu dân cư, nhà có bể nước có khả năng phục vụ việc phòng cháy chữa cháy… Việc xác
định lân cận gần hoặc xa hoàn toàn mang tính chất mờ trong đánh giá. Tuy nhiên, với các
nhân tố đề cập ở các mục trước, chúng ta thấy rằng các xác suất p, q, r, s sẽ bị tác động mạnh
m
ẽ trên chất lượng dữ liệu nền và các nhân tố hỗ trợ định vị (như tính liên tục và các dữ liệu
lân cận hỗ trợ định vị). Dễ dàng ta thấy rằng, p
i
>> q
i
>> r
i
>> s
i
nếu và chỉ nếu dữ liệu định vị
được ở một phạm vi không gian hẹp và ngược lại.
Các giá trị xác suất trên sẽ giúp người quản lý ước lượng được phương án triển khai

thực hiện dữ liệu. Trên thực tế, đối với các dự án, việc lựa chọn các phương án triển khai sẽ
ảnh hưởng đến nhân sự, tiến độ, thời gian và chi phí thực hiện. Các giá trị xác su
ất sẽ được
tính toán dựa trên những phương thức lấy mẫu trên một số tuyến đường, và một số khu dân cư
nhiều nhà.
2.4. Về một quy trình định vị không gian tổng quát
Theo tài liệu [11], để định vị vị trí không gian, chúng ta phải thực hiện 03 bước cơ bản:
bước tiền xử lý (pre-processing), bước lập tương ứng (matching) và bước tính toán (plotting).
Tiền xử lý là bước thiết lập các chuẩn để hình thành dữ liệu. Các địa chỉ sẽ được chuẩn hóa và
được tách (parse) thành các thành phần, như: số nhà, đường, phường, khu phố, Tiếp đó là
bước thiết lập tương ứng. Trong bước này, chúng ta sẽ định vị cụ thể những đối tượng tìm
thấy và những đối tượng không tìm thấy. Và sau cùng là bước tính toán. Bước tính toán sẽ nội
suy những thông tin, như địa chỉ, trên bản đồ.

Hình 4: Một góc dữ liệu nhà và thửa Quận 7
HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011

331
Đối với dữ liệu nhà, một số luật được liệt kê như sau:
- Số nhà là một dãy tăng hoặc giảm cùng chẵn hoặc cùng lẻ.
- Khi định vị dữ liệu về nhà, phân cấp định vị: đường, phường, khu dân cư, khối
nhà, các nhà lân cận.
2.5. Đề xuất giải pháp định vị không gian từ các nhân tố mấu chốt trên dữ liệu nguồn đa
nền
Những nhân tố được xác định bên các mục trên dễ dàng dựa trên kinh nghiệm và thực
tiễn về dữ liệu thu thập và dữ liệu. Thật vậy, chúng ta hoàn toàn có thể xác định nhà bằng
phương pháp định vị thủ công, nghĩa là, một kỹ thuật viên sẽ tìm kiếm khu nhà căn nhà, sau
đó định vị bằng chuột với công cụ phần mềm là một form tìm kiếm nhà. Tuy nhiên, tốc độ tìm
kiếm và định vị là yếu tố cần bàn đến đối với dữ liệu của một Quận trong thành phố Hồ Chí

Minh. Điển hình: Quận 7 có trên 40000 hộ, nếu bình quân định vị bằng cách tìm kiếm nhà sẽ
mất ít nhất 01 phút/hộ thì chúng ta cần trên 40.000 phút, nghĩa là trên 666 giờ, hoặc trên 83
ngày làm việc. Điều đó có nghĩa là, chúng ta cần tối thiểu 04 tháng làm việc hoặc tối thiểu 04
người sẽ thực hiện trong 01 tháng cho dữ liệu của một chuyên đề của một Quận. Chúng ta sẽ
phân tích hướng cài đặt đối với từng nhân tố được mô tả trong mục 2.2:
- Với nhân tố a), chúng ta có thể quy định những khu vực gọi là liên tục đối với một số
ứng dụng nhất định. Ví dụ: trong ứng dụng thu gom rác, chúng ta có thể cần đến mô tả về
đường đi của người thu gom trong một tuyến. Và tuyến trong hẻm sẽ khác với tuyến ngoài mặt
phố. Trên thực tế, thông thường các vùng liên tục ngoài đường lớn sẽ có biên là tim đường giao
thông, nhưng các vùng hẻm ít khi sử dụng tim hẻm làm biên. Về điểm này, chúng ta có thể giải
quyết bằng phương pháp sử dụng GPS để theo dõi (tracking) đường đi tiêu biểu của xe lấy rác.
Và trong trường hợp cần thiết hơn, chúng ta có thể thêm một GPS tracking vị trí lấy rác (trong
trường hợp đường hẹp hoặc người lấy rác dừng xe để đi bộ vào khu dân cư lấy).

Hình 5: Lỗi số nhà chưa quán (giữa số cũ và số mới)
trên một đoạn đường Huỳnh Tấn Phát gây khó khăn việc định vị

- Với nhân tố b), chúng ta dễ dàng thấy rằng nhân tố b) được hỗ trợ từ nhân tố a). Với
dữ liệu được xem như liên tục, chúng ta có để định vị chuẩn một số vị trí không gian và các vị
trí khác sẽ được kết hợp để suy luận. Cụ thể hơn, khi tìm thông tin các nhà lân cận, chúng ta
HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011

332
phải tìm các đối tượng bằng phương pháp buffer và có loại trừ theo các ngữ nghĩa không gian
như: nhà đang xét trong hẻm thì chỉ cần tìm các nhà trong hẻm mà không cần sử dụng thông
tin về nhà phía mặt tiền và ngược lại.
- Trong chương trình tự động định vị, những số nhà không định vị được (do không tìm
thấy) sẽ được định vị lần nữa dựa trên những nhà định vị được. Ví dụ: nhà 257 Lê Văn Lương
không tìm thấy. Tuy nhiên, ta có thể nội suy được nếu chúng ta xác định được nhà số 255 và

259 Lê Văn Lương.
Ngoài ra, chúng ta phải xây dựng các module hỗ trợ giải quyết các công việc thực tiễn
như sau:
- Chuyển đổi về một định dạng đối với hệ thống lưu trữ dữ liệu (font chữ) với các
nguồn dữ liệu thuộc nhiều font chữ khác nhau.
- Xây dựng thư viện phát hiện những từ “gần đúng” (có thể xác định thủ công) như: sai
lỗi chính tả, từ viết tắt,… (bằng các kỹ thuật tìm kiếm gần đúng hoặc tìm kiếm theo ngữ
nghĩa). Ví dụ: cùng một địa chỉ, tên hai chủ nhà ‘Nguyễn Quang Thìn’ và ‘Nguyễn Quan
Thình’ sẽ được xem là đồng nhất do có thể đây là lỗi về chính tả; hoặc ‘Võ Thị Lắm’ sẽ đồng
nhất với ‘Vỏ Thị Lắm’; hoặc tên đường ‘Đường số 2’ sẽ đồng nhất với tên đường ‘Số 2’ hoặc
‘Đ.số 2’. Trong thí nghiệm, chúng tôi đã xây dựng các hàm so sánh chuỗi đơn giản như: loại
bỏ dấu của tất cả các kí tự trong chuỗi. Ví dụ Nguyễn Quang Thình sẽ trở thành: Nguyên
Quang Thinh. Nếu việc so sánh không “khớp” giữa hai chuỗi, chúng ta tiến hành các biến đổi.
Ở đây chúng ta so sánh số lượng chữ: ‘Nguyên Quan Thinh’ và ‘Nguyên Quang Thin’ đều có
3 chữ. Trong đó có 01 từ (‘Nguyên’) giống nhau và 02 từ khác nhau (‘Quan’ <> ‘Quang’ và
‘Thinh’ <> ‘Thin’). Tuy nhiên, sự sai khác có thể được phát hiện bằng cách phân nhóm.

Hình 6: Kết quả chương trình nhập liệu và định vị không gian bằng Spatial SQL
sau khi khảo sát dữ liệu số nhà và chuyên đề thu gom rác Quận 7 TP.HCM

HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011

333
3. KẾT LUẬN
Việc chọn các nhân tố thực nghiệm gây ảnh hưởng đến việc tạo lập dữ liệu chuyên đề là
vấn đề cần thiết. Chúng ta cần phải xây dựng mối quan hệ giữa các nguồn dữ liệu trong điều
kiện dữ liệu còn rời rạc. Tuy nhiên, để ứng dụng đưa vào thực tế, dữ liệu phản ánh thế giới

thực là điều chính yếu. Do đó, chúng ta phải tìm kiếm những nhân tố tuân theo chất lượng dữ
liệu và các qui trình phục vụ thu thập dữ liệu chuyên đề cụ thể. Ngoài ra, từ những kết quả
nghiên cứu trên, một số kết luận được rút ra như sau:
- Cải tiến các tiến trình xây dựng một hệ thống GIS theo hướng phát triển các liên hệ với
nhau, đặc biệt là việc xây dựng và cập nhật dữ liệu trên từng chuyên đề và từng thời điểm.
- Đẩy mạnh việc đồng bộ dữ liệu là vấn đề cần thiết trong các hệ thống. Thời gian đồng bộ
nhanh chóng giữa các cấp phường (xã) ÅÆ quận (huyện) ÅÆ thành phố (tỉnh) cần thực
hiện nhanh chóng để dữ liệu không bị lạc hậu.
- Xây dựng qui trình nhập liệu chuyên đề dựa trên các bản đồ nền. Việc xây dựng Qua đó,
chúng ta sẽ có những phản hồi với cơ quan quản lý về những sự thay đổi trong thực tế mà
dữ liệu nền chưa cập nhật kịp thời. Trong qui trình đó, chúng ta xây dựng khung chuẩn
đào tạo GIS đối với các lực lượng tham gia xây dựng hệ thống GIS để giảm sự sai lệch
giữa các dữ liệu.
- Tạm thời ứng dụng các phương pháp định vị theo xác suất, tận dụng các phương pháp
toán học như thiết kế thực nghiệm để giảm các chi phí thực địa trong việc xây dựng các hệ
thống GIS, đặc biệt các hệ thống chuyên đề.
- Xây dựng các hệ thống 3D (không phải 2.5D) để quản lý các ứng dụng. Trên thực tế,
chúng ta cần đến các hệ thống 3D thực sự để giải quyết những căn hộ chung cư với hàng
nghìn căn hộ trên một thửa lớn.

Hình 7: Các mô tả chi tiết về dữ liệu 3D theo chuẩn CityGML. Quản lý các đối tượng
3D là hướng đến của các ứng dụng quản lý đô thị trong tương lai

(a) LOD1 building
(c) LOD3 building
(d) LOD4 building
(b) LOD2 building

HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011

334

Tài liệu tham khảo

[1] . Khưu Minh Cảnh, Trần Quang Trường Hinh, TS.Trần Trọng Đức, Hồ Nguyễn Cúc Phương, bài
báo: “Một số vấn đề về đồng bộ dữ liệu không gian”, Hội nghị KHCN lần thứ 12 Trường Đại học
Bách Khoa Tp.HCM, năm 2011.
[2]. TS. Hồ Đình Duẫn, TS. Lê Trung Chơn và Đặng Quốc Trung, bài báo nghiên cứu khoa học “Cơ
sở toán học của GIS 3D và các ứng dụng”, năm 2003.
[3]. TS. Nguyễn Ngọc Lâu, bài giảng môn học “Hệ thố
ng định vị GPS”, năm 2010.
[4]. TS. Đào Xuân Lộc, Cơ sở lý thuyết sai số, NXB đại học Quốc Gia, năm 2007.
[5]. TS. Huỳnh Trung Lương – ThS. Trương Tôn Hiền Đức, Phương pháp định lượng trong quản lý và
vận hành, NXB Khoa học và Kỹ thuật, năm 2002.
[6]. Nguyễn Khắc Thanh, Quản lý các dự án hệ thống thông tin địa lý (Tài liệu lưu hành nội bộ Sở
KHCN TPHCM), năm 2005.
[7]. Tài liệu lập trình gvSIG các phiên bản gvSIG 1.1 và gvSIG 1.9, Tài liệu lưu hành nội bộ, Trung
tâm GISC, năm 2010.
[8]. Tổ chức Open Geospatial Consortium xây dựng, Chuẩn CityGML, phiên bản 1.1, năm 2011.
[9]. Dennis Allard, Dimitri D’Or, Reoland Froidevaux, Estimating and simulating spatial categorical
data using an efficiency maximum entropy approach, tại Unité Biostatisque et Processus Spatiaux
Institut National de la Recherche Agronomique Avignon, France (
). Thời
điểm: 22/9/2009.
[10]. Weidong Li, Chuanrong Zhang, bài báo Linear interpolation and joint model fitting of
experimental transiograms for Markov chain simulation of categerical spatial variables, Vol.24,
No.6, 6/2010, trang 821-839, tạp chí International Joural of Geographical Information Science.
[11]. Dr Md. Khalequazzaman, bài báo cáo về “Geocoding & Dynamic Segmentation”, Dept. of

Geology & Physics Lock Haven University.

Báo cáo " BÀN LUẬN VỀ VẤN ĐỀ DỮ LIỆU ĐA NGUỒN VÀ KINH NGHIỆM TRONG TRIỂN KHAI THU THẬP DỮ LIỆU GIS – NHẬN ĐỊNH TỪ MỘT NGUỒN DỮ LIỆU TẠI QUẬN 7, TP. HỒ CHÍ MINH " pot

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về