BỘ TÀI NGUYÊN VÀ MÔI TRƯỜNG
TRƯỜNG ĐẠI HỌC TÀI NGUYÊN VÀ MÔI TRƯỜNG HÀ NỘI
KHOA CÔNG NGHỆ THÔNG TIN
HỌ VÀ TÊN TÁC GIẢ ĐỒ ÁN
Sinh viên: Nguyễn Mạnh Tiến
ĐỀ TÀI: NGHIÊN CỨU XÂY DỰNG MÔ HÌNH DỮ LIỆU
GEODATABASE CHO HỆ THỐNG THÔNG TIN ĐẤT
ĐAI ELIS
Hà Nội, tháng 6 năm 2015
BỘ TÀI NGUYÊN VÀ MÔI TRƯỜNG
TRƯỜNG ĐẠI HỌC TÀI NGUYÊN VÀ MÔI TRƯỜNG HÀ NỘI
KHOA CÔNG NGHỆ THÔNG TIN
HỌ VÀ TÊN TÁC GIẢ ĐỒ ÁN
Sinh viên: Nguyễn Mạnh Tiến
ĐỀ TÀI: NGHIÊN CỨU XÂY DỰNG MÔ HÌNH DỮ LIỆU
GEODATABASE CHO HỆ THỐNG THÔNG TIN ĐẤT
ĐAI ELIS
Chuyên ngành: Công nghệ thông tin
Mã ngành
: CNTT
Người hướng dẫn :Ths. Vũ Ngọc Phan
Hà Nội, tháng 6 năm 2015
LỜI CẢM ƠN
Em xin chân thành cảm ơn quý thầy cô khoa Công nghệ thông tin trường Đại
học Tài nguyên và Môi trường Hà Nội đã tận tình hướng dẫn, giảng dạy và tạo điều
kiện giúp đỡ em trong suốt quá trình học tại trường Đại học Tài nguyên và Môi trường
Hà Nội.
Em xin gửi lời cảm ơn chân thành đến thầy giáo hướng dẫn TS. Nguyễn Quốc
Khánh đã tận tình hướng dẫn em để em có thể hoàn thành đồ án này.
Mặc dù đã cố gắng để thực hiện đề tài một cách hoàn chỉnh nhất, song em vẫn
còn nhiều thiếu sót. Vì vậy, em rất mong nhận được các ý kiến đóng góp từ quý thầy,
cô giáo để đồ án của em được hoàn thiện hơn.
Em xin chân thành cảm ơn!
MỤC LỤC
LỜI MỞ ĐẦU
1. Tính cấp thiết của đề tài
Đa dạng sinh học, nguồn tài nguyên quý giá nhất, đóng vai trò rất lớn đối với tự
nhiên và đời sống con người, theo Công ước Đa dạng sinh học khái niệm "Đa dạng
sinh học" (biodiversity, biological diversity) có nghĩa là sự khác nhau giữa các sinh vật
sống ở tất cả mọi nơi, bao gồm: các hệ sinh thái trên cạn, trong đại dương và các hệ
sinh thái thuỷ vực khác, cũng như các phức hệ sinh thái mà các sinh vật là một thành
phần,...; thuật ngữ này bao hàm sự khác nhau trong một loài, giữa các loài và giữa các
loài và giữa các hệ sinh thái .
Đa dạng sinh học có vai trò rất quan trọng đối với việc duy trì các chu trình tự
nhiên và cân bằng sinh thái. Đó là cơ sở cho sự sống còn thịnh vượng của loài người và
sự bền vững của thiên nhiên trên trái đất.
Việt Nam là một nước nằm trong vùng khí hậu nhiệt đới gió mùa, có điều kiện
địa lý, địa hình đặc biệt, tạo nên khu động thực vật và vi sinh vật rất phong phú và đa
dạng, là trong những quốc gia có mức đa dạng sinh học cao trên thế giới (xếp thứ 16/25
nước có mức độ ĐDSH cao trên thế giới) (SoE, 2005)
Tuy nhiên hiện nay do các nguyên nhân khác nhau, Đa dạng sinh học ở Việt
Nam đang bị suy thoái nghiêm trọng, các hệ sinh thái bị tác động và khai thác quá
mức; diện tích rừng , nhất là rừng nhiệt đới bị thu hẹp một cách báo động. Tốc độ tuyệt
chủng của các loài ngày một tăng, hậu quả tất yếu dẫn đến là sẽ giảm/mất các chức
năng hệ sinh thái như điều hòa nước, chống xói mòn, đồng hóa chất thải, làm sạch môi
trường, đảm bảo vòng tuần hoàn vật chất và năng lượng trong tự nhiên, giảm thiểu
thiên tai/các hậu quả cực đoan về khí hậu. và hệ quả cuối cùng là hệ thống kinh tế suy
giảm do mất đi các giá trị về tài nguyên thiên nhiên, môi trường, nhất là ở các nước
đang và chậm phát triển.
Vì vậy để góp phần hỗ trợ đắc lực cho việc quản lý nhà nước về đa dạng sinh
học và công tác nghiên cứu khoa học thì việc “Xây dựng mô hình dữ liệu cho nhóm
lớp thông tin về đa dạng sinh học” là vô cùng quan trọng.
2. Mục tiêu của đề tài
- Xây dựng mô hình dữ liệu cho nhóm lớp thông tin về đa dạng sinh học
- Xây dựng báo cáo tổng hợp đồ án
3. Nội dung của đề tài
Chương 1: Tổng quan về cơ sở dữ liệu, mô hình dữ liệu và công nghệ GIS
- Cơ sở dữ liệu là gì?
- Mô hình dữ liệu là gì?
- Công nghệ GIS.
5
-
Chương 2: Quy trình xây dựng cơ sở dữ liệu và phương pháp thực hiện
Quy trình xây dựng cơ sở dữ liệu
Phương pháp thực hiện
Chương 3: Tổng quan về đa dạng sinh học
Đa dạng sinh học là gì?
Vai trò của đa dạng sinh học
Đặc trưng của đa dạng sinh học ở Việt Nam
Một số bức xúc về ĐDSH ở Việt Nam
Chương 4: Xây dựng mô hình dữ liệu cho nhóm lớp thông tin về ĐDSH (Thử
nghiệm)
Tình hình xây dựng cơ sở dữ liệu về đa dạng sinh học ở Việt Nam
Sơ đồ cấu trúc khung cơ sở dữ liệu đa dạng sinh học
Metadata
Xây dựng danh mục cơ sở dữ liệu đa dạng sinh học (Thử nghiệm)
Mô hình cấu trúc và nội dung dữ liệu của CSDL đa dạng sinh học (Thử
nghiệm)
Mô hình dữ liệu của nhóm lớp thông tin về đa dạng sinh học (Thử nghiệm)
6
CÁC THUẬT NGỮ VÀ TỪ VIẾT TẮT
Thuật ngữ và
Giải thích
từ viết tắt
CNTT
Công nghệ thông tin
ĐDSH
Đa dạng sinh học
GIS
Geographic Information Systems (Hệ thống thông tin địa lý)
ĐTQL
Đối tượng quản lý
GPS
Hệ thống định vị toàn cầu
DANH MỤC BẢNG BIỂU
STT
Tên hình
7
DANH MỤC HÌNH ẢNH
STT
Tên hình
Chương 1: Tổng quan về đa dạng sinh học
1.1.
Đa dạng sinh học là gì?
Đa dạng sinh học là thuật ngữ thể hiện tính đa dạng của các cá thể sống, loài và
quần thể, tính biến động di truyền giữa chúng và tất cả sự tập hợp phức tạp của chúng
thành các quần xã và hệ sinh thái. Đa dạng sinh học được thể hiện ở ba cấp độ: đa
dạng nguồn gen, đa dạng về loài và đa dạng về hệ sinh thái.
Đa dạng hệ sinh thái: là tất cả mọi sinh cảnh, mọi quần xã sinh vật và mọ quá
trình sinh thái khác nhau, cũng như sự biến đổi trong từng HST,. HST thường được
đánh giá qua tính đa dạng các loài thành viên, nó có thể bao gồm việc đánh gia độ
phong phú tương đối và kiểu dạng của loài. Ở Việt Nam sự đa dạng HST thể hiện:
HST trên cạn (đặc trưng là rừng với hơn 36% diện tích tự nhiên), HST đất ngập nước
8
(30 kiểu loại tự nhiên và nhân tạo) và HST biển (20 kiểu điển hình có tính ĐDSH và
năng suất sinh học cao).
Đa dạng loài: là số lượng và sự đa dạng của các loài được tìm thấy tại một khu
vực nhất định, nó được đánh giá là có tính đa dạng loài cao thành phần loài phong
phú, có nhiều nét độc đáo và đặc trưng cho vùng Đông Nam Á.
-
-
-
-
-
-
Đa dạng nguồn gen: là tất cả các gen di truyền khác nhau của tất cả các cá thể
thực vật, động vật, và vi sinh vật, đa dạng di truyền tồn tại trong một loài và giữa các
loài khác nhau. Việt Nam là một trong 12 trung tâm nguồn gốc giống cây trồng và là
trung tâm thuần hoá vật nuôi nổi tiếng của thế giới.
1.2. Vai trò của đa dạng sinh học
ĐDSH Việt Nam có ý nghĩa to lớn trên nhiều phương diện khác nhau về sinh
thái, kinh tế và xã hội.
Giá trị sinh thái môi trường: Bảo vệ tài nguyên đất và nước, điều hòa khí hậu và phân
hủy các chất thải.
Giá trị kinh tế: Ngành nông nghiệp đóng góp 21% GDP, ngành lâm nghiệp 1,1% GDP
và ngành thuỷ sản chiếm hơn 4% GDP (Tổng cục Thống kê, 2003).
Giá trị xã hội – nhân văn: Giáo dục con người, tạo ổn định xã hội.
1.3. Đặc trưng của đa dạng sinh học ở Việt Nam
1.3.1. Đặc trưng đa dạng sinh thái
Tính phong phú và đa dạng của các kiểu hệ sinh thái: Với một diện tích không rộng,
nhưng trên lãnh thổ Việt Nam có rất nhiều kiểu hệ sinh thái khác nhau. Ở từng vùng
địa lý không lớn cũng tồn tại nhiều kiểu hệ sinh thái.
Thành phần các quần xã trong các hệ sinh thái rất giàu. Cấu trúc quần xã trong các hệ
sinh thái phức tạp, nhiều tầng bậc, nhiều nhánh. Điểm đặc trưng này làm cho đa dạng
hệ sinh thái ở Việt Nam có nhiều điểm khác biệt so với các nước khác trên thế giới.
Tính phong phú của các mối quan hệ giữa các yếu tố vật lý và các yếu tố sinh học, giữa
các nhóm sinh vật với nhau, giữa các loài, giữa các quần thể trong cùng một loài sinh
vật. Mạng lưới dinh dưỡng, các chuỗi dinh dưỡng với nhiều khâu nối tiếp nhau làm
tăng tính bền vững của các hệ sinh thái. Các mối quan hệ năng lượng được thực hiện
song song với các mối quan hệ vật chất rất phong phú, nhiều tầng, bậc thông qua các
nhóm sinh vật: tự dưỡng (sinh vật sản xuất), dị dưỡng (sinh vật tiêu thụ), hoại sinh
(sinh vật phân hủy) trong các hệ sinh thái ở Việt Nam là những chuỗi quan hệ mà ở
nhiều nước khác trên thế giới không có được.
Các hệ sinh thái ở Việt Nam có đặc trưng tính mềm dẻo sinh thái cao, thể hiện ở sức
chịu tải cao, khả năng tự tái tạo lớn, khả năng trung hòa và hạn chế các tác động có hại,
khả năng tự khắc phục những tổn thương, khả năng tiếp nhận, chuyển hóa, đồng hóa
các tác động từ bên ngoài.
Các hệ sinh thái ở Việt Nam phần lớn là những hệ sinh thái nhạy cảm. Tính mềm dẻo
sinh thái của các hệ sinh thái ở Việt Nam làm cho các hệ đó luôn ở trong trạng thái
9
-
-
-
-
-
hoạt động mạnh, vì vậy, thường rất nhạy cảm với các tác động từ bên ngoài, kể cả các
tác động của thiên nhiên, cũng như những tác động của con người.
1.3.2. Đặc trưng đa dạng loài ở Việt Nam
Số lượng các loài sinh vậy nhiều, sinh khối lớn. Tính ra bình quân trên 1 kilomet vuông
lãnh thổ Việt Nam có 4,5 loài thực vật, gần 7 loài động vật, với mật độ hàng chục
nghìn cá thể. Đây là một trong những mật độ đậm đặc các loài sinh vật so với thế giới.
Cấu trúc loài rất đa dạng. Do đặc điểm địa hình, do phân hóa các kiểu khí hậu, cấu trúc
các quần thể trong nội bộ loài thường rất phức tạp. Có nhiều loài có hàng chục dạng
sống khác nhau.
Khả năng thích nghi loài cao. Thích nghi của các loài được thực hiện thông qua các đặc
điểm thích nghi của từng cá thể, thông qua chuyển đổi cấu trúc loài. Loài sinh vật ở
Việt Nam nói chung có đặc tính chống chịu cao đối với các thay đổi của các yếu tố và
điều kiện ngoại cảnh.
1.3.3. Đặc trưng đa dạng nguồn gen
Các biểu hiện của kiểu gen ở Việt Nam rất phong phú. Riêng kiểu gen cây lúa có đến
hàng trăm kiểu hình khác nhau, thể hiện ở gần 400 giống lúa khác nhau.
Các kiểu gen ở Việt Nam thường có nhiều biến dị, đột biến. Trong đó có những biến dị
xảy ra dưới tác động của các yếu tố tự nhiên (sấm, chớp, bức xạ,...), có những đột biến
xảy ra do những tác nhân nhân tạo. Đây là một trong những nguồn tạo giống mới.
Đa dạng sinh học gen ở Việt Nam chứa đựng khả năng chống chịu và tính mềm dẻo
sinh thái cao của các kiểu gen.
1.4. Một số bức xúc về ĐDSH ở Việt Nam
-
Các hệ sinh thái bị tác động nghiêm trọng, loài và nguồn gen suy giảm;
-
Hiện trạng quản lý rừng và các khu bảo tồn thiên nhiên có nhiều bất cập;
-
Quản lý và sử dụng đất ngập nước (các thuỷ vực nội địa và ĐNN ven biển) thiếu quy
hoạch;
-
Đa dạng sinh học biển đang bị đe doạ nghiêm trọng;
-
Buôn bán động thực vật hoang dã chưa giảm bớt;
-
Các loài sinh vật lạ xâm lấn gia tăng;
-
Tiếp cận nguồn gen và chia sẻ lợi ích vấn đề tri thức bản địa còn chưa được quan tâm
đúng mức.Để ngăn ngừa sự suy thoái đa dạng sinh học, Việt Nam đã tiến hành công
tác bảo tồn đa dạng sinh học khá sớm, hai hình thức bảo tồn ĐDSH phổ biến được áp
dụng ở Việt Nam là: Bảo tồn nội vi (Insitu conservation) và bảo tồn ngoại vi (Exsitu
conservation).
10
Bảo tồn nội vi in-situ
Bảo tồn nội vi bao gồm các phương pháp và công cụ nhằm mục đích bảo vệ
các loài, các chủng và các sinh cảnh, các hệ sinh thái trong điều kiện tự nhiên. Tùy theo
đối tượng bảo tồn để đáp ứng các hình thức quản lý thích hợp, thông thường bảo tồn
nội vi được thực hiện bằng cách thành thập các khu bảo tồn và đề xuất các biện pháp
quản lý phù hợp. Bảo tồn nội vi là hình thức bảo tồn chủ yếu ở Việt Nam trong thời
gian qua. Kết quả của phương pháp này thể hiện rõ nhất là đã xây dựng và đưa vào
hoạt động một hệ thống rừng đặc dụng.
Bảo tồn ngoại vi Ex- situ ở Việt Nam
Bảo tồn ngoại vi bao gồm các vườn thực vật, vườn động vật, các bể nuôi thủy
hải sản, các bộ sưu tập vi sinh vật, các bảo tàng, các ngân hàng hạt giống, bộ sưu tập
các chất mầm, mô cấy…các biện pháp gồm di dời các cây non và các vi sinh vật ra
khỏi môi trường sống thiên nhiên của chúng. Mục đích của việc di dời là để nhân
giống, lưu trữ, nhân nuôi vô tính hay cứu hộ trong trường hợp: nơi sinh sống bị suy
thoái hay hủy hoại không thể lưu giữ lâu hơn các loài nói trên, dùng để làm vật liệu cho
nghiên cứu, thực nghiệm và phát triển sản phẩm mới , để nâng cao kiến thức cho cộng
đồng. Tuy công tác bảo tồn ngoại còn tương đối mới ở Việt Nam, nhưng trong những
năm qua, công tác này đã đạt được một số thành tựu nhất
Chương 2: Cơ sở dữ liệu tài nguyên và môi trường
2.1. Tổng quan về CSDL
2.1.1. Cơ sở dữ liệu là gì?
Cơ sở dữ liệu là một bộ sưu tập rất lớn về các loại dữ liệu tác nghiệp, bao
gồm các bộ dữ liệu âm thanh, tiếng nói, chữ viết, văn bản, đồ họa, hình ảnh tĩnh hay
động, …. Cấu trúc lưu trữ dữ liệu tuân theo các quy tắc dựa trên lý thuyết toán học.
Cơ sở dữ liệu phản ánh trung thực thế giới dữ liệu hiện thực khách quan. Cơ sở dữ
liệu đã có ảnh hưởng rất lớn đến việc sử dụng máy tính. Có thể nói rằng cơ sở dữ
liệu đóng vai trò quan trọng trong mọi lĩnh vực có sử dụng máy tính như giáo dục,
thương mại, kỹ nghệ, khoa học, thư viện, …. Thuật ngữ cơ sở dữ liệu trở thành một
thuật ngữ phổ dụng. Cơ sở dữ liệu được các hệ ứng dụng khai thác bằng ngôn ngữ
11
con dữ liệu hoặc bằng các chương trình ứng dụng để xử lý, tìm kiếm, tra cứu, sửa
đổi, bổ sung hay loại bỏ dữ liệu. Tìm kiếm và tra cứu thông tin là một trong những
chức năng quan trọng và phổ biến nhất của dịch vụ cơ sở dữ liệu.
2.1.2. Mô hình dữ liệu là gì?
Mô hình cơ sở dữ liệu sẽ làm nền tảng cho cấu trúc của một cơ sở dữ liệu,
nghĩa là liên quan đến phương pháp tổ chức dữ liệu trong một cơ sở dữ liệu khái
niệm hoặc liên quan đến cấu trúc logic của dữ liệu trong một cơ sở dữ liệu.
Mỗi mô hình cơ sở dữ liệu đều có cấu trúc và kiểu dữ liệu riêng tùy thuộc
vào yêu cầu của mô hình. Cấu trúc dữ liệu: tập hợp các biến có thể thuộc một hoặc
vài kiểu dữ liệu khác nhau được nối kết với nhau tạo thành những phần tử.
Các phần tử này chính là thành phần cơ bản xây dựng nên cấu trúc dữ liệu. Kiểu dữ
liệu (data type): kiểu dữ liệu của một biến là tập hợp các giá trị mà biến đó có thể nhận.
2.1.3. Công nghệ GIS
Trong công tác xây dựng CSDL thì việc ứng dụng công nghệ GIS là một yêu
cầu cấp thiết. Công nghệ GIS đã tạo ra những lợi ích quan trọng trong quá trình xây
dựng các loại bản đồ cũng như nâng cao hiệu quả cho việc giải quyết bài toán về môi
trường. Công nghệ GIS cũng sẽ giúp các nhà quản lý lưu trữ, phân tích và hệ thống hoá
được mọi thông tin cần thiết về các loại bản đồ trên máy tính trong một thời gian dài và
thường xuyên có thể bổ sung, cập nhật, tra cứu một cách dễ dàng phục vụ cho công tác
phân tích và quản lý.
Thế mạnh của GIS có thể kể đến khả năng truy vấn (query), hỏi đáp không gian,
tìm kiếm thông tin kết hợp giữa thông tin về không gian và thông tin về thuộc tính, xử
lý dữ liệu địa lý (phân tích không gian) cho kết quả nhanh chóng, chính xác và hiệu
quả. Mỗi modul trong GIS đều có chức năng chuyên biệt và cho ra kết quả ở nhiều
dạng khác nhau. Kết quả truy vấn có thể tính toán, phân tích và xử lý tùy theo mục đích
sử dụng. Những tiện ích như vậy của công nghệ GIS đã giúp cho việc giải quyết các
bài toán quy hoạch đơn giản đi rất nhiều hoặc người sử dụng có thể dựa trên nền tảng
này để phát triển thêm các modul khác đáp ứng các yêu cầu chuyên biệt.
Trước đây, công nghệ GIS chủ yếu được ứng dụng trong việc thành lập bản đồ
chuyên đề như: bản đồ sử dụng đất, bản đồ quy hoạch sử dụng đất, bản đồ lớp phủ mặt
đất,... sử dụng các phần mềm như Mapinfo, MicroStation. Việc quản lý dữ liệu mang
tính đơn lẻ, chuyên môn hẹp, dữ liệu không lớn và gặp phải khó khăn khi quản lý một
CSDL với nhiều thông tin chuyên môn.
Công nghệ GIS ngày càng được bổ sung và hoàn thiện hơn, tính tiện ích ngày
càng được tăng cao và phần mềm ArcGIS của hãng ESRI là một sự hỗ trợ hoàn thiện
nhất cho việc xây dựng các mô hình CSDL quan hệ. Với một CSDL về môi trường đa
lĩnh vực và khối lượng dữ liệu lớn, quan hệ giữ liệu phức tạp như vậy thì việc ứng
dụng công nghệ của ESRI, sử dụng mô hình CSDL của bộ phần mềm ArcGIS là thích
hợp nhất để xây dựng CSDL.
12
2.2.
2.2.1.
Quy trình xây dựng cơ sở dữ liệu tài nguyên và môi trường
Sơ đồ quy trình xây dựng CSDL tài nguyên và môi trường
Theo thông tư số 26/2014/TT-BTNMT ngày 28 tháng 05 năm 2014
13
2.2.2.
Quy trình chi tiết xây dựng cơ sở dữ liệu tài nguyên và môi trường
2.2.2.1. Rà soát, phân tích nội dung thông tin dữ liệu
a. Rà soát, phân loại các thông tin dữ liệu
14
-
Mục đích: Rà soát, phân loại và đánh giá chi tiết các thông tin dữ liệu phục vụ xây
dựng cơ sở dữ liệu phù hợp với yêu cầu.
Các bước thực hiện:
+ Rà soát, đánh giá và phân loại chi tiết các thông tin dữ liệu đã được chuẩn hóa
và chưa được chuẩn hóa.
+ Chuẩn bị dữ liệu mẫu
-
Sản phẩm:
+ Báo cáo rà soát, phân loại và đánh giá các thông tin dữ liệu
+ Bộ dữ liệu mẫu
b. Phân tích nội dung thông tin dữ liệu
- Mục đích: Phân tích, xác định chi tiết các thông tin dữ liệu phục vụ thiết kế và lập dự
toán xây dựng cơ sở dữ liệu
- Các bước thực hiện
+ Xác định danh mục các đối tượng quản lý
+ Xác định chi tiết các thông tin cho từng đối tượng quản lý
+ Xác định chi tiết các quan hệ giữa các đối tượng quản lý
+ Xác định chi tiết các tài liệu quét (tài liệu đính kèm) và các tài liệu dạng giấy
cần nhập vào cơ sở dữ liệu từ bàn phím
+ Xác định khung danh mục dữ liệu, siêu dữ liệu sử dụng trong cơ sở dữ liệu
Quy đổi đối tượng quản lý
- Sản phẩm:
+ Danh mục đối tượng quản lý và các thông tin chi tiết (danh mục ĐTQL, các
thông tin chi tiết cho từng đối tượng quản lý, các quan hệ và các yếu tố ảnh hưởng đến
việc xây dựng cơ sở dữ liệu).
+ Danh mục chi tiết các tài liệu quét và giấy cần nhập vào CSDL
+ Báo cáo quy định khung danh mục dữ liệu, siêu dữ liệu
+ Báo cáo quy đổi đối tượng quản lý
2.2.2.2. Thiết kế mô hình dữ liệu
- Mục đích:
+ Thiết kế mô hình danh mục dữ liệu (data category), siêu dữ liệu (metadata)
theo (chuẩn dữ liêu, khung dữ liệu) dựa trên kết quả rà soát, phân tích.
+ Thiết kế mô hình cơ sở dữ liệu dựa trên kết quả rà soát, phân tích.
- Các bước thực hiện:
+ Thiết kế mô hình danh mục dữ liệu, siêu dữ liệu
+ Thiết kế mô hình cơ sở dữ liệu
• Thiết kế mô hình cơ sở dữ liệu
• Nhập dữ liệu mẫu để kiểm tra mô hình cơ sở dữ liệu
- Sản phẩm:
15
+ Mô hình cơ sở dữ liệu, mô hình danh mục dữ liệu, siêu dữ liệu dưới dạng
XML
+ Báo cáo thuyết minh mô hình danh mục dữ liệu, siêu dữ liệu
+ Báo cáo thuyết minh mô hình cơ sở dữ liệu
+ Báo cáo kết quả kiểm tra mô hình cơ sở dữ liệu trên dữ liệu mẫu
2.2.2.3. Tạo lập dữ liệu cho danh mục dữ liệu, siêu dữ liệu
- Mục đích: Tạo lập nội dung dữ liệu cho danh mục dữ liệu, siêu dữ liệu dựa trên kết quả
rà soát, phân tích và thiết kế.
- Các bước thực hiện:
+ Tạo lập nội dung cho danh mục dữ liệu
+ Tạo lập nội dung cho danh mục siêu dữ liệu
- Sản phẩm:
+ Cơ sở dữ liệu danh mục dữ liệu, siêu dữ liệu đã nhập đầy đủ nội dung
+ Báo cáo kết quả thực hiện
2.2.2.4. Tạo lập dữ liệu cho cơ sở dữ liệu
a. Chuyển đổi dữ liệu
- Mục đích: Chuyển đổi dữ liệu dạng số (không gian và phi không gian) đã được chuẩn
hóa vào cơ sở dữ liệu
- Các bước thực hiện:
+ Đối với dữ liệu không gian dạng số chưa được chuẩn hóa thì việc chuẩn hóa
dữ liệu được thực hiện theo các quy định của từng chuyên ngành trước khi thực hiện
chuyển đổi vào cơ sở dữ liệu (biên tập bản đồ, chuyển đổi hệ tọa độ,...)
+ Đối với dữ liệu phi không gian chưa được chuẩn hóa
• Chuẩn hóa phông chữ theo chuẩn TCVN 6909 (nếu có)
• Chuẩn hóa dữ liệu phi không gian theo thiết kế mô hình cơ sở dữ liệu.
+ Chuyển đổi dữ liệu dạng số đã được chuẩn hóa vào cơ sở dữ liệu
- Sản phẩm:
+ Dữ liệu dạng số trước khi chuyển đổi
+ Dữ liệu phi không gian trước khi chuẩn hóa
+ Cơ sở dữ liệu đã được chuyển đổi
+ Báo cáo kết quả thực hiện chuyển đổi dữ liệu
b. Quét (chụp) tài liệu
- Mục đích: Quét (chụp) tài liệu) đểphục vụ đính kèm vào các trường thông tin cho các
lớp, bảng dữ liệu của đối tượng quản lý
- Các bước thực hiện:
+ Quét (chụp) các tài liệu
+ Xử lý và đính kèm tài liệu quét
- Sản phẩm: Danh mục các tài liệu quét và đã được đính kèm vào các lớp, bảng dữ liệu
của các ĐTQL
c. Nhập, đối soát dữ liệu
16
-
-
-
-
Mục đích: Nhập, đối soát các dữ liệu từ dạng giấy vào cơ sở dữ liệu đã được thiết kế.
Dữ liệu sau khi được nhập vào cơ sở dữ liệu phải được đối chiếu, kiểm soát để đảm
bảo tính chính xác dữ liệu.
Các bước thực hiện:
+ Đối với dữ liệu không gian dạng giấy: số hóa theo quy định chuyên ngành sau
đó thực hiện bước chuyển đổi dữ liệu
+ Đối với nhập dữ liệu dạng giấy (phi không gian):
• Nhập dữ liệu có cấu trúc cho đối tượng phi không gian.
• Nhập dữ liệu có cấu trúc cho đối tượng không gian.
• Nhập dữ liệu phi cấu trúc cho đối tượng phi không gian.
• Nhập dữ liệu phi cấu trúc cho đối tượng không gian.
+ Đối soat dữ liệu:
• Dữ liệu có cấu trúc đã nhập cho đối tượng phi không gian.
• Dữ liệu có cấu trúc đã nhập cho đối tượng không gian.
• Dữ liệu phi cấu trúc đã nhập cho đối tượng phi không gian.
• Dữ liệu phi cấu trúc đã nhập cho đối tượng không gian.
Sản phẩm:
+ Dữ liệu dạng giấy dùng để nhập dữ liệu (được lưu trữ ở đơn vị thi công phục
vụ kiểm tra, nghiệm thu của chủ đầu tư khi có yêu cầu)
+ Báo cáo đối soát dữ liệu và các vấn đề phát sinh trong quá trình nhập dữ liệu
+ Cơ sở dữ liệu đã được nhập đầy đủ thông tin
Danh mục dữ liệu để cung cấp, khai thác, sử dụng phục vụ yêu cầu quản lý nhà
nước
2.2.2.5. Biên tập dữ liệu
Mục đích: Biên tập cơ sở dữ liệu theo quy định
Các bước thực hiện:
+Đối với dữ liệu không gian
• +Tuyên bố đối tượng.
• Sửa lỗi tương quan của dữ liệu không gian (topology).
+ Đối với dữ liệu phi không gian: Hiệu đính nội dung
+ Trình bày hiển thị dữ liệu không gian
Sản phẩm:
+ Cơ sở dữ liệu đã được biên tập
+ File trình bày hiển thị dữ liệu không gian
2.2.2.6. Kiểm tra sản phẩm
-
Mục đích: Kiểm tra cơ sở dữ liệu đã được tạo lập đảm bảo tính đầy đủ, chính xác, phù
hợp với nội dung đã được phê duyệt.
17
-
-
-
-
Các bước thực hiện:
+ Kiểm tra mô hình cơ sở dữ liệu
+ Kiểm tra nội dung cơ sở dữ liệu
• Kiểm tra dữ liệu không gian.
• Kiểm tra dữ liệu phi không gian.
+ Kiểm tra danh mục dữ liệu, siêu dữ liệu
Sản phẩm
+ Báo cáo kết quả kiểm tra sản phẩm
+ Báo cáo kết quả sửa chữa
+ Báo cáo kiểm tra, nghiệm thu chất lượng, khối lượng
2.2.2.7. Phục vụ nghiệm thu và giao nộp sản phẩm
Mục đích: Phục vụ nghiệm thu và bàn giao các sản phẩm đã kiểm tra
Các bước thực hiện:
+ Lập báo cáo tổng kết nhiệm vụ và phục vụ nghiệm thu sản phẩm đã kiểm tra
+ Đóng gói các sản phẩm dạng giấy và dạng số
+ Giao nộp sản phẩm về đơn vị sử dụng và đơn vị chuyên trách công nghệ thông
tin phân cấp/quy định quản lý để phục vụ quản lý, lưu trữ và đưa vào hệ thống thông
tin tài nguyên và môi trường
Sản phẩm:
+ Báo cáo tổng kết nhiệm vụ và hồ sơ nghiệm thu kèm theo
+ Biên bản bàn giao đã được xác nhận
+ Các sản phẩm dạng giấy và dạng số
2.3.
-
-
Phương pháp thực hiện
2.2.1. Phương pháp tổng hợp và kế thừa
- Thu thập các tư liệu, tài liệu đã có liên quan đến nhiệm vụ
- Phân tích lựa chọn các phương pháp thực hiện phù hợp.
- Phân tích, tổng hợp các kết quả nghiên cứu, các tư liệu đã có.
2.2.2. Phương pháp điều tra khảo sát
Các thông tin thu thập, xử lý từ các tài liệu và chiết tách từ tư liệu ảnh viễn thám trong
nội nghiệp sẽ được kiểm tra, xác minh ngoại nghiệp để đảm bảo tính hiện thời và độ
chính xác của thông tin.
Các thông tin mới không có trên các tài liệu, tư liệu hiện có sẽ được bổ sung bằng
phương pháp điều tra thực địa trong điều kiện cho phép.
2.2.3.
Phương pháp phân tích thống kê
18
-
-
-
-
-
-
-
Các số liệu thống kê thu thập được qua quá trình xử lý, phân tích sẽ bổ sung cập nhật
vào cơ sở dữ liệu và là cơ sở để đánh giá các thông tin thu được từ các bản đồ, các tư
liệu, tài liệu mới thành lập.
Phần lớn các tài liệu, tư liệu hiện có được thu thập và thành lập ở nhiều thời điểm khác
nhau, nên cần có quá trình nghiên cứu và phân tích kỹ lưỡng những thông tin đa thời
gian này. Trên thực tế, thông tin mới nhất chưa hẳn đã là thông tin tốt nhất.
2.2.4. Phương pháp ứng dụng GIS
Các phương pháp giải đoán và chiết tách thông tin từ ảnh vệ tinh bao gồm
phương pháp phân loại tự động, bán tự động (có giám định), giải đoán bằng mắt và
điều vẽ trực tiếp trên máy tính, điều vẽ bằng mắt trên ảnh in ra kết hợp với điều vẽ
ngoại nghiệp.
Các lớp thông tin được chiết tách ra từ ảnh vệ tinh được số hóa và chuẩn hoá, đưa vào
CSDL chuyên đề.
Sử dụng các công cụ GIS để chồng lớp thông tin lên bản đồ nền để thành lập bản đồ
bản đồ hiện trạng tài nguyên thiên nhiên phục vụ quy hoạch bảo vệ môi trường cấp
tỉnh.
Ứng dụng CNTT nói chung, công nghệ GIS và Viễn Thám được coi là phương pháp
chủ đạo trong việc xây dựng hệ thống thông tin
Các ứng dụng của công nghệ GIS và viễn thám được liên tục phát triển trong lĩnh vực
ĐDSH. Từ chương trình kiểm kê nguồn tài nguyên thiên nhiên của Canada trong
những năm 1960, đến các chương trình GIS cấp bang của Mỹ bắt đầu vào cuối những
năm 1970, đến mô hình hoá quản lý các sự cố môi trường hiện đang được phát triển,
công nghệ GIS đã cung cấp các phương tiện để quản lý và phân tích các yếu tố ảnh
hưởng đến môi trường ngày càng hữu hiệu hơn.
Xu hướng hiện nay trong ĐDSH là sử dụng tối đa khả năng cho phép của GIS. Sự phát
triển của phần cứng làm cho máy tính có nhiều khả năng hơn, mạnh hơn và các ứng
dụng GIS cũng trở nên thân thiện hơn với người sử dụng bởi các khả năng hiển thị dữ
liệu ba chiều, các công cụ phân tích không gian và giao diện tuỳ biến.
Nhờ khả năng xử lý các tập hợp dữ liệu lớn từ các CSDL phức tạp, nên GIS thích hợp
với các nhiệm vụ ĐDSH. Các mô hình phức tạp cũng có thể dễ dàng cập nhật thông tin
nhờ sử dụng GIS. GIS được sử dụng để cung cấp thông tin nhanh hơn và hiệu quả hơn
cho các nhà hoạch định chính sách. Các cơ quan chính phủ dùng GIS trong quản lý các
nguồn tài nguyên thiên nhiên, trong các hoạt động quy hoạch, mô hình hoá và quan
trắc
GIS cũng được áp dụng để đánh giá các sự cố môi trường. Các cơ quan chính phủ và
địa phương phải ứng phó nhanh với thiên tai, rủi ro trong công nghiệp và các sự cố môi
trường. Thông tin địa lý là những thông tin quan trọng để đưa ra những quyết định một
cách nhanh chóng. Các phân tích GIS phụ thuộc vào chất lượng, giá trị và tính tương
thích của các dữ liệu địa lý dạng số.
19
-
-
Việc chia sẻ dữ liệu sẽ kích thích sự phát triển các nhu cầu về sản phẩm và dịch vụ
GIS. Các nguồn dữ liệu tăng thêm nhờ sự kết hợp của GIS với GPS (hệ thống định vị
toàn cầu) và công nghệ viễn thám, đã cung cấp các công cụ thu thập dữ liệu hiệu quả
hơn.
Trong ứng dụng GIS và thành lập bản đồ, phương pháp chồng ghép được sử dụng rất
phổ biến cho ra những kết quả hữu ích. Đây là những tư liệu giúp nhà quản lý có thể
đưa ra những quyết sách với địa phương.
20
Chương 3: Xây dựng mô hình dữ liệu cho nhóm lớp thông tin về đa dạng sinh học
Tình hình xây dựng cơ sở dữ liệu về đa dạng sinh học ở Việt Nam
Hiện nay việc quản lý cơ sở dữ liệu về ĐDSH còn nhiều khó khăn, thách thức,
công tác điều tra, đánh giá, kiểm kê tài nguyên ĐDSH thiếu hệ thống, thiếu đồng bộ.
Thông tin và dữ liệu nằm phân tán ở nhiều ngành, nhiều địa phương chưa được quản
lý, thống nhất, thiếu sự chia sẻ thông tin giữa các bộ/ngành và các địa phương, trình độ
xử lý thông tin chưa cao, chất lượng thông tin còn thấp, khối lượng lớn thông tin được
lưu trữ ở dạng tĩnh ( chủ yếu là trên giấy). Một CSDL được thiết kế hợp lý sẽ cung cấp
cái nhìn nhiều chiều vào kết quả ĐDSH, qua đó mang lại giá trị gia tăng cho kết quả
nghiên cứu, giúp cho các nhà quản lý, tra cứu, tham khảo một cách thuận lợi và dễ
dàng.
Xây dựng cơ sở dữ liệu về Đa dạng sinh học là vô cùng quan trọng, góp phần hỗ
trợ đắc lực cho việc quản lý nhà nước về đa dạng sinh học và công tác nghiên cứu
khoa học
3.1.
3.2. Sơ đồ cấu trúc khung cơ sở dữ liệu đa dạng sinh học
21
3.3. Metadata
22
Metadata là dạng dữ liệu mô tả dữ liệu. Thông thường trước khi sử dụng một
lọai dữ liệu nào đó để thực hiện một công việc, chúng ta cần phải tìm hiểu những thông
tin liên quan đến dữ liệu đó, như hệ quy chiếu, ai là người sản xuất, dữ liệu được xây
dựng bằng phương pháp gì, độ phân giải là bao nhiêu,...và chúng ta cũng cần biết
người cung cấp thông tin đó là ai, tư cách pháp nhân ra sao,... Tất cả các thông tin đó
chính là nội dung của Metadata.
Một tổ chức nếu chỉ dùng một hoặc hai lớp dữ liệu GIS thì nhiều khi họ không
cần phải xây dựng metadata làm gì cả. Trong thực tế, gần như không tồn tại tổ chức
chuyên nghiệp nào như vậy, bởi lẽ để giải quyết một vấn đề GIS chúng ta cần nhiều
lớp dữ liệu hơn mà chúng ta nghĩ ban đầu, ngay cả khi chúng ta có ít dữ liệu GIS thì
các dữ liệu đó cũng thay đổi theo thời gian...điều đó có nghĩa tổ chức đó cần một
phương cách lưu lại các thông tin về các lớp dữ liệu để khai thác lâu dài sau này. Với
một tổ chức có nhiều người sử dụng GIS với nhiều nguồn dữ liệu GIS và có nhiều
khách hàng quan tâm đến dữ liệu GIS thì việc xây dựng cơ sở dữ liệu lưu trữ thông tin
về dữ liệu GIS (metadata) là vô cùng cần thiết. Sở tài nguyên và Môi trường các
tỉnh/thành phố và các đơn vị trực thuộc Bộ Tài nguyên và Môi trường (các Tổng cục và
các Cục) là các tổ chức cần phải xây dựng metadata cho toàn bộ các sản phẩm dữ liệu
không gian của mình.
Trong thực tế, các tổ chức cần dữ liệu GIS từ nhiều nguồn dữ liệu khác nhau,
chính vì vậy thông tin mô tả về dữ liệu cũng cần nằm trong một khuôn khổ chung, có
nghĩa cần phải chuẩn về hình thức và nội dung trình bày. Tổ chức chuẩn thế giới (ISOInternational Organisation), tiểu ban Hệ thống thông tin địa lý ISO/TC 211 đã đưa ra
chuẩn metadata cho dữ liệu không gian, trong đó có dữ liệu GIS với tên gọi là ISO
19115.
Chuẩn ISO 19115 được rất nhiều nước sử dụng và phát triển áp dụng tại quốc
gia mình. Chuẩn ISO 19115 xác định việc mô tả dữ liệu GIS dưới dịnh dạng XML
nhằm có thể dễ dàng đưa vào CSDL để quản lý, dễ dàng bảo trì và có khả năng chia sẻ
thông tin về dữ liệu giữa các hệ thống thông tin địa lý đựa trên công nghệ Web và kiến
trúc hướng dịch vụ (SOA).
Chính vì phục vụ cho việc mô tả dữ liệu nên metadata cần phải khởi tạo, xây
dựng và phát triển song song với việc khởi tạo, xây dựng và phát triển dữ liệu. Khi nhà
sản xuất triển khai xây dựng dữ liệu thì chuẩn metadata sẽ:
-
Cung cấp cho các nhà sản xuất các thông tin phù hợp để đặc trưng hóa dữ liệu địa lý
của họ một cách hợp lý.
-
Làm cho việc tổ chức và quản lý metadata của dữ liệu địa lý được dễ dàng.
-
Cho phép người dùng sử dụng được dữ liệu địa lý một cách có hiệu quả nhất bằng cách
hiểu các đặc tính cơ bản của nó.
23
-
Làm cho việc khảo sát, nhận và sử dụng lại được thực hiện dễ dàng. Người sử dụng dễ
dàng định vị, truy cập, khai thác, sử dụng dữ liệu địa lý.
-
Cho phép các người sử dụng chỉ định nơi chứa dữ liệu.
Chuẩn ISO 19115 đưa ra mô hình metadata với các thành phần sau :
1. Thành phần của metadata (Metadata Entity Set Information): là thành phần về chính
metadata : người tạo ra metadata, chuẩn metadata, ngày cập nhật,...
2. Thành phần thông tin nhận dạng (Identification Information) : là thành phần mô tả
những thông tin có tính đặc trưng để nhận dạng dữ liệu cần mô tả, bao gồm các chú
giải về tài nguyên, guồn gốc, mô tả khái quát về dữ liệu, mục đích xây dựng, trạng thái
và nới cần liên hệ để biết thêm thông tin.
3. Thành phần ràng buộc (Constrain Information) : là thành phần mô tả những thông tin
ràng buộc, hạn chế đối với dữ liệu.
4. Thành phần chất lượng dữ liệu ( Data Quality Information): là thành phân mô tả các
thông tin liên quan đến chất lượng dữ liệu GIS.
5. Thành phần bảo dưỡng, bảo trì ( Maintemence Information) : là thành phần mô tả các
thông tin liên quan đến việc cập nhật, chỉnh sửa, nâng cấp dữ liệu.
6. Thành phần thể hiện không gian (Spatial Representation Information): là thành phần
chứa các thông tin liên quan đến phương cách thể hiện thông tin của dữ liệu.
7. Thành phần hệ quy chiếu (Reference System Information) : là thành phần chứa các
thông tin về hệ quy chiếu được sử dụng để tạo ra dữ liệu GIS, như Geodetic datum,
phép chiếu hình, thông tin về elipsoid,...và nơi liên hệ để biết thêm chi tiết.
8. Thành phần nội dung (Content Information) : là thành phần mô tả các nội dung thông
tin của dữ liệu GIS.
9. Thành phần hình thức trình bày (Portrayal Catalogue Information) : là thành phần mô
tả cách trình bày dữ liệu cho đúng mục đích mà dữ liệu được tạo ra.
10. Thành phần phân phối (Distribution Information) : là thành phần cung cấp các thông
tin về việc phân phối dữ liệu cho khách hàng, như : các nhà cung cấp, hình thức cung
cấp, lệ phí, bản quyền,...
11. Thành phần mở rộng (Metadata Extent Information): là thành phần được phát triển và
mở rộng bởi người sử dụng nhằm mô tả chi tiết hơn về dữ liệu GIS.
12. Thành phần lược đồ ứng dụng (Application Schema Information): là thành phần cung
cấp các thông tin về lược đồ ứng dụng được sử dụng trong quá trình tạo dựng dữ liệu.
Theo nguyên tắc, Metadata phải được khởi tạo khi bắt đầu xây dựng dữ liệu và
thường xuyên cập nhật trong suốt quá trình xây dựng, xử lý dữ liệu. Tuy nhiên, các dữ
24
liệu trong đề án này thường đã thành sản phẩm nên việc xây dựng metadata sẽ khó
khăn hơn khi phải tập hợp các thông tin về dữ liệu đã quá lâu. Chính vì thế các thành
phần, lớp, phần tử, danh mục trong metadata có thể là bắt buộc hoặc tùy chọn nhưng
đối với đề án này thì cần phải phát triển và quy định thống nhất các tiêu chí cho tòan
bộ các dữ liệu không gian một cách phù hợp với thực tiễn và đáp ứng được chuẩn mực
quốc tế ISO 19115.
3.4. Xây dựng danh mục cơ sở dữ liệu đa dạng sinh học
STT
Đề mục
Loại đối tượng
Thông tin thuộc tính
Điểm
Mã loại, số hiệu điểm, tọa độ,
độ cao.
A. Nền địa lý
1
Cơ sở đo đạc
1.1
Điểm đo đạc cơ sở
2
Biên giới quốc gia, địa giới hành chính
2.3
Địa phận hành chính
Vùng
Mã, tên hành chính, diện tích,
ghi chú.
2.4
Ủy ban nhân dân các cấp
Điểm
Mã cấp, cấp ủy ban, mã hành
chính, tên hành chính
3
Địa hình
3.1
Đường đẳng cao
Đường
Mã đẳng cao, độ cao
3.2
Điểm độ cao
Điểm
Mã độ cao, độ cao
4
Thủy hệ
4.1
Sông suối, kênh mương
nhỏ
Đường
Tên, đặc tính, trạng thái nước
mặt,chiều dài, độ rộng, diện
tích lưu vực,….
4.3
Đường bờ
Đường
Tên, loại, trạng thái nước
mặt…
5
Giao thông
25