Tải bản đầy đủ (.pdf) (26 trang)

Thiết kế cơ sở dữ liệu theo mô hình Anchor Modeling cho hệ thống quản lý thảm thực vật

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (659.11 KB, 26 trang )

ĐẠI HỌC ĐÀ NẴNG
TRƢỜNG ĐẠI HỌC SƢ PHẠM

DƢƠNG THỊ MINH ÁNH

THIẾT KẾ CƠ SỞ DỮ LIỆU
THEO MÔ HÌNH ANCHOR MODELING
CHO HỆ THỐNG QUẢN LÝ THẢM THỰC VẬT

Chuyên ngành: Hệ thống thông tin
Mã số: 61.49.01.04

TÓM TẮT
LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN

Đà Nẵng – Năm 2017


Công trình được hoàn thành tại
TRƢỜNG ĐẠI HỌC SƢ PHẠM - ĐHĐN

Người hướng dẫn khoa học: TS. Nguyễn Trần Quốc Vinh

Phản biện 1: PGS.TS. Lê Văn Sơn
Phản biện 2: TS. Trần Thiên Thành

Luận văn được bảo vệ trước Hội đồng chấm Luận văn tốt nghiệp
thạc sĩ Hệ thống thông tin họp tại Trường Đại học Sư phạm ĐHĐN vào ngày 30 tháng 07 năm 2017.

Có thể tìm hiểu luận văn tại:
- Thư viện Trường Đại học Sư phạm Đà Nẵng, Đại học Đà Nẵng.


- Trung tâm thông tin học liệu, Đại học Đà Nẵng.


1
MỞ ĐẦU
1. Lý do chọn đề tài
Vấn đề xây dựng cơ sở dữ liệu ứng dụng cho mô hình quản
lý thảm thực vật đóng một vai trò rất quan trọng. Bởi theo quan điểm
sinh thái học, thảm thực vật là tấm gương phản ánh khách quan các
điều kiện tự nhiên, nhân tố môi trường. Đồng thời là thành phần quan
trọng của sinh quyển. Thực vật không những là một nhóm yếu tố tự
nhiên quan trọng của lớp vỏ địa lý mà còn là nguồn tài nguyên có giá
trị, cung cấp nguyên vật liệu đáp ứng nhu cầu sống của con người.
Dựa trên các công trình nghiên cứu về thảm thực vật [1-3].
Các CSDL này đã được tiến hành qua nhiều giai đoạn và diễn biến
theo thời gian, số liệu ngày càng được bổ sung theo thời gian nhưng
chưa có một công trình nghiên cứu tổng thể và thống nhất với các
công trình trước đó nên số liệu về thảm thực vật khác nhau theo các
công bố khác nhau. Các CSDL này phải được tổ chức và sắp xếp lại
sao cho hợp lý hơn.
Các thao tác dữ liệu truyền thống chỉ cho phép truy cập dữ
liệu ở thời điểm hiện tại, không thể truy cập đến các phiên bản dữ
liệu trong quá khứ [4].
Ngày nay, phương pháp mô hình hoá hệ thống Anchor [5]
cho phép mô hình hoá các hệ thống lớn cần lưu lại tính lịch sử của
dữ liệu. Phương pháp này ra đời nhằm giải quyết được các hạn chế
về việc lưu trữ các dữ liệu lịch sử của các phương pháp mô hình hoá
hệ thống khác như UML, ERM, FCO-IM... Bộ công cụ Anchor



2
Modeler tự động sinh CSDL thời gian Anchor cho các hệ quản trị
CSDL quan hệ đảm bảo tính toàn vẹn của CSDL. Ứng dụng của bộ
công cụ này rất lớn khi nó được áp dụng vào các hệ thông thông tin
lớn, nơi dữ liệu lịch sử rất quan trọng, như đa dạng hệ sinh học, ngân
hàng, bảo hiểm, hàng không, chứng khoán….
Trên quan điểm xây dựng một bộ số liệu cập nhật chính xác,
thống nhất làm cơ sở cho việc đánh giá, rà soát tính đa dạng của
thảm thực vật về mặt đa dạng loài, đa dạng giá trị sử dụng, dạng sống
và tình trạng bảo tồn của các loài thực vật nhằm phục vụ công tác
quản lý bảo tồn hệ sinh thái rừng có hiệu quả hơn.
Như vậy, thiết kế CSDL thời gian theo mô hình Anchor
(Anchor Modeling - AM) cho phép truy cập đến dữ liệu toàn cảnh ở
bất kỳ thời điểm nào trong quá khứ, cung cấp cơ chế mở rộng không
hủy, theo đó cho phép khả năng quản trị thay đổi dữ liệu rất mạnh và
mềm dẻo là cần thiết cho hệ thống quản lý thảm thực vật hiện nay là
cấp thiết.
Xuất phát từ những lý do trên được sự đồng ý và hướng dẫn
của TS. Nguyễn Trần Quốc Vinh, tôi chọn đề tài “Thiết kế cơ sở dữ
liệu theo mô hình Anchor Modeling cho hệ thống quản lý thảm
thực vật” để làm luận văn thạc sỹ.
2. Mục tiêu và nhiệm vụ đề tài
 Mục tiêu
- Nghiên cứu về AM.
- Thiết kế được CSDL thời gian cho hệ thống quản lý thảm
thực vật.


3
- Xây dựng được hệ thống quản lí thảm thực vật minh hoạ.

 Nhiệm vụ
- Tìm và đọc tài liệu về AM.
- Khai thác các công cụ hỗ trợ xây dựng CSDL theo AM.
- Xây dựng CSDL cho hệ thống quản lý thảm thực vật theo AM.
- Xây dựng hệ thống thông tin quản lý thảm thực vật sử dụng
CSDL theo thời gian cho phép tìm kiếm dữ liệu về thảm thực
vật theo bối cảnh thời gian.
3. Đối tƣợng và phạm vi nghiên cứu
 Đối tƣợng nghiên cứu
- Mô hình AM.
- Thảm thực vật.
- Hệ thống thông tin quản lý.
- GIS.
 Phạm vi nghiên cứu
- Xây dựng CSDL phục vụ quản lý thảm thực vật, thử nghiệm
cho một số loài trong sách đỏ khu vực Đà Nẵng.
- Sử dụng hệ quản trị CSDL SQL Server để quản lý CSDL
được thiết kế theo AM.
- Dữ liệu GIS được quản lý trên nền geoServer.
- Hệ thống thông tin quản lý thảm thực vật trên nền GIS cho
phép tìm kiếm và hiển thị kết quả theo bối cảnh thời gian.
4. Phƣơng pháp nghiên cứu
Sử dụng hai phương pháp chính là nghiên cứu lý thuyết và
nghiên cứu thực nghiệm.


4
 Phƣơng pháp nghiên cứu tài liệu
- Tìm hiểu về CSDL và hệ quản trị CSDL, AM.
- Nghiên cứu từ các bài báo, phân tích và thiết kế CSDL, các

CSDL liên quan về thảm thực vật, các KBT thiên nhiên…
- Đề xuất các chức năng cho ứng dụng dựa trên các kỹ thuật
đã nghiên cứu.
 Phƣơng pháp thực nghiệm
- Áp dụng mô hình phát triển phần mềm thác nước để xây
dựng hệ thống thông tin quản lý thảm thực vật sử dụng
CSDL theo thời gian cho phép tìm kiếm dữ liệu về thảm thực
vật theo bối cảnh thời gian trên nền GIS.
- Thực nghiệm trên dữ liệu đầu vào là thảm thực vật của các
KBT.
5. Mục đích và ý nghĩa của đề tài
 Mục đích
Nghiên cứu đề xuất giải pháp thiết kế CSDL theo AM vào
quản lý dữ liệu thảm thực vật.
 Ý nghĩa khoa học và thực tiễn
Về khoa học: Góp phần phát triển hệ thống thông tin địa lý
về sự đa dạng sinh học ở nước ta.
Từ kết quả nghiên cứu của đề tài tìm hiểu sâu hơn về kỹ
thuật thiết kế CSDL theo chuẩn AM.
Nghiên cứu sâu hơn về thuật toán lưu trữ và quay lại dữ liệu
tại thời điểm nào đó trong quá khứ.


5
Về thực tiễn: Kết quả nghiên cứu của đề tài thúc đẩy việc áp
dụng công nghệ thông tin vào việc hỗ trợ quản lý đa dạng sinh học,
cũng phần nào đáp ứng được các nhu cầu cần thiết về thông tin trong
công tác bảo vệ môi trường, bảo tồn đa dạng sinh học của nước nhà.
6. Bố cục luận văn
Nội dung của luận văn được trình bày bao gồm các phần

chính như sau:
Chƣơng 1 – TỔNG QUAN VỀ MÔ HÌNH ANCHOR
Chương này, luận văn trình bày các cơ sở lí thuyết về dữ liệu
có yếu tố thời gian, dữ liệu tiến hóa, mô hình hóa dữ liệu với AM,
các khái niệm cơ bản và truy cập dữ liệu trong AM.
Chƣơng 2 – ĐA DẠNG THỰC VẬT
Trong chương 2, luận văn trình bày tổng quan về đa dạng
thực vật, các phân tích, thiết kế CSDL thảm thực vật, xây dựng được
các mô hình thực thể, mô hình dữ liệu làm tiền đề giải quyết bài toán
thiết kế CSDL theo AM cho hệ thống quản lí thảm thực vật.
Chƣơng 3 – THIẾT KẾ CƠ SỞ DỮ LIỆU ANCHOR
MODELING CHO HỆ THỐNG QUẢN LÝ THẢM THỰC VẬT
Chương 3, tập trung vào thiết kế CSDL theo AM cho hệ
thống quản lí thảm thực vật, cài đặt và thực nghiệm chương trình.
Cuối cùng là những đánh giá, kết luận và hướng phát triển
của đề tài trong tương lai.


6
CHƢƠNG 1
TỔNG QUAN VỀ MÔ HÌNH ANCHOR MODELING
1.1. GIỚI THIỆU
AM kết hợp chuẩn hoá lược đồ quan hệ và tính cạnh tranh
(emulation) để cung cấp kỹ thuật mô hình hoá CSDL linh hoạt
(agile) cho dữ liệu tiến hoá. AM cung cấp hệ thống các nguyên tắc
[21] theo đó, mô hình thu được có thể được triển khai theo mô hình
dữ liệu quan hệ một cách đơn giản. Kết quả trực tiếp là CSDL thời
gian đạt chuẩn 6NF.
1.2. CƠ SỞ DỮ LIỆU THỜI GIAN
1.2.1. Khái niệm cơ sở dữ liệu có yếu tố thời gian

1.2.2. Thời gian thay đổi
1.2.3. Thời gian ghi
1.2.4. Thời gian diễn ra
1.3. CƠ SỞ DỮ LIỆU CHUẨN HÓA Ở MỨC THẤP
1.4. DỮ LIỆU TIẾN HÓA
1.5. MÔ HÌNH HÓA DỮ LIỆU VỚI ANCHOR MODELING
Nhìn chung, AM mang lại đầy đủ các lợi ích 8] của CSDL
đạt dạng chuẩn 6NF:
- Quản lý và xử lý được dữ liệu tiến hoá, đảm bảo tính toàn
vẹn của dữ liệu theo thời điểm bất kỳ.
- Tăng vòng đời của CSDL so với vòng đời trung bình 5 năm.
- Đơn giản hoá các khái niệm mô hình hoá (modeling
concepts), giảm thiểu hoá lỗi mô hình hoá.
- Cho phép phát triển theo mô-đun và tăng trưởng từng bước.


7
- Chuyển đổi sang CSDL vật lý đơn giản.
- Cho phép và hỗ trợ công cụ sinh tự động các kịch bản tạo
CSDL vật lý cũng như các khung nhìn, các hàm cần thiết.
- Đặc biệt, chỉ quét những dữ liệu cần thiết trong quá trình xử
lý truy vấn nhờ mỗi cột được lưu trữ riêng lẻ trong từng bảng.
- Không chấp nhận NULL nên khắc phục được vấn đề dữ liệu
thưa thớt trong CSDL thông thường.
1.6. NHỮNG KHÁI NIỆM CƠ BẢN VỀ MÔ HÌNH HÓA AM
(ANCHOR MODELING)
Các khái niệm nền tảng trong AM bao gồm neo (anchor),
giới hạn (knot), thuộc tính (attribute), thuộc tính hằng (static
attribute), thuộc tính biến thiên (historized attribute), thuộc tính hằng
giới hạn (knotted static attribute), thuộc tính biến thiên giới hạn

(knotted historized attribute). Các loại mối quan hệ (tie) bao gồm
quan hệ hằng (static tie), quan hệ biến thiên (historized tie), quan hệ
hằng giới hạn (knotted static tie), quan hệ biến thiên giới hạn
(knotted historized tie) [7].
Trong AM có các đối tượng sau:
Anchor: Lưu trữ các định danh của các thực thể
Knot: Lưu trữ miền giá trị của dữ liệu
Attributes: Lưu trữ các giá trị của các thuộc tính
Ties: Lưu trữ mối quan hệ giữa các thực thể


8
1.6.1. Tập thực thể (Anchor)
Trong mối tương quan với mô hình thực thể - mối quan hệ rất
phổ biến, có thể hiểu, anchor là tập thực thể. Anchor biểu diễn ID
của thực thể. Giới hạn đại diện cho một tập lực lượng nhỏ các giá trị
cố định theo thời gian, thường là những giá trị dùng chung cho nhiều
thực thể khác nhau.
1.6.2. Giới hạn (Knot)
Một giới hạn được sử dụng để biểu diễn một tập hợp các thực
thể cố định, thường là nhỏ, không thay đổi theo thời gian. Trong khi
các tập thực thể được sử dụng để biểu diễn các thực thể tùy ý, thì các
giới hạnđược sử dụng để quản lý các đặc tính chung trong nhiều thực
thể của một số tập thực thể.
1.6.3. Thuộc tính (Attribute)
Thuộc tính biểu diễn các thuộc tính của tập thực thể, cụ thể là
của anchor. Cần phân biệt bốn loại thuộc tính: thuộc tính hằng (Static
Attribute), thuộc tính biến thiên (Historized Attribute), thuộc tính
hằng giới hạn (Knotted Static Attribute), thuộc tính biến thiên giới
hạn (Knotted Historized Attribute), xem hình 1.2.


Hình 1.2. Kí hiệu tập thực thể


9
Một tập thực thể -Anchor (a) được thể hiện dưới dạng một
hình vuông đặc và một giới hạn -Knot (d) được thể hiện dưới dạng
hình vuông được vẽ đường viền bên ngoài với góc hơi tròn. Một
thuộc tính hằng -Static Attribute (b) và một thuộc tính hằng giới hạn
- Knotted Static Attribute (e) được thể hiện dưới dạng hình tròn được
vẽ đường viền bên ngoài.Một thuộc tính biến thiên -Historized
Attribute (c) và một thuộc tính biến thiên giới hạn -Knotted
Historized Attribute (f) được hiển thị được thể hiện dưới dạng hình
tròn với những đường viền bên ngoài kép.Các thuộc tính giới hạn
liên quan đến một giới hạn.
Định nghĩa 6 (Thuộc tính hằng - Static Attribute). Thuộc tính
hằng là những thuộc tính chấp nhận giá trị không thay đổi theo thời
gian, chẳng hạn ngày sinh của một công dân.
Định nghĩa 7 (Thuộc tính biến thiên – Historized
Attribute).Thuộc tính biến thiên là thuộc tính chấp nhận các giá trị có
thể thay đổi theo thời gian và cần ghi lại sự thay đổi này, chẳng hạn,
đơn vị công tác của một công dân.
Định nghĩa 8 (Thuộc tính hằng giới hạn – Knotted Static
Attribute). Thuộc tính hằng giới hạn biểu diễn mối quan hệ giữa thực
thể và giới hạn, cụ thể thuộc tính chấp nhận một giá trị cố định nào
đó từ tập số lượng nhỏ các giá trị; chẳng hạn, công dân có mã công
dân CMT1( chứng minh thư 1) có giới tính nam.
Định nghĩa 9 (Thuộc tính biến thiên giới hạn – Knotted
Historized Attribute).Thuộc tính biến thiên giới hạn biểu diễn thuộc
tính của một thực thể có thể chấp nhận các giá trị khác nhau từ tập số



10
lượng nhỏ các giá trị; chẳng hạn, công dân có thể được xếp vào các
nhóm tuổi khác nhau theo thời gian.
1.6.4. Mối quan hệ(Tie)
Một mối quan mô tả liên kết giữa hai hoặc nhiều tập thực thể
anchor với nhau và các thực thể giới hạn tùy chọn.
Tương tự như các thuộc tính, các mối quan hệ có bốn biến
thể: quan hệ hằng (Static Tie), quan hệ biến thiên (Historized Tie),
quan hệ hằng giới hạn (Knotted Static Tie), quan hệ biến thiên giới
hạn (Knotted Historized Tie). Xem hình 1.3.

Hình 1.3. Các mối quan hệ
Một quan hệ hằng – Static Tie (a) và một quan hệ hằng giới
hạn – Knotted Static Tie (c) được thể hiện dưới dạng hình thoi đặc.
Một quan hệ biến thiên – Historized Tie (b) và một quan hệ biến
thiên giới hạn – Knotted Historized (d) được thể hiện dưới dạng hình
thoi đặc với một đường viền bên ngoài. Các quan hệ giới hạn liên
quan đến ít nhất một giới hạn. Định danh của các liên kết được đánh
dấu bằng các vòng tròn màu đen.


11
Định nghĩa 12 (Quan hệ hằng–Static Tie).Có thể hiểu mối
quan hệ hằng là mối quan hệ không thay đổi theo thời gian, chẳng hạn,
mối quan hệ cha – con sinh học giữa hai anchor công dân. Nó cũng có
thể là ví dụ cho mối quan hệ hằng giới hạn, mối quan hệ sinh học giữa
hai công dân: cha-con, mẹ-con, ông-cháu, bà-cháu, cô/dì/chú/bác – cháu
và không quan hệ huyết thống.

Định nghĩa 13 (Quan hệ biến thiên – Historized Tie).Mối
quan hệ quan hệ biến thiên là mối liên kết có thể chấp nhận các giá
trị khác nhau theo thời gian từ tập số lượng lớn các giá trị.
Định nghĩa 15 (Quan hệ biến thiên giới hạn – Knotted
Historized). Mối quan hệ biến thiên giới hạn đại diện cho mối liên
kết chấp nhận các giá trị khác nhau theo thời gian từ một tập số
lượng nhỏ các giá trị giữa hai hoặc nhiều thực thể với nhau. Chẳng
hạn, mối quan hệ bạn bè, người yêu, vợ chồng giữa hai công dân với
nhau.
1.6.5. Quy ƣớc đặt tên
Quy ước đặt tên được gợi ý chỉ sử dụng các chữ, số thông
thường và các ký tự gạch dưới. Điều này đảm bảo rằng các tên gọi
giống nhau có thể được sử dụng trong nhiều biểu diễn, chẳng hạn
như trong một CSDL quan hệ, XML hoặc một ngôn ngữ lập trình.
1.7. TRUY CẬP DỮ LIỆU
Sau khi thiết kế mô hình Anchor trên công cụ Anchor
Modeler, người dùng có thể sinh ra các đối tượng dữ liệu liên quan
[18], cụ thể trong trường hợp thử nghiệm là trong SQL Server.


12
Khung nhìn cuối cho phép truy cập đến dữ liệu ở thời điểm
hiện tại theo thời gian thực, thời điểm lớn nhất. Hàm theo thời điểm cho
phép truy cập đến dữ liệu ở thời điểm trong quá khứ được nhập vào là đối
số của hàm, dữ liệu bao gồm các giá trị mới nhất ở thời điểm đó và
thường nhỏ hơn giá trị thời điểm hiện tại theo thời gian thực.
1

create view


13

lAC_part_PR_in_RAT_got as
2

select

3

[AC_PR_RAT].AC_ID_part,

[RAT].RAT_ID =
[AC_PR_RAT].RAT_ID_got

14

where

15 [AC_PR_RAT].AC_part_PR_in_RA
T_got_ValidFrom = (

4

[AC_PR_RAT].PR_ID_in,

5

[AC_PR_RAT].RAT_ID_got,

16


select

17 max(sub.AC_part_PR_in_RAT_got_
ValidFrom)

6

[RAT].RAT_Rating,

18

7 [AC_PR_RAT].AC_part_PR_in_R 19

from
AC_part_PR_in_RAT_got [sub]

AT_got_ValidFrom
8

from

20

where

9

AC_part_PR_in_RAT_got


21

[sub].AC_ID_part =

[AC_PR_RAT]

[AC_PR_RAT].AC_ID_part

10

left join

22

and

11

RAT_Rating [RAT]

23

[sub].PR_ID_in =
[AC_PR_RAT].PR_ID_in

12

on

24


Hình 1.5. Khung nhìn cuối

);


13
1

create function pAC_Actor
(@timepoint date) returns table

17 [GEN].GEN_ID =
[AC_GEN].GEN_ID

2

return select

18 left join

3

[AC].AC_ID,

19 AC_NAM_Actor_Name
[AC_NAM]

4


[AC GEN].GEN_ID,

20 on

5

[GEN].GEN_Gender,

21 [AC_NAM].AC_ID = [AC].AC_ID

6

[AC_NAM].AC_NAM_Actor_Name, 22 and

7

[AC_NAM].AC_NAM_ValidFrom 23 [AC_NAM].AC_NAM_ValidFrom = (

8

from

24 select

9

AC_Actor [AC]

25 max([sub].AC_NAM_ValidFrom)


10

left join

26 from

11

AC_GEN_Actor_Gender

27 AC_NAM_Actor_Name [sub]

[AC_GEN]
12

on

28 where

13

[AC_GEN].AC_ID = [AC].AC_ID 29 [sub].AC_ID = [AC].AC_ID

14

left join

30 and

15


GEN_Gender [GEN]

31 [sub].AC_NAM_ValidFrom <=
@timepoint

16

on

32 );

Hình 1.6. Hàm theo thời điểm
1.8. KẾT CHƢƠNG 1
Chương này đã tập trung nghiên cứu tổng quan về CSDL có
yếu tố thòi gian, dữ liệu tiến hóa, mô hình dữ liệu với Anchor, và
những khái niệm cơ bản về AM, cũng như lợi ích của mô hình AM
đem lại.


14
Anchor Modeler là một công cụ mô hình hoá CSDL cho
phép tạo các mô hình dữ liệu thời gian sử dụng 6NF. CSDL AM lưu
lại tất cả các phiên bản dữ liệu, cho phép truy cập đến dữ liệu ở bất
kỳ thời điểm nào trong quá khứ với tốc độ truy cập rất cao.
Mô hình hóa AM hỗ trợ mô hình hóa thông tin linh hoạt
bằng cách đáp ứng yêu cầu rằng toàn bộ miền, doanh nghiệp phải
được mô hình hóa trong một bước duy nhất. Khả năng của một mô
hình bao gồm tất cả không phải là một lựa chọn thực tế. Hơn nữa, tại
một số thời điểm, một sự thay đổi có thể xảy ra mà không thể lường

trước được. Mô hình hóa AM được xây dựng dựa trên giả định rằng
không bao giờ có thể thực hiện được các dự đoán hoàn hảo. Một mô
hình không được xây dựng để trở thành mô hình cuối cùng mà nó
được xây dựng để được thay đổi.


15
CHƢƠNG 2
ĐA DẠNG THỰC VẬT

2.1. TỔNG QUAN VỀ ĐA DẠNG THỰC VẬT
2.2. QUẢN LÝ THÔNG TIN ĐA DẠNG THỰC VẬT
2.2.1. Yêu cầu
Nhằm hỗ trợ cho các nhà nghiên cứu, những người quan tâm
đến việc lưu trữ, quản lý một cách có hệ thống và tra cứu hệ thực vật
Việt Nam, đồng thời cung cấp một công cụ tra cứu và nhận biết các
họ thực vật thì rất cần một kho dữ liệu có tính linh động và mở.
2.2.2. Thực trạng
Hiện nay việc quản lý thông tin đa dạng thực vật chưa được
quan tâm đúng mức. Dữ liệu đa dạng thực vật chưa được hệ thống
hoá, được lưu trữ rải rác trên các website tin tức, các cuốn sách cũng
như các báo cáo đề tài nghiên cứu khoa học khác nhau.
Thiết kế CSDL AM cho hệ thống quản lí thảm thực vật cho
phép người dùng tạo ngân hàng dữ liệu để quản lý các dữ liệu đa dạng
thực vật của một đơn vị địa lý hoặc của một cá nhân. Sản phẩm còn
giúp người sử dụng tra cứu và xác định họ các loài thực vật của Việt
Nam, đồng thời thực hiện các thống kê đa dạng thực vật cho các nhóm
được chọn hoặc toàn bộ ngân hàng dữ liệu ở bất kì thời điểm nào.
2.3. PHÂN TÍCH THIẾT KẾ CƠ SỞ DỮ LIỆU
2.3.1. Phân tích

Qua việc tham khảo các trang web tra cứu thông tin thực vật


16
(chủ yếu là trang ) và một số tài liệu về
ngành thực vật học, các mảng thông tin chính hệ thốngcần cung cấp
bao gồm:
Thông tin về loài thực vật gồm: bậc phân loại sinh học (giới,
ngành, lớp, bộ, họ, giống, loài), danh pháp khoa học, tên thường gọi,
tên khác, xuất xứ, đặc điểm nhận dạng, đặc điểm sinh học và hệ sinh
thái, khu vực phân bố, giá trị đối với con người, tình trạng bảo tồn,
phân hạng nguy cơ, tài liệu dẫn nguồn và ảnh.
2.3.2. Mô hình thực thể kết hợp
2.3.3. Mô hình dữ liệu quan hệ
2.4. KẾT CHƢƠNG 2
Chương 2 đã trình bày được tổng quan về đa dạng thực vật,
thực trạng và đề xuất hướng sử dụng hợp lý, bền vững thảm thực vật,
bảo tồn đa dạng sinh học là hướng nghiên cứu đặc biệt được quan
tâm trong các KBT và các VQG, nơi nguồn gen tự nhiên còn phong
phú, đa dạng. Chương này đã phân tích, thiết kế CSDL thảm thực vật
như: thông tin về loài, sự phân bố của các loài thực vật, một số đối
tượng và các thuộc tính liên quan cần lưu trữ (giới, ngành, lớp, bộ,
họ, giống, loài, KBT, phường xã, quận huyện…), xây dựng được các
mô hình thực thể, mô hình dữ liệu làm tiền đề giải quyết bài toán
thiết kế CSDL theo mô hình Anchor cho hệ thống quản lí thảm
thực vật.


17
CHƢƠNG 3

CSDL THEO MÔ HÌNH ANCHOR CHO HỆ THỐNG
QUẢN LÝ THẢM THỰC VẬT TRÊN NỀN GIS

3.1. THIẾT KẾ CƠ SỞ DỮ LIỆU THEO MÔ HÌNH ANCHOR
3.1.1. Xác định các thuộc tính và mối quan hệ
3.1.2. Thiết kế CSDL theo mô hình Anchor
Bằng công cụ Anchor Modeler được cung cấp tại website
mô hình dữ liệu
Anchor được thiết như sau :

Error! Reference source not found.Công

cụ Anchor


18
Modeler cho phép sinh mã SQL để tạo CSDL, bao gồm cả các bảng
mô tả các tập thực thể, thuộc tính và các mối quang hệ cũng như các
hàm theo thời điểm và các khu nhìn cho phép truy cập đến dữ liệu
vào bất kỳ thời điểm nào trong quá khứ.
3.2. XÂY DỰNG KỊCH BẢN CHUYỂN ĐỔI CƠ SỞ DỮ LIỆU
Với giả thiết hệ thống quản lý đa dạng thực vật đã tồn tại và
đang hoạt động với CSDL bao gồm số lượng lớn bản ghi, luận văn
cần thực hiện chuyển đổi CSDL từ mô hình dữ liệu quan hệ truyền
thống sang CSDL quan hệ được thiết kế theo AM.
CSDL chứa dữ liệu nguyên thuỷ được thiết kế theo mô hình
ER có tên ER. CSDL được thiết kế theo AM có tên AM. Từ ban đầu,
các định danh của các tập thực thể được chọn kiểu dữ liệu int. Vì thế,
có thể sử dụng các bộ giá trị khoá làm các bộ giá trị cho anchor trong
AM. Rõ ràng, với mỗi loại thuộc tính cũng như mối quan hệ theo

AM ta có cách chuyển đổi dữ liệu từ CSDL cũ theo ER sang CSDL
mới theo AM khác nhau.
Như vậy, cần xây dựng kịch bản (script) để tự động hóa tối
đa quá trình chuyển đổi CSDL này. Sự tương ứng giữa các bảng theo
ER và AM (xem phụ lục C). Một số sửa đổi trong sơ đồ AM:
 Kiểu dữ liệu của trường có knot đổi thành varchar(250) Vì
varchar(max) không thể dùng làm khóa.
 Image đổi thành HinhAnh
 Matdo đổi từ smallint thành int
 ChuVi, DienTich KhuBaoTon đổi thành bigint


19
 Trong CSDL cũ nhóm, Quyền không có ngày cập nhật nên
sửa lại trong AM là static..
 Xóa knot Nhom ở Quyền và nhóm vì nó không có ý nghĩa.
3.3. MÔ HÌNH HỆ THỐNG QUẢN LÍ ĐA DẠNG THỰC VẬT
Hệ thống quản lý đa dạng thực vật đã tồn tại và đang hoạt
động trên nền WebGIS, hoạt động theo mô hình Client – Server
(khách – chủ) giống như hoạt động của một website thông thường, vì
thế hệ thống WebGIS cũng có kiến trúc ba tầng (3 tier) điển hình của
một ứng dụng Web thông dụng. Kiến trúc 3 tầng gồm có ba thành
phần cơ bản đại diện cho ba tầng: máy khách (client), máy chủ ứng
dụng (Application Server) và máy chủ dữ liệu (Data Server) (Hình
3.2).

Hình 3.2. Mô hình hệ thống trên nền GIS
3.3.1. Nguyên lý hoạt động
3.3.2. Mô hình hoạt động của hệ thống
3.3.3. Sơ đồ phần cấp chức năng của hệ thống



20

3.4. THỬ NGHIỆM VÀ ĐÁNH GIÁ

Hình 3.5. Kết quả tìm kiếm trong bối cảnh 8:25 ngày 9/9/2000

Hình 3.6. Kết quả tìm kiếm trong bối cảnh 4:50 ngày 5/4/2013


21
Các giao diện tìm kiếm và hiển thị thông tin đa dạng thực vật
như trên Hình3.5 và Hình3.6 minh họa cho các chức năng quản lý đa
dạng thực vật theo thời gian, nghĩa là, người dùng chọn thời điểm
mong muốn làm việc trong hệ thống, mọi dữ liệu hiển thị sẽ theo bối
cảnh thời điểm mà người dùng đã chọn. Hệ thống sẽ đưa ra những
giá trị dữ liệu mới nhất tại thời điểm người dùng đang chọn để làm
việc trong hệ thống.
Cụ thể, trên Hình, người dùng chọn thời điểm làm việc trong
hệ thống là 8:25 ngày 09/9/2000.Trên Hình 3.6, người dùng chọn
thời điểm làm việc là 4:50 ngày 5/4/2013. Có thể so sánh một phần
dữ liệu mới nhất cho loài thực vật gõ lau tại 2 thời điểm mà người
dùng làm việc như trên
Bảng 3.33. Trong khoảng thời gian đó, có 2 dữ liệu phân bố
thực vật được thay đổi (5 lần và 1 lần tương ứng) và 1 dữ liệu phân
bố thực vật được thêm mới.
Bảng 3.16. Sự thay đổi dữ liệu phân bố thực vật theo thời gian
STT



độ

Kinh
độ


Số
Diện
lƣợng tích

1.

16.108 108.302

16

9

2.

16.876 108.564

5

8

3.

16.217 108.777


12

13

4.

16.617 108.019

2

4

5.

16.620 108.517

Hành
động
Sửa
(5 lần)
Sửa
(1 lần)
Sửa
(1 lần)
Thêm

Mới
Số
Diện

lƣợng tích
3

7

4

9

12

13

3

4

4

8


22
mới
Thêm
6. 16.729 108.781
31
12
mới
Để thu được dữ liệu cuối cùng theo thời điểm, cụ thể trong

trường hợp này các hàm sau đây được sử dụng:
1) pLA_Loaivà 2) T_ThongTinPhanBoThucVat với tham số
đầu vào là các giá trị thời gian ‘8:25 09/9/2000’ và ‘4:50 5/4/2013’.
Nếu người dùng chọn thời điểm lớn hơn hoặc bằng thời gian hiện tại
của hệ thống, thay vì dùng các hàm theo thời gian, hệ thống sẽ sử
dụng các khung nhìn cuối nTT_ThongTinPhanBoThucVat và
nLA_Loai. Các giao diện này cũng chứng tỏ CSDL được xây dựng
theo mô hình Anchor và đã được chuyển đổi dữ liệu được hệ thống
sử dụng thành công.
3.5. KẾT CHƢƠNG 3
Với giả thiết hệ thống quản lý đa dạng thực vật đã tồn tại và
đang hoạt động với CSDL bao gồm số lượng lớn bản ghi, chương
này đã thực hiện chuyển đổi CSDL từ mô hình dữ liệu quan hệ
truyền thống sang CSDL quan hệ được thiết kế theo mô hình Anchor
để quản lí đa dạng thực vật.
Ngoài ra bằng công cụ Anchor Modeler cho phép sinh mã
SQL để tạo CSDL, bao gồm cả các bảng mô tả các tập thực thể,
thuộc tính và các mối quan hệ cũng như các hàm theo thời điểm và
các khung nhìn cho phép truy cập đến dữ liệu vào bất kỳ thời điểm
nào trong quá khứ. Luận văn đã xây dựng kịch bản (script) để tự
động hóa tối đa quá trình chuyển đổi CSDL này và thực hiện điều
chỉnh chức năng tìm kiếm của hệ thống có sử dụng cơ sở dữ liệu theo


23
mô hình Anchor. Kết quả cho thấy hệ thống sẽ quản lý đa dạng thực
vật theo thời gian, nghĩa là, người dùng chọn thời điểm mong muốn
làm việc trong hệ thống, mọi dữ liệu hiển thị sẽ theo bối cảnh thời
điểm mà người dùng đã chọn. Hệ thống sẽ đưa ra những giá trị dữ
liệu mới nhất tại thời điểm người dùng đang chọn để làm việc trong

hệ thống.


×