HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011
33
XÂY DỰNG MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN CHO
HỆ THỐNG THÔNG TIN ĐẤT ĐAI CẤP TỈNH VÀ GIẢI PHÁP
ĐỒNG BỘ HÓA CƠ SỞ DỮ LIỆU TRÊN ORACLE
(BUILDING A DISTRIBUTED DATABASE MODEL FOR LAND INFORMATION
SYSTEM AND SOLUTIONS SYNCHRONIZE DATABASE ON ORACLE)
Bùi Văn Dũng
Trung tâm Công nghệ Thông tin, Sở Tài nguyên và Môi trường Đồng Nai
Abstract: Building a modern information system to satisfy the government targets in land
management is on of the first priority nowadays. However, the most difficult point now is
synchronous all of database between levels of management because land information system is
a huge system, management of decentralized and distributed many places. From that actual
situation, this the article finds out about making a distributed database model for land
information system and put forward a solution about technology of synchronic database on
Oracle. The result will be experimented on land information system of Dongnai province.
Keywords: Land information system, distributed database model, Oracle, Dongnai province.
1. ĐẶT VẤN ĐỀ
Trong những năm qua, ngành Tài nguyên và Môi trường không ngừng nổ lực trong việc
xây dựng một hệ thống thông tin hiện đại nhằm đáp ứng các mục tiêu quản lý Nhà nước về
đất đai theo hướng xây dựng Chính phủ điện tử và thực hiện chủ trương kinh tế hóa của
ngành. Kết quả có nhiều hệ thống thông tin đất đai được nhiều đơn vị trong nước nghiên cứu
xây dựng, các hệ thống cơ bản đều được xây dựng và hoàn thiện trên cơ sở luật hiện hành.
Tuy nhiên, các hệ thống thông tin đất đai hiện tại chỉ chú trọng vào việc thiết kế cơ sở dữ liệu
(CSDL) theo mô hình tập trung, trong khi đó công tác quản lý đất đai lại phân cấp quản lý,
cập nhật thông tin. Hơn nữa, CSDL đất đai ngoài các dữ liệu thuộc tính còn có cả dữ liệu
không gian thường được cập nhật chỉnh lý thường xuyên nên với mô hình CSDL tập trung sẽ
gặp rất nhiều khó khăn về vấn đề máy chủ, băng thông đường truyền, tính sẵn sàng của hệ
thống. Do đó, các hệ thống thông tin đất đai hiện nay thường được triển khai độc lập ở các
đơn vị hành chính, CSDL cấp huyện không gắn kết với CSDL cấp tỉnh dẫn đến tình trạ
ng các
kho dữ liệu rời rạc, thiếu đồng bộ lẫn nhau. Để khắc phục những hạn chế này cần phải xây
dựng mô hình CSDL đất đai phù hợp với yêu cầu quản lý của ngành, đồng thời đề xuất giải
pháp về kỹ thuật đồng bộ cơ sơ dữ liệu giữa hai cấp huyện, tỉnh góp phần nâng cao hiệu quả
trong việc ứng dụng công nghệ thông tin trong công tác quản lý nhà nước về đất đai. Trong
phạm vi bài báo này, chúng tôi giới thiệu tổng quản về CSDL phân tán; ứng dụng để xây
dựng mô hình CSDL phân tán cho hệ thống thông tin đất đai cấp tỉnh và đề xuất giải pháp
đồng bộ CSDL trên hệ quản trị CSDL Oracle.
2. TỔNG QUAN VỀ CSDL PHÂN TÁN
2.1. Các khái niệm về CSDL phân tán
CSDL phân tán (Distributed DataBase - DDB) là một tập hợp nhiều CSDL có liên đới
logic và được phân bố trên một mạng máy tính. Trong khái niệm này có hai thuật ngữ quan
trọng trong các định nghĩa này là “liên đới logic” và “phân bố trên một mạng máy tính”.
HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011
34
- Liên đới logic: Toàn bộ dữ liệu của CSDL phân tán có một số các thuộc tính ràng buộc
chúng với nhau, điều này giúp chúng ta có thể phân biệt một CSDL phân tán với một tập hợp
CSDL cục bộ hoặc các tập tin lưu trữ tại các vị trí khác nhau trong một mạng máy tính.
- Phân bố trên một mạng máy tính: Toàn bộ dữ liệu của CSDL phân tán không được lưu
trữ ở một nơi mà lưu trữ trên nhiều trạm thuộc mạng máy tính, điều này giúp chúng ta phân
biệt CSDL phân tán với CSDL tập trung đơn lẻ.
Hệ quản trị CSDL phân tán (Distributed Database Management System D-DBMS)
được định nghĩa là một hệ thống phần mềm cho phép quản lý các hệ CSDL phân tán và làm
cho sự phân tán trở nên “trong suốt” đối với người sử dụng.
Hệ CSDL phân tán (Distributed DataBase System - DDBS) được xây dựng dựa trên hai
công nghệ cơ bản là CSDL và mạng máy tính. Một hệ CSDL phân tán không phải là một “tập
hợp các tập tin” được lưu trữ riêng rẽ tại mỗi nút của một mạng máy tính. Để tạo ra một hệ
CSDL phân tán các tập tin không chỉ có liên đới logic mà chúng còn phải có cấu trúc và được
truy xuất qua một giao diện chung.
Hình 1: Mô hình hệ CSDL phân tán
Hệ CSDL phân tán không thuần nhất: các CSDL cục bộ ở các nơi (Site) không dùng
chung một hệ quản trị CSDL.
Hệ CSDL phân tán thuần nhất: các CSDL cục bộ ở tất cả các nơi (Site) đều dùng
chung một hệ quản trị CSDL. Trong bài báo này chỉ đề cập đến hệ CSDL phân tán thuần
nhất với hệ quản trị CSDL Oracle.
2.2. Kiến trúc cơ bản của CSDL phân tán
Kiến trúc này không biểu diễn tường minh cho mọi hệ
cơ sở dữ liệu phân tán. Tuy
nhiên, với kiến trúc này các mức của CSDLPT được trình bày mang tính khái niệm thích hợp
để dễ hiểu về tổ chức của các cơ sở dữ liệu phân tán nói chung.
HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011
35
- Sơ đồ tổng thể: Định nghĩa tất cả các dữ liệu sẽ được lưu trữ trong CSDL phân tán.
Trong mô hình quan hệ, sơ đồ tổng thể bao gồm định nghĩa của các tập quan hệ tổng thể.
- Sơ đồ phân đoạn: Mỗi quan hệ tổng thể có thể chia thành một vài phần không gối lên
nhau được gọi là đoạn (fragments). Có nhiều cách khác nhau để thực hi
ện việc phân chia này.
Ánh xạ (một - nhiều) giữa sơ đồ tổng thể và các đoạn được định nghĩa trong sơ đồ phân đoạn.
- Sơ đồ định vị: Các đoạn là các phần logic của quan hệ tổng thể được định vị vật lý trên
một hoặc nhiều vị trí trên mạng. Sơ đồ định vị định nghĩa đoạn nào định vị tại các vị trí nào.
Lưu ý rằng kiểu ánh xạ được định nghĩa trong sơ đồ định vị quyết định CSDL phân tán là dư
thừa hay không.
- Sơ đồ ánh xạ địa phương: ánh xạ các ảnh vật lý và các đối tượng được lưu trữ tại một
trạm (tất cả các đoạn của một quan hệ tổng thể trên cùng một vị trí tạo ra một ả
nh vật lý)
Hình 2: Các mức trong suốt phân tán
2.3. Các lý do để sử dụng CSDL phân tán?
- Các tổ chức có cấu trúc phân tán: Trong thực tế có nhiều tổ chức được phân tán khắp
nơi, trong khi đó, dữ liệu quản lý ngày càng lớn và phục vụ cho đa người dùng nằm phân tán,
vì vậy CSDL phân tán là con đường thích hợp với cấu trúc tự nhiên của các tổ chức đó.
- Cần kết nối các CSDL có sẵn: CSDL phân tán là giải pháp tự nhiên khi có các CSDL
đang tồn tại và sự cần thiết xây dựng một ứng dụng toàn cục. Trong trường hợp này CSDL
phân tán được tạo theo tiến trình từ dưới lên dựa trên nền tảng CSDL đang tồn tại. Tiến trình
này đòi hỏi phải tái cấu trúc các CSDL cục bộ ở một mức nhất định.
- Sự lớn mạnh của tổ chức: Các tổ chức có thể phát triển mở rộng bằng cách thành lập
thêm các đơn vị mới, vừa có tính tự trị, vừ
a có quan hệ với các đơn vị tổ chức khác.
- Giảm chi phí truyền thông: Tăng ứng dụng cục bộ làm giảm chi phí truyền thông.
- Nâng cao hiệu suất: Có cơ chế xử lý song song và phân mảnh dữ liệu theo ứng dụng
làm cực đại hóa tính cục bộ của ứng dụng.
HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011
36
-Tăng độ tin cậy và tính sẵn sàng: Nếu có một thành phần nào đó của hệ thống bị hỏng,
hệ thống vẫn có thể duy trì hoạt động.
3. XÂY MÔ HÌNH CSDL PHÂN TÁN CHO HỆ THỐNG THÔNG TIN ĐẤT ĐAI
3.1. Lựa chọn mô hình kiến trúc của hệ quản trị CSDL phân tán
Có nhiều mô hình kiến trúc của hệ CSDL phân tán như: hệ khách/chủ (client/server),
ngang hàng và phức hợp Tuy nhiên, với mô hình hệ phân tán khách/chủ có nhiều ưu điểm
vược trội là xử lý dữ liệu tập trung, phần lớn việc xử lý dữ liệu được thực hiện trên server.
Điều này có nghĩa là tất cả mọi việc xử lý và tối ưu hoá vấn tin, quản lý giao dịch được thực
hiện tại server, trên đường truyền chỉ có các gói tin yêu cầu và kết quả đáp ứng yêu cầu, như
vậy sẽ giảm khối lượng truyền tin trên mạng, tăng tố
c độ xử lý dữ liệu của hệ thống. CSDL
đất đai là một CSDL lớn phức tạp, bao gồm cả dữ liệu không gian và phi không gian nên việc
lựa chọn mô hình kiến trúc của hệ quản trị CSDL phân tán client/server là phù hợp.
Hình 3: Mô hình kiến trúc của hệ quản trị CSDl phân tán client/server
Mô hình chia thành hai lớp: chức năng đại lý (server function) và chức năng khách hàng
(client function). Nó cung cấp kiến trúc hai cấp, tạo dễ dàng cho việc quản lý mức độ phức
tạp của các hệ quản trị CSDL hiện đại và độ phức tạp của việc phân tán dữ liệu.
3.2. Lựa chọn phương pháp phân tán
CSDL đất đai sẽ được lựa chọn phương pháp phân tán partition, nghĩa là việc thực hiện
phân chia bảng dữ liệu của quan hệ tổng thể thành các bảng dữ liệu độc lập nhưng có cấu trúc
giống hệt nhau, sau đó định vị chúng vào các vị trí thích hợp.
Phương pháp partition sử dụng kỹ thuật phân mãnh ngang cơ sở trong quá trình phân
tán dữ liệu. Các CSDL từ xa kết nối và đồng bộ với nhau thông qua databaselink. Mọi thay
đổi CSDL tại các chi nhánh sẽ được đồng bộ về Trung tâm. Như vậy, các chi nhánh thường
đóng vai trò là vị trí chủ và trung tâm là vị trí ảnh. Ngược lại, mọi dữ liệu thay đổi tại Trung
HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011
37
tâm cũng sẽ được đồng bộ về các chi nhánh. Khi đó trung tâm đóng vai trò là vị trí chủ còn
chi nhánh đóng vai trò là vị trí ảnh.
3.3. Xây dựng mô hình CSDL phân tán cho hệ thống thông tin đất đai
CSDL đất đai chứa thông tin chi tiết đến từng thửa đất (bao gồm dữ liệu thuộc tính và
dữ liệu không gian), thông tin này được sử dụng phục vụ quản lý đất đai ở các cấp tỉnh, thành
phố trực thuộc trung ương, cấp huyện, thị xã và cấp xã phường, thị trấn (gọi tắt là cấp tỉnh,
huyện và xã).
Hệ thống CSDL liệu đất đai cấp tỉnh được thiết kế phân mãnh ngang theo đơn vị hành
chính cấp huyện và tổ chức phân tán CSDL ở hai cấp tỉnh, huyện. Mỗi huyện sẽ có một
CSDL chứa toàn bộ dữ liệu thuộc phạm vi của huyện và vận hành độc lập; CSDL cấp huyện
đặt tại Văn phòng Đăng ký quyền sử dụng đất cấp huyện, phục vụ tác nghiệp cho Văn phòng
Đăng ký quyền sử dụng đất, phòng Tài nguyên và Môi trường cấp huyện. CSDL cấp tỉnh
chứa toàn bộ CSDL đất đai các huyện; CSDL cấp tỉnh đặt tại Sở Tài nguyên và Môi trường,
phục vụ tác nghiệp cho Văn phòng Đăng ký quyền sử dụng đất tỉnh, Chi cục Quản lý Đất đai,
Trung tâm Công ngh
ệ thông tin. CSDL cấp tỉnh và huyện phải có cơ chế đồng bộ trực tuyến
hai chiều qua hệ thống mạng WAN.
Cán bộ địa chính cấp phường, xã và nhân dân sẽ thông qua Internet để tra cứu thông tin
đất đai qua hệ thống CSDL cấp tỉnh đặt tại Sở Tài nguyên và Môi trường.
Hình 4: Mô hình CSDL phân tán của hệ thống thông tin đất đai
4. GIẢI PHÁP ĐỒNG BỘ CSDL PHÂN TÁN
Hệ CSDL phân tán có rất nhiều ưu điểm, tuy nhiên một trong những khuyết điểm lớn
nhất là các vấn đề đồng bộ dữ liệu. Việc điều khiển phân tán có thể trở thành một gánh nặng
nếu không có những giải pháp phù hợp để giải quyết vấn đề này.
HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011
38
CSDL đất đai thuộc dạng CSDL lớn, phức tạp, trong đó có cả dữ liệu không gian và
được phân tán ở nhiều nơi với khoản cách địa lý khác nhau. Việc giải quyết bài toán đồng bộ
trước đây thường sử dụng giải pháp trích xuất và nhập liệu một cách thủ công hoặc theo một
số mô đun chuyên biệt phát triển trong phần mềm quản lý đất đai hay có thể sử dụng công cụ
có sẵn của Oracle như Import/export. Tuy nhiên, với giải pháp này thường gây tổn thương
đến CSDL được đồng bộ. Hiện nay có rất nhiều giải pháp đồng bộ CSDL khác nhau được
phát triển từ các hảng phần mềm nổi tiếng như: Streams, Advanced Replication, Advanced
Queues, Golden Gate của Oracle; IBM Websphere MQ của IBM…, mỗi loại điều có những
ưu, nhược điểm riêng. Trong phạm vi bài báo này sẽ giới thiệu kỹ thuật đồng bộ CSDL đất
đai bằ
ng Streams của Oracle.
Streams là giải pháp phù hợp với mô hình CSDL đất đai. CSDL cấp huyện và cấp tỉnh
sẽ đồng bộ trực tuyến với độ trễ có thể nói là thấp nhất. Các CSDL sẽ được đồng bộ hai chiều
lẫn nhau dựa trên DML (Data Manipulation Language), DDL (Data Definition Language)
capture và apply procedure của hệ thống. Nghĩa là mọi thay đổi dữ liệu từ CSDL cấp tỉnh
ngay lập tức sẽ được cập nhật lên CSDL cấp huyện và ngược lại.
Streams cung cấp ba module để thực hiện quá trình đồng bộ gồm: capture, propagation
và apply. Quá trình capture xảy ra ở CSDL dự định sẽ chuyển dữ liệu đồng bộ. Chúng capture
các DML hay DDL query đưa vào một hàng đợi và bộ phận propagation chịu trách nhiệm
chuyển các DML và DDL này đến máy đích. Ở máy đích quá trình tiếp nhận các query từ
propagation cũng được đưa vào một hàng đợi (streams_queue) và từ đây quá trình apply sẽ
thực thi các câu lệnh query trên máy đích. Sau đ
ây là mô hình đồng bộ CSDL bằng công nghệ
Streams do Oracle cung cấp.
Hình 5: Mô hình đồng bộ dữ liệu hai chiều giữa ba CSDL
HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011
39
Việc cấu hình đồng bộ CSDL phân tán sẽ được hướng dẫn cụ thể ở tài liệu “Oracle
Streams Concepts and Administration, 11g Release” do Oracle cung cấp trên website
5. KẾT QUẢ THỰC NGHIỆM TẠI ĐỒNG NAI
Mô hình này đã được ứng dụng triển khai cho hệ thống thông tin đất đai tại Đồng Nai.
Hệ thống này được sở Tài nguyên và Môi trường Đồng Nai phát triển trên nền tảng công nghệ
.NET, với hệ thống CSDL phân tán thuần nhất của Oracle và d
ữ liệu không gian trên công
nghệ của ESRI. Kiến trúc hệ thống hoạt động theo mô hình khách-chủ (Client-Server). Hiện
hệ thống đang được vận hành hiệu quả ở hai cấp: tỉnh (Chi cục Quản lý Đất đai, Văn phòng
Đăng ký quyền sử dụng đất tỉnh, Trung tâm Công nghệ Thông tin), huyện (Văn phòng Đăng
ký quyền sử dụng đất của 11/11 huyện) thông qua 02 hệ thống mạng là mạng LAN và mạng
riêng ảo - MEGA WAN.
Thông qua hệ thống, toàn bộ CSDL quản lý đất đai được thống nhất trên toàn tỉnh góp
phần nâng cao hiệu quả trong công tác quản lý nhà nước về đất đai như: đăng ký cấp giấy
chứng nhận quyền sử dụng đất; cập nhật, chỉnh lý biến động; thống kê, tổng hợp, hỗ trợ ra
quyết định cho các cấp Lãnh đạo
Dưới đây là một vài hình ảnh về hệ thống thông tin đất đai được ứng dụng tại Đồng Nai:
Hình 6: Chức năng đăng nhập hệ thống
Với CSDL phân tán, người sử dụng lựa chọn đăng nhập vào đơn vị hành chính để quản
lý mà không cần biết vị trí vật lý của CSDL. Việc đăng nhập sẽ được tự động thực hiện bởi hệ
thống tại điểm đưa ra yêu cầu của người sử dụng. Việc chuyển đổi của một phần hay toàn bộ
CSDL do thay đổi về Server cũng không
ảnh hưởng tới thao tác người sử dụng.
HỘI THẢO ỨNG DỤNG GIS TOÀN QUỐC 2011
40
Hình 7: Giao diện chính của hệ thống thông tin đất đai
6. KẾT LUẬN
Qua việc nghiên cứu, tìm hiểu về mô hình CSDL phân tán cho thấy đây là giải pháp rất
hiệu quả để tổ chức quản lý và triển khai các hệ thống thông tin lớn, phân tán về địa lý trong
môi trường ứng dụng CNTT. Nghiên cứu mô hình CSDL phân tán nhằm khắc phục những
hạn chế của CSDL tập trung truyền thống. Việc ứng dụng mô hình CSDL phân tán cho hệ
thống thông tin đất đai cấp tỉnh sẽ đem lại hiệu quả thiết thực cho công tác quản lý nhà nước
về đất đai, đặt biệt là vấn đề đồng bộ dữ liệu quản lý giữa các cấp.
Tài liệu tham khảo
[1] Trần Đức Quang, 1999. Nguyên lý các hệ cơ sở dữ liệu phân tán, Tập 1 (Biên dịch từ Principles of
Distributed Database Systems của M. Tamer và Patrick Valduriez), Nxb Thống kê, TP.HCM
[2] Nguyễn Bá Tường, 2004. Nhập môn CSDL phân tán, NXBKH&KT
[3] Randy Urbano, 2007. Oracle Streams Concepts and Administration, 11g Release 1 (11.1).