Tải bản đầy đủ (.doc) (26 trang)

Xây dựng cơ sở dữ liệu phân tán phục vụ thông tin nhanh về nhân sự tại quảng bình (TT)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1020.94 KB, 26 trang )

1
MỞ ĐẦU
1. Tính cấp thiết của đề tài
Về cơ cấu tổ chức, tỉnh Quảng Bình có 159 đơn vị hành chính
cấp xã, 8 huyện, thành phố và 20 sở, ban ngành là các cơ quan hành
chính cấp tỉnh thuộc Ủy ban nhân dân tỉnh quản lý. Sở Nội vụ là cơ
quan chuyên môn, giúp Ủy ban nhân dân tỉnh quản lý cán bộ, công
chức, viên chức toàn tỉnh với 187 đầu mối các cơ quan, ban, ngành.
Việc quản lý nhân sự được bố trí phân tán theo tổ chức và phân cấp
quản lý đa tầng.
Hồ sơ cán bộ, công chức là tài liệu quan trọng có tính pháp lý
phản ánh trung thực về lý lịch của từng cá nhân cán bộ, công chức.
Trên thực tế, công tác quản lý hồ sơ cán bộ, công chức bằng
phương pháp truyền thống (hồ sơ giấy) nói chung và hồ sơ điện tử về
cán bộ, công chức nói riêng thời gian qua chưa được quan tâm, chỉ
đạo để thực hiện một cách đầy đủ và nghiêm túc. Do vậy, khi các cơ
quan Nhà nước có thẩm quyền yêu cầu số liệu để phục vụ cho việc
nghiên cứu hoạch định chính sách đối với đội ngũ cán bộ, công chức
hoặc ra quyết định về nhân sự thì các cơ quan chuyên môn không
cung cấp được hoặc nếu có thì bản thân số liệu đó lại lạc hậu và thiếu
chính xác, không đầy đủ và thường không kịp thời.
Từ thực tế nêu trên, để đáp ứng yêu cầu về tính kịp thời, nâng
cao chất lượng và hiệu quả công cụ quản lý cán bộ, công chức
chính quy và hiện đại, cần thiết xây dựng cơ sở dữ liệu thông tin
về cán bộ, công chức hành chính nhà nước của tỉnh. Vì vậy, đề tài
“Xây dựng cơ sở dữ liệu phân tán phục vụ thông tin nhanh về
nhân sự tại Quảng Bình” được lựa chọn là hướng đi phù hợp với
hệ thống quản lý đa tầng, phức tạp, phải xử lý theo hướng phân
2
tán mới giải quyết được yêu cầu bài toán; đồng thời hỗ trợ thực
hiện cải cách hành chính, hướng tới chính quyền điện tử là vấn đề


tỉnh Quảng Bình đang quan tâm ưu tiên thực hiện trong giai đoạn
hiện nay.
2. Mục tiêu nghiên cứu
Nghiên cứu lý thuyết cơ sở dữ liệu phân tán để xây dựng cơ sở
dữ liệu phân tán giải quyết bài toán đã đặt ra. Tập trung vào hai nội
dung chính: tin học hóa trong công tác quản lý hành chính nhà nước
và trợ giúp thông tin nhanh về nhân sự. Ứng dụng có khả năng kết
nối mạng giữa ba cấp: tỉnh, huyện và xã; có khả năng mở rộng để kết
nối với cơ sở dữ liệu Trung ương trong tương lai.
3. Đối tượng và phạm vi nghiên cứu
3.1. Đối tượng nghiên cứu
- Lý thuyết hệ tin học phân tán; cơ sở dữ liệu phân tán.
- Các công cụ, công nghệ được sử dụng để xây dựng cơ sở dữ
liệu phân tán theo mô hình giải pháp đã lựu chọn.
- Hồ sơ cán bộ, công chức, viên chức tỉnh Quảng Bình.
3.2. Phạm vi nghiên cứu
- Quy trình quản lý hồ sơ cán bộ, công chức; các văn bản quy
phạm pháp luật về quản lý hồ sơ cán bộ, công chức hiện hành.
- Thiết kế, phân mảnh cơ sở dữ liệu và cấp phát các mảnh;
điều khiển đồng thời phân tán.
4. Phương pháp nghiên cứu
- Nghiên cứu lý thuyết
- Nghiên cứu thực nghiệm
5. Bố cục luận văn
Luận văn gồm có 3 chương, gồm:
Chương 1. Tổng quan về cơ sở dữ liệu phân tán
3
Chương 2. Phân tích, thiết kế cơ sở dữ liệu phân tán phục vụ
thông tin nhanh về nhân sự tại Quảng Bình
Chương 3. Xây dựng chương trình phân tán phục vụ thông tin

nhanh về nhân sự tại Quảng Bình
6. Tổng quan tài liệu nghiên cứu
- Quy định hiện hiện hành của Nhà nước về quản lý cán bộ,
công chức, viên chức và tình hình thực tế của địa phương;
- Hệ tin học phân phân tán; nguyên lý hệ CSDL phân tán
- Ngôn ngữ lập trình Java và JSP
- Hệ quản trị cơ sở dữ liệu MySQL
CHƯƠNG 1
TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU PHÂN TÁN
Hệ cơ sở dữ liệu phân tán phục vụ thông tin nhanh về nhân sự
tại Quảng Bình là hệ thống hợp nhất quản lý từ cấp tỉnh đến tất cả
các xã trực thuộc huyện, do dó cơ sở dữ liệu phục vụ quản lý phải
hợp nhất và là tài nguyên dùng chung để khai thác hiệu quả về công
tác quản lý nhân sự.
Hệ thống có sự phân cấp khác nhau nhằm mục đích quản lý,
tra cứu, thống kê và cập nhật thông tin một cách nhanh chóng, hiệu
quả. Trên cơ sở đó, hệ quản lý phân cấp thành 3 cụm Server khác
nhau và phân tán trên phạm vi địa lý khác nhau. Cụm thứ nhất quản
lý nhân sự cấp sở, ban ngành tương đương trực thuộc tỉnh. Cụm thứ
hai quản lý nhân sự cấp huyện, chủ yếu quản lý nhân sự các phòng
trực thuộc huyện. Cụm thứ ba quản lý nhân sự cấp xã, công tác quản
lý tập trung là các cán bộ có chức danh thuộc xã.
Việc phân tán cơ sở dữ liệu và chương trình trên hệ thống 3
cụm Server khác nhau buộc phải có sự phân tích, thiết kế và vận
4
hành hệ đảm bảo tính hoạt động ổn định và gắn bó trên hệ. Bên cạnh
đó, công tác quản lý các luồng dữ liệu khai thác dùng chung là yếu tố
sống còn của hệ, như vậy ta có thể phân chia hệ thành hai thành phần
cơ bản là mạng máy tính và CSDL phân tán.
1.1. MẠNG MÁY TÍNH

- Là tập các máy tính tự vận hành, được kết nối lại và có khả
năng trao đổi thông tin giữa chúng.
- Các máy tính trên một mạng thường được gọi là các nút hay
các trạm, chúng tạo ra các phần cứng cơ bản của mạng và được kết
nối lại với nhau bởi một đường truyền.
- Lựa chọn hình thức phân tán là yêu tố quan trọng để xây
dựng hệ thống phù hợp với từng yêu cầu và chức năng của các ứng
dụng khác nhau; đối với hệ phục vụ thông tin nhanh về nhân sự tại
Quảng Bình, phương pháp phân tán lựa chọn là phân tán không đồng
nhất, dữ liệu được phân mảnh dọc và bố trí trên các cụm Server khác
nhau. Dữ liệu phân mảnh dựa trên nền tảng của CSDL phân tán cho
phép dữ liệu được cập nhật trên 1 cụm Server lập tức sẽ cập nhật trên
các cụm còn lại nếu được phân quyền và ở Server cấp cao hơn.
1.2. CƠ SỞ DỮ LIỆU PHÂN TÁN
1.2.1. Các khái niệm
cơ bản về cơ sở dữ liệu
phân tán
Một CSDL phân tán
là một tập hợp nhiều cơ sở
dữ liệu có liên đới logic và
được phân bố trên một mạng máy tính theo Hình 1.2.
Mỗi vị trí có quyền tự quản cơ sở dữ liệu cục bộ của mình và
Hình 1.2. Môi trường hệ CSDL phân tán
5
thực thi các ứng dụng cục bộ. Mỗi vị trí cũng phải tham gia vào việc
thực thi ít nhất một ứng dụng toàn cục mà yêu cầu truy xuất dữ liệu
tại nhiều vị trí qua mạng.
Định nghĩa này nhấn mạnh hai khía cạnh quan trọng của cơ sở
dữ liệu phân tán:
- Tính phân tán: Dữ liệu thực tế không cư trú ở cùng một vị trí;

- Sự tương quan logic: Các dữ liệu có một số tính chất ràng
buộc lẫn nhau.
Đối với hệ thống phục vụ thông tin nhanh về nhân sự tại
Quảng Bình có các đặc điểm về xử lý tại các cụm Server:
Cụm Server cấp xã: nhập liệu cán bộ, xử lý thông tin về cá
nhân, thống kê chuyển một phần thông tin về cán bộ mới cập nhật
lên cụm Server cấp huyện.
Cụm Server cấp huyện: nhập liệu cán bộ, xử lý thông tin về cá
nhân, thống kê chuyển một phần thông tin về cán bộ mới cập nhật
lên cụm Server cấp sở.
Cụm Server cấp sở, ban ngành và tương đương: nhập liệu cán
bộ, xử lý thông tin về cá nhân, thống kê thông tin về cán bộ, việc cập
nhật chỉ tiến hành cục bộ.
1.2.2. Hệ quản trị cơ sở dữ liệu phân tán (DDBMS)
Hệ quản trị cơ sở dữ liệu phân tán là hệ thống phần mềm cho
phép quản lý các hệ cơ sở dữ liệu phân tán và làm cho việc phân tán
trở nên trong suốt đối với người sử dụng.
6
Các thành phần nhất thiết của DDBMS thông tin nhanh về
nhân sự tại Quảng
Bình:
- Quản trị dữ
liệu: QTDL
- Truyền
thông dữ liệu:
TTDL
- Từ điển dữ
liệu: TDDL dùng để
mô tả thông tin về
sự phân tán của dữ

liệu trên mạng.
- Cơ sở dữ liệu phân tán: CSDLPT
- Người sử dụng: NSD
Theo hình 1.3, người sử dụng tác động đến truyền thông dữ
liệu để yêu cầu nguồn thông tin mà mình mong muốn, các hoạt động
bên trong hệ thống người dùng không quan tâm đến hay cần biết hiện
nguồn dữ liệu đang nằm ở vị trí nào. Các kết nối để lựa chọn dữ liệu
trên các cụm Server khác được thực hiện dựa trên thành phần là cơ
sở dữ liệu phân tán.
1.2.3. Các điểm đặc trưng của cơ sở dữ liệu phân tán
- Cấu trúc điều khiển
phân
cấp: quản trị cơ sở dữ
liệu
toàn cục và quản trị cơ sở
dữ
liệu cục bộ phân
tán.
- Tính chất độc lập dữ liệu như trong cơ sở dữ liệu tập trung;
bổ sung tính chất trong suốt phân tán; tính đúng đắn của các chương
Hình 1.3. Các thành phần của CSDL
phân tán thông tin nhanh về nhân sự
tại Quảng Bình
7
trình ứng dụng không bị ảnh huởng bởi sự di chuyển dữ liệu từ vị trí
này đến vị trí khác.
- Dư thừa dữ liệu: Giảm thiểu dư thừa dữ liệu đảm bảo tính
gắn bó; Nhân bản dữ liệu giúp việc thực thi các ứng dụng không
dừng nếu có một địa điểm bị hỏng. Tuy nhiên vấn đề quản lý gắn bó
dữ liệu sẽ phức tạp hơn.

- Các cấu trúc vật lý phức tạp giúp liên lạc dữ liệu trong cơ sở
dữ liệu phân tán.
- Tính toàn vẹn, phục hồi, đồng thời dựa vào giao dịch phân
tán.
Việc chọn lựa CSDL phân tán sẽ thích hợp đối với các ứng
dụng phát triển trong một hệ thống mạng diện rộng do cải tiến hiệu
năng, giảm tranh chấp và giảm chi phí truyền bằng cách phân mảnh
và phân tán dữ liệu hợp lý. Đối với trường hợp xây dựng hệ thống
phục vụ thông tin nhanh về nhân sự tại Quảng Bình, việc lựa chọn
CSDL phân mảnh dọc là bài toán tối ưu cho ứng dụng quản lý, tra
cứu và thống kê nhân sự tại tỉnh và đảm bảo hiệu năng khai thác sử
dụng và giảm chi phí truyền.
1.2.4. Kiến trúc tham chiếu của cơ sở dữ liệu phân tán
Kiến trúc tham chiếu không được cài đặt rõ ràng trên tất
cả cơ sở dữ
liệu
phân tán, tuy nhiên các mức của nó được khái
quát chính xác, thích hợp để mô tả
tổ
chức chung cho mọi hệ cơ sở
dữ liệu phân tán
.
- Lược đồ toàn cục: Mô tả tổng thể và thống nhất chung nhất
của tất cả dữ liệu của cơ sở dữ liệu phân tán độc lập với môi trường
phân tán.
- Lược đồ phân mảnh: Mỗi quan hệ toàn cục có thể được chia
thành các thành phần không trùng nhau được gọi là các phân mảnh.
8
Lược đồ phân mảnh định nghĩa ánh xạ giữa các quan hệ toàn cục và
các phân mảnh.

- Lược đồ cấp
phát: Các mảnh là các
thành phần logic của
các quan hệ toàn cục,
được lưu trữ vật lý tại
một hay một số vị trí.
Tất cả các mảnh tương
ứng với cùng một quan
hệ toàn cục R và được
lưu trữ tại vị trí j tạo
thành ảnh vật lý của
quan hệ R tại vị trí j. Kí
hiệu R
j
chỉ ảnh vật lý
của quan hệ toàn cục R
tại vị trí j.
- Lược đồ ánh xạ cục bộ: Ánh xạ các hình ảnh vật lý tới các
đối tượng được thao tác bởi các hệ quản trị cơ sở dữ liệu cục bộ.
Trong hệ không thuần nhất ta có các kiểu ánh xạ cục bộ khác nhau
tại các vị trí khác nhau.
Ba đối tượng quan trọng nhất của kiến trúc này là sự tách biệt
giữa sự phân mảnh dữ liệu và sự cục bộ hóa dữ liệu, điều khiển dư
thừa dữ liệu và tính độc lập ở các hệ quản trị cơ sở dữ liệu cục bộ.
Hình 1.4. Kiến trúc tham chiếu
của cơ sở dữ liệu phân tán
9
1.2.5. Các loại truy xuất CSDL phân tán
a. Truy xuất từ xa thông qua các tác vụ cơ bản
b. Truy xuất từ xa thông qua chương trình phụ trợ

1.3. CÁC MỨC TRONG SUỐT CỦA CSDL PHÂN TÁN
1.3.1. Khái niệm tính trong suốt
1.3.2. Một số khía cạnh điển hình của tính trong suốt
1.4. PHÂN MẢNH VÀ CẤP PHÁT DỮ LIỆU
1.4.1. Phân mảnh dữ liệu
a. Lý do phân mảnh
- Các ứng dụng chỉ yêu cầu thao tác trên các tập con của các
quan hệ, là khung nhìn dữ liệu của người sử dụng.
- Phân rã một quan hệ thành nhiều mảnh, mỗi mảnh được xử
lý như một đơn vị dữ liệu cho phép thực hiện nhiều giao dịch đồng
thời. Phân mảnh các quan hệ cũng cho phép thực hiện song song một
câu truy vấn bằng cách chia nó thành một tập các câu truy vấn con
hoạt tác trên các mảnh. Vì thế việc phân mảnh sẽ làm tăng mức độ
hoạt động đồng thời và tăng lưu lượng hoạt động của hệ thống.
Đối với hệ thống phục vụ thông tin nhanh về nhân sự tại
Quảng Bình, dữ liệu được phân rã và phân tán trên 3 cụm Server
khác nhau và với mức độ yêu cầu tính chất về tra cứu, thống kê
thông tin đối với bài toán quản lý nhân sự được đặt ra tại tỉnh thì hệ
thống phân mảnh dọc là thích hợp nhất với điều kiện hiện nay. Với
nhu cầu phát triển thì hệ thống có thể sử dụng phương pháp phân
mảnh lai sẽ mang lại hiệu quả cao hơn trong việc xây dựng ứng dụng
và CSDL phân tán. Giải pháp của bài toán là lựa chọn phân mảnh
dọc, do đó các phương pháp phân tích, thiết kế tập trung vào phân
mảnh này sẽ được trình bày trong Chương 2.
10
b. Các quy tắc phân mảnh
Các nguyên tắc để đảm bảo cơ sở dữ liệu khi phân mảnh sẽ
đảm bảo tính không thay đổi về ngữ nghĩa. Ba qui tắc phải tuân thủ
khi phân mảnh cơ sở dữ liệu quan hệ:
Tính đầy đủ

Quan hệ R được phân rã thành các mảnh R
1
, R
2,
…, R
n
, thì mỗi
mục dữ liệu có trong quan hệ R sẽ được chứa trong ít nhất một mảnh
R
i
(i=1, , n).
Tính phục hồi
Nếu một quan hệ R được phân rã thành các mảnh R
1
, R
2
,…, R
n
khi đó: R=∇R
i
, ∀ R
i
∈ F
R
. Toán tử ∇ thay đổi tùy theo từng loại
phân mảnh. Khả năng phục hồi quan hệ từ các mảnh sẽ đảm bảo bảo
toàn các phụ thuộc.
Tính tách biệt
Nếu quan hệ R được phân rã ngang thành các mảnh R
i

, i =
1, ,n và mục dữ liệu dj nằm trong một mảnh R
j
thì nó sẽ không nằm
trong mảnh R
k
, (k≠j).
c. Mức độ phân mảnh
d. Các phương pháp phân mảnh
Phân mảnh ngang
Phân mảnh dọc
Phân mảnh dọc quan hệ R sinh ra các mảnh R
1
, R
2
, , R
r
, sao
cho mỗi mảnh chứa một tập con các thuộc tính của quan hệ R và
khoá của nó. Mục đích của phân mảnh dọc là phân chia quan hệ R
thành tập các quan hệ nhỏ hơn để nhiều ứng dụng có thể chỉ cần thực
hiện trên một mảnh. Mảnh tối ưu là mảnh sinh ra một lược đồ phân
mảnh cho phép giảm tối thiểu thời gian thực hiện của ứng dụng trên
mảnh đó.
11
Để có được các lời giải tối ưu cho bài toán phân mảnh dọc,
phải sử dụng hai phương pháp khám phá (Heuristic) cho phân mảnh
dọc các quan hệ toàn cục:
(1). Nhóm thuộc tính: bắt đầu gán mỗi thuộc tính cho một
mảnh và trong mỗi bước, nối một số mảnh lại với nhau cho đến khi

thỏa điều kiện.
(2). Tách mảnh: bắt đầu bằng một quan hệ và quyết định cách
phân chia dựa trên hành vi truy nhập của các ứng dụng trên các thuộc
tính.
Kỹ thuật tách mảnh thích hợp với phương pháp thiết kế từ trên
xuống. Các mảnh không gối chồng lấn lên nhau (không phải là khoá
chính). Trong các hệ CSDL phân tán, các mảnh không gối chồng lên
nhau được quan tâm, nghiên cứu.
1.4.2. Cấp phát tài nguyên
a. Phát biểu Bài toán cấp phát tài nguyên
b. Thông tin cần thiết cho bài toán cấp phát
c. Mô hình cấp phát
2.5. GIAO DỊCH
2.5.1. Định nghĩa giao dịch
a. Tính chất của giao dịch
b. Phân loại giao dịch
12
CHƯƠNG 2
PHÂN TÍCH, THIẾT KẾ CƠ SỞ DỮ LIỆU PHÂN TÁN PHỤC
VỤ THÔNG TIN NHANH VỀ NHÂN SỰ TẠI QUẢNG BÌNH
2.1. MÔ TẢ YÊU CẦU
2.1.1. Các căn cứ pháp lý về quản lý nhân sự
2.1.2. Cơ cấu tổ chức các cơ quan hành chính nhà nước
Tỉnh Quảng Bình hiện có 20 sở, ban, ngành cấp tỉnh và 08
huyện, thành phố. Mỗi cơ quan cấp tỉnh có từ 05 đến 32 phòng
trực thuộc; Mỗi huyện, thành phố có 13 phòng trực thuộc và có
từ 15 đến 30 xã.

Hình 2.1. Cơ cấu tổ chức bộ máy các cơ quan HC Quảng Bình
2.1.3. Các đối tượng tham gia vào hệ thống

Các đối tượng tham gia sử dụng gồm: Sở Nội vụ; Các sở, ban,
ngành thuộc Ủy ban nhân dân tỉnh; Phòng Nội vụ các huyện, thành
phố; Ủy ban nhân dân cấp xã.
CSDL phân tán về nhân sự tỉnh Quảng Bình được sử dụng
trong khối cơ quan hành chính nhà nước. Hồ sơ cán bộ, công chức
mỗi cơ quan, đơn vị là một cơ sở dữ liệu cục bộ.
Mỗi cơ quan (các sở, ngành, UBND cấp huyện) có quyền truy
vấn thông tin của toàn bộ cán bộ, công chức của đơn vị mình; đồng
Cấp
huyện:
08 UBND
huyện, Thành phố
Cấp
tỉnh:
20
sở, ban,
ngành
Tỉnh Quảng
Bình
Cấp xã:
159 UBND
xã, phường, thị trấn
13
thời các cơ quan chuyên môn cấp trên có thể truy vấn (xem) một số
thông tin của nhân sự cùng chuyên ngành dọc theo phân cấp quản lý:
- Các sở: Truy vấn cập nhật thông tin của cơ quan mình; xem
được thông tin của nhân sự cùng chuyên ngành quản lý từ tỉnh đến
xã.
- Các huyện: Truy vấn cập nhật thông tin của toàn huyện (bao
gồm cả của các xã); xem thông tin của toàn huyện mình.

- Các xã truy vấn xem thông tin về cán bộ, công chức của xã
mình.
2.1.4. Yêu cầu về các chức năng của hệ thống
2.1.5. Hệ thống mã hóa thông tin phục vụ xây dựng
chương trình phân tán phục vụ thông tin nhanh về nhân sự
a. Mã đặc trưng cho hệ thống tổ chức nhân sự
Bảng 2.2. Dạng mã hóa sở ban ngành tương đương,
huyện, xã trực thuộc
Cấp độ mã hóa
Dạng
ký tự
Dạng

Số
lượng
Ghi chú
Sở, ban ngành
tương đương
S 01 2
Huyện H 3 1
Xã X 3 06 2 H + STT (X)
Bảng 2.6. Dạng mã hóa phòng trực thuộc sở ban ngành
tương đương hoặc huyện
Cấp độ
mã hóa
Dạng
ký tự
Dạng mã
Số
lượng

Ghi
chú
Phòng trực
thuộc sở, ban
ngành tương
đương
S H X P 01 0 00 07 7
H=0 &
X=00
Phòng trực S H X P 00 3 00 12 7 S=0 &
14
thuộc huyện X=00
15
Bảng 2.8. Dạng mã hóa chức danh cán bộ, công chức cấp xã
Cấp độ
mã hóa
Dạng ký tự Dạng mã
Số
lượng
Ghi
chú
Chức danh cán
bộ, công chức
cấp xã
S H X P CD 00 2 05 00 05
9
S=00
&
P=00
Bảng 2.10. Dạng mã hóa nhân sự

Cấp độ
mã hóa
Dạng ký tự Dạng mã Số
lượng
Cán bộ CC
hoặc VC
S H X P CD CB 08 0 00 01 00 001
12
b. Cơ chế phân quyền quản lý đối với quản lý nhân sự
2.2. THIẾT KẾ CƠ SỞ DỮ LIỆU PHÂN TÁN
2.2.1. Mô hình tổng quát trong thiết kế CSDL phân tán
Có ba kiểu thiết kế CSDL phân tán trên mạng máy tính:
- Các bản sao: CSDL được sao chép thành nhiều bản và
lưu trữ trên các vị trí phân tán khác nhau của mạng máy tính.
- Phân mảnh: CSDL được phân thành nhiều mảnh theo kỹ
thuật phân mảnh dọc hoặc phân mảnh ngang, các mảnh được lưu
trữ trên các vị trí khác nhau.
- Mô hình kết hợp các bản sao và phân mảnh. Trên một số
vị trí chứa các bản sao, một số vị trí khác chứa các mảnh.
16
Với mô tả yêu cầu nêu trên, ứng dụng chọn kiểu thiết kế cơ sở
dữ liệu kết hợp các bản sao và phân mảnh, sử dụng kỹ thuật phân
mảnh dọc. - Theo Hình 2.2, hệ thống được chia thành 3 cụm cơ bản,
do đó mỗi cụm có sự phân cấp quản lý và các chức năng riêng khi
phân tán CSDL và chương trình. Đối với cụm các xã, người dùng chỉ
được truy cập CSDL cán bộ ở xã của mình, không thể truy xuất được
thông tin các xã khác. Đối với việc quản lý ở cấp huyện, ngoài việc
truy xuất thông tin cán bộ của đơn vị mình, có thể xem được cán bộ
cấp xã theo thẩm quyền quản lý.
- Với việc phân chia, phân cấp như trên, môi trường thực hiện

hệ thống dựa trên kết nối mạng WAN và giao thức TCP nhằm đảm
bảo kết nối giữa các cụm; bên cạnh đó, để dễ dàng đối với người
dùng trên các thiết bị đầu cuối, công nghệ sử dụng là công nghệ
Web.
Hình 2.2. Mô hình phân cấp quản lý
17
2.2.2. Phân mảnh dữ liệu
2.2.3. Cấp phát
2.2.4. Xác định vị trí đặt CSDL và phân nhóm người dùng
Trên cơ sở các tiêu chuẩn đã nêu và tính chất của hệ thống
thông tin quản lý, mô hình cấp phát dữ liệu phân tán theo hai nhóm
chính như sau:
Cơ sở dữ liệu địa phương (Cụm server 1): là nhóm cập nhật
thông tin vào cơ sở dữ liệu, đặt tại vị trí nhóm làm việc.
Cơ sở dữ liệu truy xuất từ xa (Cụm server 2, Cụm server 3):
Đặt tại các phân cụm khác nhau. Nếu có một yêu cầu cấp phát tài
nguyên, ngoài truy xuất cục bộ, các yêu cầu này được gửi đến CSDL
từ xa sau đó nhận các hồi đáp và tái cấu trúc mảnh.
Sơ đồ kết nối thông tin giữa các cụm cơ sở dữ liệu theo mô tả
ở Hình 2.6.
Hình 2.6. Mô hình cấp phát dữ liệu phân tán
18
19
2.3. XỬ LÝ TRUY VẤN TRONG CSDL PHÂN TÁN
2.3.1. Khái niệm truy vấn
Truy vấn là một biểu thức được biểu diễn bằng một ngôn ngữ
thích hợp và dùng để xác định một phần dữ liệu được chứa trong cơ
sở dữ liệu.
Truy vấn phân tán là một chuỗi các thao tác dữ liệu được thực
hiện trên các mảnh quan hệ phân rã.

2.3.2. Các tầng của quá trình xử lý truy vấn phân tán Đầu vào
là một câu truy vấn trên dữ liệu phân tán được xác định dưới dạng
các phép tính quan hệ. Câu truy vấn phân tán được đặt trên các quan
hệ toàn cục. Bốn tầng lược đồ ánh xạ truy vấn phân tán thành một
chuỗi các thao tác cục bộ được tối ưu hoá, hoạt động trên cơ sở dữ
Hình 2.7. Lược đồ phân tầng tổng quát để xử lý truy vấn
phân tán
20
liệu cục bộ. Chức năng các tầng bao gồm: phân rã truy vấn, cục bộ
hoá dữ liệu, tối ưu hoá truy vấn toàn cục và tối ưu hoá truy vấn cục
bộ.
Chức năng của ba tầng đầu tiên được thực hiện tại một vị trí
tập trung và sử dụng các thông tin toàn cục còn chức năng của tầng
thứ tư được thực hiện ở vị trí cục bộ.
a. Phân rã truy vấn
b. Cục bộ hóa dữ liệu
c. Tối ưu hoá truy vấn toàn cục
d. Tối ưu hoá truy vấn cục bộ
2.4. KIỂM SOÁT TÍNH TOÀN VẸN NGỮ NGHĨA
Vấn đề quan trọng và khó khăn cho một hệ cơ sở dữ liệu là
bảo đảm được tính gắn bó CSDL. Một trạng thái CSDL được gọi là
gắn bó nếu nó thỏa một tập các ràng buộc, được gọi là ràng buộc
toàn vẹn ngữ nghĩa.
Kiểm soát toàn vẹn ngữ nghĩa bảo đảm được tính gắn bó của
CSDL bằng cách loại bỏ hoặc hoá giải các quá trình cập nhật làm
cho CSDL không gắn bó. Cơ sở dữ liệu đã cập nhật nghĩa là đã thỏa
tập các ràng buộc toàn vẹn.
2.4.1. Kiểm soát toàn vẹn ngữ nghĩa tập trung
a. Các loại ràng buộc toàn vẹn
b. Cưỡng chế thực thi ràng buộc

2.4.2. Kiểm soát toàn vẹn ngữ nghĩa phân tán
a. Định nghĩa các phán đoán toàn vẹn phân tán
b. Cưỡng chế thi hành các phán đoán toàn vẹn phân tán
2.4.3. So sánh việc kiểm soát toàn vẹn ngữ nghĩa tập trung
và phân tán
21
CHƯƠNG 3
XÂY DỰNG CHƯƠNG TRÌNH PHÂN TÁN PHỤC VỤ
THÔNG TIN NHANH VỀ NHÂN SỰ TẠI QUẢNG BÌNH
2.1. MÔ HÌNH CHỨC NĂNG CỦA HỆ THỐNG
2.1.1. Biểu đồ phân cấp chức năng
Hình 3.1.
Biểu đồ phân cấp chức năng
Biểu đồ phân cấp chức năng về CSDL theo mô tả trong Hình
3.1 thể hiện quá trình tác động của người dùng lên CSDL với các
chức năng cơ bản như: cập nhật CSDL, tìm kiếm, thống kê, …
2.1.2. Biểu đồ luồng dữ liệu
Hình 3.2. Biểu đồ luồng dữ liệu
mức ngữ cảnh
Quản lý
nhân sự
22
Hình 3.3. Biểu đồ luồng dữ liệu mức đỉnh
2.2. TỐI ƯU HÓA TRUY VẤN PHÂN TÁN
2.2.1. Hàm chi phí
2.2.2. Số liệu thống kê cơ sở dữ liệu
2.3. Lực lượng của các kết quả trung gian
2.3. THUẬT TOÁN TỐI ƯU HÓA TRUY VẤN PHÂN TÁN
SYSTEM R*
2.4. ĐIỀU KHIỂN ĐỒNG THỜI PHÂN TÁN

Điều khiển đồng thời giải quyết các tính chất biệt lập và
gắn bó của giao dịch khi tiến hành cập nhật thông tin từ cụm
Server xã lên cụm Server huyện và cụm Server sở, ban ngành
tương đương. Cơ chế điều khiển đồng thời phân tán của một hệ
DDBMS bảo đảm tính gắn bó của một cơ sở dữ liệu sẽ được duy
trì trong môi trường phân tán.
2.4.1. Phân loại các cơ chế điều khiển đồng thời
2.4.2. Điều khiển đồng thời bằng khóa chốt
a. Thuật toán khoá 2 pha tập trung (C2PL)
b. Thuật toán khoá 2 pha phân tán (D2PL)
2.4.3. Thuật toán điều khiển đồng thời bằng dấu
a. Thuật toán thứ tự timestamp cơ bản
(
1) Cập nhật
d
ữ liệu
(
2) Tìm
kiếm
(
3) Báo cáo
thống kê
23
b. Thuật toán thứ tự timestamp bảo lưu
c. Thuật toán thứ tự timestamp đa phiên bản
2.4.4. Quản lý khóa gài
a. Ngăn chặn khóa gài
b. Phòng tránh khóa gài
c.
Phát hiện và giải tỏa khóa gài

2.5. KIẾN TRÚC CHƯƠNG TRÌNH ỨNG DỤNG
2.5.1. Kiến trúc chương trình
Trong hệ thống chương trình phân chia thành 3 cụm quản lý
khác nhau: cụm sở, ban ngành tương đương; cụm huyện và cụm xã.
Kiến trúc chương trình thể hiện qua Hình 3.10, các thành phần
nằm trong thể hiện các chức năng phục vụ ở đầu cuối đối với người
sử dụng. Thành phần nằm trong  là hệ thống giám sát, ở đây hệ
thống mới chỉ phát triển ở mức giám sát CSDL để đảm bảo tính gắn
bó và tính trong suốt của hệ phân tán như đã đề cập ở chương 1.
Thành phần quan trọng nhất nằm trong , tại đây các vấn đề phân
tích, thiết kế và triển khai hệ tổng hợp tất cả các nguyên lý và các
thuật toán đã được mô tả trong chương 1 và 2 được áp dụng để xây
24
dựng hệ; các vấn đề về phân tán CSDL và chương trình mà người
dùng không nhìn thấy được.
Theo Hình 3.10 chức năng người sử dụng bao gồm cập
nhật, tìm kiếm và thống kê nhân sự phục vụ công tác thông tin
nhanh. Đối với hệ thống người sử dụng ở , chức năng lấy
thông tin cung cấp dịch vụ,
để lấy các thông tin cơ bản và cần thiết
để cung cấp cho người sử dụng theo mô tả phân tán dữ liệu trên các
cụm Server.
Việc phân tán dữ liệu và cập nhật mảnh thể hiện qua
Hình 3.11, CSDLPT trên cụm
3 đặc trưng cho dữ liệu ở cấp
xã, tương ứng cụm 2 cấp
huyện và cụm 1 cấp sở, ban
ngành tương đương. Một dữ
liệu ở cụm 3 được chèn vào
cụm 3 ngay lập tức sẽ cập nhật

mảnh của mình ở cụm 2 và 1,
cụm 2 khi chèn dữ liệu vào chỉ cập nhật ở cụm 1. Như vậy,
cụm 1 sẽ không thực hiện cập nhật phân mảnh ở các cụm
khác mà chỉ cập nhật cục bộ.2.5.2. Các chức năng của
chương trình
a. Chức năng đăng nhập
b. Cập nhật thông tin nhân sự
c. Chức năng tra cứu nhân sự
d. Chức năng thuyên chuyển công tác
e. Hệ thống giám sát CSDL phân tán
2.6. CÀI ĐẶT VÀ THỬ NGHIỆM

Hình 3.11. Mô hình phân tán
và cập nhật mảnh
trên các cụm Server
25
KẾT LUẬN VÀ KIẾN NGHỊ
1. Kết quả đạt được
Đề tài “Xây dựng cơ sở dữ liệu phân tán phục vụ thông tin
nhanh về nhân sự tại Quảng Bình” là một trong những đề tài mang
tính chất khoa học, tiếp cận cơ sở lý thuyết về hệ tin học phân tán nói
chung và hệ cơ sở dữ liệu phân tán nói riêng. Đây là một trong
những lĩnh vực tri thức vừa mang tính chất cơ sở, vừa mang tính tiên
tiến của chuyên ngành công nghệ thông tin. Qua quá trình nghiên
cứu trong đề tài rút ra các kết luận sau:
1) Về mặt nghiệp vụ, đề tài tìm hiểu, đặc tả và phân tích các
yêu cầu trong quản lý nhân sự, đặc thù quản lý nhân sự tỉnh
Quảng Bình giúp cho việc chuyên môn hóa, tin học hóa công
tác quản lý.
2) Dựa trên các yêu cầu và cách thức quản lý xây dựng mô hình

giải pháp tổng quát và cơ sở dữ liệu phân tán phục vụ công
tác quản lý hồ sơ cán bộ công chức, viên chức tỉnh Quảng
Bình, giải quyết vấn đề bất cập, thiếu khoa học trong công
tác quản lý hồ sơ cán bộ trong ngành Nội vụ nói chung và
của tỉnh Quảng Bình nói riêng, góp phần nâng cao chất
lượng và hiệu quả công tác quản lý cán bộ viên chức, công
chức chính quy và hiện đại; khắc phục những hạn chế, bất
cập trong công tác quản lý hồ sơ hiện nay trong các cơ quan
hành chính nhà nước tỉnh Quảng Bình.
3) Nghiên cứu, phân tích và thiết kế cơ sở dữ liệu phân tán, tập
trung vào giải pháp phân mảnh dọc, các chi phí, tối ưu hóa
trong hệ thống đồng thời đảm bảo tính trong suốt mà một hệ
cơ sở dữ liệu phân tán phải đạt được.

×