TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
KHOA CÔNG NGHỆ THÔNG TIN
─────── * ───────
ĐỒ ÁN
TỐT NGHIỆP ĐẠI HỌC
NGÀNH CÔNG NGHỆ THÔNG TIN
Đề tài:
MÔ HÌNH CƠ SỞ DỮ LIỆU PHÂN TÁN
VÀ ỨNG DỤNG
Sinh viên thực hiện: Trần Minh Tuấn
Lớp: CNPM - K48
Giáo viên hướng dẫn: ThS. Thạc Bình Cường
Hà Nội 6-2008
PHIẾU GIAO NHIỆM VỤ ĐỒ ÁN TỐT NGHIỆP
1. Mục đích nội dung của ĐATN
- Nghiên cứu về Cơ sở dữ liệu phân tán
- Tìm hiểu về hệ Cơ sở dữ liệu quốc gia về Kinh tế - Xã hội
- Tìm hiểu khả năng áp dụng mô hình cơ sở dữ liệu phân tán vào hệ Cơ sở dữ liệu
quốc gia về Kinh tế- Xã hội
2. Các nhiệm vụ cụ thể của ĐATN
- Tìm hiểu lý thuyết về Cơ sở dữ liệu phân tán
- Khảo sát, tìm hiểu về hệ Cơ sở dữ liệu quốc gia về Kinh tế -Xã hội
- Tìm hiểu công nghệ áp dụng để thực hiện nhân bản dữ liệu
- Viết chương trình ứng dụng minh họa
3. Lời cam đoan của sinh viên:
Tôi – Trần Minh Tuấn - cam kết ĐATN là công trình nghiên cứu của bản thân tôi
dưới sự hướng dẫn của ThS. Thạc Bình Cường.
Các kết quả nêu trong ĐATN là trung thực, không phải là sao chép toàn văn của bất
kỳ công trình nào khác.
Hà Nội, ngày 23 tháng 5 năm 2008
Tác giả ĐATN
Trần Minh Tuấn
4. Xác nhận của giáo viên hướng dẫn về mức độ hoàn thành của ĐATN và cho phép bảo
vệ:
Hà Nội, ngày 23 tháng 5 năm 2008
Giáo viên hướng dẫn
ThS. Thạc Bình Cường
TÓM TẮT NỘI DUNG ĐỒ ÁN TỐT NGHIỆP
Nội dung của đồ án trình bày bao gồm các phần trình bày về lý thuyết cơ sở dữ liệu
phân tán, phần về hệ cơ sở dữ liệu quốc gia về Kinh tế- Xã hội và phần xây dựng ứng dụng
minh họa.
Phần lý thuyết cơ sở dữ liệu phân tán trình bày những lý thuyết về hệ cơ sở dữ liệu
phân tán bao gồm: khái niệm, đặc trưng, ưu, nhược điểm, các kiến trúc cơ bản, cũng như
các vấn đề liên quan khi thiết kế hệ cơ sở dữ liệu phân tán
Phần về cơ sở dữ liệu quốc gia về Kinh tế- Xã hội mô tả về các mục tiêu, yêu cầu của
hệ thống, trình bày về các mô hình chức năng và chi tiết các bảng trong cơ sở dữ liệu
Phần xây dựng ứng dụng minh họa thực hiện minh họa cho cơ chế nhân bản dữ liệu
ABSTRACT OF THESIS
The thesis includes parts which present the thesis of distributed database, the
description about the National Socio-Economic Database, and the development of the
illustrative application.
The thesis of distributed database presents the definition, characteristics, advantages
and disadvantages, models, and some relating problems when designing distributed
database system.
The part written about the National Socio-Economic Database depicts the objectives,
requirements, functional models and detailed design of tables in the system.
The illustrative application illustrates the replication mechanism.
LỜI CẢM ƠN
Em xin chân thành cảm ơn thầy giáo, ThS. Thạc Bình Cường, bộ môn Công
nghệ phần mềm, khoa Công nghệ thông tin, trường Đại học Bách Khoa Hà Nội, đã
tận tình hướng dẫn, giúp đỡ, chỉ bảo, cung cấp nhiều tài liệu tham khảo và tạo mọi
điều kiện thuận lợi cho em hoàn thành tốt đồ án tốt nghiệp này.
Em cũng xin bày tỏ lòng biết ơn sâu sắc tới tập thể các thầy, cô giáo trường
Đại học Bách Khoa Hà Nội nói chung và Khoa Công nghệ thông tin nói riêng đã
tận tình giảng dạy, truyền đạt cho em những kiến thức, kinh nghiệm quý báu trong
suốt những năm học vừa qua.
Cuối cùng, em xin gửi lời cảm ơn đến gia đình và bạn bè, đã giúp đỡ và tạo
điều kiện cho em trong suốt quá trình thực hiện đồ án.
Hà nội ngày 23 tháng 05 năm 2008
Sinh viên: Trần Minh Tuấn
Lớp : CNPM-K48
LỜI MỞ ĐẦU
Bước sang thế kỷ 21, nhân loại đã chuyển từ xã hội công nghiệp sang xã hội thông
tin. Với mạng Internet tốc độ cao ngày càng được mở rộng trên toàn thế giới, với
việc ứng dụng Công nghệ thông tin ngày càng sâu hơn trong nhiều lĩnh vực, nhu
cầu và khả năng kết nối, chia sẻ thông tin của con người đang trở nên lớn hơn bao
giờ hết. Để không bị tụt hậu lại phía sau, mọi quốc gia, mọi tổ chức kinh tế xã hội
đều nhận thức được vai trò quan trọng không thể thiếu của công nghệ thông tin
trong việc nâng cao hiệu quả hoạt động, thúc đẩy sự phát triển của quốc gia, tổ chức
mình. Tuy nhiên vấn đề khó khăn đặt ra ở đây là khối lượng công việc cần thực
hiện ngày càng lớn, lượng dữ liệu cần lưu trữ và các thao tác xử lý chúng ngày càng
tăng trong khi do các đặc điểm về qui mô, tổ chức và nghiệp vụ, các kho dữ liệu lại
được phân bố trải rộng ở nhiều nơi khác nhau, sử dụng những công nghệ khác nhau,
khả năng liên kết là rất hạn chế. Trong những trường hợp như vậy, các tổ chức phải
tiến hành xây dựng các ứng dụng trên hệ cơ sở dữ liệu phân tán. Công nghệ phân
tán đã được nghiên cứu khá lâu và ngày càng trở nên ổn định, hoàn thiện hơn. Nó
cung cấp khả năng kết nối, chia sẻ dữ liệu gần như không có giới hạn, nâng cao
hiệu quả hoạt động và khả năng mở rộng của hệ thống, tăng tính tin cậy và tính sẵn
sàng cho người sử dụng.
Ở Việt Nam, việc ứng dụng Công nghệ thông tin nói chung và cơ sở dữ liệu phân
tán nói riêng vẫn còn hạn chế, lý do chủ yếu có thể là do hạ tầng mạng, công nghệ
của Việt Nam còn chưa thực sự phát triển. Tuy nhiên trong những năm trở lại đây
tình hình đã được cải thiện rất tích cực. Trong khối các cơ quan Nhà nước, Chính
phủ cũng thể hiện quyết tâm rất cao về việc tin học hóa công tác quản lý, cải cách
thủ tục hành chính, tăng cường trao đổi và chia sẻ thông tin, giúp nâng cao hiệu quả
điều hành, tiết kiệm chi phí, từng bước tiến đến mục tiêu Chính phủ điện tử.
Nằm trong khuôn khổ của chương trình hỗ trợ kĩ thuật của Ủy ban Châu Âu cho
Việt Nam, dự án xây dựng cơ sở dữ liệu quốc gia về Kinh tế-Xã hội đã và đang
được triển khai tại Bộ Kế hoạch và Đầu tư nhằm lưu trữ các thông tin, dữ liệu, các
báo cáo về tình hình phát triển kinh tế xã hội quốc gia qua các năm, phục vụ cho
quá trình điều hành của Chính phủ cũng như công tác dự báo, lập kế hoạch định
hướng phát triển đất nước.
Qua một thời gian tìm hiểu, em quyết định chọn đề tài cho đồ án tốt nghiệp của
mình là:
“Mô hình Cơ sở dữ liệu phân tán và ứng dụng vào hệ cơ sở dữ liệu quốc
gia về Kinh tế-Xã hội”
Đồ án tập trung tìm hiểu về lý thuyết, một số kĩ thuật liên quan đến cơ sở dữ
liệu phân tán và ứng dụng những lý thuyết và kỹ thuật đó vào quá trình kết nối, trao
đổi dữ liệu trong hệ cơ sở dữ liệu quốc gia về Kinh tế-Xã hội.
Đồ án gồm 5 chương như sau:
Chương I: Tổng quan về hệ cơ sở dữ liệu quốc gia về Kinh tế-Xã hội
Chương này trình bày chung về hệ thống cần xây dựng, các mục tiêu, yêu cầu
của hệ thống, và đưa ra mô hình tổng thể cho hệ thống
Chương II: Lý thuyết cơ sở dữ liệu phân tán
Chương này trình bày những lý thuyết về hệ cơ sở dữ liệu phân tán, bao gồm
khái niệm, đặc trưng, ưu, nhược điểm, các kiến trúc cơ bản, cũng như các vấn đề
liên quan khi thiết kế hệ cơ sở dữ liệu phân tán
Chương III: Phân tích hệ cơ sở dữ liệu quốc gia về Kinh tế-Xã hội
Chương này trình bày về các mô hình chức năng của hệ cơ sở dữ liệu quốc gia
về Kinh tế-Xã hội
Chương IV: Thiết kế hệ cơ sở dữ liệu quốc gia về Kinh tế-Xã hội
Chương này trình bày về thiết kế chi tiết các bảng trong cơ sở dữ liệu quốc gia
về Kinh tế-Xã hội
Chương V: Xây dựng ứng dụng
Chương này trình bày về giải pháp tự động cập nhật và đồng bộ dữ liệu cho hệ
thống, viết chương trình ứng dụng thử nghiệm để minh họa cho giải pháp này.
Phần cuối là đánh giá về các kết quả đã đạt được và hướng phát triển tiếp theo của
đề tài
Mục lục
I. Tính cần thiết phải xây dựng hệ CSDL quốc gia về KT-XH 13
II. Mục tiêu của hệ thống 14
III. Một số khái niệm 14
III.1. Báo cáo kế hoạch 15
III.2. Báo cáo sơ bộ tình hình thực hiện 15
III.3. Báo cáo tình hình thực hiện 15
III.4. Các chỉ tiêu kinh tế xã hội 15
III.5. Báo cáo chuyên đề 16
IV. Quan hệ với hệ thống báo cáo định kỳ 16
IV.1. Hệ thống báo cáo định kỳ 16
IV.2. Hệ thống CSDL quốc gia về Kinh tế - Xã hội 17
V. Quan hệ với các hệ CSDL chuyên ngành 17
VI. Các đơn vị vận hành hệ thống 19
VII. Mô hình hệ thống 19
VII.1. Nguồn dữ liệu đầu vào 19
VII.2. Phương thức lưu trữ 20
VII.3. Phương thức khai thác 20
VII.4. Mô hình tổng thể 22
Chương 2: Lý thuyết CSDL phân tán 23
I. Khái niệm 23
II. Đặc trưng cơ bản của hệ thống phân tán 27
II.1. Chia sẻ tài nguyên 27
II.2. Xử lý đồng thời 27
II.3. Tính trong suốt 27
II.4. Khả năng mở rộng qui mô 28
II.5. Tính mở 29
IV. Các kiến trúc cơ bản của hệ CSDL phân tán 30
IV.1. Kiến trúc client/server 30
IV.2. Kiến trúc ngang hàng peer – to – peer 30
IV.3. Kiến trúc đa hệ quản trị CSDL 31
V.1. Khung thiết kế CSDL phân tán 33
V.1.1. Đối tượng thiết kế của CSDL phân tán 34
V.1.2. Hướng thiết kế Top-Down và Bottom-Up 35
V.2. Thiết kế phân đoạn CSDL 37
I. Mô hình chức năng mức đỉnh 46
II. Mô hình chức năng quản lý danh mục 48
II.1. Mô hình chức năng quản lý các danh mục 51
II.2. Mô hình chức năng quản lý các BMSL 52
III. Mô hình chức năng quản lý số liệu 52
III.1. Mô hình chức năng cập nhật số liệu 53
III.2. Mô hình chức năng duyệt số liệu 54
IV. Mô hình chức năng trao đổi dữ liệu 55
V. Mô hình chức năng tổng hợp báo cáo 56
VI. Mô hình chức năng cập nhật văn bản báo cáo 56
VI.1. Mô hình chức năng cập nhật văn bản báo cáo chính thức 57
VI.2. Mô hình chức năng duyệt báo cáo 58
VII. Mô hình chức năng khai thác thông tin 59
VIII. Mô hình chức năng quản trị hệ thống 60
VIII.1. Mô hình chức năng bảo mật 61
VIII.2. Mô hình chức năng quản trị 61
I. Danh sách các thực thể dữ liệu 63
I.1. Một số quy ước viết tắt trong CSDL 63
I.2. Thông tin danh mục 63
I.3. Dữ liệu 64
I.4. Quản trị và bảo mật 64
II. Mô tả chi tiết các bảng 65
II.1. Một số quy ước 65
II.2. Thông tin danh mục 65
II.3. Dữ liệu 74
II.4. Quản trị và bảo mật 89
96
Chương 5. Xây dựng ứng dụng 97
V.1. Tạo Publication 102
V.2. Tạo Subscription 104
V.3. Kết quả 104
Danh mục các hình vẽ
Hình 1.1. Quan hệ giữa hệ thống báo cáo tháng và hệ CSDL QG về KTXH.18
Hình 1.2. Mô hình tổng thể của hệ CSDL quốc gia về KTXH 22
Hình 2.1: Mô hình của hệ thống CSDL phân tán 23
Hình 2.2: Sơ đồ kiến trúc tham chiếu của hệ CSDL phân tán thuần nhất 26
Hình 2.3: Kiến trúc tham chiếu CSDL phân tán 31
Hình 2.4: Kiến trúc hệ đa quản trị CSDL với một mô hình quan niệm toàn cục
32
Hình 2.5: Hệ đa quản trị CSDL không sử dụng mô hình quan niệm toàn cục33
Hình 2.6 : Quy trình thiết kế Top-Down 36
Hình 2.7. Phân đoạn hỗn hợp của quan hệ PROJ 43
Hình 3.1. Mô hình chức năng mức đỉnh 46
Hình 3.2. Mô hình chức năng quản lý danh mục 48
Hình 3.3. Mô hình chức năng quản lý các danh mục 51
Hình 3.4. Mô hình chức năng quản lý các BMSL 52
Hình 3.5. Mô hình chức năng quản lý số liệu 52
Hình 3.6. Mô hình chức năng cập nhật số liệu 53
Hình 3.7. Mô hình chức năng duyệt số liệu 54
Hình 3.8. Mô hình chức năng trao đổi dữ liệu 55
Hình 3.9. Mô hình chức năng tổng hợp báo cáo 56
Hình 3.10. Mô hình chức năng cập nhật văn bản báo cáo 56
Hình 3.11. Mô hình chức năng cập nhật văn bản báo cáo chính thức 57
Hình 3.12. Mô hình chức năng duyệt báo cáo 58
Hình 3.13. Mô hình chức năng khai thác thông tin 59
Hình 3.14. Mô hình chức năng quản trị hệ thống 60
Hình 3.15. Mô hình chức năng bảo mật 61
Hình 3.16. Mô hình chức năng quản trị 62
Hình 5.1. Mô hình nhân bản dữ liệu 98
Hình 5.2: Các thành phần trong Replication 99
Hình 5.3. Giao diện chương trình 102
Hình 5.4. Tạo Publisher 102
Hình 5.5. Tạo Publication 103
Hình 5.6. Tạo Article 103
Hình 5.7. Tạo Subscription 104
Hình 5.8. Kết quả thực hiện 105
Danh mục các bảng
Bảng 2.1. Quan hệ PROJ 38
Bảng 2.2. Quan hệ PROJ 1 39
Bảng 2.3. Quan hệ PROJ 2 39
Bảng 2.4. Quan hệ PROJ 1 39
Bảng 2.5. Quan hệ PROJ 2 39
Bảng 2.6. Quan hệ PROJ 3 39
Bảng 2.7. Quan hệ EMP và PAY 40
Bảng 2.8. Quan hệ EMP1 và EMP2 41
Bảng 2.9. Quan hệ PROJ1 và PROJ2 42
Bảng 4.1. DMCapCT (Cấp chỉ tiêu) 65
Bảng 4.2. DMChiTieu (Hệ thống chỉ tiêu chung) 66
Bảng 4.3. DMChiTieu_CQ (Danh mục chỉ tiêu của cơ quan) 67
Bảng 4.4. DMLoaiSL (Danh mục loại số liệu) 67
Bảng 4.5. DMDinhKy (Danh mục Định kỳ BC) 68
Bảng 4.6. QH_DinhKy_LoaiSL (Các loại SL phù hợp với định kỳ BC) 69
Bảng 4.7.DMCapDB (Danh mục cấp địa bàn) 70
Bảng 4.8. DMDiaBan (Danh mục địa bàn) 70
Bảng 4.9. DMCapCQ (Danh mục cấp cơ quan) 71
Bảng 4.10. DMCoQuan (Danh mục cơ quan) 72
Bảng 4.11. DMDonVi (Danh mục đơn vị) 73
Bảng 4.12. SLCT (Số liệu chỉ tiêu) 74
Bảng 4.13. SLCT_KDK (Số liệu chỉ tiêu không định kỳ) 76
Bảng 4.14. DMBMSL (Biểu mẫu số liệu) 78
Bảng 4.15. QH_BMSL_CT (Danh sách các chỉ tiêu của BMSL) 79
Bảng 4.16. QH_BMSL_LoaiSL (Danh sách các loại số liệu của BMSL) 80
Bảng 4.17. QH_BMSL_Ky (Danh sách các định kỳ sử dụng BMSL) 81
Bảng 4.18. DMLoaiBC (Loại báo cáo) 81
Bảng 4.19. QH_LoaiBC_BMSL (Danh sách BMSL của loại BC) 83
Bảng 4.20. QH_LoaiBC_CQ (Danh sách các cơ quan nhận của loại BC) 83
Bảng 4.21. DMBC (Báo cáo) 84
Bảng 4.22. QH_BC_BMSL (Danh sách BMSL của BC) 86
Bảng 4.23. QH_BC_CQNhan(Danh sách các cơ quan nhận BC) 87
Bảng 4.24. QH_BC_File (Danh sách các tệp dữ liệu kèm theo BC) 88
Bảng 4.25. QTDMTSo (Tham số hệ thống) 89
Bảng 4.26. QTDMMucTN (Mức truy nhập) 89
Bảng 4.27. QTDMQuyenTN (Quyền truy nhập) 90
Bảng 4.28. QTDMNhom (Nhóm người sử dụng) 91
Bảng 4.29. QTDMNSD (Người sử dụng) 91
Bảng 4.30. QTPQNhom (Danh sách các quyền truy nhập của nhóm NSD) 92
Bảng 4.31. QTPQNSD (Danh sách các quyền truy nhập của NSD) 93
Bảng 4.32. QTNhomNSD (Danh sách các NSD thuộc Nhóm) 94
Bảng 4.33. QTNSDNSD (Danh sách các quyền thao tác dữ liệu của NSD). .95
Bảng 4.34. QTSLNK (Nhật ký hệ thống ) 95
Danh mục các từ viết tắt
Từ viết tắt
Giải nghĩa
1. CSDL Cơ sở dữ liệu
2. Bộ KHĐT Bộ Kế hoạch và Đầu tư
3. KTXH Kinh tế-Xã hội
4. CSDL QG về KTXH Cơ sở dữ liệu quốc gia về Kinh tế - Xã hội
Chương 1: Tổng quan về hệ CSDL quốc gia về KTXH
I. Tính cần thiết phải xây dựng hệ CSDL quốc gia về KT-
XH
Để đảm bảo sự phát triển KT-XH của đất nước theo đúng định hướng, hàng năm
Quốc hội ban hành Nghị quyết về nhiệm vụ hàng năm để đưa ra mục tiêu tổng quát
thực hiện trong năm và các chỉ tiêu chủ yếu cần đạt được như:
− Tốc độ tăng GDP, giá trị tăng thêm của ngành nông, lâm, ngư nghiệp, công
nghiệp, dịch vụ…
− Tốc độ tăng kim ngạch xuất khẩu;
− Tổng vốn đầu tư phát triển toàn xã hội/GDP;
− Tốc độ tăng giá tiêu dùng;
− Số việc làm mới tạo ra trong năm; trong đó: xuất khẩu lao động và chuyên gia;
− Giảm tỷ lệ hộ nghèo, tỉ lệ sinh, trẻ em suy dinh dưỡng…
− Phổ cập giáo dục, đào tạo, dạy nghề…
− Tỷ lệ che phủ rừng, cung cấp nước sạch, bảo vệ môi trường…
Để thực hiện tốt mục tiêu và hoàn thành các chỉ tiêu cũng như nhiệm vụ đề ra trong
Nghị quyết và phục vụ cho việc chỉ đạo điều hành, Bộ Kế hoạch và Đầu tư được
Chính phủ giao nhiệm vụ chuẩn bị báo cáo hàng tháng, hàng quý, 6 tháng và báo
cáo năm. Vụ Tổng hợp Kinh tế quốc dân là đơn vị chủ trì tổng hợp, biên tập và
hoàn thành báo cáo để trình lãnh đạo Bộ Kế hoạch và Đầu tư báo cáo trong các
cuộc họp thường kỳ của Chính phủ.
Các báo cáo này phản ánh tình hình phát triển KT-XH trong thời gian đó, phát hiện
và nêu ra những khó khăn, tồn tại và nguyên nhân gây ra những vướng mắc đó,
đồng thời đề xuất các giải pháp cần thực hiện để tháo gỡ những khó khăn, tồn tại.
Ngoài ra, các báo cáo này còn giúp thấy được mức độ hoàn thành nhiệm vụ, mục
tiêu của kế hoạch năm, từ đó đề ra các giải pháp, phương hướng nhằm đạt được
nhiệm vụ về KT-XH các tháng, quý còn lại trong năm.
Song song với những báo cáo phản ánh tình hình và cập nhật các thông tin về KT-
XH để phục vụ công tác điều hành của Chính phủ, Bộ Kế hoạch và Đầu tư phải
thực hiện một công việc khác là chuẩn bị các báo cáo kế hoạch cho năm tiếp theo,
kế hoạch 5 năm. Do đó, việc chuẩn bị tốt hệ thống số liệu, cũng như phần đánh giá
tình hình tổng hợp KT-XH hàng tháng, hàng quý, 6 tháng, cả năm là vô cùng quan
trọng.
Nhận thấy được tính quan trọng của các báo cáo và độ phức tạp của công việc,
trong thời qua Bộ Kế hoạch và Đầu tư đang từng bước xây dựng hệ thống dữ liệu
về KT-XH.
Tuy nhiên với cách lưu trữ dưới dạng văn bản phi cấu trúc, khả năng khai thác để có
được các phân tích, dự báo tầm chiến lược, trợ giúp hình thành các quyết sách là
hầu như không thể thực hiện được.
Vì vậy yêu cầu chính đối với hệ thống là trích lọc các dữ liệu từ các dạng báo cáo
thành các dạng dữ liệu có cấu trúc, tiến tới hình thành một kho dữ liệu tri thức, trợ
giúp khai thác triệt để các thông tin, hỗ trợ cho công tác phân tích, dự báo, lập kế
hoạch, ra quyết định trước hết là trong ngành kế hoạch, sau đó là cho cộng đồng,
toàn xã hội.
II. Mục tiêu của hệ thống
Hệ thống CSDL quốc gia về Kinh tế - Xã hội được xây dựng với mục đích lưu trữ các
thông tin / dữ liệu về tình hình phát triển kinh tế xã hội quốc gia qua các năm.
Nội dung dữ liệu chủ yếu được lưu trữ trong hệ thống là các báo cáo chính thức từ
Bộ Kế hoạch Đầu tư lên cấp Chính phủ.
Các báo cáo thể hiện các số liệu sau:
− Kế hoạch phát triển từng lĩnh vực hàng năm.
− Báo cáo sơ bộ tình hình thực hiện theo định kỳ thời gian
− Báo cáo thực hiện
Dữ liệu – báo cáo được lưu dưới hai dạng:
− Dạng báo cáo toàn văn có thể tra cứu thông qua hệ thống từ khoá và
− Dạng chỉ tiêu kinh tế xã hội, cho phép thực hiện các phân tích, so sánh và dự
báo xu hướng phát triển
Một nội dung dữ liệu cũng sẽ được định hướng lưu trữ trong hệ thống là các báo
cáo chính thức từ các Bộ, ngành, địa phương lên Bộ Kế hoạch Đầu tư; các báo cáo
chuyên đề Đầu tư phát triển của các vụ chuyên ngành, bán tổng hợp về một lĩnh vực
chuyên ngành kinh tế-xã hội cụ thể.
III. Một số khái niệm
Bộ số liệu 3 loại báo cáo thể hiện quá trình điều khiển hoạt động kinh tế-xã hội của
Chính phủ. Bắt đầu từ định hướng phát triển (số liệu kế hoạch), theo dõi tình hình
thực hiện kế hoạch (số liệu thực hiện sơ bộ) và kết quả thực hiện (số liệu kết quả
thực hiện).
Các báo cáo bao gồm hai dạng số liệu: Số liệu chỉ tiêu và phần lời văn. Số liệu chỉ
tiêu có dạng bảng biểu, có tính chất định lượng. Phần lời văn thể hiện các ý kiến
chuyên gia đánh giá xu hướng và các điểm cần đặc biệt lưu ý trong quá trình thực
hiện. Phần lời văn thường chỉ tập trung đánh giá các điểm đáng chú ý nhất so với kế
hoạch đề ra. Thông tin trong phần lời văn là các thông tin định tính và là các thông
tin quan trọng nhất trong một báo cáo
III.1. Báo cáo kế hoạch
Công tác lập kế hoạch được thực hiện hàng năm, do các đơn vị phòng ban của Bộ
KHĐT thực hiện trên cơ sở định hướng phát triển của Nhà nước và xu thế phát triển
chung. Kế hoạch được xác định cụ thể cho từng chỉ tiêu kinh tế-xã hội.
Kế hoạch gồm có kế hoạch 5 năm và kế hoạch hàng năm.
Báo cáo kế hoạch được Vụ Tổng hợp, Bộ KHĐT tổng hợp, hoàn chỉnh và trình
Chính phủ vào tháng 11 hàng năm, Kế hoạch được Chính phủ duyệt chính thức vào
tháng 12 hàng năm. Tài liệu này có tính pháp lệnh đối với toàn bộ hệ thống Nhà
nước.
III.2. Báo cáo sơ bộ tình hình thực hiện
Căn cứ trên kế hoạch hàng năm được Chính phủ duyệt, và được giao tới từng địa
phương, bộ ngành, các đơn vị định kỳ báo cáo tình hình thực hiện. Báo cáo này do
Vụ Tổng hợp, Bộ KHĐT tổng hợp, hoàn chỉnh và trình Chính phủ.
Báo cáo sơ bộ tình hình thực hiện thông thường bao gồm phần số liệu tình hình
thực hiện của kỳ trước và số ước thực hiện của kỳ này. Đây là một căn cứ, cơ sở
quan trọng để Chính phủ thực hiện công tác điều hành, có các biện pháp, điều chỉnh
kịp thời đối với các biến động xảy ra trong quá trình thực hiện kế hoạch Nhà nước.
Phần số liệu tình hình thực hiện của kỳ trước được tổng hợp từ số liệu báo cáo từ
Tổng cục thống kê được gửi cho Vụ Tổng hợp Bộ KHĐT hàng tháng. Số ước thực
hiện trong kỳ, do chính Vụ Tổng hợp ước tính, căn cứ trên số liệu báo cáo ước tính
của các Vụ chuyên ngành và các Vụ bán tổng hợp. Công tác ước thực hiện được
thực hiện dựa trên các số liệu tình hình thực hiện của các kỳ trước, xu hướng phát
triển, biến động và các phương pháp chuyên gia khác.
Báo cáo sơ bộ tình hình thực hiện được báo cáo hàng tháng (gọi tắt là báo cáo
tháng) và báo cáo hàng năm (gọi tắt là báo cáo năm). Hai loại báo cáo này có qui
trình và đơn vị chịu trách nhiệm tổng hợp hoàn toàn khác nhau.
Báo cáo tháng được gửi trình Chính phủ vào ngày 27-28 hàng tháng. Báo cáo năm
được gửi trình Chính phủ vào tháng 12 hàng năm.
III.3. Báo cáo tình hình thực hiện
Số liệu có cấu trúc
Sau một năm thực hiện, Tổng cục thống kê tập hợp các số liệu thống kê, lập báo cáo
tình hình thực hiện và gửi Bộ Kế hoạch và Đầu tư trình Chính phủ.
Báo cáo được tổng hợp trình Chính phủ vào cuối quí II năm sau.
III.4. Các chỉ tiêu kinh tế xã hội
Các báo cáo bao gồm hai dạng số liệu: Số liệu chỉ tiêu và phần lời văn.
Số liệu chỉ tiêu được thu thập trên nền hệ thống chỉ tiêu kinh tế xã hội, bao gồm vài
trăm chỉ tiêu được phân loại theo các lĩnh vực kinh tế - xã hội chính yếu.
Hệ thống chỉ tiêu chính thức được dùng là do Tổng cục Thống kê ban hành, thường
ít thay đổi. Các giá trị chỉ tiêu do Tổng cục Thống kê thu thập qua mạng lưới thống
kê toàn quốc của mình thể hiện một cách định lượng tình hình phát triển của đất
nước thông qua giá trị của các chỉ tiêu.
Trên nền hệ thống các chỉ tiêu được qui định chính thức (do Tổng cục Thống kê
công bố), Bộ KHĐT lập kế hoạch phát triển và ước tình hình thực hiện, cụ thể là thể
hiện thông qua con số định lượng của từng chỉ tiêu.
Ngoài hệ thống chỉ tiêu được qui định bởi Tổng cục Thống kê, Bộ KHĐT còn sử
dụng một số chỉ tiêu phục vụ công tác dự toán.
Công tác dự báo chiến lược cũng được thực hiện trên nền hệ thống các chỉ tiêu kinh
tế xã hội.
Mỗi chỉ tiêu kinh tế xã hội đều có định kỳ báo cáo riêng của mình: hàng tháng, hàng
quý, hàng năm, 5 năm
III.5. Báo cáo chuyên đề
Báo cáo chuyên đề có thể gọi là dạng báo cáo đột xuất (không định kỳ) trong một
lĩnh vực kinh tế - xã hội rộng hoặc hẹp nào đó.
Báo cáo chuyên đề thường được lập theo một nhu cầu nghiên cứu chuyên sâu của
một tổ chức, cơ quan nào đó. Thông thường là xuất phát từ một đề nghị tập trung
phát triển hoặc vực một lĩnh vực kinh tế - xã hội nào đó, đơn vị , tổ chức đề nghị
cần có thông tin làm căn cứ để giải trình đề xuất kế hoạch và dự trù của mình.
Báo cáo chuyên đề thường do đơn vị chuyên ngành tập hợp. Có thể là căn cứ trên
các số liệu thường xuyên có tại đơn vị chuyên ngành, có thể là các ý kiến đánh giá
chuyên gia, căn cứ trên các hiểu biết chuyên sâu của các cán bộ trong lĩnh vực.
Cũng có thể là kết quả của một cuộc điều tra chuyên đề nói trên.
IV. Quan hệ với hệ thống báo cáo định kỳ
Hệ thống báo cáo định kỳ (tháng/năm) và hệ thống CSDL quốc gia về Kinh tế - Xã
hội có mục đích phục vụ hoàn toàn khác nhau.
IV.1. Hệ thống báo cáo định kỳ
Hệ thống báo cáo định kỳ có mục đích chủ yếu là hỗ trợ tổng hợp thông tin từ các
đơn vị để lập các loại báo cáo định kỳ, báo cáo chuyên đề. Qui trình tổng hợp báo
cáo bao gồm cả các trao đổi giữa các đơn vị, phòng ban, bộ ngành, các sửa đổi điều
chỉnh theo yêu cầu từ cấp trên hoặc các đơn vị chuyên ngành.
Các loại báo cáo khác nhau có định kỳ tổng hợp, đơn vị chịu trách nhiệm báo cáo,
tổng hợp và qui trình tổng hợp hoàn toàn khác nhau.
Có thể chia thành 3 loại hình báo cáo chính: Báo cáo năm, báo cáo tháng và báo cáo
chuyên đề
IV.2. Hệ thống CSDL quốc gia về Kinh tế - Xã hội
Hệ thống CSDL quốc gia về Kinh tế - Xã hội lại có mục đích chủ yếu là lưu trữ các
số liệu chính thức và trợ giúp các nhu cầu tra cứu, hỏi đáp cũng như phân tích số
liệu lịch sử về tình hình phát triển kinh tế xã hội.
Số liệu được lưu trữ bao gồm cả mảng kế hoạch, báo cáo sơ bộ tình hình thực hiện
và báo cáo chính thức tình hình thực hiện. Tuy nhiên các số liệu trong quá trình
soạn thảo, số liệu không chính thức không được lưu trong hệ thống này.
Ngoài các báo cáo chính thức đã được Chính phủ phê duyệt, hệ còn có thể lưu trữ
các báo cáo chuyên đề chính thức được thu thập từ các bộ ngành, vụ chuyên ngành.
V. Quan hệ với các hệ CSDL chuyên ngành
Các hệ thống CSDL chuyên ngành được thiết lập để phục vụ cho các nhu cầu quản
lý, phân tích chuyên ngành. Các hệ thống này có thể hỗ trợ cho công tác tổng hợp
báo cáo từ các bộ ngành, lĩnh vực chuyên ngành lên Chính phủ thông qua báo cáo
tháng và báo cáo của Bộ Kế hoạch và Đầu tư. Hệ thống này cũng cho phép tổng
hợp các báo cáo chuyên đề của từng lĩnh vực.
Báo cáo chuyên đề, các báo cáo định kỳ của các chuyên ngành đều có thể là các số
liệu quan trọng trong tương lai sẽ cần được lưu trữ và khai thác trong hệ CSDL
quốc gia về kinh tế - xã hội. Hơn nữa các số liệu này tuy cũng là số liệu chính thức,
nhưng không có được từ nguồn Tổng cục Thống kê. Các số liệu này một mặt có thể
trợ giúp cho các phân tích vĩ mô toàn xã hội, còn có thể trợ giúp cho các phân tích
mang tính chuyên ngành chuyên sâu.
Tóm lại giữa CSDL chuyên ngành và CSDL quốc gia về kinh tế - xã hội, trước mắt
sẽ tiến tới có các quan hệ cung cấp thông tin đầu vào một cách gián tiếp (các báo
cáo chuyên đề chính thức sẽ được gửi vào CSDL quốc gia).
Trong tương lai sẽ thiết lập các đầu vào trực tiếp từ các CSDL chuyên ngành vào
CSDL quốc gia. Có nghĩa là các số liệu chuyên ngành sẽ được định kỳ cập nhật từ
CSDL chuyên ngành lên CSDL quốc gia ít nhất là trên một số chỉ tiêu quan trọng.
Một đặc thù cần nhắc tới là quan hệ giữa CSDL chuyên ngành và CSDL quốc gia
về Kinh tế-Xã hội được xây dựng, trao đổi trên nền các chỉ tiêu chuyên ngành. Các
chỉ tiêu này có thể phần lớn trùng với các chỉ tiêu Kinh tế-Xã hội do Tổng cục
Thống kê ban hành, nhưng được báo cáo, theo dõi chi tiết hơn trên các phân loại.
Cũng có một số chỉ tiêu hoàn toàn không có trong hệ thống chính thức do Tổng cục
Thống kê ban hành phục vụ các theo dõi chuyên sâu của ngành, lĩnh vực. Một số
chỉ tiêu khác xuất hiện do nhu cầu của các dạng nghiên cứu chuyên đề.
Hình 1.1. Quan hệ giữa hệ thống báo cáo tháng và hệ CSDL QG về KTXH
HỆ THỐNG BC THÁNG
1.Xác định chỉ
tiêu BC
2.Xác định mẫu BC cấp
dưới và hệ thốngBC
3.Nhận BC cấp
dưới
4.Xác định mẫu
BC đầu ra
5.Lập BC đầu ra
CHƯƠNG TRÌNH-MỤC
TIÊU - KẾ HOẠCH
CHƯƠNG TRÌNH-MỤC
TIÊU - KẾ HOẠCH
CÁC ĐƠN VỊ
BÁO CÁO
CÁC ĐƠN VỊ
BÁO CÁO
CÁC CƠ QUAN
CHÍNH PHỦ
CÁC CƠ QUAN
CHÍNH PHỦ
Giá trị chỉ tiêuDS chỉ tiêu BC DS Mẫu BC đầu ra
Báo
cáo
CSDL QG về KTXH
1.Xác định chỉ
tiêu KTXH
2.Xác định hình thức
nhận giá trị chỉ tiêu
3.Cập nhật giá
trị chỉ tiêu
4.Khai thác, phân
tích thông tin
5.Khai thác dưới
dạng báo cáo
Kho giá trị chỉ tiêuDS chỉ tiêu KTXH
DS Mẫu BC đầu ra
6.Lưu BC
toàn văn
YC KHAI THÁC CỦA
CÁC CQ, BỘ NGÀNH
YC KHAI THÁC CỦA
CÁC CQ, BỘ NGÀNH
CÁC NGUỒN SỐ LIỆU
KHÔNG TH.XUYÊN
CÁC NGUỒN SỐ LIỆU
KHÔNG TH.XUYÊN
CÁC CƠ QUAN
BỘ NGÀNH
CÁC CƠ QUAN
BỘ NGÀNH
VI. Các đơn vị vận hành hệ thống
Các đơn vị vận hành được chia thành các đơn vị có trách nhiệm cập nhật thông tin và
các đơn vị khai thác tin.
Các đơn vị khai thác tin là tất cả các cơ quan, bộ ngành, theo mức độ quyền truy cập.
Việc cập nhật tin về mặt kỹ thuật sẽ do đơn vị chuyên trách công nghệ thông tin của
Bộ Kế hoạch Đầu tư đảm nhiệm.
Các đầu báo cáo chính thức sẽ được cập nhật tự động vào hệ thống CSDL quốc gia,
như một đầu vào từ hệ thống báo cáo định kỳ. Hệ thống cũng sẽ được trang bị các công
cụ chuyển đổi từ các môi trường office thông dụng (Microsoft Word, Excel ) để phục
vụ nhu cầu chuyển đổi số liệu trước mắt. Trong tương lai việc cập nhật sẽ phải là các
thao tác tự động.
Khi có thay đổi về hệ thống chỉ tiêu kinh tế - xã hội. Các thay đổi này sẽ do bộ phận
công nghệ thông tin đảm nhiệm, bằng cách cập nhật danh mục các chỉ tiêu và mẫu đầu
vào - ra
Để truyền các số liệu chính thức từ Tổng cục Thống kê hệ thống cũng sẽ được trang bị
các kênh nạp thông tin tự động, trong thời gian trước mắt là các công cụ chuyển đổi từ
dạng số liệu mềm (soft).
Một kênh số liệu tự động khác là từ các CSDL chuyên ngành. Số liệu báo cáo chuyên ngành
chính thức và các dạng báo cáo chuyên đề.
VII. Mô hình hệ thống
VII.1. Nguồn dữ liệu đầu vào
Dữ liệu đầu vào là các báo cáo chính thức sau đây:
− Báo cáo năm (Bộ Kế hoạch và Đầu tư gửi Chính phủ, sau khi Chính phủ phê
duyệt)
− Báo cáo tháng (Bộ Kế hoạch và Đầu tư gửi Chính phủ, sau khi Chính phủ phê
duyệt)
− Báo cáo thống kế chính thức định kỳ (tháng, quí, năm) Tổng cục Thống kê ban
hành
− Báo cáo chuyên đề chính thức
Hình thức cập nhật
− Cập nhật tự động từ các nguồn xuất bản báo cáo
− Cập nhật qua các môi trường chuyển đổi số liệu
− Cập nhật bằng tay, gõ qua bàn phím
VII.2. Phương thức lưu trữ
Lưu trữ văn bản toàn văn
Văn bản toàn văn, dạng ký tự là thông tin định tính. Đó là kiến thức chuyên gia, thể
hiện các đánh giá của các nhà chuyên môn về tình hình Kinh tế - Xã hội, dự báo các
biến động, có thể có cả các đề xuất giải pháp cho các vấn đề phát sinh nổi cộm. Dạng
dữ liệu này, trước khi đưa vào hệ thống cần được phân loại, bằng các chủ đề, bằng các
từ khoá để có thể tìm kiếm, tra cứu sử dụng về sau.
Việc phân loại cũng có thể tiến hành tự động bằng các công cụ xử lý số liệu văn bản
Lưu trữ bảng dữ liệu
Các bảng dữ liệu là một phần của các báo cáo, thể hiện các thông tin định tính, trong
hệ thống sẽ được lưu trữ dưới dạng dữ liệu có cấu trúc.
Dữ liệu cấu trúc này chính là hệ thống CSDL chỉ tiêu kinh tế xã hội thể hiện định
lượng tình hình, xu hướng phát triển của nền kinh tế xã hội và các định hướng chiến
lược quốc gia (kế hoạch phát triển)
Gốc của phần dữ liệu có cấu trúc là danh mục các chỉ tiêu kinh tế xã hội.
− Các chỉ tiêu này phần lớn là các chỉ tiêu chính thức do Tổng cục Thống kê công
bố. Việc thay đổi cập nhật diễn ra không thường xuyên
− Một số chỉ tiêu khác do Bộ Kế hoạch và Đầu tư ban bố thể hiện dự toán quốc gia
cho các định hướng phát triển
− Một số chỉ tiêu khác là các chỉ tiêu chuyên ngành, thể hiện chi tiết hơn tình hình
phát triển ở các ngành chuyên sâu.
Mỗi chỉ tiêu được ứng với bảng số liệu được cập nhật theo thời gian, theo địa phương
với 3 mảng số liệu chính thức:
− Kế hoạch,
− Ước thực hiện tới kỳ
− Tình hình thực hiện
Hệ thống chỉ tiêu theo thời gian và nhu cầu phát triển của xã hội, theo trào lưu hội nhập
quốc tế sẽ có các biến động. Nhiều chỉ tiêu có thể được bổ sung, một số chỉ tiêu sẽ
được thay đổi cách thức, tổng hợp, thu thập, định kỳ thu thập, mức độ theo dõi chi
tiết
VII.3. Phương thức khai thác
Khác với hệ thống báo cáo định kỳ, Hệ thống CSDL quốc gia về kinh tế xã hội có mục
đích sử dụng chủ yếu là trợ giúp cho các nghiên cứu, phân tích, dự đoán xu hướng trên
kho các số liệu lịch sử với một quá trình theo dõi nhiều năm.
Hệ thống sẽ được trang bị các công cụ trợ giúp khai thác sau:
− Các công cụ cho phép tìm kiếm tới một văn bản toàn văn (một văn bản cụ thể nào
đó, theo từ khoá, theo chủ đề, theo cấp ban hành, theo thời gian )
− Các công cụ cho phép phân tích số liệu dạng công cụ kho dữ liệu
− Các công cụ cho phép dự đoán xu hướng phát triển căn cứ trên các số liệu lịch sử
− Các công cụ giải đáp thông minh, cho phép dịch câu hỏi bất kỳ của người sử dụng,
sử dụng từ điển đồng nghĩa qui về các tri thức tương ứng có trong CSDL và cung
cấp các tài liệu có liên quan cho người hỏi.
Hệ thống được khai thác chủ yếu trên môi trường web-based thông qua mạng internet.
VII.4. Mô hình tổng thể
Hình 1.2. Mô hình tổng thể của hệ CSDL quốc gia về KTXH
Cấp quận huyện
Cấp quận huyện
Cấp tỉnh
Cấp tỉnh
KHO DỮ LIỆU CẤP TW
KHO DỮ LIỆU CẤP TW
HỆ B C
THÁNG
NĂM
Giá trị chỉ tiêu
CSDL
QG
VỀ
KTXH
BC toàn văn
Trung tâm khai thác
Trung tâm khai thác
Hệ phân
tích
Cấp tỉnh, Bộ ngành
Cấp tỉnh, Bộ ngành
CSDL
CHUYÊN
NGÀNH
Cấp quận huyện, cơ sở
Cấp quận huyện, cơ sở
CSDL
Cấp quận huyện
Cấp quận huyện
Cấp quận huyện, cơ sở
Cấp quận huyện, cơ sở
CSDL
Luồng thu thập dữ liệu tác nghiệp
Luồng thu thập dữ liệu báo cáo định kỳ
Luồng cung cấp thông tin
Internet
Chương 2: Lý thuyết CSDL phân tán
I. Khái niệm
I.1. Định nghĩa CSDL phân tán
Cơ sở dữ liệu phân tán là tập hợp dữ liệu mà về mặt logic thuộc về cùng một hệ thống
nhưng được trải rộng ở nhiều vị trí khác nhau trong một mạng máy tính.
Có 2 điểm quan trọng được nêu ra trong định nghĩa trên:
- Phân tán: dữ liệu không đặt trên cùng một vị trí, điều này giúp chúng ta có thể
phân biệt một CSDL phân tán với một CSDL tập trung, đơn lẻ.
- Tương quan logic: Dữ liệu có một số các thuộc tính ràng buộc chúng với nhau,
điều này giúp chúng ta có thể phân biệt một CSDL phân tán với một tập hợp
CSDL cục bộ hoặc các tệp cư trú tại các vị trí khác nhau trong một mạng máy
tính.
Hình 2.1: Mô hình của hệ thống CSDL phân tán
I.2. So sánh CSDL phân tán và CSDL tập trung
Đặc trưng mô tả CSDL tập trung là điều khiển tập trung, độc lập dữ liệu, giảm bớt dư
thừa, cơ cấu vật lý phức tạp đối với khả năng truy cập, toàn vẹn, hồi phục, điều khiển
tương tranh, biệt lập và an toàn dữ liệu.
Điều khiển tập trung: Trong CSDL tập trung, điều khiển tập trung các nguồn thông
tin của công việc hay tổ chức. Có người quản trị đảm bảo an toàn dữ liệu.
Trong CSDL phân tán: không đề cập đến vấn đề điều khiển tập trung. Người quản trị
CSDL chung phân quyền cho người quản trị CSDL địa phương.
Độc lập dữ liệu: là một trong những nhân tố tác động đến cấu trúc CSDL để tổ chức
dữ liệu chuyển cho chương trình ứng dụng. Tiện lợi chính của độc lập dữ liệu là các
chương trình ứng dụng không bị ảnh hưởng khi thay đổi cấu trúc vật lý của dữ liệu.
Trong CSDL phân tán, độc lập dữ liệu có tầm quan trọng cũng như trong CSDL truyền
thống. Khái niệm CSDL trong suốt thể hiện rằng hoạt động của chương trình trên
CSDL phân tán được viết như làm việc trên CSDL tập trung. Hay nói cách khác tính
đúng đắn của chương trình không bị ảnh hưởng bởi việc di chuyển dữ liệu từ nơi này
sang nơi khác trong mạng máy tính. Tuy nhiên tốc độ làm việc bị ảnh hưởng do có thời
gian di chuyển dữ liệu.
Giảm dư thừa dữ liệu: Trong CSDL tập trung, tính dư thừa hạn chế được càng nhiều
càng tốt vì:
- Dữ liệu không đồng nhất khi có vài bản sao của cùng CSDL logic; để tránh được
nhược điểm này giải pháp là chỉ có một bản sao duy nhất.
- Giảm không gian lưu trữ. Giảm dư thừa có nghĩa là cho phép nhiều ứng dụng
cùng truy cập đến một CSDL mà không cần đến nhiều bản sao ở những nơi
chương trình ứng dụng cần .
CSDL phân tán chia dữ liệu ra thành nhiều phần nhỏ và được thể hiện như một bản sao
logic tổng thể duy nhất để tiện cho việc truy cập dữ liệu.
Cấu trúc vật lý và khả năng truy cập: Trong CSDL phân tán, hiệu quả của truy cập
thể hiện ở thời gian tìm kiếm và chuyển dữ liệu nhỏ nhất, chi phí truyền thông thấp
nhất. Công việc viết ra cách thức truy cập CSDL phân tán cũng giống như viết chương
trình duyệt trong các CSDL tập trung.
Tính toàn vẹn, hồi phục và điều khiển tương tranh: Trong CSDL phân tán, vấn đề
điều khiển giao tác tự trị có ý nghĩa quan trọng: hệ thống điều phối phải chuyển đổi các
quỹ thời gian cho các giao tác liên tiếp. Như vậy giao tác tự trị là phương tiện đạt được
sự toàn vẹn trong CSDL Có hai mối nguy hiểm của giao tác tự trị là lỗi và tương tranh.
Tính biệt lập và an toàn: trong CSDL truyền thống, người quản trị hệ thống có quyền
điều khiển tập trung, người sử dụng được phân quyền mới truy cập vào được dữ liệu.
Trong cách tiếp cận CSDL tập trung, không cần thủ tục điều khiển chuyên biệt.
Trong CSDL phân tán, những người quản trị địa phương cũng phải giải quyết vấn đề
tương tự như người quản trị CSDL truyền thống. Tuy nhiên, với cấp độ tự trị cao ở mỗi
điểm, người có dữ liệu địa phương sẽ cảm thấy an toàn hơn vì họ có thể tự bảo vệ dữ
liệu của mình thay vì phụ thuộc vào người quản trị hệ thống tập trung. Ngoài ra, vấn đề
an toàn với hệ phân tán còn liên quan đến an toàn trong mạng truyền thông, hệ thống
có tính mở và nhiều người dùng sử dụng nhiều CSDL, do đó đòi hỏi nhiều kỹ thuật bảo
vệ phức tạp hơn.
I.3. Phân loại các hệ CSDL phân tán
• Hệ CSDL phân tán thuần nhất
Khi áp dụng đối với các hệ CSDL, thuật ngữ thuần nhất có nghĩa là công nghệ
CSDL là như nhau (hay ít nhất là có thể tương thích) tại mỗi vị trí địa lý và dữ liệu tại
các vị trí địa lý khác nhau cũng có thể tương thích. Các hệ CSDL phân tán thuần nhất
đơn giản hoá việc chia sẻ dữ liệu giữa những người sử dụng khác nhau.
Các điều kiện sau cần được thoả mãn:
- Các hệ điều hành mày tính tại mỗi vị trí địa lý là như nhau hay ít nhất chúng có
khả năng tương thích cao.
- Các mô hình dữ liệu được sử dụng tại mỗi vị trí địa lý là như nhau (mô hình
quan hệ được sử dụng chung nhất đối với các hệ CSDL phân tán ngày nay).
- Các hệ CSDL được sử dụng tại mỗi vị trí địa lý là như nhau hay ít nhất chúng
có khả năng tương thích cao.
- Dữ liệu tại các vị trí khác nhau có thể có các định nghĩa và khuôn dạng chung.
Các hệ CSDL phân tán thuần nhất thể hiện một mục đích thiết kế đối với các CSDL
phân tán. Cụ thể, các CSDL phân tán thuần nhất được thiết kế bằng cách chia nhỏ một
CSDL xí nghiệp thành nhiều CSDL địa phương, các CSDL địa phương định vị trên các
trạm làm việc khác nhau nhưng chúng được biểu diễn bởi cùng một mô hình dữ liệu và
được quản trị bởi cùng một hệ quản trị CSDL địa phương.