Tải bản đầy đủ (.docx) (74 trang)

Nghiên cứu giải pháp tự động sao lưu và khôi phục dữ liệu trong hệ thống thông tin điện tử luận văn ths công nghệ thông tin 1 01 10

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (955.08 KB, 74 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

--------------------

Đặng Minh Chính

NGHIÊN CỨU
GIẢI PHÁP TỰ ĐỘNG SAO LƯU VÀ KHÔI PHỤC DỮ LIỆU
TRONG HỆ THỐNG THÔNG TIN ĐIỆN TỬ
Ngành:
Mã số:

Công nghệ thông tin.
1.01.10

LUẬN VĂN THẠC SỸ

NGƯỜI HƯỚNG DẪN KHOA HỌC:

PGS.TS. Vũ Duy Lợi

Hà Nội - 2007


MỤC LỤC
MỤC LỤC…………………………………………………………………………………...

2

LỜI CAM ĐOAN…………………………………………………………………………



3

DANH MỤC BẢNG BIỂU………………………………………………………………

4

DANH MỤC KÝ HIỆU…………………………………………………………………..

5

MỞ ĐẦU…………………………………………………………………………………….

7

Chƣơng 1: GIỚI THIỆU CHUNG...................................................................................................... 10
1.1 Sự cần thiết về sao lƣu, khôi phục dữ liệu……………………………………

10

1.2 Các hệ thống lƣu trữ dữ liệu

12

1.2.1 Hệ thống lƣu trữ DAS …………………………………………………….

12

1.2.2 Hệ thống lƣu trữ NAS ……………………………………………………..


14

1.2.3 Hệ thống lƣu trữ SAN ……………………………………………………... 15
1.2.4 So sánh các hệ thống lƣu trữ ……………………………………………...

16

1.3 Ứng dụng sao lƣu, khôi phục dữ liệu trong hệ thống thông tin điện tử
của các cơ quan Đảng ….......................................................................................................................... 17
1.3.1 Các phần mềm ứng dụng dùng chung…………………………………..

17

1.3.2 Những hạn chế tồn tại ……………………………………………………..

19

1.3.3 Hƣớng giải quyết hạn chế tồn tại………………………………………...

19

Chƣơng 2: CÁC PHƢƠNG PHÁP SAO LƢU, KHÔI PHỤC CƠ SỞ DỮ
LIỆU ……………………................................................................................................................... 20
2.1 Khái niệm cơ bản…………………………………………………………………

20

2.1.1 Định nghĩa sao lƣu, khôi phục dữ liệu …………………………………

20


2.1.2 Phân loại các kiểu sao lƣu, khôi phục phục dữ liệu …………….……

22

2.1.3 Tiêu chí đánh giá dịch vụ sao lƣu, khôi phục dữ liệu …. …………..

24

2.2 Các phƣơng pháp sao lƣu, khôi phục cơ sở dữ liệu ………………………... 26
2.2.1 Sao lƣu, khôi phục cơ sở dữ liệu mức hệ điều hành………………….

26

2.2.2 Sao lƣu, khôi phục cơ sở dữ liệu mức hệ quản trị cơ sở dữ liệu……

28

1


2.2.3 Sao lƣ
2.3

Đánh giá các phƣơng pháp sao lƣu, khôi ph

Chƣơng 3: ĐỀ XUẤT GIẢI PHÁP SAO LƢU, KHÔI PHỤC CÁC CƠ SỞ
DỮ LIỆU……………….........................................................................................................
3.1


Mục đích, yêu cầu………………………………

3.2

Kiến trúc hệ thống, nguyên tắc hoạt động…

3.2.1 Kiến tr

3.2.2 Nguyê
3.3

Xây dựng và thử nghiệm hệ thống……………

3.3.1 Thiết k

3.3.2 Nguyê

3.3.3 Thử ng
KẾT LUẬN…………………………………………………………………………………
TÀI LIỆU THAM KHẢO ……………………………………………………………….
PHỤ LỤC……………………………………………………………………………………
A. Cài đặt và cách sử dụng chƣơng trình………………………………………….
B. Mã nguồn chƣơng trình…………………………………………………………...
C. Cơ chế chạy tự động cron trong Linux…………………………………………
D. Cơ chế chạy tự động Scheduled Tasks trong Windows……………………..

2


DANH MỤC BẢNG BIỂU

Hình 1. Mô hình hệ thống lưu trữ DAS (Direct Access Storage)
Hình 2. Mô hình NAS (Network Attached Storage)
Hình 3. Mô hình SAN (Storage Area Network)
Hình 4. So sách các phương pháp sao lưu dữ liệu
Hình 5. Kiến trúc phần mềm EDocMan
Hình 6. Mô hình tiến trình sao lưu dữ liệu
Hình 7. Mô hình tiến trình khôi phục dữ liệu
Hình 8. So sánh các giải pháp lưu trữ dữ liệu
Hình 9. Tiêu chí đánh giá dịch vụ khôi phục thảm hoạ
Hình 10. Sao lưu cơ sở dữ liệu mức hệ điều hành
Hình 11. Sao lưu, khôi phục cơ sở dữ liệu mức hệ quản trị cơ sở dữ liệu
Hình 12. Sao lưu, khôi phục cơ sở dữ liệu mức ứng dụng
Hình 13. Đánh giá các phương pháp sao lưu, khôi phục dữ liệu
Hình 14. Mô hình kiến trúc tổng thể hệ thống
Hình 15. Mô hình các chức năng cơ bản của chương trình
Hình 16. Giao diện của chương trình sao lưu dữ liệu
Hình 17. Bảng kết quả thời gian sao lưu dữ liệu
Hình 18. Giao diện của chương trình khôi phục dữ liệu
Hình 19. Bảng kết quả chương trình khôi phục dữ liệu
Hình 20. Màn hình các ứng dụng chạy trong chế độ crontab
Hình 21. Màn hình chọn tệp chạy tự động trong Scheduled Tasks
Hình 22. Màn hình chọn thời gian chạy ứng dụng trong Scheduled Tasks
Hình 23. Màn hình kết thúc quá trình đặt lịch chạy trong Scheduled Tasks

4


DANH MỤC CÁ
STT


Ký hiệu

1.

API

2.

backup

3.

Backup offline

4.

Backup online

5.

consistent

6.

Cron

7.

Control File


8.

Client

9.

Database

10.

Database Access Libraries

11.

DMS

12.

Download

13.

Database need to backup

14.

file

15.


Full Backup

16.

Incremnental Backup

17.

Instance

18.

Ip

19.

J2EE

20.

Java Complier

21.

Modul


5



22. Transaction log
23. Pure java
24. Request
25. Response
26. Router
27. Recovery Point Objective
28. Storge
29. Server
30. Scheduled Tasks
31. Swich
32. Type of database
33. Table space
34.
35.
36.

Time out
UMS
WFS


6


MỞ ĐẦU
1.

Tính cấp thiết của luận văn
Thực hiện chỉ thị 58-CT/TW về đẩy mạnh ứng dụng và phát triển công


nghệ thông tin phục vụ sự nghiệp công nghiệp hóa, hiện đại hóa và Đề án 06
tin học hoá hoạt động của các các cơ quan Đảng giai đoạn 2006 – 2010 nhằm
xây dựng các hệ thống thông tin điện tử của các cấp uỷ Đảng đảm bảo cung
cấp thông tin và trao đổi thông tin từ Trung ương xuống các địa phương. Các
ứng dụng dùng chung trong hệ thống các cơ quan Đảng được xây dựng trên
hệ thống mã nguồn mở, cài đặt trên nền hệ điều hành Linux, cơ sở dữ liệu
Posgresql, MySQl, MicroSoft SQL. Webserver là Tomcat, Application Server
là Jboss.
Đây là hệ thống thông tin điện tử phục vụ sự lãnh đạo, chỉ đạo, điều
hành của các cấp uỷ Đảng, nơi chứa các thông tin quan trọng của Đảng. Do
vậy, cần đảm bảo hệ thống này hoạt động liên tục và an toàn. Các ứng dụng
hiện nay đang được sao lưu, khôi phục một cách cục bộ. Mỗi ứng dụng sử
dụng một chương trình sao lưu riêng, việc sao lưu tương đối phức tạp, đòi hỏi
người quản trị mạng phải có kiến thức nhất định về cơ sở dữ liệu mình quản
lý. Việc xây dựng giải pháp sao lưu và khôi phục các cơ sở dữ liệu một cách
tập trung, tự động là rất quan trọng và rất cần thiết.
2.

Mục đích của luận văn
-

Nghiên cứu tổng quan về các giải pháp sao lưu, khôi phục dữ liệu.

-

Nghiên cứu đề xuất giải pháp tự động sao lưu và khôi phục các cơ sở

dữ liệu (hệ thống và ứng dụng) một cách tập trung, phù hợp với kiến trúc của
các hệ thống thông tin điện tử.


7


3.

Đối tượng nghiên cứu
Đối tượng nghiên cứu của luận văn là hệ thống các cơ sở dữ liệu trong

mạng diện rộng của các cơ quan Đảng.

4.

Phạm vi nghiên cứu
Luận văn nghiên cứu một cách tương đối có hệ thống về nguyên tắc, cơ

chế hoạt động của các phương pháp sao lưu, khôi phục dữ liệu cơ bản.
Nghiên cứu cơ chế các phần mềm sao lưu, khôi phục của các hãng chuyên sao
lưu khôi phục trên thế giới, đánh giá ưu nhược điểm, từ đó đưa ra giải pháp và
xây dựng công cụ giúp sao lưu, khôi phục dữ liệu tự động trong các hệ thống
thông tin điện tử.
5.

Phương pháp nghiên cứu
Luận văn kết hợp giữa mô hình nghiên cứu lí thuyết và ứng dụng minh

họa để kiểm chứng. Nói chính xác hơn là, từ những nghiên cứu lí thuyết và
giải pháp lí thuyết, đánh giá ưu nhược điểm của các giải pháp về sao lưu, khôi
phục, luận văn xây dựng một chương trình cho phép sao lưu, khôi phục dữ
liệu một cách tập trung với nhiều tính năng vượt trội.
Hệ thống được kiểm nghiệm trên một số cơ sở dữ liệu dùng chung

trong các cơ quan Đảng.

6.

Ý nghĩa khoa học và thực tiễn của luận văn
Luận văn không chỉ nghiên cứu một cách khoa học, nguyên lý các cách

thức sao lưu, khôi phục dữ liệu, đánh giá các giải pháp đang có trên thị
trường, phân tích ưu nhược điểm của các giải pháp đó, mà còn đề xuất một
giải pháp cũng dựa trên các nguyên tắc cơ bản về sao lưu, khôi phục dữ liệu
nhưng được cải tiến một số nhược điểm mà các giải pháp trước đó gặp phải.
Như vậy, luận văn đã đạt được ý nghĩa khoa học và khẳng định tính thực tiễn

8


của mình. Nó đóng góp một phần quan trọng trong việc đảm bảo an toàn dữ
liệu và đảm bảo hoạt động liên tục của các hệ thống thông tin điện tử đang
hoạt động trong mạng diện rộng của Đảng.

7.

Kết cấu luận văn
Ngoài phần Mở đầu và phần Kết luận, luận văn gồm có 3 chương sau:
Chương 1: Giới thiệu tổng quan về sự cần thiết sao lưu, khôi phục
dữ liệu và hiện trạng thực hiện các hệ thống thông tin điện tử trong
các cơ quan Đảng.
Chương 2. Nghiên cứu các giải pháp sao lưu, khôi phục dữ liệu,
đánh giá ưu nhược điểm của từng giải pháp.
Chương 3: Đề xuất giải pháp sao lưu, khôi phục các cơ sở dữ liệu

áp dụng cho các hệ thống thông tin điện tử trong các cơ quan Đảng.

9


Chƣơng 1: GIỚI THIỆU CHUNG

1.1 Sự cần thiết sao lưu, khôi phục dữ liệu
Trong thời đại ngày nay, thông tin đóng vai trò hết sức quan trọng trong
hầu hết các cơ quan, tổ chức. Xét trên khía cạnh công nghệ, hoạt động của cơ
quan, tổ chức là quá trình xử lý, trao đổi dữ liệu và lưu trữ thông tin. Việc sao
lưu, khôi phục dữ liệu để đảm bảo hệ thống hoạt động liên tục, thông suốt
ngày càng được quan tâm cao và được đầu tư thỏa đáng.
Có nhiều nguyên nhân làm hỏng hóc hoặc mất mát dữ liệu như: tệp
chẳng may bị xoá, trục trặc phần cứng, thông tin liên quan nằm ở những tệp
không còn truy cập được. Một quản trị viên giỏi phải đảm bảo sao cho người
dùng vẫn tham khảo được những tệp “đã mất” như thế. Muốn vậy, quản trị
mạng phải sao lưu dữ liệu kịp thời. Tương lai của cơ quan bạn và tương lai
của bạn tại cơ quan có thể tuỳ thuộc vào việc các người dùng truy cập được
những tệp đã sao lưu ấy. Tại những thời điểm nóng bỏng như thế, bản thân
bạn cũng như các người khác sẽ có cơ hội nhận thức giá trị của thời gian và
công sức để sao chép dữ liệu một cách đều đặn, chặt chẽ và theo một thời
điểm đầy đủ. Việc sao lưu tệp không mấy hấp dẫn, nhưng quản trị viên không
thể không am tường tiến trình sao lưu.
Trong quá trình thực hiện sao lưu dữ liệu có thể xảy ra lỗi hệ thống,
nghĩa là dữ liệu có thể bị mất hoặc không được sao lưu đầy đủ, chính xác. Các
nguyên nhân chủ yếu gây ra lỗi hệ thống là:
-

Lỗi do con người: Một trong những nguyên nhân phổ biến làm hỏng


hệ thống là do con người. Ví dụ nếu người nào đó trong quá trình sử

10


dụng xoá nhầm dữ liệu của một bảng thông tin, lập tức hệ thống sẽ kết
nối đến các bảng có liên quan để xóa dữ liệu dữ liệu trong các bảng
này. Mặc dù chúng ta có thể khôi phục dữ liệu từ các thiết bị lưu trữ
nhưng một số dữ liệu có thể mất. Cách khắc phục hay dùng là trong các
hệ điều hành có phân quyền đến từng người sử dụng, tạo người dùng
với những quyền khác nhau trên từng ứng dụng cụ thể.

-

Lỗi phần cứng: Hệ thống máy móc thiết bị có thể hỏng hóc bất cứ lúc

nào, nó có thể hỏng ở bộ xử lý, bộ nhớ, đường vào ra và các thiết bị lưu
trữ. Đối với người quản trị hệ thống thì phải luôn giám sát hệ thống
thông qua các thông báo lỗi của hệ thống để tìm cách khắc phục lỗi.

-

Lỗi trong phiên giao dịch: Trong các phiên giao dịch, đôi khi bị lỗi do

hệ thống bị treo hay đang cập nhật thông tin. Trong trường hợp này, hệ
thống sẽ có ghi nhận một cách thứ tự tất cả các thao tác chứa trong tệp
nhật ký giao dịch (transaction log) kể từ lần nhật ký giao dịch được sao
lưu gần nhất. Và do vậy có thể khôi phục dữ liệu vào một thời điểm nào
đó trong quá khứ mà vẫn đảm bảo tính nhất quán (consistent).


-

Lỗi do thiên tai : Một số trường hợp hệ thống bị lỗi do các thảm hoạ

thiên tai như động đất, sét đánh, cháy, điện không ổn định, ... Tùy thuộc
số lượng dữ liệu bị mất, sẽ có các mức độ khôi phục khác nhau.

11


1.2 Các hệ thống lưu trữ dữ liệu [22]
Hiện nay có rất nhiều hệ thống lưu trữ dữ liệu để thực hiện việc sao lưu,
khôi phục dữ liệu, trong đó ba hệ thống lưu trữ dữ liệu phổ biến nhất là DAS,
NAS, SAN.
1.2.1 Hệ thống lƣu trữ DAS

DAS (Direct Access Storage) là hệ thống lưu trữ dữ liệu mà ở đó thiết
bị lưu trữ được gắn trực tiếp vào máy chủ. Thiết bị lưu trữ có thể là tủ đĩa đặt
bên ngoài và được nối với máy chủ bởi cáp điều khiển với cổng bên ngoài,
hoặc là những ổ đĩa ở bên trong máy chủ. Hiện nay hầu hết các hệ máy chủ
đều có các hệ thống lưu trữ DAS dùng chuẩn SCSI hoặc Serial SCSI. Trong
hệ thống DAS, các máy trạm truy xuất qua máy chủ, trong trường hợp máy
chủ hỏng, các truy xuất dữ liệu sẽ không thực hiện được. Với giải pháp này,
mỗi máy chủ sẽ có một hệ thống lưu trữ và phần mềm quản lý lưu trữ riêng
biệt.

Hình 1. Mô hình hệ thống lưu trữ DAS (Direct Access Storage)
Các thành phần chính của hệ thống DAS là:
-


Máy chủ (Server)

-

Card HBA được cài đặt trong máy chủ để kết nối máy chủ với thiết bị

lưu trữ bên ngoài.
-

Ổ đĩa lưu trữ được cài đặt vào trong hệ thống con của thiết bị lưu trữ.

12


Ưu điểm: Dễ lắp đặt, chi phí thấp, hiệu năng cao.
Nhược điểm:
-

Khả năng mở rộng hạn chế, thực tế DAS làm việc rất tốt với một máy

chủ (server) nhưng khi dữ liệu tăng, số lượng máy chủ cũng tăng sẽ tạo nên
những vùng dữ liệu phân tán và gián đoạn. Khi đó, người quản trị sẽ phải bổ
sung hay thiết lập lại dung lượng và công việc bảo trì sẽ phải thực hiện trên
từng máy chủ. Điều đó sẽ làm tăng chi phí lưu trữ tổng thể và sẽ càng khó
khăn hơn khi sao lưu hay bảo vệ một hệ thống kho lưu trữ dữ liệu đang nằm
rải rác và phân tán như vậy.
-

Khai thác tài nguyên không hiệu quả: Không gian lưu trữ bị chia nhỏ


thành các vùng cục bộ nên khai thác không hiệu quả. Ví dụ, một máy chủ có
thể cố gắng ghi lên một vùng lưu trữ bị đầy, trong khi đó một vùng lưu trữ
khác thì lại thừa nhưng không khai thác chung được.
-

Lưu thông mạng chậm: Khi chia sẻ dữ liệu qua mạng sẽ làm chậm lưu

thông mạng.
-

Quản trị phức tạp: Việc chia nhỏ các vùng lưu trữ cục bộ sẽ làm phức

tạp vấn đề quản lý của toàn hệ thống lưu trữ.
1.2.2 Hệ thống lƣu trữ NAS

NAS (Network Attached Storage) là phương pháp lưu trữ dữ liệu sử
dụng các thiết bị lưu trữ đặc biệt gắn trực tiếp vào mạng LAN như một thiết bị
mạng bình thường (tương tự máy tính, switch hay router). Các thiết bị NAS
cũng được gán các địa chỉ IP cố định và được người dùng truy nhập thông qua
sự điều khiển của máy chủ. Trong một số trường hợp, NAS có thể được truy
cập trực tiếp không cần có sự quản lý của máy chủ. NAS cung cấp khả năng
chia sẻ tài nguyên lưu trữ cho nhiều người dùng đồng thời. Bên cạnh đó, NAS

13


cho phép thực hiện mở rộng về dung lượng lưu trữ khi nhu cầu sử dụng tăng
cao.
Vì NAS là thiết bị lưu trữ dựa trên mạng LAN nên NAS đòi hỏi các

yêu cầu riêng về cách truy xuất tệp, tính bảo mật, môi trường kết nối mạng.

Hình 2. Mô hình hệ thống lưu trữ NAS (Network Attached Storage)
Các ưu điểm của NAS:
-

Không tốn chi phí cho các card điều hợp HBA và RAID.

-

Dễ dàng cấu hình vì đây là các thiết bị plug-and-play.

-

Có thể truy xuất từ bất kì nơi nào, qua kết nối mạng.

-

Hỗ trợ nhiều hệ điều hành.

Nhược điểm của NAS
-

Chỉ cho phép dùng qua LAN.

-

Bị giới hạn băng thông và làm ảnh hưởng đến lưu thông mạng LAN.

-


Bị giới hạn về khả năng quản lí dung lượng.

14


1.2.3 Hệ thống lƣu trữ SAN

SAN (Storage Area Network) là một mạng riêng tốc độ cao dùng cho
việc truyền dữ liệu giữa các máy chủ tham gia vào hệ thống lưu trữ cũng như
giữa các thiết bị lưu trữ với nhau. Một mạng SAN cho phép các thành phần
kết nối với nhau thông qua thiết bị như routers, gateways, hubs, switchs. Điều
đó cho phép bỏ kết nối lưu trữ và sao lưu truyền thống giữa một máy chủ với
thiết bị lưu trữ, đồng thời bỏ ý niệm một máy chủ chỉ sở hữu và quản lý một
thiết bị lưu trữ.
Sử dụng mạng lưu trữ SAN cho phép quản lý toàn bộ hệ thống lưu trữ,
cho phép một hay nhiều máy chủ hỗn hợp chia sẻ các tiện ích lưu trữ như
dùng chung ổ đĩa, băng từ và các phương tiện lưu trữ quang, mặc dù hệ thống
thiết bị lưu trữ đó được đặt cách xa các máy chủ sử dụng nó bởi kết nối là
những tuyến cáp quang. Vì vậy, SAN thường được phát triển ở những trung
tâm dữ liệu lớn.

Hình 3. Hệ thống lưu trữ SAN (Storage Area Network)
Hình 3 cho thấy SAN kết nối nhiều máy chủ với nhiều hệ thống ứng dụng và
lưu trữ khác nhau. Hầu hết mạng SAN hiện nay cung cấp cho người sử dụng

15


khả năng mở rộng, hiệu năng và tính sẵn sàng cao. SAN đặc biệt thích hợp

với các ứng dụng cần tới tốc độ và độ trễ nhỏ, ví dụ như ứng dụng xử lý giao
dịch trong ngành ngân hàng, tài chính.
1.2.4 So sánh các hệ thống lƣu trữ

Mỗi một hệ thống lưu trữ đều có mặt ưu và nhược điểm khác nhau. Tùy
vào quy mô dữ liệu, nhu cầu, kinh phí… mà sử dụng hệ thống lưu trữ thích
hợp.

Máy chủ, HĐH

Thiết bị lưu trữ
Quản trị
Hiệu suất

Tốc độ

Sẵn sàng cao
Chi phí

Hình 4. So sánh các giải pháp lưu trữ dữ liệu

16


1.3 Ứng dụng sao lưu, khôi phục dữ liệu trong các hệ thống
thông tin điện tử của Đảng [17]
1.3.1 Các phần mềm ứng dụng dùng chung

Hiện tại, trong các cơ quan Đảng đang sử dụng dùng chung, thống nhất
một số phần mềm như:

a)

Phần mềm Hệ thông tin điều hành tác nghiệp thực hiện trên phần

mềm nền Lotus Notes, cho phép quản lý, xử lý, trao đổi, khai thác văn bản, tài
liệu lưu trữ của Đảng;
b)

Phần mềm Hệ thông tin quản lý dữ liệu đảng viên cho phép quản lý,

xử lý, trao đổi, khai thác dữ liệu về đảng viên, tổ chức đảng trong toàn Đảng;
c)

Phần mềm đặc thù chuyên ngành Kiểm tra Đảng, cho phép quản lý,

xử lý, trao đổi khai thác hồ sơ, tài liệu liên quan đến công tác kiểm tra đảng.
Các phần mềm này được phát triển và hoạt động trên nền hệ điều hành
Windows, sử dụng các hệ quản trị cơ sở dữ liệu chuyên biệt của Lotus Notes
hoặc hệ quản trị cơ sở dữ liệu quan hệ SQL; giao diện người dùng, hoặc được
phát triển riêng (client software) hoặc là giao diện Web.
Một trong các định hướng phát triển các hệ thống thông tin điện tử của
các cơ quan Đảng là sử dụng phần mềm mã nguồn mở. Phần mềm Hệ thông
tin điều hành tác nghiệp eDocMan được phát triển trên nền phần mềm mã
nguồn mở và đang được triển khai sử dụng trong các cơ quan Đảng, thay thế
cho phần mềm Hệ thông tin điều hành tác nghiệp trên phần mềm nền Lotus
Notes.

17



Kiến trúc của phần mềm eDocman được mô tả trong Hình 5.

Hình 5. Kiến trúc phần mềm eDocMan
Thành phần cơ bản của phần mềm eDocMan là phân hệ quản lý văn
bản (document management) và xử lý luồng công việc (workflow). Các phân
hệ này liên hệ chặt chẽ với các phân hệ cung cấp dịch vụ hệ thống như: a)
dịch vụ thư điện tử và thông báo, phục vụ việc trao đổi văn bản giữa các phân
hệ quản lý văn bản khác nhau; b) dịch vụ lưu trữ dữ liệu; c) dịch vụ quản trị
người dùng, bao gồm quản lý tài khoản người dùng, quản lý quyền truy nhập
các cơ sở dữ liệu văn bản, quản lý vai trò người dùng trong xử lý luồng công
việc; và d) xác thực người dùng. Ngoài ra, các phân hệ cơ bản của eDocMan
còn được tích hợp với dịch vụ ứng dụng khác như: dịch vụ fax, dịch vụ nhận
dạng văn bản OCR, dịch vụ quét ảnh văn bản (scan document).
Người dùng trao đổi dữ liệu với hệ thống eDocMan thông qua các giao
diện trình duyệt Web (Webbrowser) và dịch vụ ODMA, cho phép truy nhập
trực tiếp từ các ứng dụng văn phòng như: MS Word, MS Powerpoint, ... vào
cơ sở dữ liệu văn bản được quản lý bởi eDocMan.

18


1.3.2 Một số hạn chế tồn tại
-

Các phần mềm đã xây dựng này đều là các ứng dụng độc lập, chưa có

kiến trúc thống nhất và không được tích hợp, chia sẻ thông tin, dữ liệu theo
các tiêu chuẩn tiên tiến hiện nay.
-


Chưa có cơ chế sao lưu, khôi phục dữ liệu tập trung.

1.3.3 Hƣớng giải quyết hạn chế tồn tại
-

Nghiên cứu, xây dựng mô hình kiến trúc hệ thống công nghệ thông tin

trong quá trình xây dựng các hệ thống thông tin điện tử của Đảng, đảm bảo
kiến trúc thống nhất cho việc xây dựng và đưa các hệ thống thông tin điện tử
vào vận hành, sử dụng, tránh trùng lắp, lãng phí khi phát triển, giúp người
dùng khai thác, sử dụng dễ dàng thuận tiện.
-

Nghiên cứu, đề xuất xây dựng giải pháp sao lưu các cơ sở dữ liệu một

cách tập trung nhằm đảm bảo dữ liệu, thông tin được hoàn toàn kiểm soát và
đảm bảo độ an toàn trong toàn Đảng.

19


CHƢƠNG 2: CÁC PHƢƠNG PHÁP SAO LƢU, KHÔI PHỤC
CƠ SỞ DỮ LIỆU

2.1 Khái niệm cơ bản
2.1.1 Định nghĩa sao lƣu, khôi phục dữ liệu

Sao lưu dữ liệu là quá trình tạo ra một bản sao dữ liệu sang các thiết bị
lưu trữ. Việc lưu trữ này được sử dụng trong tương lai khi hệ thống ban đầu bị
hỏng.


Nguồn

Tiến trình
sao lưu

Đích

Hình 6. Mô hình tiến trình sao lưu dữ liệu
Trong hầu hết các trường hợp thì nguồn thường là dữ liệu trong đĩa
cứng như các tệp, thư mục, cơ sở dữ liệu và các ứng dụng. Phần mềm thực
hiện quá trình sao lưu dữ liệu sang các thiết bị lưu trữ gọi là phần mềm sao
lưu dữ liệu. Đích là các thiết bị lưu trữ như băng từ, đĩa từ, đĩa quang, ...

20


Khôi phục dữ liệu là quá trình tạo lại dữ liệu gốc từ dữ liệu đã được lưu trữ.

Đích

Tiến trình
khôi phục

Nguồn

Hình 7. Mô hình tiến trình khôi phục dữ liệu
Sao lưu dữ liệu trong môi trường mạng là quá trình sao lưu dữ liệu
trong đó tiến trình sao lưu dữ liệu từ nguồn sang các thiết bị lưu trữ thông qua
môi trường mạng.

Sao lưu dữ liệu trong môi trường mạng cần chú ý một số vấn đề sau :
-

Thiết bị sao lưu phải có khả năng kết nối đến bất kỳ hệ thống

máy tính trong mạng.
-

Định tuyến luồng dữ liệu sẽ sao lưu trong mạng

-

Quản trị hoạt động sao lưu đối với bất kỳ hệ thống nào.

-

Hỗ trợ sao lưu nhiều loại hệ thống khác nhau.

Sao lưu tự động là quá trình hệ thống tự động sao lưu theo một thời
gian định trước. Việc sao lưu tự động đem lại rất nhiều lợi ích như giúp quản
trị mạng thực hiện công việc sao lưu vào thời điểm không có người dùng truy
cập hệ thống hoặc ít sử dụng tài nguyên hệ thống, tránh các sai sót trong quá
trình sao lưu. Trên hệ điều hành Linux, Unix để chạy các chương trình tự
động thì thường sử dụng chức năng Cron. Đó là chức năng cho phép người
dùng thực hiện các tác vụ theo định kỳ đã được lên kế hoạch và thời gian
trước.

21



2.1.2 Phân loại các kiểu sao lƣu dữ liệu

Có hai kiểu sao lưu dữ liệu chính : Sao lưu không trực tuyến (backup
offline) và Sao lưu trực tuyến (backup online).
Sao lưu không trực tuyến: thực hiện khi hệ thống tạm ngừng hoạt động
và do đó không có các thao tác của người dùng tác động vào hệ thống. Người
dùng không thể kết nối đến các ứng dụng để thực hiện bất kỳ thao tác nào. Sẽ
không có bất cứ hành động nào tác động lên hệ thống ngoại trừ tiến trình sao
lưu.
Sao lưu trực tuyến: Thực hiện quá trình sao lưu ngay cả khi hệ thống
đang hoạt động. Người dùng có thể sử dụng các chức năng của chương trình
trong khi tiến trình sao lưu đang thực hiện.
Bản thân trong sao lưu trực tuyến và sao lưu không trực tuyến cũng
chia ra làm các loại nhỏ đó là sao lưu theo phương thức đầy đủ và sao lưu
theo phương thức gia tăng.
Loại sao lưu
Sao lưu đầy đủ
(Full Backup)

22


Sao lưu gia tăng
so với lần
lưu cuối cùng
(Incremental
backup)

Sao lưu gia tăng
so với lần

lưu đầy đủ cuối
cùng.
(Differential
backup)

Hình 8. So sách các phương pháp sao lưu dữ liệu
Sao lưu theo phương thức đầy đủ là sao lưu toàn bộ các tệp trong thư
mục được xác định cần sao lưu hoặc sao lưu toàn bộ ứng dụng bao gồm cả

23


×