Tải bản đầy đủ (.pdf) (13 trang)

Nghiên cứu giải pháp tự động sao lưu và khôi phục dữ liệu trong hệ thống thông tin điện tử

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (393.1 KB, 13 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

--------------------

Đặng Minh Chính

NGHIÊN CỨU
GIẢI PHÁP TỰ ĐỘNG SAO LƯU VÀ KHÔI PHỤC DỮ LIỆU
TRONG HỆ THỐNG THÔNG TIN ĐIỆN TỬ
Ngành:
Mã số:

Công nghệ thông tin.
1.01.10

LUẬN VĂN THẠC SỸ

NGƢỜI HƢỚNG DẪN KHOA HỌC:

PGS.TS. Vũ Duy Lợi

Hà Nội - 2007


MỤC LỤC
MỤC LỤC…………………………………………………………………………………...

2

LỜI CAM ĐOAN…………………………………………………………………………



3

DANH MỤC BẢNG BIỂU………………………………………………………………

4

DANH MỤC KÝ HIỆU…………………………………………………………………..

5

MỞ ĐẦU…………………………………………………………………………………….

7

Chƣơng 1: GIỚI THIỆU CHUNG ..... ............................................................................

10

1.1 Sự cần thiết về sao lƣu, khôi phục dữ liệu……………………………………

10

1.2 Các hệ thống lƣu trữ dữ liệu

12

1.2.1 Hệ thống lƣu trữ DAS …………………………………………………….

12


1.2.2 Hệ thống lƣu trữ NAS ……………………………………………………..

14

1.2.3 Hệ thống lƣu trữ SAN ……………………………………………………...

15

1.2.4 So sánh các hệ thống lƣu trữ ……………………………………………...

16

1.3 Ứng dụng sao lƣu, khôi phục dữ liệu trong hệ thống thông tin điện tử
của các cơ quan Đảng … .....................................................................................

17

1.3.1 Các phần mềm ứng dụng dùng chung…………………………………..

17

1.3.2 Những hạn chế tồn tại ……………………………………………………..

19

1.3.3 Hƣớng giải quyết hạn chế tồn tại………………………………………...

19


Chƣơng 2: CÁC PHƢƠNG PHÁP SAO LƢU, KHÔI PHỤC CƠ SỞ DỮ
LIỆU ……………………......................................................................................................

20

2.1 Khái niệm cơ bản…………………………………………………………………

20

2.1.1 Định nghĩa sao lƣu, khôi phục dữ liệu …………………………………

20

2.1.2 Phân loại các kiểu sao lƣu, khôi phục phục dữ liệu …………….……

22

2.1.3 Tiêu chí đánh giá dịch vụ sao lƣu, khôi phục dữ liệu …. …………..

24

2.2 Các phƣơng pháp sao lƣu, khôi phục cơ sở dữ liệu ………………………...

26

2.2.1 Sao lƣu, khôi phục cơ sở dữ liệu mức hệ điều hành………………….

26

2.2.2 Sao lƣu, khôi phục cơ sở dữ liệu mức hệ quản trị cơ sở dữ liệu……


28

1


2.2.3 Sao lƣu, khôi phục cơ sở dữ liệu mức ứng dụng……………………..

29

2.3 Đánh giá các phƣơng pháp sao lƣu, khôi phục cơ sở dữ liệu……………...

31

Chƣơng 3: ĐỀ XUẤT GIẢI PHÁP SAO LƢU, KHÔI PHỤC CÁC CƠ SỞ
DỮ LIỆU……………….........................................................................................................

33

3.1 Mục đích, yêu cầu………………………………………………………………..

34

3.2 Kiến trúc hệ thống, nguyên tắc hoạt động……………………………………

35

3.2.1 Kiến trúc hệ thống …………………………………………………...

35


3.2.2 Nguyên tắc hoạt động……………………………………………………..

38

3.3 Xây dựng và thử nghiệm hệ thống…………………………………………….

39

3.3.1 Thiết kế chi tiết chƣơng trình ……………………………………………

39

3.3.2 Nguyên tắc hoạt động ……………………………………………………..

41

3.3.3 Thử nghiệm chƣơng trình ………………………………………………...

42

KẾT LUẬN…………………………………………………………………………………

47

TÀI LIỆU THAM KHẢO ……………………………………………………………….

50

PHỤ LỤC……………………………………………………………………………………


52

A. Cài đặt và cách sử dụng chƣơng trình………………………………………….

52

B. Mã nguồn chƣơng trình…………………………………………………………...

53

C. Cơ chế chạy tự động cron trong Linux…………………………………………

69

D. Cơ chế chạy tự động Scheduled Tasks trong Windows……………………..

70

2


LỜI CAM ĐOAN.
Tôi luôn tâm niệm với bản thân rằng “Mình phải luôn luôn học tập và
nghiên cứu để nâng cao kiến thức và trình độ chuyên môn nhằm mục đích trở
thành con ngƣời hữu ích cho xã hội, cho đất nƣớc”. Chính vì vậy, tôi đã theo
đuổi khoá học sau đại học cũng nhƣ lựa chọn và thực hiện luận văn này. Tôi
tự tin và tự hào khi khẳng định rằng kết quả mình có đƣợc trong suốt quá
trình học tập và nghiên cứu ở trƣờng cũng nhƣ trong luận văn tốt nghiệp Thạc
sỹ của mình là kết quả của một quá trình học tập, công tác, nghiên cứu và

thực hiện hoàn toàn nghiêm túc, trung thực của bản thân.
Trong luận văn, tôi có tham khảo đến một số tài liệu của một số tác giả
khác. Chúng đƣợc liệt kê tại phần Tài liệu tham khảo ở cuối luận văn.
Tôi xin cam đoan và chịu trách nhiệm về nội dung và sự trung thực
trong luận văn tốt nghiệp Thạc sỹ của mình.

Học viên Đặng Minh Chính.

3


DANH MỤC BẢNG BIỂU
Hình 1. Mô hình hệ thống lƣu trữ DAS (Direct Access Storage)

12

Hình 2. Mô hình NAS (Network Attached Storage)

14

Hình 3. Mô hình SAN (Storage Area Network)

15

Hình 4. So sách các phƣơng pháp sao lƣu dữ liệu

16

Hình 5. Kiến trúc phần mềm EDocMan


18

Hình 6. Mô hình tiến trình sao lƣu dữ liệu

20

Hình 7. Mô hình tiến trình khôi phục dữ liệu

21

Hình 8. So sánh các giải pháp lƣu trữ dữ liệu

23

Hình 9. Tiêu chí đánh giá dịch vụ khôi phục thảm hoạ

25

Hình 10. Sao lƣu cơ sở dữ liệu mức hệ điều hành

26

Hình 11. Sao lƣu, khôi phục cơ sở dữ liệu mức hệ quản trị cơ sở dữ liệu

28

Hình 12. Sao lƣu, khôi phục cơ sở dữ liệu mức ứng dụng

30


Hình 13. Đánh giá các phƣơng pháp sao lƣu, khôi phục dữ liệu

32

Hình 14. Mô hình kiến trúc tổng thể hệ thống

35

Hình 15. Mô hình các chức năng cơ bản của chƣơng trình

38

Hình 16. Giao diện của chƣơng trình sao lƣu dữ liệu

43

Hình 17. Bảng kết quả thời gian sao lƣu dữ liệu

43

Hình 18. Giao diện của chƣơng trình khôi phục dữ liệu

44

Hình 19. Bảng kết quả chƣơng trình khôi phục dữ liệu

44

Hình 20. Màn hình các ứng dụng chạy trong chế độ crontab


68

Hình 21. Màn hình chọn tệp chạy tự động trong Scheduled Tasks

70

Hình 22. Màn hình chọn thời gian chạy ứng dụng trong Scheduled Tasks

70

Hình 23. Màn hình kết thúc quá trình đặt lịch chạy trong Scheduled Tasks

71

4


DANH MỤC CÁC KÝ HIỆU
STT Ký hiệu

Chú giải cho ký hiệu sử dụng

1. API

Giao diện lập trình ứng dụng

2. 1backup

Sao lƣu


3. Backup offline

Sao lƣu không trực tuyến

4. Backup online

Sao lƣu trực tuyến

5. 2consistent

Tính nhất quán

6. 3Cron

Cơ chế chạy tự động trong Linux

7. Control File

Tệp điều khiển

8. Client

Máy trạm

9. Database

Cơ sở dữ liệu

10. Database Access Libraries


Thƣ viện truy xuất cơ sở dữ liệu

11. DMS

Hệ thống quản trị tài liệu

12. Download

Tải xuống

13. Database need to backup

Cơ sở dữ liệu cần sao lƣu

14.4file

tệp

15. Full Backup

Sao lƣu toàn bộ

16. Incremnental Backup

Sao lƣu gia tăng

17. Instance

Thực thể


18. Ip

Giao thức Internet

19. J2EE
20. Java Complier
21. Modul

Công nghệ phát triển các ứng dụng web,
chạy trên máy ảo Java
Bộ dịch java
Là một đoạn chƣơng trình có khả năng
thực hiện một chức năng cụ thể

5


22.5Transaction log

Tệp ghi lại nhật ký các giao dịch

23.6Pure java

Hoàn toàn bằng java

24.7Request

Yêu cầu

25.8Response


Phản hồi

26. Router

Thiết bị định tuyến

27. Recovery Point Objective

Thời gian khôi phục

28. Storge

Lƣu trữ

29. Server

Máy chủ

30. Scheduled Tasks

Cơ chế chạy tự động trong Windows

31. Swich

Thiết bị chuyển mạch

32. Type of database

Loại cơ sở dữ liệu


33.9Table space

Không gian bảng

34.1
Time out
1

Thời gian chờ, thời gian tạm ngƣng

35.1
UMS
3

Hệ thống quản lý ngƣời dùng

36.1
WFS
4

Hệ thống quản lý luồng công việc

6


MỞ ĐẦU
1. Tính cấp thiết của luận văn
Thực hiện chỉ thị 58-CT/TW về đẩy mạnh ứng dụng và phát triển công
nghệ thông tin phục vụ sự nghiệp công nghiệp hóa, hiện đại hóa và Đề án 06

tin học hoá hoạt động của các các cơ quan Đảng giai đoạn 2006 – 2010 nhằm
xây dựng các hệ thống thông tin điện tử của các cấp uỷ Đảng đảm bảo cung
cấp thông tin và trao đổi thông tin từ Trung ƣơng xuống các địa phƣơng. Các
ứng dụng dùng chung trong hệ thống các cơ quan Đảng đƣợc xây dựng trên
hệ thống mã nguồn mở, cài đặt trên nền hệ điều hành Linux, cơ sở dữ liệu
Posgresql, MySQl, MicroSoft SQL. Webserver là Tomcat, Application Server
là Jboss.
Đây là hệ thống thông tin điện tử phục vụ sự lãnh đạo, chỉ đạo, điều
hành của các cấp uỷ Đảng, nơi chứa các thông tin quan trọng của Đảng. Do
vậy, cần đảm bảo hệ thống này hoạt động liên tục và an toàn. Các ứng dụng
hiện nay đang đƣợc sao lƣu, khôi phục một cách cục bộ. Mỗi ứng dụng sử
dụng một chƣơng trình sao lƣu riêng, việc sao lƣu tƣơng đối phức tạp, đòi hỏi
ngƣời quản trị mạng phải có kiến thức nhất định về cơ sở dữ liệu mình quản
lý. Việc xây dựng giải pháp sao lƣu và khôi phục các cơ sở dữ liệu một cách
tập trung, tự động là rất quan trọng và rất cần thiết.
2. Mục đích của luận văn
- Nghiên cứu tổng quan về các giải pháp sao lƣu, khôi phục dữ liệu.
- Nghiên cứu đề xuất giải pháp tự động sao lƣu và khôi phục các cơ sở
dữ liệu (hệ thống và ứng dụng) một cách tập trung, phù hợp với kiến trúc của
các hệ thống thông tin điện tử.

7


3. Đối tượng nghiên cứu
Đối tƣợng nghiên cứu của luận văn là hệ thống các cơ sở dữ liệu trong
mạng diện rộng của các cơ quan Đảng.
4. Phạm vi nghiên cứu
Luận văn nghiên cứu một cách tƣơng đối có hệ thống về nguyên tắc, cơ
chế hoạt động của các phƣơng pháp sao lƣu, khôi phục dữ liệu cơ bản. Nghiên

cứu cơ chế các phần mềm sao lƣu, khôi phục của các hãng chuyên sao lƣu
khôi phục trên thế giới, đánh giá ƣu nhƣợc điểm, từ đó đƣa ra giải pháp và
xây dựng công cụ giúp sao lƣu, khôi phục dữ liệu tự động trong các hệ thống
thông tin điện tử.
5. Phương pháp nghiên cứu
Luận văn kết hợp giữa mô hình nghiên cứu lí thuyết và ứng dụng minh
họa để kiểm chứng. Nói chính xác hơn là, từ những nghiên cứu lí thuyết và
giải pháp lí thuyết, đánh giá ƣu nhƣợc điểm của các giải pháp về sao lƣu, khôi
phục, luận văn xây dựng một chƣơng trình cho phép sao lƣu, khôi phục dữ
liệu một cách tập trung với nhiều tính năng vƣợt trội.
Hệ thống đƣợc kiểm nghiệm trên một số cơ sở dữ liệu dùng chung
trong các cơ quan Đảng.
6. Ý nghĩa khoa học và thực tiễn của luận văn
Luận văn không chỉ nghiên cứu một cách khoa học, nguyên lý các cách
thức sao lƣu, khôi phục dữ liệu, đánh giá các giải pháp đang có trên thị
trƣờng, phân tích ƣu nhƣợc điểm của các giải pháp đó, mà còn đề xuất một
giải pháp cũng dựa trên các nguyên tắc cơ bản về sao lƣu, khôi phục dữ liệu
nhƣng đƣợc cải tiến một số nhƣợc điểm mà các giải pháp trƣớc đó gặp phải.
Nhƣ vậy, luận văn đã đạt đƣợc ý nghĩa khoa học và khẳng định tính thực tiễn

8


của mình. Nó đóng góp một phần quan trọng trong việc đảm bảo an toàn dữ
liệu và đảm bảo hoạt động liên tục của các hệ thống thông tin điện tử đang
hoạt động trong mạng diện rộng của Đảng.
7. Kết cấu luận văn
Ngoài phần Mở đầu và phần Kết luận, luận văn gồm có 3 chƣơng sau:
Chương 1: Giới thiệu tổng quan về sự cần thiết sao lƣu, khôi phục
dữ liệu và hiện trạng thực hiện các hệ thống thông tin điện tử trong

các cơ quan Đảng.
Chương 2. Nghiên cứu các giải pháp sao lƣu, khôi phục dữ liệu,
đánh giá ƣu nhƣợc điểm của từng giải pháp.
Chương 3: Đề xuất giải pháp sao lƣu, khôi phục các cơ sở dữ liệu
áp dụng cho các hệ thống thông tin điện tử trong các cơ quan Đảng.

9


TÀI LIỆU THAM KHẢO
Tiếng Việt
1. Phan Đình Diệu [1999], Lý Thuyết Mật Mã và An Toàn Thông Tin.
2. Nguyễn Văn Vị [2004], Phân tích thiết kế Hệ thống thông tin.
3. Vũ Duy Lợi và Lê Trung Nghĩa [2006], Mô hình kiến trúc hệ thống công
nghệ thông tin trong các cơ quan Đảng.
4. Nguyễn Kim Anh [2004], Nguyên lý của các hệ cơ sở dữ liệu.

5. Trần Tuấn Hƣng, Tạp chí bưu chính viễn thông số 6/2007, Tạo bản sao dữ
liệu.
6. Nguyễn Ngọc Tuấn - Hồng Phúc [2005], Phát triển cơ sở dữ liệu Java
Oracle
7. Hoàng Ngọc Ân [1998], Lập trình Java thế nào, Nhà xuất bản thống kê.
8. Website, cộng đồng java Việt Nam, .

Tiếng Anh
9. Beety Jo Armstead and Stephen Prahst [1995], Implementation of a
Campuswide Distributed Mass Storage Service.
10. Luis-Felipe Cabrera, Ribert Ress and Wayne Hineman [1995], Applying
Dabase Technology in the ADSM Mass Storage System.
11. Subhash Bhalla and Stuart E. Madnick [2003], Asyschronous Backup and

Initialization of a Database Server for Replicated Database Systems.
12. Brett McLaughlin [2007], Building Java Enterprise Applications Vol 1.

10


13. Wei-Dong Zhu, Monti Abrahams, Doris Ming Ming Ngai, Sandi Pond,
Hernán Schiavi, Ed Stonesifer and Vanessa Stonesifer [2005], Content
Manager OnDemand Backup, Recovery and High Availability.
14. Lou Marco [2007], EJB & JSP - Java On The Edge, Unlimited Edition.
15. Cay S. Horstmann, Gary Cornell [2007], Core Java 2-Volume I
Fundamentals, 7th Edition.
16. Derek C.Ashmore [2004], J2EE Architects Handbook.
17. Elmasri and Navathe, P.[2001], “Fundamentals of database systems”.
18. QuickSpec HP, Corp [2004], HP StorageWork Enterprise Virtual Array
8000.
19. Rogers Cadenhead - Laura Lemay [2007], Teach Yourself Java6 in 21
Days.
20. Elmasri and Navathe, P.[2001], “Fundamentals of database systems”,
International edition, Third edition.
21. Maurice Naftalin and Philip Wadler [2006], Java Generics and
Collections.
22. Ravi Kumar Khattar, Introduction to Storage Area Network, pp.52-61

11


12




×