Tải bản đầy đủ (.docx) (82 trang)

Tìm hiểu bảo mật dữ liệu phân tán và ứng dụng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.55 MB, 82 trang )

LỜI CAM ĐOAN
Tôi xin cam đoan đề tài khoa học “Tìm hi ểu bảo mật dữ li ệu phân tán
và ứng dụng” là công trình nghiên cứu của riêng tôi. Các s ố li ệu, k ết qu ả
nghiên cứu trong luận văn là trung thực và chưa từng được ai công bố trong
bất kỳ công trình nào khác.

1


LỜI CẢM ƠN
Lời đầu tiên, tôi xin chân thành cảm ơn PGS.TS. Nguy ễn Mậu Hân, m ặc dù
công việc rất bận nhưng Thầy đã dành thời gian hướng dẫn, định h ướng và
luôn động viên để tôi hoàn thành tốt luận văn này.
Tôi xin cảm ơn Quý Thầy, Cô trong khoa Công nghệ Thông tin Trường Đại
học Khoa học – Đại học Huế đã truyền đạt nhiều kiến thức sâu s ắc, quý báu
về các môn học trong quá trình giảng dạy giúp tôi hoàn thiện luận văn này.
Tôi xin chân thành cảm ơn Sở Giáo dục và Đào tạo Quảng Tr ị, Tr ường
THPT Chuyên Lê Quý Đôn đã tạo điều kiện về thời gian để tôi học tập và s ố
liệu để tôi hoàn thành luận văn này.
Tôi xin chân thành cảm ơn các anh, chị học viên l ớp cao h ọc Khoa h ọc Máy
tính khóa 2016 – 2018 và các bạn đồng nghiệp đã luôn động viên, giúp đ ỡ tôi
suốt thời gian học tập và thực hiện luận văn.
Cuối cùng, tôi xin bày tỏ lòng biết ơn đối với gia đình và nh ững ng ười thân
đã tạo điều kiện, giúp đỡ tôi hoàn thành luận văn này.

2


MỤC LỤC

3




DANH MỤC CÁC HÌNH
Trang

4


DANH MỤC CÁC CHỮ VIẾT TẮT
CSDL

Cơ sở dữ liệu

GDNN-GDTX

Giáo dục nghề nghiệp – Giáo dục thường xuyên

GD & ĐT

Giáo dục và Đào tạo

HTTT
THPT

Hệ thống thông tin
Trung học phổ thông

5



PHẦN MỞ ĐẦU
1. LY DO CHON ĐỀ TÀI
Ngày nay các hoạt động trao đổi thông tin trên mạng ngày càng đ ược
phát triển và sử dụng trong toàn xã hội mang đến nhiều tiện ích cho người s ử
dụng. Vấn đề đặt ra cho tất cả người sử dụng các dịch vụ này là làm th ế nào
để bảo đảm an toàn, tránh được các vấn đề mạo danh, đánh cắp dữ li ệu. Do
đó bảo mật và xác thực dữ liệu hiện nay đã và đang được các nhà tin h ọc quan
tâm nghiên cứu và đã có những thành công nhất định, được đưa vào ứng d ụng
trong thực tế.
Việc ứng dụng công nghệ thông tin vào quản lí hành chính tại các cơ
quan Nhà nước hiện nay rất được chú trọng quan tâm. Đặc thù như Sở Giáo
dục và Đào tạo Quảng Trị, hầu như tất cả các báo cáo, các thông t ư ch ỉ d ẫn
cũng như văn bản chỉ đạo của cấp trên đều được trao đổi với các tr ường, đ ơn
vị trực thuộc thông qua email đăng kí hoặc qua trang Web giáo dục Vn.edu.
Việc này giúp tiết kiệm công sức, chi phí và thời gian nhưng cũng đặt ra các
vấn đề cần giải quyết đó là: đảm bảo tính bảo mật của các email đi - đ ến và
sự bảo đảm tránh được hiện tượng mạo danh, thay đổi thông tin nhằm mục
đích xấu.
Nhận thấy được tính quan trọng trong việc bảo mật dữ liệu, qua tìm
hiểu em đã chọn đề tài “Tìm hiểu bảo mật dữ liệu phân tán và ứng dụng”
để nghiên cứu làm luận văn tốt nghiệp.
2. MỤC ĐÍCH Y NGHĨA CỦA ĐỀ TÀI
- Tìm hiểu nghiên cứu tổng quan về hệ thống phân tán để bi ết được s ự
liên quan giữa điều khiển đồng thời, cơ chế phục hồi và cấu trúc c ủa h ệ
thống từ đó đi sâu vào nghiên cứu những ứng dụng của hệ thống phân tán
- Tìm hiểu chữ ký điện tử cách thức bảo mật thông tin. Tìm hi ểu các
hàm băm thông tin dữ liệu, cách mã hóa và giải mã dữ liệu: Hàm băm SHA,
6



MD5, mã hóa công khai, mã hóa bí mật cùng những thuật toán được s ử dụng
cho mỗi loại mã hóa. Nghiên cứu các kỹ thuật và phương pháp đ ể th ực hi ện
nhiệm vụ An toàn thông tin và đặc biệt là các vấn đề về chữ ký điện tử.
- Cài đặt và thử nghiệm ứng dụng mã hóa dữ liệu gửi đi và giải mã dữ
liệu nhận, ứng dụng chữ ký điện tử khi trao đổi, bài toán được ti ển khai trên
ứng dụng bằng C#.
3. PHẠM VI NGHIÊN CỨU CỦA ĐỀ TÀI
- Nghiên cứu các phương pháp mã hóa thông tin.
- Áp dụng an toàn thông tin trong việc bảo mật, xác thực thông báo, văn
bản thông qua email trong hệ thống quản lý văn bản tại Sở giáo dục đào t ạo
Tỉnh Quảng Trị.
4. CẤU TRÚC LUẬN VĂN
Chương 1 – An toàn thông tin trong môi trường phân tán
Chương này, giới thiệu tổng quan về an toàn thông tin, một s ố gi ải pháp
an toàn thông tin và ứng dụng. Chương này cũng khái quát v ề hệ phân tán, các
lợi ích và các vấn đề cần giải quyết khi phân tán dữ liệu.
Chương 2 – Các phương pháp mã hóa và xác thực thông tin
Chương này, tập trung trình bày chi tiết một số phương pháp mã hóa dữ
liệu, các nguyên tắc xác thực trong hệ phân tán cụ th ể như là: xác th ực ng ười
dùng; xác thực dữ liệu; kết hợp các phương pháp đ ể đưa ra nguyên t ắc xác
thực phù hợp trong một số trường hợp cụ thể.
Chương 3 – Ứng dụng bảo mật thông tin trong trao đổi công văn ở
Sở Giáo dục và Đào tạo Quảng Trị.
Chương này, mô tả tình hình thực tế về việc trao đổi các thông tin gi ữa
Sở Giáo dục và Đào tạo Quảng Trị với các Trường và đơn vị trực thu ộc, từ đó
đưa ra giải pháp ứng dụng bảo mật thông tin trong trao đổi công văn của Sở.

7



8


Chương 1. AN TOÀN THÔNG TIN
TRONG MÔI TRƯỜNG PHÂN TÁN
1.1. HỆ CƠ SỞ DỮ LIỆU PHÂN TÁN [2], [3], [4], [5]
1.1.1. Các khái niệm và định nghĩa
Cơ sở dữ liệu (CSDL): là một tập hợp thông tin có cấu trúc, và nó
thường được hiểu rõ hơn dưới dạng một tập hợp liên kết các dữ liệu, thường
đủ lớn để lưu trên một thiết bị lưu trữ.
CSDL phân tán là một tập hợp dữ liệu mà về mặt logic tập hợp này
thuộc cùng một hệ thống, nhưng về mặt vật lý dữ liệu đó được phân tán trên
các vị trí khác nhau của một mạng máy tính.
Có 2 điểm quan trọng được nêu ra trong định nghĩa:
* Phân tán: Dữ liệu không đặt tại một vị trí duy nhất mà được phân bố
rộng khắp trên nhiều máy tính đặt tại nhiều vị trí khác nhau (hay còn được
gọi là trạm), đây là điểm phân biệt một CSDL phân tán với một CSDL t ập
trung.
* Tương quan logic: Dữ liệu trong hệ phân tán có một số thuộc tính ràng
buộc chúng với nhau. Điều này giúp chúng ta có th ể phân bi ệt m ột CSDL phân
tán với một tập hợp CSDL tập trung hoặc các file dữ li ệu đ ược l ưu tr ữ t ại
nhiều vị trí khác nhau, điều này thường thấy trong các ứng dụng mà h ệ th ống
sẽ phân quyền truy nhập dữ liệu trong môi trường mạng.
Hệ quản trị CSDL phân tán (DDBMS) là một hệ thống phần mềm có
chức năng hỗ trợ việc tạo và bảo trì CSDL phân tán, nó cho phép qu ản lý các
hệ CSDL phân tán và làm cho sự phân tán “trong suốt” đối với người sử dụng.
Đôi khi chúng ta sử dụng “Hệ CSDL phân tán” để nói về CSDL phân tán
và hệ quản trị CSDL phân tán.
Trong môi trường phân tán, dữ liệu sẽ được phân tán đến các trạm khác
9



nhau như được biểu diễn theo Hình 1.1.

10


CSDL

CSDL

CSDL

Trạm 1

Trạm 2

Trạm 4

11


Hình 1.1. Môi trường của hệ thống CSDL phân tán
1.1.2. Các phương thức phân tán dữ liệu
Có 4 chiến lược phân tán dữ liệu:
* Tập trung dữ liệu: Tất cả dữ liệu được tập trung một chỗ. Cách này
đơn giản nhưng có 3 nhược điểm: Dữ liệu không sẵn sàng cho người s ử d ụng
truy cập từ xa; Chi phí truyền thông lớn, thường làm cực đại vi ệc truy c ập d ữ
liệu tới nơi tập trung; Toàn bộ hệ thống ngừng khi CSDL bị sự cố.
* Chia nhỏ dữ liệu (phân hoạch dữ liệu): CSDL được chia thành các phần

nhỏ, không trùng lặp và liên kết với nhau. Mỗi phần dữ liệu được đưa đ ến các
trạm một cách thích hợp để sử dụng.
* Sao lặp dữ liệu (nhân bản dữ liệu): CSDL được chia thành nhi ều b ản
từng phần hoặc đầy đủ và được đặt ở nhiều trạm trên mạng. Nếu bản sao
của CSDL được lưu giữ tại mọi trạm của hệ thống thì ta có trường hợp sao lập
đầy đủ. Hiện nay, trong môi trường client-sever có nhiều kỹ thu ật m ới cho
phép tạo bản sao không đầy đủ phù hợp với yêu cầu dữ li ệu ở mỗi tr ạm và
một bản đầy đủ được quản lý ở sever. Sau một khoảng thời gian nhất định các
bản sao sẽ được làm đồng bộ với bản chính bằng một ứng dụng nào đó.
* Phương thức lai: Trong phương thức này, CSDL đưuọc chia thành
nhiều phần: quan trọng và không quan trọng. Phần quan trọng được lưu giữ
tại một nơi, phần quan trọng được lưu giữ tại nhiều nơi khác.
1.1.3. Giao tác phân tán
1.1.3.1. Các khái niệm
Giao tác là một lần thực hiện của một chương trình. Chương trình có
thể là một câu truy vấn hay một chương trình ngôn ngữ chủ v ới các l ời g ọi
được gắn vào một ngôn ngữ truy vấn.
Có hai giao tác cơ sở: đọc dữ liệu từ CSDL và ghi dữ li ệu vào CSDL. C ần
chú ý, khi đọc/ghi dữ liệu vào CSDL các giao tác sẽ s ử d ụng m ột không gian
12


làm việc riêng để thực hiện các thao tác tính toán. Các thao tác tính toán này sẽ
không ảnh hưởng đến CSDL.
Một giao tác phải đảm bảo bốn thuộc tính ACID (Atomicity, Consistency,
Isolation và Durability). Chúng được coi là bốn thuộc tính quan trọng của h ệ
thống phân tán khi xử lý bất kỳ giao tác nào. Nếu thiếu một trong những
thuộc tính này thì tính toàn vẹn của dữ liệu khó có thể được đảm bảo. Các
tính chất ACID sẽ đảm bảo các giao tác được thực hiện một cách đáng tin cậy:
- Tính nguyên tử (Atomicity): Một giao tác có nhiều thao tác khác bi ệt thì

hoặc là toàn bộ các thao tác hoặc là không một thao tác nào được hoàn thành.
- Tính nhất quán (Consistency): Một giao tác hoặc là sẽ tạo ra một trạng
thái mới và hợp lệ cho dữ liệu, hoặc trong trường hợp có lỗi sẽ chuy ển toàn
bộ dữ liệu về trạng thái trước khi thực thi giao tác.
- Tính biệt lập (Isolation): Một giao tác đang thực thi không thể đưa ra
các kết quả của nó cho những giao tác khác đang cùng ho ạt đ ộng tr ước khi nó
uỷ thác (commit). Nếu một giao tác cho phép những giao tác khác s ử dụng
những kết quả chưa hoàn tất của nó trước khi uỷ thác rồi sau đó nó quy ết
định huỷ bỏ (abort). Khi đó mọi giao tác đã đọc những giá trị chưa hoàn t ất đó
cũng sẽ phải được huỷ bỏ, nếu không xâu mắc xích này dễ dàng tăng nhanh và
gây ra những phí tổn đáng kể cho hệ thống.
- Tính bền vững (Durability): Tính bền vững muốn nói đến tính chất của
giao tác, bảo đảm rằng mỗi khi giao tác uỷ thác, kết qu ả c ủa nó đ ược duy trì
cố định và không bị xoá ra khỏi hệ thống. Vì thế các hệ th ống phân tán b ảo
đảm rằng kết quả của giao tác sẽ vẫn tồn tại dù có xảy ra sự cố hệ thống.
Cần chú ý rằng, một giao tác đang thực thi không thể đưa ra các k ết qu ả
của nó cho những giao tác khác đang cùng hoạt động trước khi nó ủy thác.
Nếu một giao tác cho phép những giao tác khác s ử dụng nh ững k ết qu ả ch ưa
hoàn tất của mình trước khi ủy thác, rồi sau đó nó quy ết đ ịnh h ủy b ỏ, thì m ọi
giao tác đã đọc những giá trih chưa hoàn tất đó cũng sẽ ph ải được hủy b ỏ n ếu
13


không xâu mắt xích này dễ dàng tăng nhanh và gây ra những phí tổn đáng k ể
cho Hệ quản trị CSDL phân tán.
Giao tác phân tán: Là giao tác bao gồm một bó thao tác gi ữa hai hoặc
nhiều máy khác nhau trong một hệ thống phân tán. Một giao tác từ máy tr ạm
(client) được gọi là giao tác phân tán nếu nó gọi những hoạt đ ộng trong nhi ều
giao tác khác nhau. Giao tác phân tán cũng phải đảm bảo các thu ộc tính ACID.
Quản lý giao tác phân tán nhằm giải quyết một s ố vấn đề trong quá

trình truyền thông của hệ phân tán như: độ tin cậy, điều khiển tương tranh,
hiệu quả sử dụng các tài nguyên của hệ thống. Đặc biệt trong lĩnh vực phục
hồi giao tác phân tán và điều khiển tương tranh các nghiên cứu về v ấn đ ề này
là nhằm mục đích giải quyết chúng một cách rõ ràng nhất. Do đó, hi ểu đ ược
việc quản lý giao tác phân tán là điều cần thiết cho vi ệc hi ểu được s ự liên
quan giữa điều khiển tương tranh, cơ chế phục hồi và cấu trúc của hệ th ống.
1.1.4. An toàn dữ liệu trong hệ phân tán
1.1.4.1. Xử lý bế tắc trong giao tác phân tán
Sự bế tắc xảy ra với một giao tác đơn lẻ khi dùng c ơ ch ế đi ều khi ển
tương tranh bằng khóa. Các server phải ngăn chặn hoặc phát hi ện và gi ải
quyết bế tắc. Dùng thời gian chờ có thể còn chưa tốt vì khó khăn đ ể l ựa ch ọn
một khoảng thời gian thích hợp, có trường hợp giao tác hủy bỏ là không c ần
thiết.
Đồ thị chờ (Hình 1.2) là một đồ thị có hướng trong đó các nút đại di ện
cho các giao tác và các đối tượng, các cạnh đại di ện cho đối tượng được gi ữ
bởi giao tác hoặc một giao tác đang chờ một đối tượng. xảy ra bế tắc khi và
chỉ khi có một vòng lặp trong đồ thị chờ.
Hầu hết các chương trình phát hiện bế tắc hoạt động bằng cách tìm
vòng lặp trong đồ thị chờ giao tác. Trong một hệ th ống phân tán bao g ồm
nhiều giao tác được truy cập đến nhiều server, một đồ thị chờ toàn cục có thể

14


về lý thuyết được xây dựng từ những đồ thị ở cục bộ. Có th ể có m ột vòng l ặp
trong đồ thị chờ toàn cục mà không có trong bất kỳ đồ thị cục b ộ nào, đi ều đó
có thể có một tắc nghẽn phân tán.

Hình 1.2. Đồ thị chờ
Đồ thị chờ hoàn chỉnh (Hình 1.2a) cho thấy một chu kỳ b ế tắc bao g ồm

các cạnh khác nhau, chúng đại diện cho các giao tác ch ờ m ột đ ối t ượng và giao
tác đang nắm giữ một đối tượng. Khi bất kỳ một giao tác nào đang ch ờ m ột
đối tượng tại một thời điểm, đối tượng có thể lấy ra khỏi đồ thị ch ờ, minh
họa (Hình 1.2b).
1.1.4.2. Phục hồi giao tác
Phục hồi giao tác là duy trì được tính nguyên tử khi hệ th ống có s ự c ố.
Khi một server đang chạy nó giữ những đối tượng trong bộ nhớ khả biến
(RAM) của nó và lưu lại những đối tượng đã được ủy thác xong vào những tệp
để có thể phục hồi lại. Vì vậy phục hồi bao gồm việc khôi phục l ại giao tác
với phiên được ủy thác sau cùng của những đối tượng từ các tệp trên.
Trong một số trường hợp, chúng ta yêu cầu quản lý phục hồi phải
chống chịu được các thất bại của các phương tiện. Sự sai lệch trong một s ự
cố, sự hư hỏng vật lý ngẫu nhiên hay một sự thất bại thường xuyên có th ể
dẫn đến hỏng hóc của các tệp, có thể dẫn đến một số các dữ li ệu trên đĩa b ị
mất. Trong trường hợp này chúng ta cần một bản sao của tệp. Lưu trữ an toàn

15


có thể được thực hiện bằng cách sao lưu ổ đĩa nhân bản hoặc là l ưu ở nhi ều
vị trí khác nhau.



Nhật ký (Logs)
Kỹ thuật cơ bản cho việc thực thi lại các giao tác khi có s ự c ố là d ựa
trên việc sử dụng nhật ký. Một nhật ký bao gồm thông tin cho việc hủy hoặc
làm lại tất cả các hành động được thực hiện bởi các giao tác. H ủy các hành
động của một giao tác có nghĩa là xây dựng lại hệ th ống tr ước sự th ực hi ện
của nó. Làm lại các hành động của một giao tác nghĩa là th ực hi ện l ại các hành

động của nó.
Một bản ghi nhật ký bao gồm: Định danh của giao tác, định danh của
bản ghi, kiểu hoạt động (chèn, xóa, sửa đổi), giá trị bản ghi cũ (dùng đ ể hoàn
lại thao tác), giá trị bản ghi mới (dùng để thực hiện l ại thao tác), thông tin ph ụ
(dùng cho thủ tục phục hồi).



Các quy trình phục hồi
Khi một sự cố có mất thông tin tạm thời xảy ra, quy trình ph ục h ồi đ ọc
file nhật ký và thực hiện các thao tác sau:
- Xác định tất cả các giao tác chưa hoàn tất cần ph ải hoàn l ại. Các giao
tác chưa hoàn tất được nhận ra bởi vì chúng có một lệnh begin_transaction ghi
trong file nhật ký, không có một bản ghi commit hoặc abort.
- Xác định tất cả các giao tác cần thực hiện lại. Theo nguyên tắc, tập này
gồm tất cả các giao tác có một bản ghi commit trong file nhật ký.
- Hoàn lại và lặp lại các giao tác trên.
1.1.4.3. Bảo mật dữ liệu trong hệ phân tán
Hệ thống phân tán đối mặt với nhiều nguy cơ về an ninh hơn so v ới h ệ
tập trung. Vấn đề bảo mật cho hệ phân tán cũng phức tạp h ơn so v ới h ệ t ập
trung. Có bốn nguy cơ bảo mật mà hệ phân tán phải đối mặt đó là:

16


-

Nghe trộm: là tình huống một người không được cấp quyền lại có được quyền
truy xuất đến một dịch vụ hay dữ liệu. Một ví dụ điển hình cho vấn đ ề này đó
là truyền thông giữa hai người bị nghe trộm bởi một ai đó.


-

Gián đoạn: là tình huống các dịch vụ và dữ liệu trở nên không sẵn sàng, không
sử dụng được, bị phá huỷ,... Theo nghĩa này, tình huống từ ch ối dịch vụ đ ược
gây ra bởi một người nào đó cố tình làm cho một dịch v ụ không th ể truy c ập
được đối với những người khác là một nguy cơ bảo mật được phân vào loại
nguy cơ gián đoạn.

-

Thay đổi: là bao gồm sự thay đổi dữ liệu mà không được cấp quy ền ho ặc gi ả
mạo một dịch vụ để nó không còn tuân thủ các đặc tả ban đầu. Ví d ụ của s ự
thay đổi bao gồm việc nghe trộm và sau đó thay đổi dữ liệu được truy ền.

-

Giả mạo: là tình huống dữ liệu hoặc các hành động được phát sinh thêm mà
thông thường chúng không tồn tại. Ví dụ, một kẻ đột nhập chèn thêm m ột
thông điệp trong một giao dịch phân tán.
Để giải quyết các vấn đề bảo mật cho hệ phân tán cần phải xây d ựng
cơ chế bảo mật cho hệ phân tán bao gồm:

 Mã hóa là nguyên tắc cơ bản để bảo mật cho hệ phân tán. Việc mã hóa là
chuyển dữ liệu thành một thứ mà những kẻ tấn công không th ể hi ểu được.
Ngoài ra mã hóa còn cho phép ta ki ểm tra dữ li ệu có b ị thay đổi hay không t ừ
đó có thể kiểm tra tính toán vẹn của dữ liệu.
 Xác thực được sử dụng để xác nhận lại định danh của user, client, server …
Trong trường hợp xác thực các client, điều kiện cơ bản là trước khi một d ịch
vụ thực thi trên một client thì dịch vụ đó phải biết định danh của client.

Phương pháp xác thực phổ biến nhất hiện nay là mật khẩu ngoài ra còn rất
nhiều những phương pháp xác thực khác.
 Phân quyền khi client đã được xác thực thì hệ thống có thể phân quyền cho
client đó thực thi những quyền nào. Ví dụ client được truy cập đến các bản ghi

17


của dữ liệu hay không, nếu được truy cập thì được quyền gì: xóa, sửa, ghi m ới
hay chỉ được phép đọc.
 Kiểm soát các client đã truy cập những gì và bằng cách nào. Ki ểm soát không
cung cấp sự bảo mật để chống lại sự tấn công tức thời nhưng nó là công cụ
giúp phân tích các lỗ hổng bảo mật từ đó đưa ra được những phương pháp
chống lại sự tấn công.
1.2. NHỮNG LỢI ÍCH VÀ CÁC VẤN ĐỀ CẦN GIẢI QUY ẾT KHI PHÂN TÁN DỮ
LIỆU [2]
1.2.1. Lợi ích của cơ sở dữ liệu phân tán
Việc phân tán dữ liệu tạo cho CSDL có tính tự trị địa phương. Tại một
site, dữ liệu được chia sẻ bởi một nhóm người sử dụng tại nơi họ làm việc và
như vậy dữ liệu được kiểm soát cục bộ, phù hợp đối v ới nh ững tổ ch ức phân
bố tập trung. Cho phép thiết lập và bắt buộc sách lược địa phương đối v ới
việc sử dụng CSDL.
Tính song song trong các hệ CSDL phân tán có thể nâng cao được hi ệu
quả truy nhập.
Trong tổ chức phân tán, tương tranh dịch vụ, CPU, vào/ra ít h ơn so v ới
tổ chức tập trung. Độ trễ trong truy nhập từ xa có thể gi ảm do việc th ực hi ện
địa phương hoá dữ liệu một cách hợp lý.
Độ tin cậy và tính sẵn sàng được nâng cao trong tổ chức phân tán, là
một trong những mục tiêu cơ bản của tổ chức dữ li ệu phân tán. Vi ệc tổ chức
lặp dữ liệu cũng có thể đảm bảo cho việc truy nhập CSDL không b ị ảnh

hưởng khi có sự cố xảy ra đối với trạm hoặc kênh truy ền, không th ể làm s ụp
đổ cả hệ thống.
Tổ chức dữ liệu phân tán kinh tế hơn so với tổ chức tập trung. Giá cho
một hệ máy tính nhỏ rẻ hơn nhiều so với giá của một máy tính l ớn khi tri ển

18


khai cùng một mục đích ứng dụng. Giá chi phí truyền thông cũng ít h ơn do
việc địa phương hoá dữ liệu.
Khả năng mở rộng hệ thống và phân chia tài nguyên. Vi ệc mở rộng khả
năng cho một hệ xử lý phân tán là dễ dàng hơn và cho phép thực hiện t ốt h ơn.
1.2.2. Các vấn đề cần giải quyết khi phân tán dữ liệu
Tính chất phức tạp của môi trường phân tán làm nảy sinh nhiều vấn đề
cần giải quyết đối với CSDL phân tán. Các vấn đề m ới nảy sinh, chủ y ếu b ị
ảnh hưởng bởi ba yếu tố sau:
Điều đầu tiên, trong môi trường phân tán, dữ liệu có th ể được nhân
bản. CSDL phân tán có thể được thiết kế sao cho toàn bộ ho ặc m ột ph ần c ủa
CSDL này được đặt tại các trạm khác nhau trong một hệ th ống m ạng máy
tính. Việc duy trì sự trùng lặp dữ liệu chủ yếu xuất phát từ yêu c ầu đ ảm b ảo
hệ thống hoạt động đáng tin cậy và hiệu quả. Như vậy, hệ quản tr ị CSDL phân
tán cần đảm nhận trách nhiệm trong trường hợp có yêu cầu trích xu ất d ữ
liệu, hệ thống phải chọn ra một trong các bản sao dữ li ệu đ ể đáp ứng yêu c ầu
đó, và trong trường hợp có yêu cầu thay đổi dữ liệu, hệ th ống phải đảm bảo
rằng kết quả của cập nhật phải được phản ánh trên mọi và mỗi bản sao dữ
liệu.
Điều thứ hai đó là nếu một vài trạm nào đó bị l ỗi, ho ặc liên k ết truy ền
thông nào đó bị lỗi trong khi đang thực hiện cập nhật (làm cho một s ố tr ạm
không kết nối được), hệ thống phải đảm bảo rằng các kết quả của cập nh ật
phải được phản ánh trên dữ liệu đang được lưu trữ tại các trạm bị lỗi hoặc

các trạm bị ngắt kết nối này ngay khi hệ thống có thể phục hồi lỗi.
Điểm thứ ba đó là vì mỗi trạm có thể không có thông tin tức th ời v ề các
hành động hiện đang được thực hiện tại các trạm khác, vi ệc đồng b ộ hóa các
giao tác trên nhiều trạm khó hơn nhiều so với một hệ thống tập trung.

19


Hệ phân tán dễ bị tấn công bởi các tin tặc do tính chất mở và sử dụng
tài nguyên công cộng như internet vì thế bảo mật hệ th ống mạng là r ất quan
trọng. Mạng máy tính cung cấp một số cơ chế bảo mật để bảo vệ nguồn tài
nguyên mạng, chống lại các cuộc tấn công. Sự quản lý đáng tin cậy trong h ệ
thống mạng được xử lý bằng cách sử dụng mối quan hệ xác th ực và đáng tin
cậy gồm chứng thực và các giấy ủy quyền. Những cơ chế bảo mật này s ẵn có
trong hầu như ở tất cả các hệ thống mạng hiện nay.
1.3. AN TOÀN THÔNG TIN [2], [5], [6], [8]
1.3.1. Khái niệm
An toàn thông tin là hành động ngăn cản, phòng ngừa sự s ử dụng, truy
cập, tiết lộ, chia sẻ, phát tán, ghi lại hoặc phá hủy thông tin ch ưa có s ự cho
phép.
Là sự bảo toàn của việc bảo mật, toàn vẹn và tính sẵn có của thông tin.
1.3.2. Những nguyên tắc cơ bản
- Tính Bảo mật: Đảm bảo thông tin đó là duy nhất, những người mu ốn
tiếp cận phải được phân quyền truy cập.
- Tính Toàn vẹn: Bảo vệ sự hoàn chỉnh toàn diện cho hệ thống thông
tin.
- Tính luôn sẵn sàng: Việc bảo mật thông tin luôn ph ải s ẵn sàng, có th ể
thực hiện bất cứ đâu, bất cứ khi nào
- Tính chính xác: Thông tin đưa ra phải chính xác, đầy đủ, không được
sai lệch hay không được vi phạm bản quyền nội dung.

1.3.3. Mục đích của an toàn thông tin
- Đảm bảo tính bí mật của thông tin: tức là thông tin ch ỉ đ ược phép truy
cập (đọc) bởi những đối tượng (người, chương trình máy tính…) được cấp
phép.

20


Tính bí mật của thông tin có thể đạt được bằng cách gi ới hạn truy cập
về cả mặt vật lý, ví dụ như tiếp cận trực tiếp tới thi ết bị lưu tr ữ thông tin đó
hoặc logic, ví dụ như truy cập thông tin đó từ xa qua môi trường mạng.
- Đảm bảo tính toàn vẹn của thông tin, tức là thông tin ch ỉ đ ược phép
xóa hoặc sửa bởi những đối tượng được phép và phải đảm bảo rằng thông tin
vẫn còn chính xác khi được lưu trữ hay truyền đi. Về điểm này, nhi ều người
thường hay nghĩ tính “toàn vẹn” đơn giản chỉ là đảm bảo thông tin không bị
thay đổi là chưa đẩy đủ.
- Đảm bảo độ sẵn sàng của thông tin, tức là thông tin có th ể đ ược truy
xuất bởi những người được phép vào bất cứ khi nào họ muốn.
Như vậy, vấn đề bảo mật thông tin không chỉ đơn thuần là việc ch ống
lại các cuộc tấn công từ hacker, ngăn chặn phần mềm đ ộc h ại đ ể đ ảm b ảo
thông tin không bị phá hủy hoặc bị tiết lộ ra ngoài.
1.3.4. Các nguy cơ mất an toàn thông tin
- Nguy cơ bị mất, hỏng, sửa đổi nội dung thông tin
- Nguy cơ xâm nhập từ lỗ hổng bảo mật
- Nguy cơ mất an toàn thông tin do sử dụng e-mail
- Nguy cơ mất an toàn thông tin trong quá trình truyền tin
1.4. ỨNG DỤNG AN TOÀN THÔNG TIN
1.4.1. Đặt vấn đề
Cùng với sự phát triển của mạng Internet và hoạt động Thương m ại
điện tử thì vấn đề an toàn thông tin càng tr ở nên cần thi ết h ơn. Các cu ộc t ấn

công mạng diễn ra ngày càng tinh vi, có tổ ch ức bài b ản v ới quy mô và m ục
tiêu tấn công có chủ định. Nếu trước đây, kẻ tấn công chỉ nhằm vào cá nhân,
thì bây giờ Hacker đã chuyển hướng tới các tập đoàn kinh tế, kh ối doanh
nghiệp và chính phủ. Kéo theo nhiều doanh nghi ệp, tổ ch ức b ị ảnh h ưởng

21


nặng nề về kinh tế. Đảm bảo an toàn thông tin mạng luôn là v ấn đ ề thách
thức đối với các tổ chức, doanh nghiệp và cá nhân.
1.4.2. Một số giải pháp an toàn thông tin
1.4.2.1. Phòng chống virus
Theo thống kê, trung bình mỗi tháng có hơn 500 virus ra đ ời, do đó
doanh nghiệp nên sử dụng các phần mềm chống virus để ki ểm tra tất c ả các
dữ liệu hoặc được truyền qua cổng máy chủ ở mạng hoặc truyền giữa các
cổng nội bộ.
Các phần mềm chống virus cũng nên được cập nhật thường xuyên (hàng ngày,
hàng tuần). Thông thường, các công ty phần mềm virus uy tín th ường gửi
email tới khách hàng thông báo về việc xuất hiện những virus mới và cung
cấp công cụ cập nhật tự động cho khách hàng.
Không click vào các link lạ, các email lạ, link web khiêu dâm và các n ội
dung tương tự trừ khi biết rõ ai là người gửi cho mình và họ đang gửi cái gì.
Phố biến kiến thức cho người sử dụng, ví dụ, không mở những email l ạ có tệp
đính kèm, thậm chí từ người gửi có tên trong sổ địa chỉ; không tải v ề những
tệp từ những nguồn không rõ ràng; thường xuyên quét virus; cập nhật ph ần
mềm quét virus thường xuyên; không gửi những cảnh báo về virus ho ặc các
thư dây chuyền cho những người sử dụng khác.
1.4.2.2. Bảo mật mật khẩu
Sử dụng password đủ mạnh, kích hoạt tự động việc khóa không cho
truy cập hệ thống nếu sau từ 3-5 lần nhập mật khẩu vẫn không đúng.

Không sử dụng chức năng tự động điền (auto complete) của m ột s ố
phần mềm ứng dụng như Microsoft Explorer để lưu mật khẩu và s ố tài
khoản.
1.4.2.3. Giải pháp an ninh nguồn nhân lực

22


Các doanh nghiệp, cơ quan cần lưu ý mọi nhân viên, cán bộ trong tổ
chức ý thức về vấn đề an ninh mạng và những nguy cơ tấn công doanh nghiệp
có thể chịu trong trường hợp thiếu kinh nghiệm hoặc thiếu sự lưu tâm đúng
mức từ phía các nhân viên.
1.4.2.4. Giải pháp về trang thiết bị an ninh mạng
Sử dụng các thiết bị kiểm soát việc ra vào trụ s ở làm vi ệc nh ư: các th ẻ
từ, mã điện tử, thẻ thông minh hoặc các thiết bị nhận dạng nhân tr ắc nh ư
kiểm tra vân tay, tròng mắt hoặc giọng nói. Các biện pháp khác có th ể là sao
lưu dữ liệu vào những nơi an toàn, đánh dấu nhận dạng tia cực tím, các h ệ
thống phát hiện xâm phạm như camera vào chuông báo động.
1.4.2.5. An toàn dữ liệu, thông tin
Những thông tin quan trọng không cần chia sẻ cho nhi ều ng ười thì
không nên lưu trên mạng nội bộ, hoặc lưu trong những th ư mục có password
bảo vệ, nên có bản back-up (sao lưu) lưu trên đĩa CD v.v...

1.4.2.6. Mã hóa dữ liệu
Để bảo mật thông tin trên đường truyền người ta sử dụng các phương
pháp mã hoá. Dữ liệu bị biến đổi từ dạng nhận thức được sang dạng không
nhận thức được theo một thuật toán nào đó và sẽ được bi ến đổi tr ở l ại ở
người nhận. Đây là cách bảo mật thông tin rất quan trọng.
1.4.3. Ứng dụng an toàn thông tin trong tổ chức chính phủ
Sự phát triển của công nghệ thông tin, mạng Internet, đã làm thay đ ổi

nhiều hoạt động trong đời sống xã hội, trong đó, có nảy sinh các hoạt đ ộng
giao dịch điện tử bên cạnh các giao tác truy ền th ống. Các giao d ịch trên m ạng
Internet trong cơ quan nhà nước chủ yếu là để gửi/nhận Email và truy ền các
văn bản, thông báo. Tuy nhiên các giao dịch, trao đổi đi ện tử trên môi tr ường
mạng luôn tồn tại các nguy cơ về an toàn thông tin như: đánh cắp ho ặc s ửa

23


đổi thông tin, mạo danh người gửi.... Do đó, yêu cầu đặt ra là phải có ph ương
thức đảm bảo để thông tin, tài liệu trao đổi trên mạng phải được toàn vẹn,
xác định được nguồn gốc và chống chối bỏ trách nhiệm của các bên tham gia
giao dịch.
Để đảm bảo tính bảo mật trong việc trao đổi, điều hành giữa các cơ
quan nhà nước trong việc gửi/nhận Email, truyền tải văn bản qua m ạng thì
việc triển khai hệ thống chứng thực chữ ký điện tử chuyên dùng nhằm đảm
bảo an toàn các giao dịch điện tử trở nên cấp thiết.
Cùng với quá trình đẩy mạnh ứng dụng công nghệ thông tin trong công
tác quản lý, điều hành, trao đổi văn bản, tài li ệu của các cơ quan nhà n ước,
việc triển khai ứng dụng chữ ký điện tử chuyên dùng sẽ góp phần xây d ựng
môi trường làm việc hiện đại, minh bạch trong cải cách hành chính. Tăng
cường triển khai ứng dụng chữ ký điện tử trong trao đổi văn bản đi ện tử,
bước đầu các tổ chức sẽ ứng dụng chữ ký điện tử trong hoạt động nội b ộ đơn
vị qua việc ký số trên các văn bản và gửi nhận văn bản hoàn toàn trên môi
trường mạng thông qua phần mềm quản lý văn bản và hồ sơ công việc, hộp
thư điện tử đối với các văn bản sau: Giấy mời họp nội bộ; các tài li ệu ph ục v ụ
họp; văn bản để biết, để báo cáo; thông báo chung của c ơ quan; các tài li ệu
cần trao đổi trong quá trình xử lý công việc; thông tin ch ỉ đ ạo, đi ều hành của
lãnh đạo; lịch công tác của cơ quan; các chương trình, kế hoạch của c ơ quan;
công văn…

Để bảo mật thông tin trên đường truyền người ta sử dụng các phương
pháp mã hóa. Đây là một cách để bảo vệ thông tin rất quan trọng
1.5. TIỂU KẾT CHƯƠNG 1
Trong chương này luận văn đã trình bày tổng quan về an toàn và b ảo
mật thông tin trong hệ phân tán, về CSDL phân tán: th ế nào là CSDL phân tán,
các phương thức phân tán dữ liệu, các loại CSDL phân tán, giao tác phân tán.
Đồng thời nêu lên các lợi ích và vấn đề cần giải quyết khi phân tán d ữ li ệu.
Đây là những kiến thức cơ sở làm nền tảng cho các chương tiếp theo.

24


25


×