Tải bản đầy đủ (.doc) (11 trang)

Tài liệu Báo cáo tốt nghiệp: NGHIÊN CỨU PHÁT TRIỂN GIẢI THUẬT QUẢN LÝ NHIỀU BẢN SAO CHO CÁC ỨNG DỤNG PHỨC TẠP ppt

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (471.07 KB, 11 trang )

Báo cáo tốt nghiệp
NGHIÊN CỨU PHÁT TRIỂN GIẢI THUẬT QUẢN LÝ
NHIỀU BẢN SAO CHO CÁC ỨNG DỤNG PHỨC TẠP
MỤC LỤC
Báo cáo tốt nghiệp 1
NGHIÊN CỨU PHÁT TRIỂN GIẢI THUẬT QUẢN LÝ NHIỀU BẢN
SAO CHO CÁC ỨNG DỤNG PHỨC TẠP 1
MỤC LỤC 2
I. ĐẶT VẤN ĐỀ 3
II. CẬP NHẬT THÔNG TIN TRONG MÔI TRƯỜNG PHÂN TÁN. 4
III. KỸ THUẬT ĐÁNH DẤU BẢN ĐIỀU KHIỂN 6
IV. GIẢI THUẬT QUẢN Lí NHIỀU BẢN SAO 8
V. KẾT LUẬN 10
LÊ VĂN SƠN
Trường Đại học Sư phạm - Đại học Đà Nẵng
TÓM TẮT
Bài viết này nêu lên kết quả mô hình hóa và nghiên cứu giải thuật đảm bảo
tính gắn bó thông tin trong quản lý nhiều bản sao trên môi trường phân tán hiện
đại. Trên cơ sở lý thuyết về cập nhật thông tin cho các bản sao của cùng một đối
tượng, kỹ thuật đánh dấu bản điều khiển cho phép xác định trạng thái chung của
toàn hệ và chọn lựa giải thuật cập nhật phù hợp được nghiên cứu.
Việc tham chiếu đến bản điều khiển là cơ sở chủ yếu để các tác tử tự
quyết định khi tiến hành cập nhật các bản sao một cách tin cậy.
Toàn bộ giải pháp kỹ thuật này được thiết kế và xây dựng bằng Java trên
JVM và bao gồm các bước thể hiện hoạt động của hệ theo phương thức cung cấp
động danh sách các bản sao cần phải cập nhật.
Kết quả này có thể phục vụ cho quá trình nghiên cứu thiết kế và xây dựng
các ứng dụng phức tạp với khối lượng lớn các thông tin dùng chung cần xử lý.
ABSTRACT
This paper presents the result of modelisation and algorithm research to
assure the coherence in managing multicopies of the modern distributive


environment. On the theory of information update for the copies of the same
object, the technique of marking the control panel allows defining the general
state of the whole system and choosing the appropriate update researched
algorithm.
The reference to control panel is the principal basis for an agent to make
decision when it carries out updating the copies reliably.
All of this technical measure is designed and built by Java on JVM and
consists of the steps of the system activities according to the method of dynamic
supplication for the list of updated copies.
This result can serve the process of research on designing and building
complicated applications with the large quantity of treated information.
I. ĐẶT VẤN ĐỀ
Hiện nay, trong lĩnh vực mạng diện rộng, đặc biệt là mạng Internet, việc
quản lý nhiều bản sao của cựng một đối tượng thông tin đang được các nhà
chuyên môn tin học quan tâm nghiên cứu ngay trong giai đoạn phân tích, thiết kế
và xây dựng hệ điều hành. Ngoài ra, đây cũn là một trong những vấn đề có tính
chất cơ sở cho các ứng dụng phức tạp.
Quản lý nhiều bản sao (multicopies) là giải phỏp kỹ thuật bao gồm tập hợp
cỏc thụng tin được nhân bản từ một đối tượng thông tin và các chương trỡnh quản
lý chỳng trong mụi trường phân tán.
Vấn đề truy cập và xử lý thụng tin phõn tỏn núi chung, quản lý nhiều bản
sao núi riờng được nghiên cứu trong hàng loạt các công trỡnh, đặc biệt của
Herman, Ellis, Wilms và Le Lann [[5], tr. 205-206 và 275-291]. Các giải thuật này
là cơ sở chủ yếu cho giải pháp đảm bảo sự gắn bó yếu nhờ dấu, nhờ bộ tuần tự
tuần hoàn và đảm bảo sự gắn bó mạnh cho các hệ thống đồng nhất.
Yờu cầu quan trọng của tất cả cỏc giải phỏp quản lý nhiều bản sao là đảm
bảo tính gắn bó thông tin (coherence), toàn vẹn dữ liệu và trỏnh bế tắc diễn ra
trong quỏ trỡnh khai thỏc - vận hành hệ.
Nội dung quản lý nhiều bản sao là cỏc giải phỏp cho phộp tự động hóa các
công việc kiểm tra tính hợp thức của truy cập thông tin, khôi phục thông tin, cập

nhật thông tin, an toàn cho các bản sao, sử dụng các bộ nhớ, đĩa, lưu lịch sử,
mở/ghi lịch sử, chuyển các bản loại bỏ vào vùng có thể khôi phục, Trong các nội
dung nêu trên, vấn đề quan trọng nhất là cập nhật tự động thông tin vào các bản
sao.
Bài viết này định hướng chủ yếu vào việc xây dựng hệ thống giải pháp kỹ
thuật quản lý nhiều bản sao trong mụi trường phân tán phục vụ cho các ứng dụng
có khối lượng xử lý thông tin lớn trong điều kiện kỹ thuật phần cứng, phần mềm
không đồng nhất.
Mục tiờu nghiờn cứu của đề tài là xây dựng mô hỡnh hoạt động của hệ
phân tán và phát triển giải thuật quản lý nhiều bản sao trờn cơ sở công nghệ tác tử
di động trên môi trường JVM.
II. CẬP NHẬT THÔNG TIN TRONG MÔI TRƯỜNG PHÂN TÁN
Mụ hỡnh và giải thuật nghiờn cứu phải đảm bảo các đặc tính toàn vẹn đó
được nêu trong [[6], tr. 205-206] và tuân thủ theo các giai đoạn thể hiện trong
hỡnh vẽ 1. Mỗi một giai đoạn cập nhật thể hiện những đặc điểm riêng biệt về sự
gắn bó dữ liệu giữa các bản sao.
Trong giai đoạn 1 và 3, thao tác duy nhất là lưu dữ liệu và trạng thái hiện
có là đủ. Nếu nằm vào trạng thái 2, thỡ tỏc tử phải cố gắng kết thỳc cụng việc của
mỡnh ở điểm II hoặc là phải phục hồi lại trạng thái ban đầu ở điểm I. Hai giai
đoạn gắn bó 1 và 2 cú bản dữ liệu khỏc nhau.
Trong môi trường phân tán, sơ đồ vị trí của các bản sao và việc cập nhật
chúng có thể mô tả trong hỡnh vẽ 2 sau đây.
Các bản sao có thể đặt trên các server S
1
, S
2
, ,S
n
trên các tập tin hay vùng
nhớ đặc biệt b

ij
, i=1 n, j=1 m, trong đó i chỉ server, j chỉ bản sao, n là số lượng
server được mắc nối trong mạng, m là số lượng các bản sao cần phải cập nhật.
Mỗi server có thể quản lý một mạng con. Ngoài ra, cỏc bản sao cú thể được bố trí
trên các trạm thể hiện bằng cỏc t
k
, k=1 q, k là trạm và q là số trạm được mắc nối.
Nếu ta cú n bản sao của đối tượng b nào đó, thỡ ràng buộc toàn vẹn phải
là:
Trên bản sao của 1 đối tượng
b
1
=b
2
=b
3
= =b
n
Trên các bản sao của toàn bộ các đối tượng
b
11
=b
21
= =b
n1
b
12
=b
22
= =b

n2

b
1m
=b
2m
= =b
nm
Gọi M là cực đại của các cập nhật có thể diễn ra đồng thời, thỡ M cú thể
tớnh theo cụng thức M=n x m.
Căn cứ vào nội dung thông tin cần phải đảm bảo sự gắn bó mà người ta
chia ra hai loại giải thuật:
• Giải thuật toỏn gắn bú mạnh
• Giải thuật toỏn gắn bú yếu.
Hệ thống viễn thông là đối tượng có thể diễn ra các sự cố kỹ thuật và ùn
tắt đường truyền, ta có số lần truy cập bản sao trên thực tế sẽ lớn hơn M rất nhiều;
hiệu năng hoạt động của hệ trong trường hợp này sẽ bị giảm.
Một trong những giải pháp khắc phục vấn đề vừa nêu là áp dụng kỹ thuật
đánh dấu bản điều khiển và căn cứ vào hệ thống tín hiệu này, người ta có thể chọn
các giải thuật cập nhật thích hợp, rút ngắn được tốc độ cập nhật bỡnh quõn.
Việc lựa chọn giải thuật cập nhật được tiến hành trên cơ sở truy cập vào
cấu trúc phân tầng. Cấu trúc này được mô tả trong hỡnh vẽ 3.
Ứng với mỗi một loại truy cập, người ta có thể hoặc là áp dụng các giải
thuật đang có đó được kiểm nghiệm hoặc là phải nghiên cứu các giải thuật phù
hợp hơn nhằm khai thác tối đa khả năng của kỹ thuật và công nghệ mới.
III. KỸ THUẬT ĐÁNH DẤU BẢN ĐIỀU KHIỂN
Kỹ thuật đánh dấu bản điều khiển gọi tắt là TOMCP (Technique Of
Marking the Control Panel) là một hệ thống bao gồm các chương trỡnh, danh sỏch
tài nguyờn cần thiết để thực hiện các lệnh và tổ hợp các tín hiệu cho phép nhận
biết trạng thái của toàn bộ các bản sao đang được sử dụng trong hệ.

Thành phần cơ bản của TOMCP có thể mô tả trong hỡnh vẽ 4 sau đây.
Chương trỡnh quản lý TOMCP được xây dựng dưới dạng thủ tục tiện ích
với chức năng chủ yếu là kiểm tra tính hợp thức của việc truy cập vào bản, dũ tỡm
thụng tin, cập nhật cỏc tớn hiệu và yờu cầu được cung cấp tài nguyên theo danh
sách, Thủ tục này là một trong những thành phần cơ bản của tác tử.
Danh sách các tài nguyên cần thiết là tổ hợp các các thiết bị, chương trỡnh
và dữ liệu phục vụ cho việc quản lý TOMCP. Hệ thống cỏc tớn hiệu nhận dạng là
tập hợp cỏc chuẩn hỡnh thành trong quỏ trỡnh thiết kế hệ phục vụ cho việc nhận
biết tự động trạng thái của hệ quản lý nhiều bản sao và xác định GT
l
cần thực
hiện.
Nội dung cơ bản của kỹ thuật này có thể mô tả trong hỡnh vẽ 5. Theo mụ
hỡnh điều khiển này, tại mỗi tác tử di động, trạng thái các bản sao trên toàn bộ hệ
thống được thể hiện một cách chính xác và nhờ đó các tác tử biết cần phải hành
động như thế nào là tối ưu nhất.
Mỗi khi cập nhật, thay vỡ phải kớch hoạt một trỡnh điều khiển như mô
hỡnh Client/Server chứa sẵn trờn Server và gửi toàn bộ các yêu cầu thay đổi, thỡ
kỹ thuật này cho phộp chỉ gửi những chi tiết cần thay đổi là đủ.
Việc làm tươi thông tin trong bản điều khiển sẽ do các tác tử thực hiện tự
động căn cứ vào dữ liệu mà nó có được. Những thông tin này có khối lượng
không lớn và được các tác tử trao đổi với nhau bằng thông điệp.
Để tránh bế tắc diễn ra trong quá trỡnh truy cập bản điều khiển theo kiểu 2
pha, thông thường giải pháp gắn bú mạnh của Herman được sử dụng.
Hai tỏc tử quan trọng trong tiến trỡnh truy cập bản để đọc và ghi bản là tác
tử gửi thông điệp (tác tử yêu cầu) và tác tử nhận thông điệp (tác tử đáp ứng yêu
cầu).
Cấu trúc của các thông điệp trao đổi giữa các tác tử có thể mô tả trong
hỡnh vẽ 6 dưới đây.
Các trường của thông điệp trao đổi là:

1 START Bắt đầu Giá trị 8 bít cho phép bắt đầu thông
điệp.
2 SOURCE Địa chỉ
nguồn
Địa chỉ tác tử gửi thông điệp với độ
dài từ 8 bít đến 16 bít đủ để biểu
diễn số lượng địa chỉ của các tác tử
trong các hệ thống lớn.
3 TARGET Địa chỉ đích Địa chỉ của tác tử nhận với độ dài
của trường từ 8 bít đến 16 bít.
4 CODE Mó
Mó sử dụng để nhận biết phép toán
trên bản với độ dài là 8 bít. Ý nghĩa
các bít được trỡnh bày trong hỡnh 6.
5 INFORMATION Thụng tin Thụng tin cần thiết để truy cập vào
các bản sao.
6 CONTROL
Kiểm tra Trường kiểm tra phục vụ cho việc
truyền dữ liệu qua mạng và các giá
trị được quy ước cho từng loại
mạng cụ thể.
7 END Kết thỳc Giá trị 8 bít cho phép kết thúc thông
điệp.
Giỏ trị cỏc bớt của trường CODE được thể hiện trong hỡnh 7 dưới đây.
Ưu điểm căn bản của kỹ thuật đánh dấu bản điều khiển là:
1 Gắn bú
Đảm bảo tính gắn bó thông tin. Nếu kết hợp với kỹ thuật
hàng đợi các thông điệp ta có thể tránh được hiện tượng
thiếu vô hạn tài nguyên.
2 Tin cậy

Hệ thống hoạt động với kỹ thuật này chịu đựng được
trạng thái lỗi của mạng nói chung, trong đó có lỗi của hệ
thống đường truyền.
3 Nhạy Phản ứng được với các tỡnh huống sinh lỗi.
4 Liờn tục Cho phộp phõn phối động các tài nguyên cần cập nhật.
5 Phỏt hiện sự cố Phỏt hiện cỏc lỗi phỏt sinh trong quỏ trỡnh vận hành.
6 Thống kờ Biết được trạng thái cập nhật ở mọi thời điểm.
Ngoài ra, để hoàn chỉnh kỹ thuật này, ta cần nghiên cứu Root Server với
chức năng giám sát thường xuyên các hoạt động của toàn bộ tác tử cập nhật.

IV. GIẢI THUẬT QUẢN Lí NHIỀU BẢN SAO
Sơ đồ thể hiện giải thuật tổng quát xử lý cập nhật thụng tin vào cỏc bản
sao được mô tả trong hỡnh vẽ 9. Cỏc thụng điệp trao đổi được sử dụng với các
mục đích khác nhau căn cứ vào nội dung của trường CODE. Tác tử gửi ghi thông
tin yêu cầu dưới dạng mó vào trường này, cũn tỏc tử nhận sẽ căn cứ vào mó đó để
nhận biết sẽ phải hành động như thế nào trên bản sao.
Việc xử lý trạng thái điều khiển do tác tử nhận tiến hành trên cơ sở tham
chiếu thông tin trong bản điều khiển và theo yêu cầu thể hiện trong hỡnh 8.
Sau khi hoàn thành trọn vẹn công việc, tác tử nhận tiến hành phát thông
điệp đến toàn bộ các tác tử của hệ thống để cập nhật vào bản điều khiển, đồng thời
tự động cập nhật vào bản cục bộ của mỡnh.
Khi cập nhật, giải thuật GT
l,
l=1 P được thực hiện bởi tác tử nhận trong
cơ chế then cài đối với các phép làm thay đổi thông tin trong bản sao, ngược lại,
thỡ thực hiện theo kiểu tương tranh.
Việc phỏt hiện và xử lý lỗi trong quỏ trỡnh xử lý được tiến hành ngay sau
khi tác tử nhận được yêu cầu cập nhật. Nếu mọi cố gắng sửa lỗi không thể thực
hiện có kết quả, thỡ thụng điệp sẽ được phát đi để yêu cầu tác tử gửi phát lại thông
tin. Trong trường hợp công việc cập nhật kết thúc tốt đẹp, một thông điệp khẳng

định cũng được phát đi bởi tác tử nhận. Sau khi phát đi thông điệp, tác tử gửi
chuyển sang trạng thái chờ thông điệp mới, cũn tỏc tử nhận thụng điệp chỉ chuyển
sang trạng thái chờ khi đó nhận đủ các thông điệp khẳng định.
Các bước thể hiện công việc xử lý thông tin điều khiển được tiến hành
tuần tự như trong hỡnh 10 sau đây.
Thuật toỏn kiểm tra và cập nhật bản sao thể hiện bằng cỏc khối trong hỡnh
vẽ 11, trong đó mỗi khối có thể xây dựng một thủ tục hoặc hàm chuyên biệt.
Sơ đồ trên được nghiên cứu cho việc ghi có kiểm tra thông tin vào một
trường xác định của bản sao là cơ sở dữ liệu phân tán.
V. KẾT LUẬN
Trong quỏ trỡnh xõy dựng cỏc phần mềm cho hệ phõn tỏn hỗ trợ cỏc ứng
dụng lớn như thương mại điện tử, chính phủ điện tử, vấn đề cập nhật thông tin
dùng chung trong các bản sao của cùng một đối tượng là một trong những vấn đề
quan trọng. Nó không chỉ đảm bảo hệ thống hoạt động với tốc độ bỡnh quõn chấp
nhận được, ổn định, tin cậy mà quan trọng hơn cả là phải đảm bảo tính gắn bó của
dữ liệu trong các bản sao.
Mụ hỡnh hệ thống quản lý nhiều bản sao giống nhau trờn mụi trường phân
tán và các giải thuật được nghiên cứu đó đáp ứng các yêu cầu của một hệ thống
phức tạp với lượng thông tin lớn cần phải xử lý và thể hiện ở cỏc mặt sau đây:
• Tự động hóa cập nhật các bản sao
• Phát triển giải thuật nhiều bản sao trong môi trường phân tán hiện đại
• Làm phong phú khả năng ứng dụng các tác tử di động.
• Triển khai kỹ thuật đánh dấu bản điều khiển trong quản lý nhiều bản sao
• Bổ sung lý thuyết cập nhật nhiều bản sao
Kết quả nghiên cứu đó thể hiện cụ đọng bằng những sơ đồ giải thuật và
mô hỡnh. Cỏc giải thuật và mụ hỡnh này đó được thực nghiệm trên ngôn ngữ Java
RMI trong môi trường Java ảo.
TÀI LIỆU THAM KHẢO
[1] Guy Pujolle, Les Rộseaux, Eyrolles, Paris 1995.
[2] S. Fdida, G. Pujolle, Modốles de systốmes et de rộseaux, Tom I,

Performances, Eyrolles, Paris, 1989.
[3] Lê Văn Sơn, Trần Nguyễn Hồng Phúc, Nghiờn cứu cỏc kỹ thuật thụng bỏo
lỗi và kỹ thuật truy vấn hệ thống trong mạng Internet bằng ICMP, Tạp chí
Khoa học và Công nghệ các Trường Đại học Kỹ thuật, Hà Nội, Số 38+39
(2002), tr. 11-16.
[4] Abraham Silberschatz và Peter B. Galvin, Principes des systemes
d’exploitation, 4e edition, Addison-Wesley, 1998.
[5] Le Van Son, Tra Van Son, Integrating Mobile Agent into Network
Management, ASIAN'02 Workshop on Southeast Asian Computing
Research, Hanoi, V1, pp 1-3.

×