Tải bản đầy đủ (.doc) (27 trang)

Tiểu luận môn hệ phân tán VẤN ĐỀ NHIỀU BẢN SAO VÀ CÁC THAO TÁC ĐỌC, CÁC THAO TÁC CẬP NHẬT

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (660.26 KB, 27 trang )

Tiểu luận môn Hệ tin học phân tán Trang
Đề số 5:
I. Giải quyết vấn đề nhiều bản sao.
II. Bài toán này dựa vào thuật toán Herman.
Với thuật toán ở phần VI.4.2.2 (theo hệ ổn định), bây giờ, ta chấp nhận
rằng các NSD có thể thực hiện toàn bộ các giao dịch đã nêu.
Hãy cho biết sơ đồ tuần tự của các xử lý sau :
1. Các thao tác đọc.
2. Các thao tác cập nhật.
LỜI NÓI ĐẦU
Những năm gần đây, các thành tựu mới nhất của hệ thống tin học về phần
cứng, phần mềm và các hệ dữ liệu ổn định, tin cậy đã góp phần đáng kể cho sự
phát triển của toàn xã hội nói chung, ngành công nghệ thông tin nói riêng. Xu
hướng toàn cầu hoá thông tin dẫn đến nhu cầu xử lý thông tin ngày một tăng. Hệ
dữ liêu tập trung không còn đáp ứng được hết các yêu cầu đặt ra. Như thương mại
điện tử, chính phủ điện tử. Hệ phân tán đã ra đời để đáp ứng những nhu cầu xử lý
thông tin trên các hệ thống ứng dụng có quy mô rộng lớn đó.
Hiện nay, các chuyên gia công nghệ thông tin đang rất quan tâm đến hệ
phân tán là hệ thống tin học hiện đại, đa dạng, phức tạp và đang trên đà phát triển
nhanh chóng. Việc nghiên cứu hệ đòi hỏi phải có phương pháp hợp lý, mang tính
khả thi cao và được chia cắt thành các phương diện tiếp cận khác nhau. Mỗi
phương diện đều phải có mục tiêu, phương pháp và đối tượng nghiên cứu tương
đối độc lập nhau trên cơ sở nhất quán với mục đích chung của hệ.
Trong giới hạn của một báo cáo tiểu luận kết thúc môn học “Hệ tin học
phân tán”, báo cáo này trình bày những nội dung sau:
I. Giải quyết vấn đề nhiều bản sao
II. Bài toán này dựa vào thuật toán của Herman, theo hệ ổn định. Bây giờ,
ta chấp nhận rằng các người sử dụng có thể thực hiện toàn bộ các giao dịch đã
nêu.
Hãy cho biết sơ đồ tuần tự xử lý các thao tác đọc, các thao tác cập nhật
Được sự giúp đỡ, hướng dẫn tận tình của Thầy giáo PGS.TS Lê Văn Sơn và


các bạn đồng nghiệp, tôi đã hoàn thành được những nhiệm vụ cơ bản trên. Tuy
nhiên, với thời gian và kiến thức còn hạn chế, tiểu luận này chắc chắn còn những
thiếu sót , tôi rất mong nhận được sự góp ý chân thành của Thầy giáo Lê Văn Sơn
và các bạn đồng nghiệp. Cho phép tôi xin được bày tỏ lòng biết ơn chân thành
Thầy giáo Lê Văn Sơn và các bạn đồng nghiệp đã giúp đỡ tôi hoàn thành công
việc này.
Trân trọng cám ơn!
Học viên thực hiện: Trần Đình Truyền
1
Tiểu luận môn Hệ tin học phân tán Trang
CHƯƠNG I
MỞ ĐẦU VỀ HỆ TIN HỌC PHÂN TÁN
I.1 Giới thiệu hệ tin học phân tán
I.1.1 Định nghĩa
Hệ tin học phân tán hay nói ngắn gọn là hệ phân tán là hệ thống xử lý thông
tin bao gồm nhiều bộ xử lý hoặc bộ vi xử lý nằm tại các vị trí khác nhau và được
liên kết với nhau thông qua phương tiện viễn thông dưới sự điều hành thống nhất
của một hệ điều hành.
Từ định nghĩa này, người ta có thể xem hệ phân tán như là một tập hợp bao
gồm các bộ xử lý hoặc bộ vi xử lý với bộ nhớ và đồng hồ nhịp độc lập. Điều này
đồng nghĩa với việc các bộ xử lý không sử dụng chung bộ nhớ và đồng hồ. Như
vậy, mỗi một hệ xử lý thông tin thành phần của hệ phân tán bao gồm một hay
nhiều bộ xử lý và bộ nhớ cục bộ. Hệ xử lý thông tin thành phần phải được thiết kế
sao cho về cấu trúc, số lượng và dung lượng có thể cho phép thực hiện một cách
trọn vẹn các chức năng mà nó đảm nhận.
Hệ phân tán được xây dựng nhằm mục đích, phân tán hoá các quá trình xử
lý thông tin và thực hiện công việc đó trên các trạm xa nhau. Đó là những cơ sở
căn bản cho việc xây dựng các ứng dụng lớn như thương mại điện tử, giáo dục
điện tử, thư viện điện tử số,…
I.1.2 Vấn đề trỏ thông tin

Trong hệ phân tán, thời hạn truyền một thông điệp là hiệu số giữa thời điểm
nhận và thời điểm truyền. Ta giả sử rằng, thời hạn đó đủ lớn so sánh với hệ tập

2
Tiểu luận môn Hệ tin học phân tán Trang
trung, là địa lượng biến thiên và ở cặp máy này khác với ở cặp máy khác. Từ đó ta
có hai hệ quả sau đây:
1) Ở một thời điểm cho trước, một bộ xử lý đang thực hiện trên một máy
chỉ có thể biết được trạng thái gần đúng của các máy khác.
2) Trật tự nhận các thông điệp trên các máy nhận có thể không giống trật
tự phát của chính các thông điệp đó.
Các máy trên mạng có thể bị sự cố và các thông điệp có thể bị mất. Giải
pháp cho vấn đề này là máy phát đánh số thứ tự tất cả các gói thông tin gửu đi
kèm theo các số đó cho máy nhận. Nếu máy phát không đánh số thì máy nhận sẽ
không xác đinh được. Ta có hệ quả ba là:
3) Hai máy giống nhau chứa thông tin hoàn toàn giống nhau lại không bao
giờ giống nhau về mặt trạng thái.
Từ những vấn đề nêu trên, ta rút ra các đặc tính tổng quát của hệ phân tán:
i) Thời gian truyền thông điệp là một biến với giá trị khác nhau, giá trị này
có thể rất lớn.
ii) Tần suất xuất hiện các sự cố trong khi vận hành mạng lớn.
iii) Việc truy cập tài nguyên, kích hoạt các tiến trình trong mạng không thể
thực hiện bởi một thiết bị duy nhất, mà chức năng này phải được phân tán trên
nhiều máy trên mạng.
I.2 Hệ thống nhiều bản sao
Trong hệ phân tán, quá trình tổ chức, vận hành các hệ thống cho phép đăng
ký từ xa, từng hệ thống cục bộ đều có lưu trữ một bản sao của tất cả các thông tin
liên quan đang có ở tất cả các hệ thống cục bộ.
Ưu điểm nổi bật của kiểu tổ chức này là:
i) Dễ dàng thực hiện việc truy cập thông tin cần thiết cho các yêu cầu ngay

tại hệ thống cục bộ của mình
ii) Cho kết quả truy cập một cách nhanh chóng.
Tuy nhiên, chỉ cho kết qủa tương đối chính xác và phụ thuộc rất nhiều vào
phương pháp và thời hạn cập nhật thông tin trong các CSDL cục bộ.
Sự tồn tại nhiều bản sao trong một hệ phân tán trên nhiều hệ thống cục bộ
khác nhau có thể dẫn đến các hệ quả sau đây:

3
Tiểu luận môn Hệ tin học phân tán Trang
i) Cập nhật thông tin diễn ra do đăng ký gần hay từ xa hoặc sự thay đổi
thông tin cục bộ trên một hệ cục bộ nào đó cần phải được tiến hành cho tất cả các
hệ thống cục bộ và không được phép bỏ sót hệ thống nào cả. trong khoản thời gian
làm tươi, thông tin phải đảm bảo sao cho việc truy vẩn dữ liệu cho kết quả kịp thời
hay đặt truy vấn trong trạng thái treo.
ii) Cần phải tránh trường hợp các thao tác trên hai bản sao khác nhau nhưng
chứa cùng một thông tin được truy cập bởi hai hay nhiều yêu cầu dẫn đến không
gắn bó.
Hai vấn đề vừa nêu trên xác định về các ràng buộc đối với vấn đề gắn bó dữ
liệu. Để đảm bảo sự gắn bó này điều kiện đủ là phải bắt buộc tuân thủ trình tự nào
đó cho các bản sao, các cập nhật thông tin.
Biện pháp hàng đầu nhằm thực hiện việc loại trừ tương hỗ tổng quát trên
tập hợp các bản sao khi đăng ký và thực hiện việc đăng ký trước khi trả lại bình
thường. Biện pháp này có mặt hạn chế là không cho phép các chương trình đăng
ký thực hiện song song. Tất cả các bản sao đều được khoá chặt trong lúc đăng ký.
I.2.1 Thuật toán cung cấp cho hệ phân tán
Vì sự ổn định và hiệu quả mà ta phải phân tán chức năng cung cấp trên
nhiều trạm khác nhau. Sự hoạt động gắng bó với nhau giữa các chương trình cung
cấp là rất cần thiết để bảo đảm cho hoạt động cung cấp được hoàn toàn chính xác.
Một sự hoạt động gắn bó dữ liệu của các chương trình cung cấp phân tán
quản lý trên cùng một tập hợp các tài nguyên chỉ đạt được nếu tuân thủ các

nguyên tắc sau:
i) Các bộ cung cấp bắt buộc phải thực hiện cùng một giải thuật
ii) Các bộ cung cấp đều nhận tất cả các thông điệp phát đi từ các tiến trình
iii) Các thông điệp phải được xử lý cùng một trật tự như nhau trong các
chương trình cung cấp. Trật tự duy nhất trên tập hợp các thông điệp của hệ, và trật
tự được thực hiện thông qua việt hợp lực giữa các tiến trình cung cấp hay tiến
trình
phát thông điệp
I.2.2 Sắp xếp kiểu đóng dấu
Trạm phát được gắn một giá trị gọi là dấu. Giá trị này có tính chất thời
điểm cho trạm phát thông tin và dựa vào đồng hồ lô gích cục bộ của chính trạm.

4
Tiểu luận môn Hệ tin học phân tán Trang
I.2.3 Phân tán biểu hiện trạng thái và chức năng cung cấp
Phân tán biểu hiện trạng thái và chức năng cung cấp, có các giải pháp có
thể:
i) Duy trì tại mỗi trạm một bản sao trạng thái tài nguyên tổng quát
ii) Phân tán biểu hiện trang thái trên các trạm, mỗi một trạm chỉ có trạng
thái các tài nguyên cục bộ của mình. Các quyết định được đưa ra trên các trạm
khác nhau cần phải được phối hợp theo kiểu sao cho dữ liệu của việc cung cấp
phải được gắn bó với nhau
iii) Nhóm sắp xếp nhằm bảo đảm cho tất cả các yêu cầu tài nguyên xuất
phát từ các tiến trình đến được các bộ cung cấp khác nhau theo một trật tự duy
nhất được cố định từ trước.
Nội dung của các bản sao trên các trạm của hệ có thể phản ảnh như sau:
- Tập hợp tất cả các tài nguyên còn chưa được cung cấp
- Tập hợp các tài nguyên đã cung cấp
- Đối tượng đang chiếm giữ tài nguyên
- Kiểu sử dụng

- Tập hợp các yêu cầu không được thỏa mãn
- Tập hợp các thông điệp dành cho trường hợp đã được sử dụng
- Tập hợp các thông điệp dành cho trường hợp thất bại
Ngày nay, trong các ứng dụng lớn như thương mại điện tử, giáo dục điện
tử,…, bản sao dữ liệu được sử dụng để tăng tính sẵn sàng của dữ liệu. Tuy nhiên,
lợi ích sẵn sàng của dữ liệu này chỉ có được khi phải trả giá bằng những thuật toán
phức tạp để ẩn đi tính phức tạp trong việc bảo trì nhiều bản sao của đối tượng. Sự
khó khăn nằm ở việc phải đảm bảo gắn bó cho các bản sao của đối tượng để tránh
bế tắc khi vận hành hệ thống.
Các thuật toán giải quyết những vấn đề này được gọi là các thuật toán điều
khiển bản sao.
Việc quản lý nhiều bản sao của cùng một đối tượng thông tin đang được
các nhà chuyên môn tin học quan tâm nghiên cứu ngay trong giai đoạn phân tích,
thiết kế và xây dựng hệ điều hành. Ngoài ra, đây còn là một trong những vấn đề có
tính chất cơ sở cho các ứng dụng phức tạp.
Quản lý nhiều bản sao là giải pháp kỹ thuật bao gồm tập hợp các thông tin
được nhân bản từ một đối tượng thông tin và các chương trình quản lý chúng trong
môi trường phân tán.
Vấn đề truy cập và xử lý thông tin phân tán nói chung, quản lý nhiều bản
sao nói riêng được nghiên cứu trong hàng loạt các công trình của Herman, Ellis,
Wilms và Le Lann.

5
Tiểu luận môn Hệ tin học phân tán Trang
Thuật toán đảm bảo sự gắn bó yếu nhờ dấu, được trình bày trong các công
trình nghiên cứu của Herman.
Nội dung quản lý nhiều bản sao là các giải pháp cho phép tự động hóa các
công việc:
Kiểm tra tính hợp thức của truy cập thông tin
Khôi phục thông tin

Cập nhật thông tin
An toàn cho các bản sao
Sử dụng các bộ nhớ, đĩa
Chuyển các bản loại bỏ vào vùng có thể khôi phục
Trong các nội dung nêu trên, vấn đề quan trọng nhất là cập nhật tự động
thông tin vào các bản sao.
CHƯƠNG II
GIẢI QUYẾT VẤN ĐỀ NHIỀU BẢN SAO
II.1 Vấn đề nhân bản các đối tượng dữ liệu
Khi nghiên cứu về hệ phân tán chúng ta thấy rằng, thời gian truy cập trung
bình vào thông tin trong hệ phân tán có thể được rút ngắn, trong một số trường
hợp, nhờ vào phương pháp nhân nhiều bản và được gọi là nhiều bản sao của một
đối tượng thông tin.
Ta cần phân biệt hai trường hợp khác nhau được thể hiện sau đây:
Trường hợp 1
a) Đa xử lý với bộ nhớ chung:

6
Tiểu luận môn Hệ tin học phân tán Trang
Mỗi một bộ xử lý đều có bộ nhớ cục bộ của mình, hay còn gọi là cache,
được dùng để sao chép lại các vùng đang làm việc của bộ nhớ chung. Một chương
trình thể hiện thuật toán thay thế đảm nhận nhiệm vụ làm mới các bộ nhớ cục bộ.
Trường hợp có nhiều bộ xử lý muốn truy cập vào cùng một đối tượng, ta sử dụng
như là sự tham chiếu đến phiên bản của đối tượng tìm thấy trong bộ nhớ chung.
b) Hệ truy cập từ xa thông qua một máy server duy nhất:

7
L
B
ch

B
cb
B
cb
L
Bé xö lý
Bé nhí côc bé
Bé nhí chung
(e)
(e)
Hình 1. Đa xử lý với bộ nhớ chung
L
B
ch
B
cb
B
cb
L
Bé xö lý
Bé nhí côc bé
Bé nhí chung
(e)
(e)
HÖ thèng viÔn th«ng
L
M¸y client
M¸y server
Hình 2. Hệ truy cập từ xa thông qua máy server
Tiểu luận môn Hệ tin học phân tán Trang

Trong trường hợp này, một đối tượng được đưa vào trên một trạm xác định
và được quản lý bởi một server cục bộ trên trạm này. Khi một tiến trình ở xa muốn
sử dụng đối tượng, nó phải bắt đầu bằng yêu cầu server cho một bản sao thông qua
hệ thống viễn thông. Sau khi sử dụng xong, tiến trình phải gửi lại cho server một
phiên bản đã được sửa đổi của đối tượng.
Các trường hợp thể hiện trong hình 1 và 2 xét theo chức năng là giống
nhau. Đó là trường hợp một bản duy nhất của đối tượng là một đặc quyền.
Trường hợp 2
Tính cân đối giữa các người sử dụng tài nguyên thông tin của mạng.

8
Tiểu luận môn Hệ tin học phân tán Trang
Tại đây, tất cả các bản đóng vai trò đối xứng. Công việc được tiến hành
theo kiểu này cho phép rút ngắn thời gian truy cập, nếu số lần truy cập để đọc lớn
hơn số lần truy cập để cập nhật và vì lý do thuận lợi sử dụng theo nghĩa có sẵn để
dùng.
Tình hình nêu trên đặt ra cho chúng ta nhiều vấn đề cần phải giải quyết. Đó
chính là các lần cập nhật thông tin hay nói cách một cách tổng quát là cập nhật các
bản sao. Từ đó, ta rút ra các đặc điểm quan trọng sau đây :
1) Khi chỉ tồn tại một bản tập trung đặc quyền, ta có thể đặt ra rằng việc
thay đổi đối tượng thực hiện trên một trong các bản sao sẽ được sao lại ngay lập
tức vào bản chính. Đó chính là trường hợp ghi tức thời và các cập nhập đều gắn
bó. Với các phương pháp ghi khác, ngược lại, các thay đổi tương ứng của một bản
sao đối tượng cục bộ chỉ được sao lại trên bản chính khi thuật toán thay thế được
thực hiện nhằm cung cấp lại các bản ghi bị chiếm bởi bản sao cục bộ đó.
2) Khi không tồn tại bản đặc quyền, ta có thể gặp các trường hợp không
gắn bó thông tin.
Trường hợp thứ hai làm phát sinh hai yêu cầu mới:

9

L
ee
L
HÖ thèng viÔn th«ng
e
L
e
LL
e
L
e
. . . . . .
. . . . . .
Tiểu luận môn Hệ tin học phân tán Trang
i)
Toàn bộ giao dịch thay đổi bản sao của đối tượng cần phải chép lại
càng sớm càng tốt thay đổi đó trên tất cả các bản sao khác. Trong
khi thực hiện giao dịch, không có bất kỳ sao chép nào khác được
thực hiện. Sau khi thực hiện xong, tất cả các bản sao hoàn toàn
giống nhau.
ii) Việc cập nhật tức thời (theo hệ tập trung) của tất cả các bản sao là
không cần thiết
Trong tất cả các trường hợp, một giao dịch tham chiếu trạng thái một đối
tượng thực hiện xuất phát từ một trạm trên bản cục bộ cần phải cung cấp :
+Hoặc là một giá trị cập nhật của tất cả các thay đổi diễn ra trước
tham chiếu.
+Hoặc là một giá trị đã cũ, nhưng lại là giá trị đã được cập nhật ở
thời điểm trước đó.
Sự tham chiếu không bao giờ phải cung cấp một giá trị xuất phát từ việc
thực hiện từng phần của một giao dịch.

II.2 Th
uật toán quản lý nhiều bản sao
Thuật toán cho phép sao lại các thay đổi của một đối tượng trên các bản sao
khác nhau như sau:
II.2.1 Cơ chế then cài
Một giao dịch nào đó đang thực hiện phép then cài trên một đối tượng
muốn giành quyền sử dụng đối tượng này theo một vài kiểu truy cập nhất định. Cơ
chế then cài gán hay không gán quyền truy cập này căn cứ vào quy tắc tiền định
như loại trừ tương hỗ, luật đọc, hiệu chỉnh thông tin,…
Nếu quyền được thừa nhận thì đối tượng bị cài then bởi giao dịch. Nếu
không, tiến trình giao dịch bị khoá và đối tượng không bị cài then.
Cơ chế cài then cho phép một giao dịch có thể giải phóng đối tượng mà nó
đã cài then.
II.2.1.1 Loại trừ tương hỗ
Một trong những giải pháp giản đơn để đạt được trật tự hoá gắn bó thể hiện
ở chỗ bắt buộc phải sử dụng trật tự hoá tuần tự, toàn bộ giao dịch được đặt trong

10
Tiểu luận môn Hệ tin học phân tán Trang
cặp hàm nguyên thuỷ mo_giaodich và dong_giaodich. Đây là sự đảm bảo cho việc
loại trừ tương hỗ giữa các giao dịch.
II.2.1.2 Then cài chọn lựa các đối tượng
Một giao dịch thay đổi giá trị của đối tượng phải loại trừ tất cả các đối
tượng khác muốn truy cập, ngược lại thì việc truy cập được tiến hành theo kiểu
tương tranh
Để đảm bảo điều đó luôn luôn được thực hiện, người ta cho phép tiến hành
cài then một đối tượng trước khi việc sử dụng nó có hiệu lực
Một giao dịch có thể thực hiện trên ba hàm nguyên thuỷ trên đối tượng e:
SốTT Tên hàm Thuyết minh
1 v_doc(e) Sử dụng khi muốn có được quyền đọc e theo kiểu chia sẻ

2 v_viet(e) Sử dụng khi muốn có được quyền đọc và viết vào e theo
kiểu loại trừ
3 giai_phong(e) Giải phóng đối tượng e. giả sử trước đó đã dược cài then
bởi cùng giao dịch này
Trong môi trường phân tán, phục vụ cho các ứng dụng có khối lượng xử lý
thông tin lớn trong điều kiện kỹ thuật phần cứng, phần mềm không đồng nhất, việc
quản lý nhiều bản sao trong điều kiện số lượng cập nhật lớn được đặt ra. Chính vì
vây, trong phần này chúng ta sẽ tìm hiểu sơ lược các thuật toán cho phép sao lại
các thay đổi của một đối tượng trên các bản sao khác nhau đảm bảo hệ thống hoạt
động một cách hiệu quả.
II.2.2 Xử lý các sự cố
Một cơ chế cho phép duy trì gắn bó trong môi trường phân tán có sự cố
phải là:
i) Giao dịch T bắt buộc phải được thực hiện một cách trọn vẹn
ii) Nếu có sự cố diễn ra thì bắt buộc nó phải quay trở lại điểm xuất phát.
+Nếu một tiến trình bị sự cố trước khi kết thúc T nhưng lại sau các thao tác
thay đổi cần thiết của T, trạng thái của hệ là gắn bó
+ Nếu một tiến trình bị sự cố trước khi diễn ra các thay đổi của T, trạng thái
của hệ là gắn bó
+ Nếu một tiến trình bị sự cố giữa các thay đổi T, trạng thái của hệ là không
gắn bó
Các mô hình và giải thuật nghiên cứu phải đảm bảo các đặc tính toàn vẹn
dữ liệu của hệ và tuân thủ theo các giai đoạn thể hiện trong hình vẽ 4.

11
Tiểu luận môn Hệ tin học phân tán Trang
Trong
Sơ đồ mô tả cơ cấu tổ chức của hệ thống nhiều bản sao và việc cập nhật các
bản sao được thể hiện trong hình 5 sau đây.
b

ij
với i =1 n, j=1 m, trong đó i chỉ server
j chỉ bản sao
n là số lượng server được mắc nối trong mạng
m là số lượng các đối tượng dữ liệu
t
k với
k=1 q, trong đó k là trạm
q là số trạm được mắc nối
Các ràng buộc trên các bản sao:

12
Tr íc cËp nhËt
Trong cËp nhËt
Sau cËp nhËt
Kh«ng
g¾n bã
G¾n bã
G¾n bã
I
II
1
2
3
t
t
1
t
2
t

q
b
1m
b
12
b
11
b
21
b
22
b
2m
HÖ thèng viÔn th«ng
S
1
S
2
S
n
b
n1
b
n2
b
nm



Hình 5. Sơ đồ mô tả hệ thống nhiều bản sao

Hình 4. Ba giai đoạn của một giao dịch
Hình 4. Ba giai đoạn của một giao dịch
Tiểu luận môn Hệ tin học phân tán Trang
Trên bản sao của một đối tượng:
Nếu ta có n bản sao b1, b2,…, bn của đối tượng b, một trong các ràng buộc
toàn vẹn là:
b1=b2= =bn
Trên các bản sao của toàn bộ các đối tượng:

b11=b21= =bn1
b12=b22= =bn2


b1m=b2m= =bnm
Gọi M là cực đại của các cập nhật có thể diễn ra đồng thời, thì M có thể
tính theo công thức M=n x m.
Căn cứ vào nội dung thông tin cần phải đảm bảo sự gắn bó mà người ta
chia ra hai loại giải thuật:
+ Giải thuật gắn bó mạnh
+ Giải thuật gắn bó yếu
Hệ thống viễn thông là đối tượng có thể diễn ra các sự cố kỹ thuật và ùn tắt
đường truyền, ta có số lần truy cập bản sao trên thực tế sẽ lớn hơn M rất nhiều;
hiệu năng hoạt động của hệ trong trường hợp này sẽ bị giảm.
Cách đầu tiên được áp dụng là then cài. Giả sử với trường hợp có n bản sao
b
1
, b
2
, …, b
n

của đối tượng b, để tham chiếu đến b, cần phải thực hiện giao dịch:
Để thực hiện việc cập nhật vào các bản sao, ta cần phải cài then chúng một
cách hợp thức theo kiểu loại trừ.

13
v_doc(b
i
)
doc(b
i
)
giai_phong(b
i
)
Để cho i:=1 đến n thực hiện v_viet(b
i
)
<Thực hiện các cập nhật và chép chúng vào tất cả các bản>
Để cho i:=1 đến n thực hiện giai_phong(b
i
)
Tiểu luận môn Hệ tin học phân tán Trang
Nhược điểm căn bản của giải pháp này là rất yếu về song song giữa các
phép toán cập nhật. Ta có thể áp dụng các ràng buộc toàn vẹn yếu hơn.
II.2.3 Thuật toán đảm bảo sự gắn bó yếu nhờ dấu
II.2.3.1 Nguyên lý
Tập hợp các yêu cầu cập nhật được sắp xếp theo cùng một kiểu trên tất cả
các trạm nhờ cơ chế dấu. Theo đó mỗi một yêu cầu được phát đi cho tập hợp các
trạm. Tên mỗi trạm, tồn tại một tiến trình Server đảm nhận nhiệm vụ tiếp nhận các
yêu cầu theo trật tự của dấu. Điều đó cho phép có được một sự gắn bó yếu giữa

các bản sao.
II.2.3.2 Triển khai hệ ổn định
Các giao dịch cần xét là các khả năng đọc, ghi hay cập nhật. Cập nhật được
xác định như là một dãy các thao tác đọc và ghi, thao tác kiểm tra đọc tức thì trạng
thái hiện hành của một bản sao.
Mỗi một server tiếp nhận các yêu cầu ghi đến từ trạm cục bộ ở thời điểm
cho trước. Nó tiếp nhận các yêu cầu và tính toán trên cơ sở dấu theo tiêu chí lâu
nhất. Việc xác định yêu cầu không được tiến hành ngay tức khắc vì nguyên do ta
không thể biết chắc chắn yêu cầu nào là lâu nhất. Yêu cầu lâu nhất có thể đang
truyền trên đường. Tính không chắc chắn này xuất hiện có điều kiện với giả thiết
về hệ viễn thông. Khi trạm i truyền các thông điệp cho trạm j, Trật tự nhận các
thông điệp tại j là hoàn toàn giống với trật tự của các thông điệp phát đi. Giả thiết
này được kiểm tra trong các mạng thông thường. Việc xác định các yêu cầu cần xử
lý trên một trạm là hoàn toàn có thể.
Có hai trường hợp cần xem xét:
1) Tập hợp các yêu cầu ghi khi chờ chứa các yêu cầu từ tất cả các trạm khác.
Trong trường hợp này các yêu cầu đi qua, nếu chúng tồn tại, là mới hơn so
với các yêu cầu đã đi qua. Nói cách khác, yêu cầu lâu nhất chính là yêu cầu
đang chờ.
2)
Tồn tại các trạm mà không có bất kỳ yêu cầu nào được truyền đến. Ta được đưa
các trường hợp trước đây bằng cách truyền cho tất cả các trạm một thông điệp yêu
cầu và bắt buột phải xác nhận. Do vây, sau một khoảng thời gian, theo giả thiết về
độ ổn định, ta sẽ nhận hoặc là các yêu cầu đi qua, hoặc là các trả lời cho thông
điệp yêu cầu. Lúc này, ta có được các thông điệp đến từ tất cả các trạm.

14
Tiểu luận môn Hệ tin học phân tán Trang
II.2.3.3 Các hành vi bên ngoài của chế độ bình thường
Hai vấn đề mở rộng hơn đối với thuật toán này cho phép rút ra hay chèn

vào tùy ý một trạm nào đó. Ngược lại, thuật toán chỉ sống trong trường hợp có sự
cố, nếu các điều kiện sau đây được tôn trọng:
1) Việc đột nhiên biến mất đi một trạm nào đó phải được các trạm khác
nhận biết tự động.
2)
Việc phát một thông điệp là một phép toán không chia cắt được nữa. Đó là một
thông điệp hoặc là tất cả đều phải nhận được hoặc là không trạm nào nhận được
cả.
Vì vậy, việc tuân thủ hai điều kiện trên đặt ra cho chúng ta tình hình là nếu
điều kiện đầu tiên có thể được khống chế, thì điều kiện thứ hai rất khó đảm bảo.
II.2.4 Kết luận
Khái niệm sự gắn bó yếu cho phép giải phóng các ràng buộc đồng nhất chặt
chẽ của các bản sao; bằng cách cho phép truy cập đến các thông tin quá hạn, ta có
được một hiệu quả rất lớn.
Các nguyên lý có tính chất thuật toán được sử dụng trong việc quản lý các
bản sao được xây dựng cho hệ thống ổn định. Chúng không thích hợp cho các loại
hệ hay sự cố, đặc biệt cho trường hợp phân tán hệ ra thành hai hay nhiều mạng con
độc lập; mỗi mạng tiếp tục hoạt động như là hệ cục bộ. Dẫu rằng các bản sao tạo
nên mạng con vẫn duy trì trạng thái gắn bó, nhưng sự hợp nhất chúng lại là vấn đề
khá nan giải. Ta chỉ có thể tránh được hiện tượng này bằng cách để số lượng các
trạm nhỏ hơn hay bằng đa số tuyệt đối của hệ khởi sự.

15
Tiểu luận môn Hệ tin học phân tán Trang
CHƯƠNG III
THUẬT TOÁN XỬ LÝ CÁC THAO TÁC ĐỌC,
CÁC THAO TÁC CẬP NHẬT
III.1 Kỹ thuật đánh dấu bản điều khiển
Trong môi trường phân tán, hệ thống viễn thông là đối tượng có thể diễn ra
các sự cố kỹ thuật và ùn tắt đường truyền, ta có số lần truy cập bản sao trên thực tế

sẽ lớn hơn số lần tính theo lý thuyết rất nhiều; hiệu năng hoạt động của hệ trong
trường hợp này sẽ bị giảm.
Một trong những giải pháp khắc phục vấn đề vừa nêu là áp dụng kỹ thuật
đánh dấu bản điều khiển và căn cứ vào hệ thống tín hiệu này, người ta có thể chọn
các giải thuật cập nhật thích hợp, rút ngắn được tốc độ cập nhật bình quân.
Việc lựa chọn giải thuật cập nhật được tiến hành trên cơ sở truy cập vào cấu
trúc phân tầng. Cấu trúc này được mô tả trong hình vẽ 6.

16
Tiu lun mụn H tin hc phõn tỏn Trang
ng vi mi mt loi truy cp, ngi ta cú th hoc l ỏp dng cỏc gii
thut ang cú ó c kim nghim hoc l phi nghiờn cu cỏc gii thut phự
hp hn nhm khai thỏc ti a kh nng ca k thut v cụng ngh mi.
K thut ỏnh du bn iu khin gi tt l TOMCP (Technique Of
Marking the Control Panel)
Chng trỡnh qun lý TOMCP c xõy dng di dng th tc tin ớch
vi chc nng ch yu l kim tra tớnh hp thc ca vic truy cp vo bn, dũ tỡm

17
W R
WS S
L G
AL P
T NT
GT
1
GT
2
GT
m

xác định hành vi thay đổi thông tin
xác định nguồn truy cập
xác định vị trí truy cập
xác định phạm vi thay đổi thông tin
xác định cấu trúc l u trữ
xác định hoạt động t ơng ứng
TRUY cập
GT
i
: giải thuật t ơng ứng
. . .
TOMCP
Danh sách các tài
nguyên cần thiết
Ch ơng trình
quản lý TOMCP
Hệ thống các tín
hiệu nhận dạng
Hỡnh 6. Cu trỳc phõn tng ca truy cpbn iu khin
Tiểu luận môn Hệ tin học phân tán Trang
thông tin, cập nhật các tín hiệu và yêu cầu được cung cấp tài nguyên theo danh
sách, Thủ tục này là một trong những thành phần cơ bản của trạm.
Danh sách các tài nguyên cần thiết là tổ hợp các thiết bị, chương trình và dữ
liệu phục vụ cho việc quản lý TOMCP.
Hệ thống các tín hiệu nhận dạng là tập hợp các chuẩn hình thành trong quá
trình thiết kế hệ phục vụ cho việc nhận biết tự động trạng thái của hệ quản lý nhiều
bản sao và xác định GTl cần thực hiện
Nội dung cơ bản của kỹ thuật này có thể mô tả trong hình vẽ 8. Theo mô
hình điều khiển này, tại mỗi trạm, trạng thái các bản sao trên toàn bộ hệ thống
được thể hiện một cách chính xác và nhờ đó các trạm biết cần phải hành động như

thế nào là tối ưu nhất.
Mỗi khi cập nhật, thay vì phải kích hoạt một trình điều khiển như mô hình
Client/Server chứa sẵn trên Server và gửi toàn bộ các yêu cầu thay đổi, thì kỹ thuật
này cho phép chỉ gửi những chi tiết cần thay đổi là đủ.
Việc làm tươi thông tin trong bản điều khiển sẽ do các trạm thực hiện tự
động căn cứ vào dữ liệu mà nó có được. Những thông tin này có khối lượng không
lớn và được các trạm trao đổi với nhau bằng thông điệp.

18
Hình 8. Sơ đồ hệ thống bản điều khiển
Tiểu luận môn Hệ tin học phân tán Trang
Để tránh bế tắc diễn ra trong quá trình truy cập bản điều khiển theo kiểu 2
pha, thông thường giải pháp gắn bó mạnh của Herman được sử dụng.
Hai trạm quan trọng trong tiến trình truy cập bản để đọc và cập nhật bản là
trạm gửi thông điệp (trạm yêu cầu) và trạm nhận thông điệp (trạm đáp ứng yêu
cầu).
Cấu trúc của các thông điệp trao đổi giữa các trạm có thể mô tả trong hình
vẽ 9 dưới đây.
START SOURCE TARGET CODE INFORMATION CONTROL END
Các trường của thông điệp trao đổi là:
1 START Bắt đầu Giá trị 8 bit cho phép bắt đầu thông điệp
2 SOURCE Địa chỉ nguồn Địa chỉ trạm gửi thông điệp với độ dài
từ 8 bit đến 16 bit đủ để biểu diễn số
lượng địa chỉ của các trạm trong các hệ
thống lớn
3 TARGET Địa chỉ đích Địa chỉ của trạm nhận với độ dài của
trường từ 8 bit đến 16 bit
4 CODE Mã Mã sử dụng để nhận biết phép toán trên
bảng với độ dài là 8 bit. Ý nghĩa các bit
được trình bày trong hình 10


19
Hình 9. Cấu trúc thông điệp trao đổi
Tiểu luận môn Hệ tin học phân tán Trang
5 INFORMATION Thông tin Thông tin cần thiết để truy cập vào các
bản sao
6 CONTROL Kiểm tra Trường kiểm tra phục vụ cho việc
truyền dữ liệu qua mạng và các giá trị
được qui ước cho từng loại mạng cụ thể
7 END Kết thúc Giá trị 8 bit cho phép kết thúc thông
điệp
Giá trị các bít của trường CODE được thể hiện trong hình 10 dưới đây.
Ưu điểm căn bản của kỹ thuật đánh dấu bản điều khiển là:
1 Gắn bó Đảm bảo tính gắn bó thông tin. Nếu kết hợp với kỹ thuật
hàng đợi các thông điệp, ta có thể tránh được hiện tượng
thiếu vô hạn tài nguyên
2 Tin cậy Hệ thống hoạt động với kỹ thuật này chịu đựng được trạng
thái lỗi của mạng nói chung, trong đó có lỗi của hệ thống
đường truyền
3 Nhạy Phản ứng được với các tình huấn sinh lỗi
4 Liên tục Cho phép phân phối động các tài nguyên cần cập nhật
5 Phát hiện sự cố Phát hiện các lỗi phát sinh trong quá trình vận hành

20
7 6 5 4 3 2 1 0
Yªu cÇu côc bé hay tõ xa
PhÐp to¸n truy cËp
CÊu tróc b¶n sao
VÞ trÝ trong cÊu tróc b¶n sao
TÝnh chÊt cËp nhËt

Hình 10. Ý nghĩa các bit của trường CODE
Tiểu luận môn Hệ tin học phân tán Trang
6 Thống kê Biết được trạng thái cập nhật ở mọi thời điểm
III.2 Sơ đồ tuần tự xử lý các thao tác đọc, các thao tác cập nhật
Việc xử lý trạng thái điều khiển do trạm nhận tiến hành trên cơ sở tham
chiếu thông tin trong bản điều khiển và theo yêu cầu thể hiện trong hình 11.
Sau khi hoàn thành trọn vẹn công việc, trạm nhận tiến hành phát thông điệp
đến toàn bộ các trạm của hệ thống để cập nhật vào bản điều khiển, đồng thời tự
động cập nhật vào bản cục bộ của mình.
Sơ đồ tổng quát xử lý nhiều bản sao:

21
caithen(B)
Khãa b¶n ®iÒu khiÓn B
Thùc hiÖn viÖc cËp nhËt th«ng tin
trªn b¶n ®iÒu khiÓn B
Më khãa b¶n ®iÒu khiÓn
giaiphong(B)
Capnhat(B)
Hình 11. Trình tự thực hiện cập nhật bản điều khiển
Tiu lun mụn H tin hc phõn tỏn Trang
.
Khi cp nht, gii thut GT
l
, l=1 P c thc hin bi trm nhn trong c
ch then ci i vi cỏc phộp lm thay i thụng tin trong bn sao, ngc li, thỡ
thc hin theo kiu tng tranh.
Vic phỏt hin v x lý li trong quỏ trỡnh x lý c tin hnh ngay sau
khi trm nhn c yờu cu cp nht. Nu mi c gng sa li khụng th thc
hin cú kt qu, thỡ thụng ip s c phỏt i yờu cu trm gi phỏt li thụng


22
Bắt đầu
Xử lý
thông điệp
Kết thúc
Lặp lại
Xử lý trạng
thái điều khiển
Tự động
sửa lỗi
Lỗi
OK
Xử lý và chọn giải
thuật thích hợp
Thực hiện giải
thuật gt
l
xong
phát
thông điệp
s
Đ
đ
đ
s
đ
s
S
Hỡnh 12. S tng quỏt x lý nhiu bn sao khin

Tiểu luận môn Hệ tin học phân tán Trang
tin. Trong trường hợp công việc cập nhật kết thúc tốt đẹp, một thông điệp khẳng
định cũng được phát đi bởi trạm nhận. Sau khi phát đi thông điệp, trạm gửi chuyển
sang trạng thái chờ thông điệp mới, còn trạm nhận thông điệp chỉ chuyển sang
trạng thái chờ khi đã nhận đủ các thông điệp khẳng định.
Các bước thể hiện công việc xử lý thông tin điều khiển được tiến hành tuần tự như
trong hình 13 sau đây.

23
Hình 13. Các bước xử lý trạng thái điều khiển
Tiu lun mụn H tin hc phõn tỏn Trang
Thut toỏn kim tra v cp nht bn sao th hin bng cỏc khi trong hỡnh
v 14, trong ú mi khi cú th xõy dng mt th tc hoc hm chuyờn bit.

24
Bắt đầu
Truy cập thông
tin về cấu trúc
Tồn tai
Bản sao
xác định
độ dài của
information
Hợp thức
phát thông điệp
cho trạm gửi
Trạng thái
vật lý [o/c]
Thực hiện open
vật lý [kt1]

định vị
cập nhật
Chuyển giá trị
vùng nhớ vào
bản sao
Lock
[mức record]
OK1
phép đặc
biệt
OK2
Unlock
record
Thao tác kỹ
thuật [kt2]
Kết thúc
Trạng thái
chờ
Phục hồi
bản sao
S
Đ
S
Đ
S
Đ
S
Đ
S
Đ

S
Đ
Hỡnh 14. S x lý v cp nht nhiu bn sao
Tiểu luận môn Hệ tin học phân tán Trang
III.3 Kết luận
Vấn đề cập nhật các bản sao thông tin của cùng một đối tượng dùng chung
trong môi trường phân tán đã được nghiên cứu khá rộng rãi và đã được ứng dụng
vào thực tế xây dựng các ứng dụng lớn như thương mại điện tử, chính phủ điện
tử Tuy vậy, trong khuôn khổ tiểu luận này chỉ nêu lên những vấn đề mang tính
nguyên lý. Thuật toán xử lý các thao tác đọc, các thao tác cập nhật trên không chỉ
chỉ đảm bảo hệ thống hoạt động với tốc độ bình quân chấp nhận được, ổn định, tin
cậy mà quan trọng hơn cả là phải đảm bảo tính gắn bó của dữ liệu trong các bản
sao.
Mô hình hệ thống quản lý nhiều bản sao giống nhau trên môi trường phân
tán và các giải thuật được nghiên cứu trên đã đáp ứng các yêu cầu của một hệ
thống phức tạp với lượng thông tin lớn cần phải xử lý. Nó được ứng dụng như là
các nguyên lý cơ bản cho các hệ thống tệp tin phân tán, các cơ sở dữ liệu phân tán
hiện nay.

25

×