Tải bản đầy đủ (.pdf) (128 trang)

Một số thuật toán lập lịch để phân phối tài nguyên trong hệ thống tính toán lưới

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.58 MB, 128 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
----------------------------

Trịnh Thị Thúy Giang

MỘT SỐ THUẬT TOÁN LẬP LỊCH
ĐỂ PHÂN PHỐI TÀI NGUN TRONG
HỆ THỐNG TÍNH TỐN LƯỚI
Chun ngành: Bảo đảm tốn học cho máy tính
và hệ thống tính tốn
Mã số:

62 46 35 01
LUẬN ÁN TIẾN SĨ TỐN HỌC

NGƯỜI HƯỚNG DẪN KHOA HỌC:
1. GS.TS. Nguyễn Thanh Thủy
2. PGS.TS. Hoàng Chí Thành

Hà Nội - 2011


MỤC LỤC
LỜI CAM ĐOAN ..................................................................................................1
LỜI CẢM ƠN........................................................................................................2
MỤC LỤC..............................................................................................................3
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT............................................6
DANH MỤC CÁC BẢNG.....................................................................................7
DANH MỤC CÁC HÌNH VẼ ...............................................................................8
MỞ ĐẦU ................................................................................................................9


CHƯƠNG 1. TỔNG QUAN VỀ HỆ THỐNG TÍNH TỐN LƯỚI .................11
1.1 Giới thiệu chung ............................................................................................11
1.1.1 Hệ thống tính tốn lưới là gì .....................................................................11
1.1.2 Các mơ hình tính tốn lưới........................................................................12
1.1.3 Các thành phần chính của hệ thống tính tốn lưới ....................................15
1.1.4 So sánh mơ hình tính tốn lưới với một số mơ hình tính tốn khác ............20
1.1.5 Những ứng dụng cơ bản của hệ thống tính tốn lưới .................................23
1.1.6 Các cơng cụ hỗ trợ xây dựng hệ thống tính tốn lưới ................................27
1.1.7 Một số hệ thống tính tốn lưới...................................................................29
1.2 Các thách thức đối với mơ hình tính tốn lưới và một số vấn đề nghiên cứu
..............................................................................................................................31
1.2.1 Các xu hướng trong tính tốn....................................................................31
1.2.2 Các khó khăn ............................................................................................33
1.2.3 Một số hướng nghiên cứu..........................................................................35
1.3 Mục tiêu của luận án .....................................................................................39
1.4 Các kết quả ñã ñạt ñược của luận án............................................................40
CHƯƠNG 2. BÀI TỐN LẬP LỊCH TRONG TÍNH TỐN LƯỚI................41
2.1 Một số bài toán lập lịch truyền thống ...........................................................41
3


2.1.1 Bài toán lập lịch trên hai máy và giải thuật gia công Johnson ..................41
2.1.2 Giải thuật xếp lịch heuristic ......................................................................42
2.1.3 Phương pháp duyệt nhánh cận ..................................................................43
2.1.4 Phương pháp qui hoạch ñộng....................................................................44
2.1.5 Phương pháp làm mịn kết quả...................................................................44
2.1.6 Phương pháp Hung-ga-ri ..........................................................................46
2.2 Bài tốn lập lịch trong hệ thống tính toán lưới ............................................48
2.2.1 Phát biểu bài toán ....................................................................................48
2.2.2 Một số khó khăn trong lập lịch đối với hệ thống tính tốn lưới..................51

2.2.3 Một số cách tiếp cận .................................................................................52
2.2.4 Độ khó của bài tốn ..................................................................................55
2.3 Mơ hình lập lịch trong hệ thống tính tốn lưới ............................................55
2.3.1 Các mơ hình lập lịch trong hệ thống tính tốn lưới ...................................56
2.3.2 Mơ hình Buyya lập lịch trong hệ thống tính tốn lưới................................60
2.3.3 Thực hiện cơng việc lập lịch trong hệ thống tính tốn lưới........................64
Kết luận chương 2 ...............................................................................................70
CHƯƠNG 3. MỘT SỐ GIẢI THUẬT CHO BÀI TỐN LẬP LỊCH TRONG
TÍNH TỐN LƯỚI.............................................................................................71
3.1 Các giải thuật lập lịch tối ưu theo thời gian, chi phí ....................................71
3.1.1 Giải thuật lập lịch tối ưu về thời gian........................................................71
3.1.2 Giải thuật tối ưu về chi phí........................................................................72
3.1.3 Giải thuật tối ưu về thời gian - chi phí.......................................................73
3.2 Giải thuật tham lam lam ...............................................................................74
3.2.1 Giải thuật ..................................................................................................74
3.2.2 Các kết quả thử nghiệm.............................................................................77
3.2.3 Đánh giá ...................................................................................................79
3.3 Giải thuật di truyền .......................................................................................79
4


3.3.1 Giới thiệu về giải thuật di truyền..............................................................80
3.3.2 Giải thuật di truyền trong lập lịch ............................................................81
3.3.3 Các kết quả thử nghiệm............................................................................84
3.3.4 Đánh giá ...................................................................................................89
3.4 Giải thuật tối ưu hóa theo nhóm bầy (PSO) .................................................89
3.4.1 Giải thuật PSO..........................................................................................89
3.4.2 Giải thuật PSO cho bài tốn lập lịch trong hệ thống tính tốn lưới ..........92
3.4.3 Các kết quả thực nghiệm ...........................................................................94
3.4.4 Đánh giá ...................................................................................................96

Kết luận chương 3 ...............................................................................................97
CHƯƠNG 4. MƠ HÌNH HỆ THỐNG THỬ NGHIỆM ....................................98
4.1 Giới thiệu về hệ thống thử nghiệm TestGrid................................................98
4.1.1 Kiến trúc chung của TestGrid ...................................................................98
4.1.2 Mô tả chức năng bộ lập lịch .................................................................... 101
4.1.3 Thiết kế bộ lập lịch.................................................................................. 104
4.1.4 Cơ chế lập lịch của TestGrid................................................................... 106
4.1.5 Xử lý và chống lỗi ................................................................................... 108
4.2 Bộ lập lịch của TestGrid với các giải thuật đề xuất ................................... 109
4.2.1 Mơ hình triển khai thực nghiệm bộ lập lịch trên lưới............................... 109
4.2.2 Yêu cầu tương thích giữa giải thuật lập lịch với khung phần mềm thực
nghiệm ............................................................................................................. 114
Kết luận chương 4 ............................................................................................. 119
KẾT LUẬN CHUNG......................................................................................... 120
DANH MỤC CƠNG TRÌNH KHOA HỌC CỦA TÁC GIẢ LIÊN QUAN ĐẾN
LUẬN ÁN .......................................................................................................... 122
TÀI LIỆU THAM KHẢO................................................................................. 123

5


DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT
BOINC

The Berkeley Open
Infrastructure for Network
Computing

Cơ sở hạ tầng mở Berkeley cho tính


Center for Development of

Trung tâm Phát triển Cơng nghệ Tính

Advance Computing

tốn Tiên tiến (Ấn Độ)

Common Object Request

Kiến trúc môi giới yêu cầu đối tượng

Broker Architecture

chung

Distributed Component

Mơ hình hướng đối tượng thành phần

Object Model

phân tán

GA

Genetic Algorithm

Giải thuật di truyền


MDS

Meta Directory Service

Dịch vụ siêu thư mục

MPI

Message Passing Interface

Giao diện truyền thơng điệp

P2P

Peer - to - Peer

Hệ thống tính tốn ngang hàng

PSO

Particle Swarm Optimization

Tối ưu theo nhóm bầy

OGSA

Open Grid Services
Architecture

Kiến trúc dịch vụ lưới mở


OGSI

Open Grid Services
Infrastructure

Cơ sở hạ tầng dịch vụ lưới mở

SA

Simulated Annealing

Giải thuật mô phỏng tôi luyện

SP

Service Providers

Nhà cung cấp dịch vụ

UR

User Requirements

Yêu cầu người dùng

CDAC

CORBA


DCOM

toán mạng

6


DANH MỤC CÁC BẢNG

Bảng 2. 1. Mối ràng buộc giữa giới hạn thời gian và kinh phí trong lập lịch ..........64
Bảng 2. 2. Ma trận thông tin tài nguyên ................................................................68
Bảng 3. 1. So sánh hiệu quả của giải thuật mô phỏng tôi luyện và giải thuật tham
lam ........................................................................................................................78
Bảng 3. 2. Hiệu quả của giải thuật di truyền khi giá trị α thay ñổi - Kịch bản 1......86
Bảng 3. 3. Hiệu quả của giải thuật di truyền khi giá trị α thay ñổi - Kịch bản 2......86
Bảng 3. 4. Hiệu quả của giải thuật di truyền khi giá trị α thay ñổi - Kịch bản 3......86
Bảng 3. 5. So sánh hiệu quả của các giải thuật - Kịch bản 1...................................87
Bảng 3. 6. So sánh hiệu quả của các giải thuật - Kịch bản 2...................................87
Bảng 3. 7. So sánh hiệu quả của các giải thuật - Kịch bản 3...................................87
Bảng 3. 8. So sánh hiệu quả của giải thuật di truyền và PSO .................................95
Bảng 3. 9. So sánh thời gian chạy của giải thuật di truyền và PSO.........................95

7


DANH MỤC CÁC HÌNH VẼ
Hình 1. 1. Mơ hình lưới nội tuyến..........................................................................13
Hình 1. 2. Mơ hình lưới liên tuyến.........................................................................14
Hình 1. 3. Các thành phần của một lưới tính tốn ..................................................19
Hình 1. 4. Tổ chức ảo ............................................................................................35

Hình 2. 1. Mơ hình bài tốn lập lịch trong hệ thống tính tốn lưới .........................53
Hình 2. 2. Mơ hình lập lịch trung tâm ....................................................................57
Hình 2. 3. Mơ hình lập lịch phân tán giao tiếp trực tiếp .........................................58
Hình 2. 4. Mơ hình lập lịch phân tán giao tiếp gián tiếp.........................................59
Hình 2. 5. Mơ hình lập lịch phân cấp .....................................................................60
Hình 2. 6. Mơ hình Pull cho khám phá tài ngun .................................................65
Hình 2. 7. Mơ hình Push cho khám phá tài ngun ................................................66
Hình 2. 8. Mơ hình Push-Pull cho khám phá tài nguyên ........................................66
Hình 3. 1. Mã giả cho giải thuật tham lam .............................................................77
Hình 3. 2. So sánh hiệu quả của giải thuật mô phỏng tôi luyện (SA) và giải thuật
tham lam (Greedy).................................................................................................78
Hình 3. 3. Mã giả cho giải thuật di truyền với tối ưu ña mục tiêu..........................83
Hình 3. 4. So sánh hiệu quả của các giải thuật mô phỏng tôi luyện (SA) và giải thuật
di truyền (GA)- theo Makespan .............................................................................88
Hình 3. 5. So sánh hiệu quả của các giải thuật mô phỏng tôi luyện (SA) và giải
thuật di truyền (GA) - theo Flowtime.....................................................................88
Hình 3. 6. Mã giả của giải thuật PSO cho bài toán lập lịch ....................................92
Hình 3. 7. So sánh thời gian chạy của các giải thuật di truyền (GA) và PSO..........96
Hình 4. 1. Kiến trúc TestGrid ................................................................................98
Hình 4. 2. Trường hợp sử dụng của bộ lập lịch .................................................... 104
Hình 4. 3. Mơ hình triển khai thực nghiệm .......................................................... 110
Hình 4. 4. Đệ trình cơng việc lên lưới.................................................................. 113
Hình 4. 5. Các job 1 - 2 -4 -6 chạy trên máy bkluster.hut.edu.vn.......................... 113
Hình 4. 6. Các job 3-5 chạy trên máy rocks-200.sdsc.edu .................................... 114

8


MỞ ĐẦU


Khoa học và công nghệ ngày càng phát triển vượt bậc và ñược ứng dụng rộng
rãi trong tất cả các lĩnh vực của đời sống xã hội. Cơng nghệ thông tin cũng phát
triển như vũ bão. Cuộc sống và công việc của chúng ta trở nên thuận tiện do máy
tính và Internet. Việc trao đổi thơng tin với thế giới bên ngồi sẽ khơng cịn tốn thời
gian và tiền bạc như trước đây.
Trong thực tế, ngày càng có nhiều bài tốn đặt ra với u cầu dữ liệu lớn, tốc
độ xử lý cao. Trong khi đó, tồn tại nhiều nguồn tài nguyên dư thừa. Sự phát triển
rộng khắp, mạnh mẽ của mạng Internet tồn cầu đã làm nảy sinh một nhu cầu tất
yếu, đó là tận dụng nguồn tài ngun dư thừa để xử lý các bài tốn với u cầu tính
tốn lớn. Cơng nghệ tính tốn lưới ra ñời, cho phép giải quyết vấn ñề nêu trên.
Hệ thống tính tốn lưới cung cấp các dịch vụ, cho phép chia sẻ năng lực của
các máy tính và dung lượng của kho dữ liệu khổng lồ thông qua Internet. Lưới tính
tốn dựa trên truyền thơng giữa các máy tính kết nối với nhau và các dịch vụ hỗ trợ
làm cho mạng máy tính tồn cầu trở thành một tài ngun tính tốn rộng lớn. Tồn
bộ tài ngun tính tốn này ñược coi như một tổ chức ảo ñộng và khổng lồ. Người
sử dụng chỉ cần đệ trình cơng việc lên lưới tính tốn và nhận lại kết quả thơng qua
các dịch vụ hỗ trợ của máy ảo khổng lồ này.
Ban đầu, cơng nghệ tính tốn lưới thu hút được sự quan tâm của các nhà khoa
học, chuyên gia nghiên cứu và triển khai. Hiện nay, nó đã được đơng đảo các tổ
chức, doanh nghiệp quan tâm đầu tư. Tính ưu việt của cơng nghệ tính tốn lưới,
cung cấp khả năng tính tốn phân tán tồn cầu đi kèm với nhiều thách thức cần giải
quyết. Trên thế giới ñã xuất hiện các bộ cơng cụ mã nguồn mở cho tính tốn lưới.
Tuy nhiên, các bộ cơng cụ này được xây dựng chung cho tất cả các ứng dụng, vì
vậy trên thực tế, tồn tại khá nhiều hạn chế.

9


Một trong những vấn ñề người sử dụng quan tâm khi đệ trình cơng việc lên
lưới tính tốn đó là thời gian thực hiện công việc và giá thành. Lưới tính tốn phải

giải quyết một bài tốn khó là lập lịch và lựa chọn tài nguyên ñáp ứng yêu cầu
người dùng trong một mơi trường động khơng đồng nhất.
Bài tốn lập lịch là một bài tốn khó. Bài tốn lập lịch trong tính tốn lưới cịn
phức tạp hơn rất nhiều do phải xem xét trong một môi trường phân tán, ñộng, với
tài nguyên không ñồng nhất và phải giải quyết trong thời gian thực. Xuất phát từ
những tìm hiểu, nghiên cứu về tính tốn lưới trên thế giới và Việt Nam, chúng tơi
đã lựa chọn đề tài “Một số thuật tốn lập lịch để phân phối tài ngun trong hệ
thống tính tốn lưới”.
Nội dung nghiên cứu của luận án thực sự có ý nghĩa với thực tế Việt Nam khi
cơ sở hạ tầng mạng và máy tính cịn dư thừa và điều kiện kinh tế khơng cho phép
đầu tư để xây dựng những hệ thống siêu máy tính cỡ lớn.
Luận án gồm 4 chương. Chương I giới thiệu tổng quan về hệ thống tính tốn
lưới; Chương II giới thiệu về bài tốn lập lịch trong hệ thống tính tốn lưới; Chương
III ñề xuất áp dụng một số giải thuật cho bài tốn lập lịch trong hệ thống tính tốn
lưới; Chương IV trình bày mơ hình cài đặt thử nghiệm và cuối cùng là Phần kết
luận.
Luận án ñã ñề xuất 3 giải thuật giải quyết bài toán lập lịch trong hệ thống tính
tốn lưới. Các thử nghiệm đã chỉ ra rằng các giải thuật do luận án ñề xuất cho kết
quả tốt hơn các giải thuật ñã ñược các tác giả khác ñưa ra trước ñây [77]. Các giải
thuật ñề xuất ñã ñược cài ñặt và chạy thử nghiệm trên lưới tính tốn TestGrid, kết
nối với lưới tính tốn khu vực Thái Bình Dương PRAGMA.
Hiện nay, ở Việt Nam đang nghiên cứu triển khai lưới tính tốn VNGrid. Việc
cài đặt thành cơng các giải thuật trong TestGrid sẽ góp phần khai thác hệ thống
VNGrid, kết nối các trung tâm tính tốn hiệu năng cao, ñáp ứng các yêu cầu ứng
dụng.
10


Chương 1. TỔNG QUAN VỀ HỆ THỐNG TÍNH TỐN LƯỚI
1.1 Giới thiệu chung

1.1.1 Hệ thống tính tốn lưới là gì
Ngày nay, cùng với sự phát triển vượt bậc của khoa học kỹ thuật và cơng nghệ
đã xuất hiện các bài tốn u cầu khối lượng tính tốn lớn với độ chính xác cao, ví
dụ như: dự báo thời tiết, chẩn đốn trong y học sử dụng thơng tin hình ảnh, khoa
học sự sống, hố học tính tốn, khoa học trái ñất, vật lý năng lượng cao, y sinh,
khoa học trái ñất, vật lý học thiên thể, dược phẩm học, thủy lực học, vũ trụ học, mơ
hình hố tài chính, mơ phỏng động đất… Với những bài tốn này, các máy tính
riêng lẻ khơng thể đảm trách được. Do vậy, các kỹ thuật tính tốn song song, tính
tốn phân tán được ñề xuất và phần nào ñáp ứng ñược yêu cầu này.
Để có được các hệ thống tính tốn song song với khả năng tính tốn mạnh, các
tổ chức phải đầu tư thêm trang thiết bị, cơ sở hạ tầng tính tốn (máy chủ, máy trạm,
siêu máy tính, cụm máy tính, ...). Cách làm này hết sức tốn kém. Mặt khác, thực tế
cho thấy có một phần lớn các nguồn tài ngun đang được sử dụng lãng phí: các
máy để bàn thường chỉ hoạt động khoảng 5% cơng suất, các máy chủ cũng chỉ hoạt
động với 20% cơng suất. Do vậy, việc tận dụng hiệu quả các nguồn tài nguyên này
mang lại một sức mạnh tính tốn khổng lồ. Hơn nữa, thay vì việc đầu tư vào cơ sở
hạ tầng, chúng ta cũng có thể "thuê" các nguồn tài nguyên từ bên ngồi với chi phí
rẻ hơn. Cùng với việc phân bố hợp lý các tài nguyên sẵn có và các tài ngun th
ngồi, chúng ta sẽ thu được một hệ thống có khả năng tính tốn lớn với chi phí thấp.
Đây là mục tiêu chính của hệ thống tính tốn lưới [27]. Hệ thống tính tốn lưới
hướng đến việc chia sẻ và sử dụng hiệu quả các nguồn tài nguyên thuộc về nhiều tổ
chức trên một quy mô rộng lớn (thậm chí là quy mơ tồn cầu) [12,23,40].
Như vậy, hệ thống tính tốn lưới, hiểu một cách đơn giản, là sự phát triển tiếp
theo của tính tốn phân tán [71]. Mục đích của hệ thống tính tốn lưới là tạo ra một
"máy tính" ảo lớn từ một tập các hệ thống khơng đồng nhất nhằm nâng cao khả
11


năng tính tốn, chia sẻ các tài ngun khác nhau [13]. Các nhà khoa học tại Argone
National Labs thuộc Đại học Chicago (Mỹ) là những người ñầu tiên ñề xuất ý tưởng

về hệ thống tính tốn lưới. Thuật ngữ "lưới" ở ñây xuất phát từ lưới ñiện (electricity
grid), ngụ ý rằng bất cứ một thiết bị tương thích nào đều có thể gắn vào trong lưới
và được xếp ở một mức tài ngun nào đó mà khơng cần quan tâm ñến nguồn gốc
của tài nguyên ấy. Trong tương lai, hệ thống tính tốn lưới có thể cung cấp cho
người sử dụng các dịch vụ, như là dịch vụ cơ sở hạ tầng ñược sử dụng hàng ngày
như ñiện, nước, giao thơng [22,29,56]. Để đáp ứng được mục tiêu to lớn này, hệ
thống tính tốn lưới cần có những gì? Phần tiếp theo luận án sẽ trình bày các mơ
hình tính tốn lưới.
1.1.2 Các mơ hình tính tốn lưới
Trong thực tế, hệ thống tính tốn lưới được cài đặt theo nhiều mơ hình khác
nhau, phù hợp với từng ứng dụng cụ thể. Có thể phân loại các dạng lưới tính tốn
này dựa vào cấu trúc của tổ chức ảo tham gia vào mạng lưới hoặc định nghĩa hệ
thống tính tốn lưới theo tính chất của tài ngun được chia sẻ [22,23]. Lưới tính
tốn có thể được xây dựng với các kích thước khác nhau. Có thể là chỉ một vài máy
trong một phịng hoặc có thể là cả một hệ thống phân cấp các máy tính trải rộng trên
tồn cầu. Sau ñây chúng ta sẽ xem xét một số cấu trúc hệ thống lưới tính tốn cơ
bản.
a) Lưới nội tuyến (Intragrid)
Là một hệ thống tính tốn lưới bao gồm các tài ngun nằm rải rác trong một
tổ chức (cơng ty, xí nghiệp) và cung cấp dịch vụ cho tất cả người dùng. Tài nguyên
chia sẻ trong các nhóm khác nhau của một tổ chức tạo thành một lưới nội tuyến.
Lưới nội tuyến có thể chỉ hạn chế trong một mạng cục bộ hoặc các mạng riêng ảo.
Thông thường lưới nội tuyến ñược bảo vệ bởi hệ thống tường lửa.

12


Lưới nội tuyến có thể bao gồm các máy trạm, máy chủ, cũng như các tài
nguyên tập trung ñược quản lý cục bộ, nằm tại các bộ phận khác nhau trong một tổ
chức.

Mơ hình tính tốn lưới phức tạp hơn có thể gồm các máy tính khơng đồng nhất.
Trong hệ thống này tồn tại nhiều kiểu tài nguyên khác nhau. Để quản lý điều phối
tài ngun, hệ thống tính tốn lưới phải gồm thành phần điều phối và lập lịch.
Ngồi ra, việc chia sẻ các tệp ñược thực thi bởi hệ thống quản lý tệp. Các máy tính
tham gia vào lưới tính tốn loại này thường khơng nhất thiết phải nằm trong cùng
một phòng, nhưng nhất thiết phải nằm trong cùng một tổ chức.

Hình 1. 1. Mơ hình lưới nội tuyến
b) Lưới liên tuyến (Intergrid)
Là những lưới tính tốn được phát triển dựa vào mạng Internet công cộng.
Lưới loại này có thể được thiết lập bởi các cơng ty nhằm hỗ trợ việc kinh doanh
mua bán, cung cấp các dịch vụ giá trị gia tăng và cho phép người dùng khai thác các
tài nguyên bên ngoài [37].

13


Lưới liên tuyến cho phép truy cập và khai thác các tài nguyên phân tán trên
khắp thế giới nhằm phục vụ các cơng việc tính tốn và cộng tác của người dùng.
Lưới liên tuyến cung cấp khả năng chia sẻ tài ngun tính tốn và lưu trữ thơng qua
Web.
Lưới tính tốn được sử dụng và xuất hiện ở rất nhiều nơi trên thế giới. Điều
này dẫn ñến việc cần thiết phải có các khuyến nghị cụ thể về việc lưới tính tốn
được sử dụng như thế nào. Ví dụ như, khuyến nghị xác định loại cơng việc nào
được thực hiện trên hệ thống và vào khoảng thời gian nào. Bên cạnh đó, việc bảo
mật cũng trở thành một vấn đề quan trọng của các tổ chức liên quan.
Ngày nay, hệ thống tính tốn lưới trải rộng trên khắp tồn cầu, vượt qua biên
giới của từng tổ chức riêng lẻ, của các nước và trở thành một lưới tính tốn giải
quyết các dự án mang tính chất tồn cầu. Hệ thống tính tốn lưới này được gọi là:
Lưới liên tuyến - “Intergrid”. Hình 1.2 dưới đây minh họa một hệ thống lưới liên

tuyến.

Hình 1. 2. Mơ hình lưới liên tuyến
14


1.1.3 Các thành phần chính của hệ thống tính tốn lưới
Khi nói đến các thành phần của lưới, ta có nhiều cách tiếp cận khác nhau [3].
Nếu nhìn một cách tổng thể, một hệ thống lưới bao gồm nhiều nút lưới mà mỗi nút
đó có thể là một lưới nhỏ hay một cluster. Ở góc độ này, một hệ thống lưới bao gồm
các thành phần:
a) Thành phần quản lý
Bất kì một lưới nào cũng cần có một thành phần quản lý. Trước hết, thành
phần này theo dõi các tài nguyên ñang sẵn dùng và các thành viên ñang có mặt
trong hệ thống. Các thông tin này rất quan trọng trong việc gán cơng việc cho máy
trong lưới.
Tiếp đó là thành phần ño lường, xác ñịnh dung lượng tài nguyên của từng nút
mạng và tỉ lệ tài nguyên ñược sử dụng tại một thời điểm bất kì. Điều này là cơ sở
cho việc lập lịch cho các tiến trình lưới. Thành phần đo lường cũng cho thấy tình
trạng của lưới, cảnh báo người sử dụng về khả năng có thể xảy ra thất bại do thiếu
tài nguyên, ñụng ñộ hay các nguyên nhân khác. Một thủ tục khác cần ñến các thông
tin này là các thống kê về sử dụng hệ thống, việc chi trả cho hệ thống khi chạy các
phần mềm trên lưới.
b) Phần mềm quản lý donor
Mỗi máy tính thành viên đóng góp tài ngun vào hệ thống đều cần có q
trình đăng nhập trước khi được xem như một thành viên chính thức. Thơng thường
sẽ có các thủ tục ñịnh danh và thẩm quyền ñể thực hiện, các thủ tục này sẽ giúp tạo
lập một tài khoản cho máy thành viên cũng như người chủ của máy đó.
Một số hệ thống lưới tự ñộng ñăng nhập, trong khi một số hệ thống khác lại sử
dụng việc ñăng nhập vào hệ ñiều hành trên máy ñịa phương. Trong kiểu quản lý thứ

hai, hệ thống sẽ ñối chiếu ñịnh danh người dùng, ñể quyết ñịnh quyền của người sử
dụng ñối với các máy khác nhau trong hệ thống lưới. Những quyền hạn này ñược

15


quyết ñịnh bởi người quản trị hệ thống, sử dụng các thông tin trong cơ sở dữ liệu
người dùng.
Hệ thống tính tốn lưới cịn thơng báo tới tất cả các máy thành viên khi có một
tài ngun mới được kết nối vào hệ thống. Máy đệ trình phải tiến hành các hoạt
ñộng theo dõi, ño lường tỉ lệ tài nguyên ñược sử dụng trên máy, máy nào ở trạng
thái nghỉ, … Các thơng tin này được truyền đến hệ thống quản lý lưới phục vụ cho
công việc lập lịch sau này.
Vấn ñề quan trọng nhất vẫn là khả năng tiếp nhận công việc và thực hiện công
việc của một phần mềm được cài đặt trên một máy nào đó khi được gán nhiệm vụ.
Q trình được mơ tả như sau: tại một trạm nào đó trên lưới, người sử dụng đệ trình
một cơng việc và u cầu thực hiện trên lưới. Phần mềm quản lý phải chọn ra máy
thực hiện, liên lạc với máy đó để gửi cơng việc cần thực hiện. Phần mềm đệ trình
phải nhận được tệp chạy hoặc chọn bản sao trên máy ñã sẵn sàng, tiếp đó tệp chạy
được thực hiện trên máy đệ trình và kết quả ñược trả về cho người yêu cầu.
c) Phần mềm đệ trình
Về ngun tắc, người ta có thể dùng bất cứ máy thành phần nào trong lưới để
đệ trình một công việc. Tuy vậy, trong một số hệ thống, việc đệ trình các cơng việc
được thực hiện bởi một số thành phần cài ñặt trên máy, gọi là nút đệ trình hay máy
khách đệ trình. Khi lưới tính tốn ñược xây dựng dựa trên các tài nguyên chuyên
dụng, các thành phần đệ trình thường được cài đặt trên máy của người dùng hay các
trạm làm việc.
d) Quản lý phân tán
Các lưới tính tốn được cài đặt trên phạm vi rộng lớn thường có cấu trúc hình
cây hay các cấu trúc ñặc thù khác phù hợp với dạng kết nối. Các máy tính được kết

nối thơng qua mạng LAN tạo thành các cụm máy tính. Các lưới có thể được tạo nên
bằng cách ghép cụm của các cụm máy tính này. Vì thế địi hỏi phải có các thủ tục
quản lý các lưới phân tán sao cho ñạt hiệu quả tính tốn cao nhất. Các thao tác trên
16


lưới cũng như các thủ tục chia sẻ dữ liệu và lập lịch phải phù hợp với cấu hình của
lưới tính tốn. Ví dụ, bộ lập lịch trung tâm sẽ không gán trực tiếp công việc cho một
máy cụ thể, mà gán cho một cụm máy tính ở dưới nó, sau đó bộ lập lịch của cụm
máy tính này mới thực hiện gán công việc cho một máy cụ thể trong cụm máy tính
đó. Tương tự như thế, khi một máy đệ trình một cơng việc nào đó, cơng việc này sẽ
ñược chuyển tới bộ phận quản lý của cụm máy tính chứa máy thành phần, sau đó
được tiếp tục chuyển lên bộ quản lý cao hơn để từ đó thực hiện lập lịch cho công
việc này.
e) Bộ lập lịch
Phần lớn các lưới tính tốn đều có các phần mềm lập lịch. Các phần mềm này
có nhiệm vụ chọn ra các máy thành phần để thực thi các cơng việc, được đệ trình tại
một máy nào đó. Cơ chế lập lịch ñơn giản nhất là cơ chế round-robin, tức là hệ
thống sẽ chọn máy tiếp theo có các tài nguyên ñáp ứng nhu cầu của công việc ñể
thực thi. Tuy vậy, trong các hệ thống lớn, các cơ chế lập lịch phức tạp và hiệu quả
hơn sẽ ñược áp dụng.
Một số bộ lập lịch thực hiện gán ưu tiên cho từng cơng việc. Điều này được
thực hiện bằng cách duy trì các hàng đợi cơng việc, mỗi hàng đợi chứa một tập các
công việc với cùng mức ưu tiên. Khi một máy đã thực hiện xong cơng việc của
mình, nó sẽ chọn tiếp một cơng việc ở hàng đợi có mức ñộ ưu tiên cao nhất. Cơ chế
này sẽ ñược kết hợp với một số quy ñịnh khác dựa trên cơ sở là các tài nguyên
người sử dụng .... Ví dụ, tài nguyên trong tổ chức có thể bị hạn chế sử dụng trong
khoảng thời gian nào đó trong ngày.
Bộ lập lịch phải dựa vào các thông tin như tải của lưới, thơng tin tỉ lệ tài
ngun được sử dụng để quyết định xem máy thành phần có bận khơng, trước khi

đệ trình một cơng việc. Giống như tổ chức của mạng, bộ lập lịch cũng ñược tổ chức
theo cấu trúc cây.

17


Các bộ lập lịch tiên tiến hơn cịn có các chức năng theo dõi q trình thực hiện
của các cơng việc trong lưới, từ đó có thể quản lý được luồng cơng việc của tồn bộ
hệ thống. Nếu một cơng việc bị ngừng do thiếu tài nguyên, bộ lập lịch phải có
nhiệm vụ đệ trình lại cơng việc tại một nơi khác trong hệ thống. Tương tự như vậy,
khi tiến trình rơi vào trạng thái lặp, đã q giới hạn thời gian thì cơng việc đó sẽ
khơng được thực hiện lại nữa. Thơng thường, mỗi cơng việc sẽ có một mã trả về khi
kết thúc ñể hệ thống nhận biết cơng việc có được thực hiện thành cơng hay khơng.
f) Các thành phần truyền thơng
Hệ thống lưới có các phần mềm giúp các tiến trình có thể liên lạc với nhau.
Một cơng việc được chia thành nhiều cơng việc nhỏ khác nhau. Các cơng việc này
được thực hiện riêng lẻ trên lưới. Có thể cơng việc này phải sử dụng kết quả của các
cơng việc khác. Điều này dẫn đến việc các cơng việc phải có khả năng liên kết với
nhau. Các phần mềm truyền thông sẽ giúp một tiến trình có khả năng liên lạc với
các tiến trình khác, gửi và nhận các dữ liệu cần thiết. Trong hệ thống có thể sử dụng
chuẩn giao diện MPI và một số chuẩn khác ñể thực hiện các liên kết này.
g) Các thành phần theo dõi và ño lường
Như ñã ñề cập ở trên, các hoạt động lập lịch địi hỏi phải có các thơng tin về hệ
thống hiện tại như các máy nào sẵn dùng, tỉ lệ tài nguyên ñược sử dụng, tải của các
nút lưới.... Thông thường, các phần mềm quản lý donor sử dụng một số công cụ của
hệ điều hành hoặc trực tiếp đo các thơng số này. Các phần mềm này đơi khi cịn
được gọi là “sensor tải”. Các thơng tin này khơng những có giá trị với việc lập lịch,
mà nó cịn đo được khả năng sử dụng lưới. Các thơng số này có thể dự báo cho
người quản trị thấy ñược xu hướng của lưới và các thiết bị cần thiết phải thêm vào
hệ thống.

Khi xem xét đến một lưới cụ thể thì người ta thường quan tâm hơn đến các
thành phần được trình bày ở hình 1.3, đó là:
• Cổng giao diện với người dùng - Portal
18


• Thành phần an ninh - Security
• Thành phần môi giới - Broker
• Thành phần lập lịch - Scheduler
• Thành phần quản trị dữ liệu - Data management
• Thành phần quản trị công việc và tài nguyên - Job and resource
management

Hình 1. 3. Các thành phần của một lưới tính tốn
Hình 1.3 mơ tả q trình người dùng tương tác với lưới thông qua các thành
phần này. Trước tiên, người dùng đưa các u cầu của mình thơng qua cổng giao
diện người dùng. Việc kiểm tra xác nhận, ủy quyền cho người dùng sẽ ñược thành
phần an ninh ñảm trách. Yêu cầu của người dùng sau khi vượt qua thành phần an
ninh, sẽ được thành phần mơi giới đưa đến bộ lập lịch, cùng với các thông tin do
dịch vụ siêu thư mục MDS cung cấp. Bộ lập lịch ñưa ra quyết ñịnh về việc các
nhiệm vụ tương ứng trong yêu cầu ñược thực hiện trên các tài nguyên cụ thể nào, sẽ
chuyển những thông tin này cho các thành phần quản trị cơng việc và dữ liệu để
chúng đảm trách việc thực thi công việc cũng như nhận kết quả trả về. Mọi thơng
tin trả về sẽ được hiển thị trên cổng giao diện người dùng.

19


Như chúng ta đã biết, dù ở góc độ quan sát nào thì một thành phần khơng thể
thiếu trong lưới tính tốn chính là thành phần lập lịch. Nhiệm vụ của bộ lập lịch là

tìm ra tài nguyên phù hợp nhất ñể thực hiện yêu cầu của người dùng. Ở mức tổng
thể, ta có bộ siêu lập lịch và nhiệm vụ của nó là tìm ra cụm máy tính phù hợp cho
yêu cầu người dùng. Còn trong một nút của lưới tính tốn cụ thể, nhiệm vụ của bộ
lập lịch là tìm ra chính xác tài ngun nào sẽ được sử dụng. Với yêu cầu cụ thể của
từng lưới tính tốn, những dịch vụ mà nó cung cấp và hướng tiếp cận mơi trường
tính tốn lưới của người sở hữu tài nguyên, bộ lập lịch sẽ ñược thiết kế sao cho phù
hợp với các tiêu chí đó.
1.1.4 So sánh mơ hình tính tốn lưới với một số mơ hình tính tốn khác
a) World Wide Web (Web computing)
WWW hiện nay đang phát triển mạnh mẽ và ñược sử dụng rộng khắp. Sử dụng
các chuẩn mở và các giao thức mở (TCP, HTTP, XML, SOAP), WWW có thể được
sử dụng để xây dựng các tổ chức ảo. WWW và tính tốn lưới ñều có ñiểm chung là
chia sẻ tệp ngang hàng, xây dựng các tổ chức ảo và đơn giản hóa việc nhiều người
dùng cùng khai thác sử dụng một nền hoạt ñộng chung thống nhất [21]. Tuy nhiên,
WWW thiếu một số ñặc tính quan trọng như các cơ chế chứng thực, ủy nhiệm, các
cơ chế phối hợp thực hiện, sự hỗ trợ liên lạc trong hệ thống [3,7].
b) Các hệ thống tính tốn phân tán
Các cơng nghệ tính tốn phân tán hiện tại bao gồm CORBA, J2EE và DCOM
rất thích hợp cho các ứng dụng phân tán. Tuy nhiên, chúng không cung cấp một nền
tảng phù hợp cho việc chia sẻ tài nguyên giữa các thành viên của tổ chức ảo. Có thể
thấy một số khó khăn khi khai phá tài nguyên, ñảm bảo an ninh và xây dựng các tổ
chức ảo động. Ngồi ra, việc tương tác giữa các cơng nghệ này cũng gặp phải khó
khăn. Đã có một số nghiên cứu mở rộng các công nghệ này cho môi trường lưới
[61], ví dụ Java JINI.

20


c) Các nhà cung cấp dịch vụ ứng dụng và dịch vụ lưu trữ
Các nhà cung cấp dịch vụ ứng dụng và dịch vụ lưu trữ thường cung cấp cho

người dùng một số ứng dụng cụ thể nào đó cũng như không gian lưu trữ. Thông
thường, người dùng tương tác với nhà cung cấp dịch vụ thông qua mạng riêng ảo
(VPN) hoặc các đường truyền dành riêng. Vì vậy, có thể loại bỏ được nhiều nguy
cơ về an tồn bảo mật. Khi nói về các loại dịch vụ này, ngữ cảnh của chúng cũng
hẹp hơn hệ thống tính tốn lưới rất nhiều .
d) Các hệ thống tính tốn ngang hàng P2P
Hệ thống tính tốn ngang hàng cũng là một trường hợp riêng của hệ thống tính
tốn phân tán. Các hệ thống tính tốn ngang hàng phổ biến hiện nay là SETI@home
[72]. Các mạng ngang hàng chia sẻ tập tin như Napster, Kazaa, Morpheus và
Gnutella. Điểm khác biệt chính giữa hệ thống tính tốn ngang hàng và hệ thống tính
tốn lưới là:
- Cộng đồng người sử dụng: hệ thống tính tốn lưới có cộng đồng người sử
dụng nhỏ hơn. Nhưng tập trung vào các ứng dụng và có yêu cầu cao hơn về an ninh
cũng như tính tồn vẹn của ứng dụng. Trong khi đó các hệ thống mạng ngang hàng
số người sử dụng có thể rất lớn, bao gồm người dùng đơn lẻ và các tổ chức, khơng
địi hỏi cao về an ninh và mơ hình chia sẻ tài ngun đơn giản hơn.
- Mơi trường hệ thống tính tốn lưới liên kết các nguồn tài nguyên ña dạng hơn
và chặt chẽ hơn.
- Tính tốn lưới và P2P cùng cho phép người sử dụng chia sẻ tệp, nhưng tính
tốn lưới cho phép chia sẻ khơng chỉ là các tệp mà cịn có thể là nhiều tài nguyên
khác.

21


e) Cơng nghệ tính tốn hiệu năng cao
Như đã nói ở trên, để giải quyết những bài tốn lớn người ta có thể đầu tư để
xây dựng cơ sở hạ tầng tính tốn hiệu năng cao [57]. Các hướng phát triển trong
tính tốn hiệu năng cao bao gồm:
- Nghiên cứu chế tạo những siêu máy tính tuần tự đơn bộ vi xử lý nhưng với

tốc ñộ rất cao. Cách làm này gặp phải các giới hạn về vật lý như ñộ truyền dẫn của
bán dẫn, tốc ñộ ñiện từ, nhiễu ñiện từ, ...
- Để khắc phục khó khăn trên người ta nghiên cứu chế tạo các siêu máy tính
song song bao gồm rất nhiều bộ xử lý hoạt ñộng song song trên một bảng mạch chủ.
Cách làm này địi hỏi phải có những phần mềm thích hợp để tận dụng năng lực tính
tốn của hệ thống, ví dụ: hệ điều hành song song phân tán, trình biên dịch song
song, ngơn ngữ lập trình song song, ...
- Tuy nhiên, việc nghiên cứu chế tạo ra các siêu máy tính nói chung mới chỉ
ñược thực hiện ở các nước phát triển và giá thành của một hệ thống siêu máy tính
như vậy (bao gồm cả phần cứng lẫn phần mềm hệ thống, cơng cụ phát triển) có thể
lên đến hàng triệu đơla. Do vậy, đối với các nước đang phát triển có thể dùng cách
thứ ba, đó là xây dựng các siêu máy tính bằng cách kết nối nhiều máy tính thơng
thường với nhau thành một cụm máy tính. Cách làm này cho phép tạo ra các siêu
máy tính giá rẻ. Bằng cách này viện CDAC của Ấn Độ ñã tạo ra ñược siêu máy tính
xếp thứ 173 trong số top 500 siêu máy tính của thế giới [19].
Như vậy khi nói ñến các cụm máy tính ta thấy ngữ cảnh của chúng hẹp hơn hệ
thống tính tốn lưới rất nhiều, thể hiện ở các ñiểm sau:
- Trước hết các cụm máy tính thuộc về một tổ chức, các tài nguyên của cụm
máy tính là các máy tính, thường đồng nhất về mặt kiến trúc, hệ ñiều hành, khả
năng xử lý... phân bố trên một giới hạn địa lý rất hẹp (ví dụ trong một phịng máy)
và được liên kết với nhau bởi các mạng LAN tốc ñộ cao (cỡ vài trăm Mbits - Gbits).
Do vậy, hệ thống có độ tin cậy rất cao. Trái lại, lưới bao gồm tập hợp nhiều tài
22


ngun đa dạng, khơng đồng nhất thuộc nhiều tổ chức phân tán về mặt ñịa lý, ñược
liên kết với nhau bởi các mạng diện rộng có tốc độ thấp hơn và mức độ tin cậy kém
hơn.
- Trong cụm máy tính các vấn đề về an ninh khơng được coi trọng. Vấn đề chủ
yếu là làm sao để có được hiệu năng cao và không cần thiết phải hy sinh một phần

hiệu năng vì các thủ tục an ninh (vì cụm máy tính chỉ thuộc về một tổ chức và chỉ
nằm trong một phịng máy). Trong khi đó vấn đề an ninh là một trong những vấn ñề
quan trọng nhất mà hệ thống tính tốn lưới phải giải quyết.
- Trong cụm máy tính người ta quan tâm nhiều đến hiệu năng, ví dụ: tối ưu hóa
phần cứng phần mềm, sửa đổi nhân hệ ñiều hành hoặc viết hẳn những hệ ñiều hành
chun biệt, thay đổi giao thức... Hệ thống tính tốn lưới khơng đặt vấn đề hiệu
năng lên hàng đầu, mà chủ yếu tập trung vào việc làm sao phân bổ hiệu quả các
nguồn tài nguyên. Trong một số trường hợp, khi đã đạt được mục tiêu đó, hệ thống
tính tốn lưới cũng mang lại hiệu năng cao, thậm chí hơn nhiều lần so với các siêu
máy tính hiện có. Điều đó chủ yếu là do quy mơ cực kỳ rộng lớn của nó.
Cuối cùng, cũng cần phải nói thêm rằng hệ thống tính tốn lưới khơng phải là
chìa khóa vạn năng dùng để giải quyết mọi vấn đề. Nó được dùng để bổ trợ chứ
khơng phải thay thế hồn tồn các cơng nghệ tính tốn hiện tại. Các cơng nghệ tính
tốn đã tồn tại cũng đã giải quyết từng phần các u cầu của hệ thống tính tốn lưới
đặt ra (các yêu cầu về chia sẻ tài nguyên phân tán). Tuy nhiên, hệ thống tính tốn
lưới giải quyết các vấn ñề ñó một cách tập trung và bài bản hơn, với một ngữ cảnh
rộng hơn rất nhiều.
1.1.5 Những ứng dụng cơ bản của hệ thống tính tốn lưới
Trong mục này, chúng ta sẽ ñiểm qua một cách kỹ lưỡng hơn các ứng dụng cơ
bản của hệ thống tính tốn lưới để thấy được lợi ích của cơng nghệ mới đầy hứa hẹn
ñối với người sử dụng [18,22,23,27,42,53]:

23


a) Khai thác nguồn tài nguyên chưa ñược sử dụng ñúng mức
Ứng dụng cơ bản nhất của hệ thống tính tốn lưới chính là chạy một ứng dụng
hiện hữu trên một máy khác. Cơng việc được u cầu có thể chạy trên một máy rỗi
trong mạng. Cần ít nhất hai ñiều kiện tiên quyết ñể thực hiện yêu cầu này. Thứ nhất,
ứng dụng phải có khả năng thực hiện từ xa; Thứ hai, máy từ xa phải ñáp ứng ñược

những yêu cầu về phần cứng, phần mềm và/hoặc những yêu cầu về tài nguyên khác
cho ứng dụng.
Theo thống kê, trong ña số các tổ chức, phần lớn các tài nguyên tính tốn
khơng được tận dụng đúng mức. Đa số các máy tính để bàn chỉ bận trong khoảng
5% thời gian và thậm chí, trong một vài tổ chức, máy chủ cũng thường rất nhàn rỗi.
Hệ thống tính tốn lưới cung cấp khả năng khai thác triệt ñể những tài nguyên chưa
ñược tận dụng ñúng mức và như vậy, làm tăng ñáng kể hiệu quả khai thác các tài
nguyên này [47].
Trong thực tế, các máy có thể để trống một dung lượng đĩa khá lớn. Hệ thống
tính tốn lưới có khả năng tập hợp các không gian nhớ trống này thành một một bộ
nhớ ảo lớn hơn, cải thiện hiệu năng và ñộ tin cậy. Thực vậy, giả sử một ứng dụng
cần đọc rất nhiều dữ liệu; dữ liệu này có thể được tự động nhân bản tại nhiều điểm
chính trên lưới. Như vậy, nếu ứng dụng phải xử lý trên một máy từ xa trong lưới, dữ
liệu ñã ở ngay đó hoặc gần đó và do vậy, khơng cần phải di chuyển ñến ñiểm ở xa.
Điều này tạo ra những lợi ích về hiệu năng, đồng thời việc sao chép dữ liệu như vậy
có thể được sử dụng như những bản sao khi bản gốc bị hư hại hoặc không sẵn sàng.
Một chức năng khác của lưới là cân bằng việc sử dụng tài ngun. Khi có một
ứng dụng địi hỏi nhiều tài ngun, một hệ thống đơn lẻ khơng ñủ sức ñể ñáp ứng
thì giải pháp ở ñây là chúng có thể được chuyển đến những hệ thống chưa được sử
dụng hết cơng suất. Nói cách khác, ứng dụng đó có thể được phân ra thành nhiều
phần để hồn thành các phần trên nhiều hệ thống khác nhau. Tóm lại, lưới có thể
đảm bảo tính nhất qn để cân bằng tải trên một tập rộng lớn các tài nguyên [48].
24


b) Khả năng thực hiện tính tốn song song
Khả năng tính tốn song song là một trong những đặc điểm lơi cuốn nhất của
hệ thống tính tốn lưới [42]. Ngồi nhu cầu khoa học thuần túy, sức mạnh tính tốn
song song tạo nên một bước tiến bộ mới trong các lĩnh vực khác nhau của ñời sống
như: dự báo thời tiết, khí hậu, điều khiển vật thể bay (tàu vũ trụ, tên lửa đạn đạo,…),

y sinh học, mơ hình tài chính, thăm dị dầu mỏ, làm phim hoạt hình và nhiều lĩnh
vực khác.
Yêu cầu chung của việc thực hiện tính tốn song song là các ứng dụng được
thiết kế sao cho nó có thể được chia nhỏ thành các phần chạy độc lập với nhau. Một
ứng dụng có u cầu tính tốn lớn trên lưới có thể được xem như nhiều “công việc
con nhỏ hơn”, sao cho mỗi công việc con này có thể được thực hiện trên một máy
nào đó trong lưới tính tốn. Mức độ liên quan giữa các cơng việc con càng thấp thì
ứng dụng càng tối ưu. Một ứng dụng thực hiện song song sẽ kết thúc nhanh hơn gấp
10 lần nếu nó sử dụng số bộ vi xử lý gấp 10 lần, nếu khơng tính ñến thời gian trao
ñổi thông tin giữa các bộ xử lý.
Việc song song hố các cơng việc đặt ra rất nhiều vấn đề. Trước tiên, cần có
giải thuật phù hợp ñể chia ứng dụng ra thành các phần cho nhiều CPU. Vấn ñề thứ
hai là nếu các thành phần ñược chia ra khơng độc lập hồn tồn, có thể gây ra sự
tương tranh về tài nguyên. Ví dụ, nếu tất cả các cơng việc con cần phải đọc ra và
viết vào một tệp chung hoặc cơ sở dữ liệu chung, giới hạn truy nhập tệp hay cơ sở
dữ liệu đó sẽ trở thành nhân tố gây ra sự tương tranh. Sự tương tranh cịn tiềm ẩn
trong việc truyền thơng điệp giữa các công việc con, khả năng truyền thông mạng,
giao thức đồng bộ hố, băng thơng vào ra cho các thiết bị lưu trữ.
Một đặc điểm của lưới tính tốn là tài ngun khơng đồng nhất. Vì vậy, khơng
nhất thiết phải chia ứng dụng ra thành những cơng việc điều nhau.
Một đóng góp quan trọng khác của hệ thống tính tốn lưới là cho phép đơn
giản hố tương tác giữa các hệ thống thuộc các lĩnh vực khác nhau. Trước ñây, tính
25


tốn phân tán cũng đáp ứng u cầu tương tự và ở một chừng mực nào đó có những
thành cơng. Hệ thống tính tốn lưới cung cấp những tiêu chuẩn quan trọng cho phép
các hệ thống khơng đồng nhất có thể làm việc với nhau để hình thành một hệ thống
tính tốn ảo lớn với những nguồn tài ngun ảo khác nhau [25]. Người dùng của hệ
thống tính tốn lưới có thể được tổ chức động trong một tổ chức ảo. Mỗi tổ chức ảo

có thể có những yêu cầu chính sách khác nhau. Các tổ chức ảo này có thể chia sẻ tài
nguyên với nhau và tập hợp lại trong một lưới tính tốn lớn.
Một ưu điểm nổi bật của sự hợp tác là việc chia sẻ về dữ liệu. Tệp hoặc cơ sở
dữ liệu có thể trao chuyển giữa các hệ thống trong tổ chức ảo, như vậy nó sẽ có khả
năng khai thác được nhiều hơn các hệ thống đơn lẻ. Việc chia sẻ tài ngun khơng
chỉ giới hạn về dữ liệu mà cịn đặt ra đối với các nguồn tài nguyên khác như các
thiết bị, các dịch vụ, phần mềm có bản quyền,… Các tài nguyên này được ảo hố,
để chúng có khả năng vận hành đồng nhất giữa những người tham gia vào lưới tính
tốn.
Người tham gia vào lưới tính tốn có thể là thành viên của một hay một vài tổ
chức thực, ảo. Khi tham gia vào lưới tính tốn, họ buộc phải tn theo những chính
sách bảo mật, những chính sách về giải quyết quyền ưu tiên trong tổ chức đó.
c) Chia sẻ những nguồn tài ngun đặc biệt
Ngồi việc chia sẻ CPU và những tài ngun lưu trữ, lưới tính tốn cịn cung
cấp các dịch vụ, cho phép truy nhập tới các thiết bị đặc biệt như phần mềm có bản
quyền và những dịch vụ khác.
Ví dụ, khi người dùng cần tăng thêm băng thơng để thực hiện tìm kiếm, khai
phá dữ liệu, cơng việc có thể được chia ra cho các máy trong lưới tính tốn kết nối
Internet. Khi đó, tồn bộ khả năng tìm kiếm được nhân lên, do mỗi máy đều có một
kết nối riêng biệt tới Internet. Tất nhiên, nếu những máy này cùng chia sẻ kết nối tới
mạng băng thơng sẽ tăng khơng đáng là bao.

26


×