ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ
Nguyễn Đức Thịnh
GIẢI HỆ PHƢƠNG TRÌNH TUYẾN TÍNH KÍCH
THƢỚC LỚN TRÊN NỀN TẢNG GRID
COMPUTING
KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY
Ngành: Công nghệ thông tin
Cán bộ hƣớng dẫn: Tiến sĩ. Nguyễn Minh Hằng
HÀ NỘI - 2010
Lời cảm ơn
Trước hết là lời cảm ơn sâu sắc của em đến những người đã giúp đỡ em hoàn
thành khóa luận tốt nghiệp này, một dấu mấu quan trọng trong cuộc đời và sự nghiệp của
em.
Em xin chân thành cảm ơn Khoa công nghệ thông tin trường đại học Công Nghệ -
Đại học quốc gia Hà Nội đã tạo điều kiện cho em được thực hiện khóa luận này.
Khóa luận sẽ không thể hoàn thành nếu thiếu sự chỉ bảo tận tình của TS.Nguyễn
Minh Hằng, người đã định hướng, hỗ trợ em trong suốt thời gian 3 tháng thực hiện khóa
luận. Em xin chân thành cảm ơn cô.
Một lời cảm ơn từ đáy lòng con xin được gửi đến cha mẹ, những người đã nuôi
nấng con thành người để được có ngày hôm nay.
Em xin cảm ơn các quý thầy cô đã dạy dỗ em trong suốt 4 năm học ở nhà trường,
cung cấp cho em những kiến thức quý báu để bước vào đời.
Cảm ơn các bạn của tôi đã là những người động viên tinh thần cũng như ở bên tôi
giúp đỡ tôi khi tôi gặp khó khăn.
Thời gian 3 tháng vừa qua, mặc dù đã cố gắng để hoàn thành khóa luận một cách
tốt nhất nhưng vẫn không thể tránh nổi những sai sót. Em xin kính mong nhận được sự
góp ý cũng như chỉ bảo của quý thầy cô. Xin chân thành cảm ơn
Sinh viên
Nguyễn Đức Thịnh
Mc lc
Li m u 1
Tóm tt khóa lun 3
ng quan v công ngh Grid Computing 4
1.1. Lch s phát trin ca công ngh Grid 4
1.2. Khái nim 5
1.3. Các kiu tài nguyên ca Grid 6
1.3.1. Tài nguyên tính toán 6
6
n liên lc 6
1.3.4. Phn mm, ng dng 7
1.3.5. Các thit b c bit 7
1.4. Phân lai các h thng Grid 7
1.4.1. Grid Tính toán (Computation Grid) 7
1.4.2. Grid D liu (Data Grid) 8
1.4.3. Scavenging Grid 8
1.5. Kin trúc Grid 8
1.5.1. Bn cht Kin trúc Grid 8
1.5.2. Chi tit Kin trúc Grid tng quát 10
1.5.2.1. Tng Fabric 10
1.5.2.2. Tng Connectivity 11
1.5.2.3. Tng Resource 12
1.5.2.4. Tng Collective 13
1.5.2.5. Tng Application 13
i nhng li ích gì ? 13
1.6.1. Khai thác t lý 13
1.6.2. Kh lý song song 14
1.6.3. Chia s tài nguyên o và t chc o 14
1.6.4. S truy cn các tài nguyên khác 14
1.6.5. Cân bng tài nguyên 15
tin cy 16
17
2.1. Khái nim v Globus 17
2.2. Nguyên nhân thúc y s phát trin ca Globus 18
2.3. Kin trúc Globus 19
2.3.1. Các thành phng trc 19
2.3.1.1. Java WS Core 19
2.3.1.2. C WS Core 19
2.3.2. Các thành phn bo mt 19
n v bo mt Grid và GSI 20
2.3.3. Các thành phn qun lý d liu 25
2.3.3.1. GridFTP 25
2.3.3.2. Information services 26
2.3.3.3. Index Service 27
2.3.4. Các thành phn qun lý tài nguyên 27
2.3.4.1. Kin trúc qun lý tài nguyên ca Globus Toolkit 27
2.3.4.2. Chi tit các thành phn 29
2.3.4.2.1. GRAM 29
2.3.4.2.2. Pre-WS GRAM 32
2.3.4.2.3. WS-GRAM 34
-G2 40
3.1. MPI 40
3.2. MPICH 41
3.3. MPICH-G2 41
3.3.1. Quá trình thc thi mt ng dng 42
n khai h thn cho m
tính toán song song s dng Globus Toolkit và MPICH-G2 44
4.1. Trin khai Globus Toolkit 44
4.1.1. Chun b v phn cng và phn mm h thng 44
t Globus Toolkit 45
4.1.3. Cu hình các thành phn ca globus toolkit 47
4.1.3.1. Cu hình bo mt 47
4.1.3.2. Cu hình dich v GridFTP 50
4.1.3.3. Cu hình gatekeeper 51
4.1.3.4. Cu hình WS GRAM 52
4.2. Trin khai MPICH-G2 53
a h thng Grid 54
5.1. Gii thiu v 3 bài toán s c th nghim 54
5.1.1. Tính toán s PI 54
5.1.2. H n tính 54
5.1.3. Bài toán quy hoch tuyn tính 55
5.2. Cách thc chy 1 bài toán trên h thc xây dng bi 2 công c
Globus Toolkit và MPICH 57
5.3. Kt qu chy các t qu 59
5.3.1. Kt qu ch PI 59
5.3.2. Kt qu chi h n tính 59
5.3.3. Kt qu gii bài toán quy hoch tuyn tính 60
5.3.4. Nhn xét chung 62
Kt lun 63
Tài liu tham kho 64
1
Lời mở đầu
Trong thp niên qua, nn công ngh thông tin th gii phát trit
nhiu vào s phát trin chung ca th gii. Chúng ta có th bt gp nhng ng dng ca
công ngh thông tin khp m i s hu máy tính cá nhân, s hu
nhng chin thoi, cp nhp thông tin qua nhng trang web, kt ni vi nhau qua
nhng phn my là nhng th hin hu hàng ngày mà chúng ta trc tip s
thy và s dng nó, n sau nó là nhng nghiên cu, nhng công ngh c rt nhiu nhà
khoa hn trên th gii nghiên c phát trin ca
nn công ngh thông tin nói riêng và nn khoa hc th gii nói chung.
n máy tính, mt khái nic nhn là nhng chic máy tính
bàn nh gn hay nhng chic laptop cá nhân. Nng thit b cá nhân giúp
chúng ta gii trí, làm vic, còn vi nhng chic máy tính phi x ng d liu t khp
gii mng xuyên và liên tc bt
gp khái nim siêu máy tính (Super Computer) . Nhng siêu máy tính trên th gic
xây dng rt tin vu b vi x ng
h thy tn rt nhiu tin ca cho vic trin khai bng, vi
m dng kt ni nhi dùng hay t chc có chung mt m x lý
hay tn dng tài nguyên máy tính ca bt k to thành mt
h thng mnh m phc v cho vic gii các bài toán v khoa hc, i, m
vc nghiên cu m Nói mt cách tng quát nht
Grid là mt loi h thng phân tán, b trí song song, cho phép linh hot chia s, tuyn la
và tp hp các nguc lp và ri rác v a lý, tùy theo kh n có,
công sut, hong, chi phí và yêu cu v chng dch v ci s dng. Grid
Computing có rt nhim mà có th áp dng cho vic nghiên cng
m có th áp dng cho doanh nghip.
Trên th ging v Grid Computing c hình thành và nghiên cu t rt
lâu c s bùng n lc các t chp
n trên th gii nghiên cu và trin khai. Ti Vit Nam, công vic nghiên cu Grid
c trin khai t khá lâu và g tài cc
cu, phát trin h th h tr gii quyt các bài toán có khng tính
2
toán l do PGS.TS. Vũ Đức Thi làm chủ nhiệm c mt s
thành tu nhnh.
Nhn thy Grid computing là mng nghiên cu c quan tâm ti
Vit Nam c gii và nhng li ích to ln mà nó mang li. Em quynh chn
i gii h n tính c ln trên nn t
vi mu Công ngh Grid là gì ,nhng khái nim liên quan,
thí nghim to mt h thng Grid nh bng gói phn mm GLOBUS TOOLKIT cùng
MPICH-G2 kim nghim hi ca h thng grid khi chy bài toán Gii h
n tính c ln.
3
Tóm tắt khóa luận
1. Thông tin chung về khóa luận
tài : Giải hệ phương trình tuyến tính trên nền tảng Grid Computing
Ging dn : TS.Nguyễn Minh Hằng
Sinh viên thc hin : Nguyễn Đức Thịnh
2. Tóm tắt nội dung khóa luận
Khóa lun thc hin nghiên cu tìm hiu các v chung ca công ngh Grid v
mt khái nim, kin trúc ca mt h thng Grid và nhng ích li ca Grid mang li. Cung
cp mt cái nhìn tng quan v Grid.
Tìm hiu mô hình hong ca gói phn mm Globus Toolkit, mt gói phn mm
giúp xây dng mt h thng Grid, các v khi thc hin trin khai to dng mt h
thng Grid vi Globus Toolkit.
Tìm hiu v MPICH, MPICH-G2, nguyên tc hong ca MPICH kt hp vi
to dng h thng Grid phc v vic tính toán song song s dng ngôn
ng C và MPI.
Th nghim bài toán gii h n tính theo thut toán song song trên
mt h th xem cách thc hom v kh t hp x lý
gia các máy tính khác nhau.
3. Các công cụ đƣợc sử dụng triển khai và thử nghiệm
Globus Toolkit 4.2.1
Centos 5.4
MPICH-1.2.7
4
Chương 1 : Tổng quan về công nghệ Grid Computing
1.1. Lịch sử phát triển của công nghệ Grid
Trong nh c nghe nhi n công ngh Grid và
nhm ca nó. Vy Grid xut hin t khi nào, t bao gi ? Trong quá kh, nhng
t hin, vi nhng tên gi khác nhau và cách
tip cn khác nhau.
Ví d t hin t nh-70
ca th k c chia s t các máy mainframe.
i phát trin h u hành Multics (tin thân ca h u hành
cn vic s dt tin ích, mm
rt gn vm v Grid hit h thng cung cc tính toán
thng cung cc hic s dng trong cuc sng hàng
i dùng khi mun s d x lý công vic, ch cn cm
thit b vào h thng cung cp, s dng và tr tin gim thit b n vào
n.
ng v n gc ca Grid chính thc
t ng i, dùng
mô t các d án kt ni các trung tâm siêu máy tính ca M nhm kt hp sc mnh
x lý ca nhiu siêu máy tính li vi nhau.
án siêu tính toán quan trng, ng ln các công
ngh nn tng trong các d án Grid ngày nay là FAFNER (Factoring via Network-
Enabled Recursion) và I-i.
Khái ni i phòng thí nghim Argonne National Laboratory vào tháng
n sách "The Grid: Blueprint for a New Computing
Infrastructure" vit bi tin s Ian Foster (Argonne National Laboratory) và Carl
ng tham gia d
án I-i tham gia d án Globus Toolkit, mt d án nn tng
ca công ngh Grid và Metacomputing.
5
T n nay, vic phát trin công ngh Grid tr nên rng vi s tham gia
nghiên ca nhiu t chc, tp thông tin, nhiu qu
c nhng thành tu. Có th nói, vic phát trin và xây dng h thng
Grid là s k tha và phát tring, các công ngh hin hành m
phát trin không ngng c h tng, phn cng máy tính, m
thng Grid ngày nay thc hic nhi
1.2. Khái niệm
M Grid khá hoàn chi tin s
“Grid là một loại hệ thống song song, phân tán cho phép chia sẻ, lựa chọn, kết hợp các
tài nguyên phân tán theo địa lý, thuộc nhiều tổ chức khác nhau dựa trên tính sẵn sàng,
khả năng, chi phí của chúng và yêu cầu về chất lượng dịch vụ (QoS) của người dùng để
giải quyết các bài toán, ứng dụng có quy mô lớn trong khoa học, kỹ thuật và thương mại.
Từ đó hình thành nên các “tổ chức ảo” (Virtual Organization (VO)), các liên minh tạm
thời giữa các tổ chức và tập đoàn, liên kết với nhau để chia sẻ tài nguyên và/hoặc kỹ năng
nhằm đáp ứng tốt hơn các cơ hội kinh doanh hoặc các dự án có nhu cầu lớn về tính toán
và dữ liệu, toàn bộ việc liên minh này dựa trên các mạng máy tính”
Mt h thng Grid có nhsau:
Có s kt hp, chia s c qun lý tp trung Grid tích hp
và phi hi dùng thuc nhiu vùng qun lý khác nhau, nhiu
khác nhau trong mt t chc, hay nhiu t chc khác nhau. Công ngh Grid
tp trung gii quyt các v v bo mt, chính sách qun tr, chi phí, thành
y sinh trong quá trình chia s và s dng tài nguyên.
S dng các giao din và giao thc chun, mang tính mc xây
dng trên các giao thc và giao din t gii quyt các v
bng thi dùng, phân quyn, tìm kim và truy xut tài nguyên.
ng yêu cu cao v chng dch v. Grid cho phép s dng phi hp các
cung cp nhiu loi dch v vi các mc chng khác nhau, liên
n ví d ng, hiu sut, tính sn sàng, bo mt, cho phép
kt hp nhiu ki ng nhu cu phc tp ci dùng. Mc
tiêu là phi phi h kh a h thng sau khi kt hp phi ln
n tng kh a t cu thành nên Grid.
6
1.3. Các kiểu tài nguyên của Grid
1.3.1. Tài nguyên tính toán
bin nht, là các chu k c
cung cp bi b vi x lý ca các thit b trong Grid. Các b vi x lý không cn phi cùng
loi mà có th có t, kin trúc, chy phn m khai thác tài
nguyên tính toán ca Grid:
n nht là chy các ng dng hin có trên mt node ca Grid thay vì chy
trên máy tính cc b.
2. Thit k ng dng, tách các công vic thành các phn riêng r có th thc thi song
song trên nhiu b x lý khác nhau.
3. Chy ng dng thc thi nhiu ln trên nhiu node khác nhau trong Grid.
1.3.2. Tài nguyên lƣu trữ
Tài nguyên ph bin th . Mi thit b trong
ng cung cp mt s phc v cho vic thc thi ng dng trên
có th là b nh trong, ng hoc các thit b khác.
B nh d liu tm thi cho ng dng, trong khi các thit b
ngoài có th c s d u sut, kh
chia s m bo tính tin cy ca d liu.
1.3.3. Phƣơng tiện liên lạc
Kh c gia các máy tính phát tri
Grid tr nên hin tht tài nguyên quan trng. m vic
liên li d liu gia các thành phn trong Grid và giao tip gia Grid vi bên
ngoài. Mt s công vi i mng d liu l li ng
không n c thi công vic. Kh ng
ng hy là mt tài nguyên then cht, n kh a Grid.
Vic giao tip vc thc hin thông qua mng Internet. Grid có th
s dng các kt n liên lc gia các node. Vì các kt ni này không chia s
mng truyng truyn d phòng
n thi gii quyt t v ng mng và truyn d liu ln.
7
1.3.4. Phần mềm, ứng dụng
Grid có th t các phn mm mà có th quá m cài trên tt c mi
máy tính trong Grid. Các phn mm này ch cc cài trên mt s node. Thông qua
Grid, khi mt công vic cn chúng, nó s gi d lit phn
mm và cho th là mt gii pháp t tit kim chi phí v bn quyn
phn mm.
1.3.5. Các thiết bị đặc biệt
Là các thit b dùng trong khoa hc, k thun vng, các b cm bin
t b này ch yu thu thp các d liu khoa hc, phc v c
phân tích, x lý sau này.
Ghi chú: Các tài nguyên trên đây đến từ nhiều nguồn khác nhau, có thể không thuộc quyền quản
lý của một tổ chức, của một đơn vị mà có thể thuộc nhiều tổ chức, ở nhiều nơi khác nhau. Một số
tài nguyên có thể được sử dụng tự do, trong khi một số khác được sử dụng dưới những chính
sách nhất định. Các tài nguyên được “ảo hóa” (virtualize) để che dấu sự phức tạp, đa dạng
nhằm đưa ra một cái nhìn thống nhất, đơn giản về toàn bộ tài nguyên trên Grid sao cho dưới mắt
của người dùng, các tài nguyên Grid là một khối thống nhất.
1.4. Phân lọai các hệ thống Grid
Công ngh Grid Computing có th c s dng theo nhi gii
quyt các loi yêu cu ng dc phân loi bi kiu ca ng
dng cn gii quyt. Có 3 lo không có ranh gii
phân bit rõ ràng gia các loi Grid và trong thc t, các gii ng là s kt
hp 2 hay nhiu loi khác nhau.
1.4.1. Grid Tính toán (Computation Grid)
Loi Grid này tp trung ch yu vào vic s dc tính toán. dng Grid
này, phn ln các node là các máy tính hay các nhóm máy tính(cluster) có c x lý,
tính toán rt ln. Hình thc thc hin là chia tác v tính toán ln thành nhiu công vic
nh thc thi song song trên các node ca Grid. Vic phân tán các tác v tính toán trong
Grid s làm gim r toàn b thi gian x n dng h thng.
ng mt h thng chính s chia khi d liu cn x lý thành các phn nh, sau
8
n các node trên Grid. Mi node s thc hin x lý d liuvà tr kt qu v
h th h này tng hp và trình din kt qu toàn cc i dùng
1.4.2. Grid Dữ liệu (Data Grid)
là tài nguyên. Mt Grid D liu chu trách nhim
và cung cp kh p d liu cho nhiu t chi dùng không
cn bit chính xác v trí d liu khi thao tác vi d liu. d lic bi
s d liu liên h trng trong các Grid D liu, nht là khi có nhiu
ngun d liu và xut hin nhu cu kt hp các thông tin t các ngun d liu này. Các
Grid D liu có th c s dc khai thác d liu(data mining) hoc các
h thng hp này, không ch có h thng file hay
d liu mà toàn b d liu ca t chc cn tp hp li. th phi kt
hp gia Grid D liu và Grid Tính toán.
1.4.3. Scavenging Grid
Mc dùng vi mng l bàn.
c kinh k xem khi nào b x lý và các tài nguyên
khác rnh r thc hin các tác v Grid. Ch nhân c bàn ng có quyn
nh khi nào thì chia s chic máy ca mình.
1.5. Kiến trúc Grid
1.5.1. Bản chất Kiến trúc Grid
T chc n quan trng trong h thng Grid. Vic thit lp,
qun lý, khai thác, chia s tài nguyên gia các t chc hi phi có kin trúc h
thng mi, kin trúc Grid. Kic xây dng da trên quan nim
các VO hong hiu qu i phi thit lc các quan h chia s vi bt k
tham gia ti làm u này, v t ho
(interoperability) cn phc tp trung gii quyng mt
hoi vic s dn trúc Grid s là
kin trúc protocol, vi các nn t i dùng và nhà
cung cp tài nguyên ng, thit lp, qun lý và khai thác các mi quan h chia s
tài nguyên.
9
Kin trúc Grid phi là kin trúc da chung m d m rng, liên kt hot
ng tt, có tính kh chuyn (portability) cao. Các protocol chun s nh
service chun, nh xây dng các service cao ct cách d dàng. Sau khi
c kin trúc Grid, vic tip theo là xây dng các hàm API và các b cung
cp các công c cn thi phát trin các ng dng chy trên nn Grid. S
t hoc xem là v n vì các mi quan h chia s có th phi
c thit lp gia các bên tham gia khác nhau v các chính sách, ging
khác nhau v nn tng, ngôn ng ng lp u không có nó, các thành
viên trong VO s thc hin các chính sách chia s c rng các
s dng cho 2 thành viên này s m rc u này
khin cho vic thành lng là không th thc hin ho thành lp
c VO theo mt ki thôi.
vic chia s thông tin bng cách cung cp
các protocol và cú pháp chun (HTTP và HTML) dùng cho vii thông tin,
n các protocol và cú pháp chu chia s tài nguyên. gii quyt v
kt hoc xây dng các protocol là quan trnh cách các
thành phn phân i v t c mt mnh các cu
trúc thông tin cn thit trong quá trình
ch nh, chia s và s dng tài nguyên cn phi mm do, gn nh các tha thun
chia s tài nguyên có th c thit li m chia
s c nh n các chính sách cc b, và phi cho phép các thành viên
quc các tài nguyên ca h nh vic giao tip gia các
thành viên ch nào, nên khi dùng các
protocol, các chính sách cc b c gi lc cn.
các protocol, thì vic xây dng các service là cn thit và quan trng, các service là bn
t c th ca các protocol. Vic xây dn phc v truy cn tài
nguyên tính toán, d liu, tìm kim tài nguyên, lp lch và ng b hoá, sao chép d
ling các service cao c ng dng thi trng
hoá các chi tit v tài nguyên. n phi xây dng các b API và SDK, vì các nhà
phát trin ng dng cn phi có công c h tr phát trin các ng dng phc tp trong
ng Grid, i có kh c các ng dng này. Sc
mnh, tính n ca ng dng, chi phí phát trin và bo trì là nhng mi quan tâm
10
quan trng. Các API và SDK có th c vic phát trin mã, cho phép chia s mã,
chuyn cho ng dng. Tt nhiên, API và SDK ch h tr thêm ch không
th thay th c.
1.5.2. Chi tiết Kiến trúc Grid tổng quát
Sau gp trung nghiên cu, phát trin, tích lu kinh nghim, các nhà
phát trin công ngh ng thng nh v kin trúc Grid. Mt trong
nhng kic chp nhn nhiu nhi Ian Foster,phi
gii thiu v kin trúc này. Kin trúc Grid, theo Ian Foster, là mt kin trúc phân
t 1.1 . Các thành phn trong mt tm, tính cht, có
th c xây dng t bt c ti nào. Các thành phc phân tng da theo vai
trò ca chúng trong h tht kin trúc m.Kin trúc này ch nh
các yêu cu chung nht v thit k và trin khai vi m tham kho. Vic
xây dt c th tu thuc vào tng d án, tc ng dng.
chi tit ca kin trúc:
Hình 1.1.Grid protocol Architecture
1.5.2.1. Tng Fabric
ng thp nht ca kii din cho các thit b vt lý và toàn b tài
nguyên ca Grid mà các t chi dùng mun chia s, s dng. Các tài nguyên có
th tn ti dng v th, các danh mc, tài nguyên
Application (Ứng dụng)
Collective (Tầng kết hợp)
Resource (Tầng tài nguyên)
Connectivity (Tầng kết nối)
Fabric (Tầng thiết bị)
11
mng, các lo là các thc th logic - mt thc th tru ng - i
din cho mt tp các tài nguyên v thng file phân tán, các ng
ng hp các thc th logic, vic trin khai có th n các protocol cc b (ví
d các protocol phc v dng truy cp NFS, hoc protocol qun lý tài nguyên, tin trình
n kin trúc Grid. Các thành phn ca tng Fabric thc hin các hong cc b
trên các tài nguyên c th (vt lý lc tip sau ca các hong chia s
tài nguyên ca các tt mi liên h ph thuc cht ch gia các chc
a tng Fabric vi các ho ng chia s c h tr. Các ch ca tng
Fabric càng mnh, càng nhiu s cho phép các hong chia s phc tp, phong phú
m cho thy, vic qun lý tài nguyên tng này ít nht
ch cung c c cu trúc, trc c
u khin chng dch v.
1.5.2.2. Tng Connectivity
Tc và chng thn cn thit
cho các giao dch mng a Grid. Các protocol liên lc cho phép trao i d
liu gia các tài nguyên tng Fabric. Các protocol chng thc xây dng trên các dch v
liên lc nhm cung cp mã hóa, bo mt, xác minh và nhn di
dùng và tài nguyên. Vic liên li các công vin chuynh tuyt
c liên lc ca Grid có th cn các protocol mn nay
nên xây dng trên các protocol có sn ca b TCP/IP protocol stack, c th là các tng
Network (IP và ICMP), Transport (TCP,UDP) và
V khía cnh bo mt ca tng Connectivity, các gii pháp phi da trên các chun
bo mt hin hành khi có thc, rt nhiu chun bo mc
phát trin vi b Internet protocol có th áp d c.Vic chng thc, phân quyn
ng Grid là rt phc tp. Các công ngh bo mt truyn thng ch yu tp
trung bo v các giao dch gia các máy client và server. Trong Grid, vic phân bit
client/server không tn ti, vì các mi tài nguyên trong m là server
(khi nó nhn yêu cu), mt lúc khác l xut yêu c n các tài
12
i pháp chng thc các
yêu cu v bo mt trong Grid i thiu.
1.5.2.3. Tng Resource
Tng Resource da trên các protocol liên lc và chng thc ca tng Connectivity
xây dng các protocol, API và SDK nhm h tr vi ng, khi to, theo dõi,
u khin, tính toán chi phí và chi tr cho các hong chia s trên tng tài nguyên
riêng l mt cách an toàn. Bt các protocol ca tng Resource s gi các chc
a t truy cu khin các tài nguyên cc b.
Các protocol tng Resource tp trung toàn b vào các tài nguyên riêng l, không quan tâm
n trng thái toàn cc và các hong trong các tp tài nguyên phân tán.
Các protocol tc phân thành 2 d
- Các protocol thông tin
S d thu thp thông tin v cu trúc và trng thái các tài nguyên ví d
cu hình hin ti, ti hin ti, chính sách s d
- Các protocol qun lý
S d ng truy xun mt tài nguyên chia snh rõ, ví d,
các yêu cu v tài nguyên (bao gm luôn vic gi ch tài nguyên và chng dch v)
và các thao tác c c thc hi o tin trình, hoc truy xut d liu. Do các
protocol qun lý chu trách nhii din cho các quan h chia sm bo các hot
ng s dng tài nguyên phi phù hp vi các chính sách chia s tài nguyên, bao gm
luôn vic tính toán và chi tr chi phí. M tr vic theo dõi trng
u khin các hot ng. Vi nhng yêu c y, tp các protocol tng
Resource (và Connectivity) nên nh gn và tp trung. Các protocol này ch ng
chia s vi nhiu loi tài nguyên khác nhau (ví d, các h thng qun lý
tài nguyên cc b . Các cha tng
a tng Fabric cng thêm nhiu ng ni v báo li tin cy khi hot
ng không thành công.
13
1.5.2.4. Tng Collective
Trong khi tng Resource t, tng Collective cha
các protocol, service, API, SDK không liên h n bt k mt tài nguyên c th nào mà
thc hin qun lý toàn cc, tp trung vào các giao tác gia các tp tài nguyên. Tng
Collective có th b sung thêm nhiu loi hong chia s mi ngoài nh
tng Resource mà không cn b sung thêm các yêu cu mi cho các tài nguyên c
chia s. Các cha tng Collective có th i các
SDK(vc thit k liên
kt vi ng dng. Trong c ng ht này có th c xây dng trên các
protocol và API ca tng Resource và Connectivity.
1.5.2.5. Tng Application
Tng trên cùng ca kin trúc Grid bao gm các ng dng ci dùng chy
trong mng VO. Các ng dc xây dng theo cách s gi các dch v nh
i các ti. Ví d : m i cn phi
chy hàng ngàn tác v c lp, mi tác v cn nhiu file cha thông tin tng phn ca b
gen có th s dng các ch
- Ly các thông tin, th chng thc (các protocol tng Connectivity).
- Truy vn h thng thông tin Grid và các danh m tìm các tài nguyên thích
hp và v trí các file d liu vào. (các dch v tng Collective).
- Gi các yêu c thc hin tính toán, di chuyn d li
và kim soát quá trình thc thi công vii dùng khi mi
th hoàn tt, dò tìm và phn ng vu kin gây li (tng Resource).
1.6. Grid computing đem lại những lợi ích gì ?
1.6.1. Khai thác tối đa tài nguyên xử lý
Li ích u tiên c y mu máy
tính khác nhau . Hay nói m lý song song. Trong mt mi gm
nhiu máy tính ,r c s dng mt cách t ng tài
nguyên ca mìng thì vi công vin ,máy tính ch s
dng ty chúng ta nhìn thy luôn s lãng phí ca
nhng tài nguyên còn li. Triên khai h thng grid computing s giúp tn dng nhng tài
14
nguyêc s d x lý mng hp này,
t x c t c gim ti mc t
Không ch th ,grid computing cho phép o hóa nhng còn trng thành
mng mi , t tn d d liu.
1.6.2. Khả năng xử lý song song
Khi kt hp nhiu b vi x gii quyt mt bài toán, chúng ta có th ng
c chia làm n phn cho n CPU x lý, mi mt CPU s x lý 1
phy công vic s nhanh gp n ln.
i ng dp lý nc trin khai mt cách song
song. Công vii thit ké ng dng pho
Tuy nhiên x lý song song s là mu tiên trong nghiên
cu khoa hc ,gii quyt nhng bài toán lc lp ca các thành phn cao.
1.6.3. Chia sẽ tài nguyên ảo và tổ chức ảo
Grid computing cho phép to ra mng cng tác rng lng nht. Mi
t t chc o. Grid computing thm chí còn cho phép kt hp các t
chc ng nht v cng tác vi nhau. Các t chc o này chia s tài
nguyên vt mi ln.
Chia s tài nguyên d liu bng cách tri r d liu trên nhiu h thng to
ng lu so vi h thi rng d li
t truyn d liu vi công ngh stripping. D lic
v cho vic khôi phc d liu.
Ngoài ra ,còn có th chia s nhit b chuyên dng, phn
mm.
1.6.4. Sự truy cập đến các tài nguyên khác
, Grid còn có th truy cn các tài nguyên khác.
Các tài nguyên này có th c cung ci dng s ng hoc kh
thông. Ví d, nu mi mu thc hin vic
khai thác d liu tìm kim, công vic này có th phân chia gia các máy trong mng Grid
ng truyn Internet không ph thung hp này, kh
15
kic nhân lên khi mng truyn riêng bit. Nu các máy chia s ng
kt ni internet thì nó s
Trong mt mi, mt s n mt tin, mt
s i s dng không ct phn mn có th s dng
phn mm này bng cách gi công vin c cài phn m yêu cu x lý.
n dng phn mm ca Grid.
Mt vài máy in có th s dng nhng thit b c bit, chng hu
hc s dng t xa. Grid có th chia s c nhng thit b c bit này.
Thm chí Grid còn có th chia s nhng thit b, tài nguyên phc t
bnh hay robot h tr phu thut.
1.6.5. Cân bằng tài nguyên
Grid liên kt các tài nguyên t nhiu máy khác nhau to thành mt h thng duy
nht. Grid có th thc hin cân bng cách lp lch
làm vic cho các công vic. Chn trong vic x ng
hp quá ti v x lý, tính toán trong mt t chc. Cân bng có th c thc hin bi 2
cách sau : nhng m quá t n nhng máy ri trên m i, nu toàn
mng Grid bn, nhng công vi c t dành cho nhng
công vi
ng công vit ng n hoàn thành gp.
Grid không th x c nhng công vic cn hoàn thành quá gp. Tuy nhiên Grid có
th x c nhng công vic nh ng mt lng l x lý
nó mt cách nhanh nht.
Mt li ích khác ca Grid là cân bng ti. Khi mt công vic liên lc vi mt công
vic khác, vi Internet, hoc các tài nguyên khác, Grid có th lp l có th
gim thiu tng truyng cách truyu này giúp
Grid có th gim thiu tc nghn mng.
Cui cùng Grid còn có kh i tài nguyên. Các trng thái ca tt c
các tài nguyên trong mc Grid qun lý. Các t chc trên Grid có th to tài khon
và tr ti s dng các tài nguyên này khi cn thiu này to nên tài chính mng
i.
16
1.6.6. Độ tin cậy
t mi có th có kh mt h th
cy. Grid mi ch bu công ngh này. Mô hình máy ch y s dng Grid có
th c mô t t mi gm nhic phân b khp n
t s c ti mt nt mm khác s không b
ng. Khi mt máy tính b hng hóc, phn mm qun lý trong Grid t ng chuyn
công vic x lý t n m ng hp quan
trng, nhiu bn sao ca công vic tc chuyn nhiu máy khác nhau
trên mi.
17
Chương 2: Globus Toolkit 4
Globus Toolkit là một bộ toolkit mã nguồn mở được sử dụng để xây dựng các hệ
thống và các ứng dụng Grid. Globus Toolkit hiện đang được phát triển bởi tổ chức
Globus Alliance và nhiều tổ chức khắp nơi trên thế giới. Globus Alliance là một cộng
đồng và các cá nhân và tổ chức tham gia phát triển các công nghệ nền tảng cho Grid.
Globus Toolkit cho phép hiện thực hóa các ý tưởng, mục tiêu đằng sau khái niệm
Grid. Bộ toolkit bao gồm các dịch vụ và thư viện phục vụ việc bảo mật, hạ tầng thông tin
Grid, quản lý tài nguyên, quản lý dữ liệu, liên lạc, phát hiện lỗi,… Nó được đóng gói như
một tập các thành phần có thể sử dụng độc lập hoặc kết hợp với nhau. Mỗi tổ chức đều có
những hoạt động, chính sách khác nhau, việc kết hợp, chia sẻ tài nguyên từ nhiều tổ chức
bị cản trở bởi tính không tương thích giữa các tài nguyên. Globus Toolkit được xây dựng
để loại bỏ những trở ngại này. Các service, interface, và protocol của nó cho phép người
dùng truy cập đến các tài nguyên ở xa như thể nó đang nằm trong máy tính của họ trong
khi vẫn cho phép các tổ chức thiết lập chính sách cục bộ của mình như quản lý việc ai
được dùng tài nguyên và khi nào…
Mặc dù Globus được phát triển để phục vụ các dự án về khoa học và kỹ thuật, nhưng hiện
nay Globus cũng đã được áp dụng vào các lĩnh vực thương mại. Từ năm 2000, các công
ty hàng đầu thế giới trong lĩnh vực công nghệ thông tin như Avaki, DataSynapse,
Entropia, Fujitsu, Hewlett-packard, IBM, NEC, Oracle, Platform, Sun, Microsoft ,đã bắt
đầu xây dựng các chiến lược về Grid Computing trên nền tảng Globus.
2.1. Khái niệm về Globus
c phát trin t cui nh n nay
nhm h tr phát trin các dch v ng ứng dụng tính toán phân tán và cơ sở
hạ tầng. Các thành phn bao gm an ninh, truy cp tài nguyên, qun lý tài nguyên,
di chuyn d liu, tìm king công c ã lc s
d m rng h t ca Grid và các ng dng phân tán.
Globus c hiu theo nh :
18
- Mt cng nhi dùng và phát trin ,nhng cng tác viên bng cách
s dng hoc phát trin nhng phn mm mã ngun m ,liên kt các tài liu
cho vic tính toán phân tán và liên kt tài nguyên.
- Là phn mm GLOBUS TOOLKIT : mt tn
thi xây dng mt h thng phân tán và các ng dc trin khai trên
nó.
- Mt nn tng h tr cho cng : mã ngut c u có th
c gii quyt khi truy cp vào globus.org
Globus toolkit cung cp rt nhiu thành phn ,bao gm :
- Mt tp hp các dch v c thêm vào tp trung vào vic qu h
tng.
- Các công c xây dng nhng dch v Web bng Java, C, Python.
- H tng bo mt cao.
- Là máy khách API hoc dòng lnh cho vic truy cp dch v và tài nguyên.
- Tài lic t v các thành phn và cách dùng nó th xây dng mt ng
dng.
2.2. Nguyên nhân thúc đẩy sự phát triển của Globus
Phn mc thit k cho phép các ng dng s dng ngun lc gia
t b , d liu, dch v, mng
i, hoc cm bin. u, vic phát trin y bi nhu cu ca các
"t chc o" trong khoa hc. Trong thi gian g, vic s dng Globus trong các ng
d nên ngày càng quan trng. i và khoa hc có cùng mt
mi quan tâm là luôn luôn i hi x lý d liphi là liên
tc. Vic phát trin Globus bt ngun t nhu cu mun truy cp và x lý d liu hay nhân
rng d li thuc các t cht ti các v trí
a lý cách xa nhau. Ví d:
Mt nhà khoa hc (hoc mt nhà phân tích v kinh t) cn truy cp d liu nm
d liu khác nhau trong mt mt t chc hp tác khoa hc (hoc doanh
nghip).
Mt doanh nghip cn phi phân b , và tài nguyên m
h tr thi n t (hoc vt lý phân tích d liu
19
Mt k u thit k và vn hành th nghim trên các thit b u khin
t xa, liên kt và so sánh các s liu và mô phng vt lý.
Mc cn nhân rng mt terabyte d liu mi
tác trên khp th gii.
2.3. Kiến trúc Globus
2.3.1. Các thành phần thƣờng trực
2.3.1.1. Java WS Core
Bao gm các API và các công c thi hành chun WSRF và WS-Notification trên
nn ngôn ng Java. Các thành ph thành nn tng cho mt s các dch v Grid.
Ngoài ra, Java WS Core còn cung cn và công c cho vic phát trin các dch
v WSRF
2.3.1.2. C WS Core
Bao gm các API và các công c thi hành chun WSRF trên nn ngôn ng C
2.3.2. Các thành phn bo mt
Trong GT, vic bo m m trách bi module Grid Security
t, yêu cu v bo mt, an toàn là mt trong nhng v
chính trong các thit k Grid. Các thành phn bo m c
khá t thc hin vic chng thc, phân quyn, bo mt liên lc gia các node trong
Grid. GSI là mt s m rng các protocol và API ca các chun v bo mt hin
c xây dng trên các công ngh, các chu
Mô hình mã hoá khóa công khai (public key infrastructure(PKI))
X.509 certificate
Protocol Secure Sockets Layer (SSL)
Tt c các kt ni liên lc mã hoá theo công ngh
RSA 1024 bit và truyn ti vi protocol SSL.
Generic Security Service API (GSS-API)
Toàn b pht cu tuân theo GSS-API (là mt b API
chun dành cho các h thng bo mc t chc Internet Engineering
20
GSI rng các chu cung cp thêm chp mt ln
(single sign-on), y quyn (delegation), identity mapping (ánh x thc th).
Hình 2.1. Tóm tắt cấu trúc và chức năng các thành phần của GSI
2.3.2.1. n v bo mt Grid và GSI
Symmetric Encryption
Mã hoá kiu Symmetric da trên vic s dng mt khoá bí m thc hin mã hoá và
gii mã d li m bo d liu ch c bi bên gi và bên nhc
i mt cách bí mt gia 2 bên. Nc khóa bí m d mã
hoá, h có th gic thông tin. c
mã hóa/gii mã li i dây.
Asymmetric Encryption
c g c s
dng r dng mt c mã hóa c gi là
khóa công khai (public key) và khóa bí m mã hoá khác vi khoá
c s d gi yêu cu các bên phi bo
v k các khóa bí mt ca mình, trong khi khóa công khai ca h không cc bo v,
có th c công b rng rãi trong c
Proxy và y quyn
(Phn m rng bi GSI, phc v single sign-on)
PKI
(CA và Certificate)
SSL/TSL
(Chng thc và bo v thông
p)