Tải bản đầy đủ (.docx) (36 trang)

Tiểu luận môn tính toán lưới CÔNG NGHỆ GRID COMPUTING VÀ ỨNG DỤNG

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (764.78 KB, 36 trang )

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
  
BÁO CÁO THU HOẠCH
MÔN : TÍNH TOÁN LƯỚI
ĐỀ TÀI:
CÔNG NGHỆ GRID COMPUTING VÀ ỨNG DỤNG
Giảng viên phụ trách: Học viên thực hiện:
PGS. TS. NGUYỄN PHI KHỨ NGUYỄN NGỌC LÂM
MSHV: CH1101098
LỚP: CH-K6
TP. Hồ Chí Minh – Năm 2013
GVPT: PGS.TS Nguyễn Phi Khứ 2013
LỜI MỞ ĐẦU
Tính toán phân tán là một nhánh nghiên cứu quan trọng trong tính
toán hiệu năng cao (High Performance Computing). Năng lực xử lý của các
máy tính ngày càng tăng, kết hợp với sự ra đời của các hạ tầng mạng tốc độ
cao đã thúc đẩy sự phát triển của các hệ thống xử lý phân tán. Mặt khác,
nhu cầu tính toán của con người ngày càng cao, yêu cầu thời gian thực thi
các ứng dụng phải được rút ngắn, do đó hiện nay có rất nhiều nghiên cứu
tập trung vào lĩnh vực xử lý phân tán.
Cũng như các công nghệ tính toán khác, điện toán lưới (Grid
Computing) ra đời xuất phát từ nhu cầu tính toán của con người. Thực tế,
ngày càng có nhiều bài toán lớn và phức tạp hơn được đặt ra và do đó cần
phải có những năng lực tính toán mạnh mẽ hơn. Có thể giải quyết vấn đề
này bằng hai cách:
 Thứ nhất: Đầu tư thêm trang thiết bị, cơ sở hạ tầng tính toán (mua
thêm máy chủ, máy trạm, siêu máy tính, cluster ). Rõ ràng cách làm
này hết sức tốn kém.
 Thứ hai: Một cách thực hiện hiệu quả hơn đó là phân bố hợp lý các
nguồn tài nguyên trong tổ chức hoặc thuê thêm các nguồn tài nguyên


từ bên ngoài (với chi phí rẻ hơn nhiều so với việc đầu tư cho cơ sở
hạ tầng tính toán). Đây là mục tiêu chính của điện toán lưới.
Điện toán lưới ra đời giúp cho việc phối hợp hoạt động của các hệ
thống tính toán phân tán với nhau về mặt địa lý trở nên dễ dàng hơn. So với
công nghệ ra đời trước là máy tính cụm (cluster computing), công nghệ
điện toán lưới có phạm vi phân tán và hoạt động rộng hơn. Mỗi một cluster
có thể trở thành một thành phần tính toán (node) trong hệ thống lưới. Công
nghệ lưới không đòi hỏi các thành phần phải có sự tương đồng với nhau về
cấu trúc, năng lực xử lý. Có thể xem môi trường lưới là một tập hợp rất
nhiều các tài nguyên tính toán và có cấu trúc không đồng nhất. Sử dụng
công nghệ tính toán chúng ta có thể xây dựng một hệ thống bao gồm hàng
trăm, hàng triệu bộ xử lý.
Điện toán lưới là một trong những công nghệ mới trong lĩnh vực tính
toán phân tán. Điện toán lưới là đề tài được tập trung nghiên cứu bởi nhiều
tổ chức lớn như IBM, Syn MicroSystems, Oracle … và trong các trường,
viện nghiên cứu.
HVTH: CH1101098 Nguyễn Ngọc Lâm
2
GVPT: PGS.TS Nguyễn Phi Khứ 2013
Nội dung của bài thu hoạch bao gồm 3 phần, chủ yếu lựa chọn và sắp
xếp những nội dung then chốt nhất trong khoảng thời gian cho phép.
 I. TỔNG QUAN VỀ CÔNG NGHỆ ĐIỆN TOÁN LƯỚI
Giới thiệu tổng quan về lịch sử phát triển, các tổ chức, cũng như một
số ứng dụng đã được triển khai thành công trên phạm vi toàn thế giới.
 II. KIẾN TRÚC VÀ MÔI TRƯỜNG PHÁT TRIỂN MẠNG LƯỚI.
Giới thiệu kiến trúc, cơ sở hạ tầng, các chuẫn cũng như các công cụ để xây
dựng hệ thống điện toán lưới.
 III. KHẢO SÁT MỘT SỐ TT LẬP LỊCH ĐỂ PHÂN PHỐI TÀI
NGUYÊN TRONG HỆ THỐNG ĐIỆN TOÁN LƯỚI
Giới thiệu một số thuật toán lập lịch như: OLB, MCT, Min-Min, Max-Min,

Sufferage và X Sufferage nhằm năng cao hiệu năng tính toán trong hệ thống lưới.
LỜI CẢM ƠN
Với lòng biết ơn sâu sắc nhất, em xin gửi đến quý Thầy Cô Khoa Học Máy
Tính - Trường Đại Học Công Nghệ Thông Tin đã đem hết tâm huyết của mình
truyền đạt vốn kiến thức quý báu cho chúng em.
Em xin chân thành cảm ơn PGS. TS Nguyễn Phi Khứ đã truyền đạt kiến thức
môn Tính toán lưới qua đó giúp em có đầy đủ kiến thức để hoàn thành bài thu
hoạch này.
Nhân đây em cũng xin gửi lời cảm ơn chân thành đến gia đình, bạn bè, đồng
nghiệp đã động viên tinh thần cho em trong suốt quá trình học tập của mình.
Sau cùng, em xin kính chúc quý Thầy Cô Khoa Học Máy Tính cùng PGS. TS
Nguyễn Phi Khứ dồi dào sức khỏe để thực hiện sứ mệnh cao đẹp của mình là
truyền đạt kiến thức cho thế hệ mai sau.
Một lần nữa em xin chân thành cảm ơn !
TP. HCM, ngày 27 tháng 07 năm 2013
Học viên thực hiện
(ký và ghi rõ họ tên)
Nguyễn Ngọc Lâm
HVTH: CH1101098 Nguyễn Ngọc Lâm
3
GVPT: PGS.TS Nguyễn Phi Khứ 2013
NHẬN XÉT CỦA GIẢNG VIÊN PHỤ TRÁCH
……………………………………………………………………………………………
……………………………………………………………………………………………
……………………………………………………………………………………………
……………………………………………………………………………………………
……………………………………………………………………………………………
……………………………………………………………………………………………
……………………………………………………………………………………………
……………………………………………………………………………………………

……………………………………………………………………………………………
……………………………………………………………………………………………
……………………………………………………………………………………………
……………………………………………………………………………………………
……………………………………………………………………………………………
……………………………………………………………………………………………
……………………………………………………………………………………………
……………………………………………………………………………………………
……………………………………………………………………………………………
TP. HCM, ngày tháng năm 2013
Giảng viên phụ trách
(ký và ghi rõ họ tên)
PGS. TS Nguyễn Phi Khứ
MỤC LỤC
Số hiệu Tên Trang
1.1 Quá trình ra đời Grid Computing 10
1.2 Mô hình Grid Computing 14
1.3 Computation grid 16
1.4 Data grid 16
1.5 Compute Grid + Data Grid 17
2.1 Kiến trúc phân tầng của Grid so với kiến trúc phân tầng
Internet
28
2.2 Cấu trúc một hệ thống lưới do IBM đề xuất 32
2.3 Các chuẩn cho môi trường lưới 34
HVTH: CH1101098 Nguyễn Ngọc Lâm
4
GVPT: PGS.TS Nguyễn Phi Khứ 2013
2.4 Mối quan hệ giữa OGSA va OGSI 36
2.5 Kiến trúc tổng quát của Globus Toolkit 44

2.6 Các dịch vụ gLite cung cấp 46
I. TỔNG QUAN VỀ CÔNG NGHỆ ĐIỆN TOÁN LƯỚI
1.1 Lịch sử ra đời và phát triển của công nghệ điện toán lưới
Networking:
TCP/IP
Communications: The Internet & The e-mail era
Information:
The Web
Computing:
The Grid
Time evolution
Quá trình ra đời của công nghệ điện toán lưới như sau:
Hình 1.1 Quá trình ra đời Grid Computing
Mặc dù công nghệ Grid vẫn còn khá mới mẻ, đặc biệt là tại Việt Nam. Tuy
nhiên, ý tưởng về Grid đã xuất hiện từ những năm 60-70 của thế kỷ XX.
Năm 1965, đã đề cập đến việc sử dụng năng lực tính toán như một tiện ích.
Tương tự như hệ thống cung cấp điện, nước hiện đang được sử dụng trong cuộc
sống hằng ngày.
Cơ sở hạ tầng truyền thông của điện toán lưới là mạng Internet. Sau khi
WWW ra đời cuối những năm 80 đã tạo ra một cuộc cách mạng trong quá trình
tính toán và chia sẻ thông tin trên mạng. Giao thức HTTP cùng với trình duyệt
ngôn ngữ HTML đã cung cấp một cơ chế cho phép liên kết các văn bản và truy
cập các thông tin trực tuyến, dễ dàng và ở bất kỳ đâu.
HVTH: CH1101098 Nguyễn Ngọc Lâm
5
GVPT: PGS.TS Nguyễn Phi Khứ 2013
Tuy nhiên đó mới là những ý tưởng về Grid nhưng nguồn gốc của Grid
chính thức được xác định vào năm 1990, khi thuật ngữ “siêu tính toán” ra đời,
dùng để mô tả các dự án kết nối các trung tâm siêu máy tính của Mỹ nhằm kết
hợp sức mạnh của nhiều siêu máy tính lại với nhau.

Các nhà khoa học tại Argone National Labs thuộc đại học Chicago (Mỹ) là
những người đầu tiên đề xuất ý tưởng về điện toán lưới. Thuật ngữ lưới ở đây
xuất phát từ lưới điện (electricity grid), ngụ ý rằng bất cứ một thiết bị tương thích
nào đều có thể gắng vào trong lưới và được xếp ở một mức tài nguyên nào đó mà
không cần quan tâm đến nguồn gốc của tài nguyên đó. Trong tương lai, điện toán
lưới có thể cung cấp cho người sử dụng các dịch vụ đóng vai trò như các dịch vụ
cơ sở hạ tầng mà chúng ta sử dụng hằng ngày như: điện, nước,
Những khái niệm và công nghệ lưới bắt đầu phát triển từ các nghiên cứu
của Foster và Kesselman vào năm 1998.
Lưới dữ liệu được bắt đầu năm 1999 với Globus Tookit 2.0+. Giai đoạn sau
đó là sự ra đời của kiến trúc dịch vụ lưới mở rộng (OGSA) vào năm 2001 và sản
phẩm Globus Tookit 3.0.
Hiện tại điện toán lưới đang có xu hướng phát triển mạnh và được nhiều
nhà nghiên cứu quan tâm. Trong đó, đáng chú ý là Globus Alliance (được sự tài
trợ của một vài trường đại học tại Mỹ như đại học Chicago, đại học Berkeley,…)
và Global Grid Forum (các thành viên bao gồm các hãng lớn như IBM, SUN,
Microsoft,…). Các nhóm này đã cố gắng chuẩn hóa công nghệ và giao thức tính
toán để các thành phần trong lưới có thể giao tiếp được với nhau.
 Globus Alliance tạo ra bộ công cụ Globus Toolkit (GT) mã nguồn mở, bao
gồm các thư viện phần mềm và các dịch vụ cho phép người phát triển tạo
ra các ứng dụng lưới. Thư viện GT cung cấp các hàm đảm bảo vấn đề như
an ninh, cơ sở hạ tầng thông tin, quản lý tài nguyên lưới, tính tin cậy, tính
khả chuyển, . . .
 Global Grid Forum quản lý các tiến trình chuẩn cho việc đặc tả kiến trúc
các dịch vụ lưới OGSA (Open Grid Service Architecture) và OGSI (Open
Grid Service Infrastructure). Các chuẩn OGSA, OGSI và bộ công cụ
Globus Toolkit giúp các nhà khoa học triển khai một cách thuận lợi các
giải pháp điện toán lưới trong nhiều lĩnh vực nghiên cứu chuyên sâu ở Mỹ
và Châu Âu như: dự án tìm kiếm các tín hiệu ngoài trái đất SETI (Search
for Extraerrestrial Intellegence), dự án về nghiên cứu bản đồ gen người,

dự án IPG (Information Power Grid) của NASA,
1.2 Điện toán lưới là gì ?
Mỗi tổ chức, mỗi cá nhân tùy theo quan điểm và hệ thống ứng dụng của
mình mà đưa ra định nghĩa khác nhau về lưới.
Dưới quan điểm cá nhân của tiến sỹ Ian Foster và các đồng nghiệp thì "Một
lưới là một hệ thống có các đặc trưng như tài nguyên được điều phối một cách
phi tập trung; sử dụng các giao thức chuẩn, mở và đa năng; cung cấp chất lượng
dịch vụ không tầm thường" - I. Foster‘s Three-Point Checklist (HPCWIRE -
22.07.2002). Quan điểm này ngay lập tức làm dấy lên phản ứng của nhiều hãng
HVTH: CH1101098 Nguyễn Ngọc Lâm
6
GVPT: PGS.TS Nguyễn Phi Khứ 2013
giải pháp điện toán bởi rất nhiều phần mềm được coi là “Grid” ở thời điểm đó
không thể đáp ứng hết những tiêu chí mà Foster nêu ra.
Trong bài báo “What is Grid ?” Ian Foster đưa ra 3 đặc điểm của một hệ
thống Grid:
[1] Kết hợp, chia sẻ các tài nguyên không được quản lý tập trung.
Grid tích hợp và phối hợp các tài nguyên, người dùng thuộc nhiều vùng
quản lý khác nhau, nhiều đơn vị khác nhau trong một tổ chức và nhiều tổ chức
khác nhau. Công nghệ Grid tập trung giải quyết một số vấn đề bảo vệ tài
nguyên, chính sách quản trị, chi phí, thành viên, … nảy sinh trong quá trình
chia sẻ và sử dụng tài nguyên.
[2] Sử dụng các giao diện và giao thức chuẩn, mang tính mở, đa dụng.
Điện toán lưới sử dụng các chuẩn mở để chia sẻ qua mạng những tài
nguyên phức tạp (trên các nền tảng kiến trúc phần mềm, phần cứng và ngôn
ngữ lập trình khác nhau), nằm tại những điểm khác nhau tùy vào khu vực hành
chính. Nói cách khác nó “ảo hóa” các tài nguyên tính toán.
Điện toán lưới thường bị nhầm với tính toán phân cụm, tuy nhiên có sự
khác nhau giữa hai kiểu tính toán này: cụm tính toán là một tập đơn các nút
tính toán tập trung trên một khu vực địa lý nhất định. Lưới tính toán gồm

nhiều cụm tính toán và những tài nguyên khác (như mạng, các thiết bị lưu trữ).
[3] Cung cấp các dịch vụ có chất lượng cao.
Điện toán lưới tạo ra một mô hình để giải quyết các bài toán tính toán
lớn bằng cách sử dụng những tài nguyên rỗi (CPU, thiết bị lưu trữ) của một
loạt các máy tính riêng rẽ, thường là máy để bàn. Hệ thống này được coi là
một cụm “máy ảo”, nhúng trong một môi trường liên lạc phân tán. Điện toán
lưới tập trung vào khả năng hỗ trợ tính toán giữa các khu vực hành chính, điều
này làm cho mô hình này khác biệt so với mô hình cụm tính toán và tính toán
phân tán truyền thống.
Điện toán lưới cung cấp một giải pháp cho những bài toán về tính toán
hiệu năng cao như tạo nếp protein, mô hình hoá tài chính, mô phỏng động đất
và dự báo khí hậu thời tiết, … Ngoài ra điện toán lưới còn có thể giúp các tổ
chức, doanh nghiệp sử dụng tối ưu các tài nguyên CNTT và tạo ra các dịch vụ
tính toán theo nhu cầu cho khách hàng thương mại, trong đó khách hàng chỉ
phải trả những gì họ đã sử dụng giống như điện và nước.
Điện toán lưới được thiết kế với mục tiêu giải các bài toán quá lớn cho
một siêu máy tính, trong khi vẫn giữ được sự linh hoạt đối với những bài toán
nhỏ hơn. Vì vậy điện toán lưới cung cấp một môi trường đa người dùng.
Mục tiêu thứ hai của điện toán lưới là khả năng khai thác tốt hơn những
năng lực tính toán chưa được sử dụng và phục vụ cho những nhu cầu tính toán
không ngừng của các bài toán khoa học lớn. Điều này dẫn đến việc sử dụng
các cơ chế cấp phép an toàn, cho phép người dùng từ xa có thể điều khiển
được các tài nguyên tính toán.
Khái niệm “tổ chức ảo” là một khái niệm rất quan trọng trong điện toán
lưới. Tổ chức ảo là một tổ chức được lập ra để giải quyết một vấn đề nào đó.
Thành phần của tổ chức ảo bao gồm nhiều tài nguyên thuộc về nhiều tổ chức
HVTH: CH1101098 Nguyễn Ngọc Lâm
7
GVPT: PGS.TS Nguyễn Phi Khứ 2013
thực khác nhau trong môi trường lưới cùng hoạt động vì một mục tiêu chung.

Tùy theo mức độ của vấn đề cần giải quyết mà các tổ chức ảo có thể rất khác
nhau về quy mô, phạm vi hoạt động và thời gian sống. Hình phía dưới minh
họa về một tổ chức ảo. Có một người dùng cần giải quyết một bài toán lớn về
dự báo thời tiết, anh ta thành lập một tổ chức ảo bằng cách thuê một số nguồn
tài nguyên khác nhau từ một vài tổ chức khác nhau. Tương tự như vậy, một
người dùng cần giải một bài toán về dự báo tài chính, anh ta cũng thành lập
một tổ chức ảo để giải quyết bài toán này.
Hình 1.2 Mô hình Grid Computing
Còn dưới quan điểm của một số công ty và liên minh phát triển lưới uy tín
trên thế giới thì điện toán lưới được định nghĩa như sau:
 Định nghĩa của Oracle: Điện toán lưới là việc liên kết nhiều máy chủ và
thiết bị lưu trữ thành một siêu máy tính nhằm tối ưu hóa được tính ưu việt
của các hệ thống máy chủ cũng như hệ thống ứng dụng, nhờ đó giảm thiểu
đến mức thấp nhất chi phí.
 Định nghĩa của IBM: Điện toán lưới là một môi trường tính toán ảo. Môi
trường này cho phép bố trí song song, linh hoạt, chia sẻ, tuyển lựa, tập
hợp các nguồn tài nguyên hỗn hợp về mặt địa lý, tùy theo mức độ sẵn
sàng, hiệu suất, chi phí của các tài nguyên tính toán và yêu cầu về chất
lượng dịch vụ của người sử dụng.
 Định nghĩa của liên minh điện toán lưới: Môi trường điện toán lưới được
hiểu như một hạ tầng kết nối hệ thống máy tính, hệ thống mạng, hệ thống
cơ sở dữ liệu được sở hữu và quản lý bởi nhiều tổ chức, cá nhân nhằm
cung cấp môi trường tính toán ảo duy nhất với hiệu năng cao cho người sử
dụng.
HVTH: CH1101098 Nguyễn Ngọc Lâm
8
GVPT: PGS.TS Nguyễn Phi Khứ 2013
1.3 Điện toán lưới ra đời nhằm mục đích gì ?
Điện toán lưới là một giải pháp tập hợp tài nguyên tính toán chi phí thấp để
thực hiện những bài toán lớn.

Hệ thống tính toán cho phép bố trí song song, linh hoạt, chia sẻ, tập hợp các
nguồn tài nguyên hỗn hợp về mặt địa lý.
Điện toán lưới có thể đạt đến quy mô toàn cầu và người sử dụng không cần
biết vị trí nguồn tài nguyên
1.4 Phân loại lưới tính toán
1.1.1 Lưới tính toán (Computation grid)
Lưới tính toán là một loại của điện toán lưới, chủ yếu tập trung vào việc
sử dụng năng lực tính toán của lưới. Ở loại lưới này, phần lớn các node là các
nhóm máy tính có năng lực tính toán lớn, để phục vụ cho việc tính toán bài
toán lớn.
Hình thức thực hiện là chia tác vụ tính toán lớn thành nhiều công việc
nhỏ thực thi song song trên các node của lưới. Việc phân tán các tác vụ của
lưới sẽ làm giảm đáng kể thời gian xử lý, và làm tăng khả năng tận dụng của
hệ thống. Thông thường hệ thống chính sẽ chia khối dữ liệu cần xử lý thành
các phần nhỏ, sau đó phân phối đến các node trên grid. Mỗi node thực hiện
xử lý dữ liệu, kết quả trả về hệ thống chính, tại đây sẽ tổng hợp và trình diễn
kết quả toàn cục cho người dùng.
Hình 1.3 Computation grid
1.1.2 Lưới dữ liệu (Data grid)
Lưới dữ liệu sẽ tập trung vào việc lưu trữ và cung cấp khả năng truy
xuất dữ liệu của nhiều cá nhân, tổ chức khác nhau. Người dùng không cần
biết chính xác vị trí dữ liệu khi thao tác với dữ liệu. Các cơ sở dữ liệu, đặc
biệt là các cơ sở dữ liệu liên hợp đóng vai trò quan trọng trong lưới dữ liệu
nhất là khi có nhiều nguồn dữ liệu và xuất hiện nhu cầu kết hợp các thông tin
từ các nguồn dữ liệu này. Lưới dữ liệu có thể được sử dụng trong lĩnh vực
khai phá dữ liệu (data mining), hoặc các hệ thống thương mại thông minh.
Trong trường hợp này, không chỉ có hệ thống file hay các cơ sở dữ liệu mà
toàn bộ dữ liệu của tổ chức cần tập hợp lại. Ở đây có thể kết hợp lưới dữ liệu
và lưới tính toán.
HVTH: CH1101098 Nguyễn Ngọc Lâm

9
GVPT: PGS.TS Nguyễn Phi Khứ 2013
Hình 1.4 Data grid
1.1.3 Lưới kết hợp (Scavenging
grid)
Scavenging grid có thể được
xem là một loại kết hợp giữa data
grid và compute grid. Một
scavenging thường được
dùng với nhiều máy tính để bàn.
Các máy tính sẽ được kiểm tra
định kỳ để xem khi nào bộ xử lý
và các tài nguyên khác rảnh rỗi để thực hiện các tác vụ grid. Chủ nhân của
các máy để bàn này sẽ được quyền xác định khi nào thì sẽ chia sẻ máy tính
của mình với mạng lưới.
Hình 1.5 Compute Grid + Data Grid
1.5 Các tổ chức hỗ trợ và phát triển điện toán lưới
1.5.1 Các tổ chức phát triển chuẩn lưới
 Diễn đàn điện toán lưới toàn cầu GGF: Có mục đích định nghĩa các
đặc tả cho điện toán lưới. GGF được phát triển nhờ vào sự hỗ trợ, hợp
tác giữa khu vực công nghiệp và bộ khoa học.
 Các tổ chức chuẩn hóa quốc tế như: OASIS (Organization for the
Advancement of Structure Information Standards), W3C (World Wide
Web Consortium), IETF (the Internet Engineering Task Force) và
DMTF (the Distributed Management Task Force).
1.5.2 Các tổ chức phát triển bộ công cụ framework và các middleware
Bao gồm các trường đại học, các viện nghiên cứu. Các tổ chức này đã
cho ra đời nhiều bộ công cụ phát triển lưới như Legion, Condor, Nimrod,
Unicore, Globus, …
1.5.3 Các tổ chức xây dựng và sử dụng các giải pháp lưới

Một số lưới tiêu biểu trên thế giới như: Nasa Information Power Grid
của NASA, Science Grid của bộ quốc phòng Mỹ, dự án EuroGrid của liên
minh Châu Âu với nhiều lưới con như Bio Grid, Metro Grid, Computer-
Aided Engineering (CAD) Grid,…
HVTH: CH1101098 Nguyễn Ngọc Lâm
10
GVPT: PGS.TS Nguyễn Phi Khứ 2013
1.5.4 Các tổ chức đưa công nghệ lưới vào các sản phẩm thương mại
Trong nhóm này có nhiều đại gia trong ngành công nghiệp máy tính
như IBM, SUN, HP, …Các hãng này đưa ra nhiều giải pháp khác nhau dựa
trên nền công nghệ điện toán lưới.
1.6 Giới thiệu một số mô hình tính toán khác
1.6.1 World Wide Web (Web Computing)
World Wide Web hiện nay đang phát triển mạnh mẽ và được sử dụng
rộng khắp. Sử dụng các chuẩn mở và các giao thức mở (TCP, HTTP, XML,
SOAP), WWW có thể được sử dụng để xây dựng các tổ chức ảo tuy nhiên nó
thiếu một số đặc tính quan trọng như các cơ chế chứng thực một lần, ủy
nhiệm, các cơ chế phối hợp sự kiện
1.6.2 Các hệ thống tính toán phân tán (Distributed computing systems)
Các công nghệ tính toán phân tán hiện tại bao gồm CORBA, J2EE và
DCOM rất thích hợp cho các ứng dụng phân tán tuy nhiên chúng không cung
cấp một nền tảng phù hợp cho việc chia sẻ tài nguyên giữa các thành viên
của tổ chức ảo. Khó khăn trong việc tương tác giữa các công nghệ, khai phá
tài nguyên, đảm bảo an ninh và xây dựng động các tổ chức ảo.
1.6.3 Hệ thống tính toán ngang hàng (Peer - to - peer Computing Systems)
Tính toán ngang hàng cũng là một lĩnh vực của tính toán phân tán.
Những điểm khác biệt chính giữa tính toán ngang hàng và điện toán lưới là:
 Cộng đồng người sử dụng mà chúng hướng tới: Điện toán lưới có
cộng đồng người dùng có thể nhỏ hơn, tuy nhiên tập trung nhiều vào
các ứng dụng và có yêu cầu cao hơn về an ninh cũng như tính toàn

vẹn của ứng dụng. Trong khi hệ thống mạng ngang hàng có thể có số
người dùng rất lớn, bao gồm cả các người dùng đơn lẻ và các tổ chức
tuy nhiên không đòi hỏi cao về an ninh, và mô hình chia sẻ tài nguyên
cũng đơn giản hơn.
 Môi trường lưới liên kết các nguồn tài nguyên: Môi trường liên kết
các nguồn tài nguyên trong điện toán lưới mạnh hơn, đa dạng hơn và
chặt chẽ hơn rất nhiều so với hệ thống tính toán ngang hàng.
1.6.4 Hệ thống tính toán phân cụm (Cluster Computing Systems)
Điện toán lưới thường bị nhầm lẫn với tính toán phân cụm. Tuy nhiên
sự khác biệt chính giữa hai kiểu tính toán này là một cụm tính toán là một tập
đơn các nút tính toán tập trung trên một khu vực địa lý nhất định, trong khi
một lưới bao gồm nhiều cụm tính toán và những loại tài nguyên khác (như
mạng, các thiết bị lưu trữ).
1.6.5 Công nghệ tính toán hiệu năng cao (High Performance Computing
Để giải quyết những bài toán rất lớn và phức tạp người ta phải nghiên
cứu xây dựng hệ thống siêu tính toán. Các hướng nghiên cứu trong tính toán
hiệu năng cao bao gồm:
 Nghiên cứu cơ chế tạo siêu máy tính tuần tự đơn bộ vi xử lý với tốc
độ rất cao. Cách làm này gặp phải các giới hạn về vật lý như độ truyền
dẫn của bán dẫn, tốc độ điện từ, nhiễu điện từ, …
HVTH: CH1101098 Nguyễn Ngọc Lâm
11
GVPT: PGS.TS Nguyễn Phi Khứ 2013
 Để khắc phục khó khăn trên, người ta nghiên cứu chế tạo các siêu
máy tính song song bao gồm nhiều bộ xử lý hoạt động song song trên
một bảng mạch chủ. Cách làm này đòi hỏi phải có những phần mềm
tương thích (hệ điều hành song song phân tán, trình biên dịch song
song, ngôn ngữ lập trình song song ,…) để tận dụng năng lực tính
toán của hệ thống.
Tuy nhiên việc nghiên cứu chế tạo ra các siêu máy tính nói chung mới

chỉ được thực hiện ở các nước phát triển và giá thành của một hệ thống siêu
máy tính như vậy (bao gồm cả phần cứng lẫn phần mềm hệ thống, công cụ
phát triển ) có thể lên đến hàng triệu đô la.
1.7 Một số lợi ích khi sử dụng công nghệ Grid Computing
Dưới đây xin giới thiệu một số lợi ích cụ thể của việc áp dụng công nghệ
điện toán lưới, tùy vào tình huống cụ thể việc áp dụng công nghệ điện toán lưới
đem lại những lợi ích khác nhau. Vấn đề là phải hiểu rõ bản chất Grid, sử dụng
tốt các công cụ nhằm khai thác tốt nhất trong các tình huống cụ thể.
1.7.1 Khai thác, tận dụng các nguồn tài nguyên nhàn rỗi
Việc khai thác, tận dụng các nguồn tài nguyên nhàn rỗi là lợi ích lớn
nhất mà grid mang lại và cũng là lợi ích dễ nhìn thấy nhất khi triển khai một
hệ thống grid. Hầu hết các tổ chức đều có một lượng lớn các tài nguyên tính
toán nhàn rỗi là các máy tính trong tổ chức của mình (bao gồm cả máy chủ).
Các máy tính cá nhân thường chỉ sử dụng hết 5% thời gian xử lý CPU, ngay
cả các sever cũng thường rảnh rỗi. Grid có thể tối ưu sử dụng các tài nguyên
nhàn rỗi này theo nhiều cách khác nhau.
Một chức năng nữa của grid đó là cân bằng sử dụng tài nguyên rất tốt.
Một tổ chức thường gặp các vấn đề không mong đợi khi các hoạt động đòi
hỏi thêm nhiều tài nguyên. Với grid, có thể chuyển hoạt động đến tài nguyên
nhàn rỗi khác, hoặc có thể thêm tài nguyên mới một cách dễ dàng, từ đó làm
tăng khả năng của hệ thống.
Hệ thống lưới cho phép kết hợp nhiều không gian lưu trữ nhàn rỗi để
tạo thành một không gian lưu trữ lớn hơn, được cấu hình để tăng hiệu suất,
độ tin cậy hơn so với các máy tính đơn lẻ thông qua các cơ chế quản lý dữ
liệu.
Hệ thống lưới có thể quản lý nhiều loại tài nguyên, do đó có thể cho
phép theo dõi tổng quan về các hoạt động sử dụng tài nguyên trong một tổ
chức lớn, hỗ trợ hoạch định các chiến lược sử dụng tài nguyên.
1.7.2 Sử dụng bộ xử lý song song
Khả năng sử dụng CPU song song là một đặc tính tuyệt vời của grid,

ngoài việc hỗ trợ các nhu cầu tính toán của các nhà khoa học, sức mạnh tính
toán do grid cung cấp có thể giúp giải quyết các bài toán đòi hỏi năng lực xử
lý lớn trong các ngành y dược, tính toán tài chính, kinh tế và khai thác dầu,
dự báo thời tiết, công nghiệp vũ trụ,… và nhiều lĩnh vực khác.
1.7.3 Cho phép hợp tác trên toàn thế giới
HVTH: CH1101098 Nguyễn Ngọc Lâm
12
GVPT: PGS.TS Nguyễn Phi Khứ 2013
Một trong những đóng góp quan trọng của công nghệ Grid Computing
là cho phép và đơn giản hoá hợp tác chia sẻ, làm việc giữa một cộng đồng
rộng lớn trên toàn thế giới.
Các công nghệ tính toán phân tán trước đây cũng cho phép hợp tác
nhưng chỉ trong một phạm vi nhỏ, còn Grid cho phép mở rộng trên phạm vi
toàn cầu khi đưa ra những chuẩn quan trọng cho phép các hệ thống không
đồng dạng làm việc chung với nhau để tạo nên một hệ thống tính toán ảo
cung cấp rất nhiều dạng tài nguyên khác nhau.
1.7.4 Cho phép chia sẻ tất cả các loại tài nguyên
Không chỉ cho phép chia sẻ các chu kỳ tính toán dữ liệu. Ngoài ra, Grid
còn cho phép chia sẻ tất cả các loại tài nguyên mà trước đây chưa được chia
sẻ như băng thông mạng, các thiết bị đặc biệt, phần mềm, bản quyền và các
dịch vụ, …
1.7.5 Tăng tính tinh cậy cho các hệ thống máy tính
Hiện nay, các hệ thống tính toán sử dụng các phần cứng chuyên dụng,
đắt đỏ để tăng độ tin cậy. Ví dụ, có thể sử dụng các “chip” có các mạch dự
phòng để có thể phục hồi lỗi khi có sự cố về phần cứng. Một máy tính có thể
sử dụng các bộ vi xử lý đôi, cho phép “cắm nóng”, để khi có một vi xử lý bị
hỏng, có thể thay thế cái khác mà không làm ngưng hoạt động của hệ thống.
Các giải pháp này làm tăng độ tin cậy của hệ thống, tuy nhiên với chi quá đắt
khi phụ kiện đi kèm cũng phải nhân lên.
Trong tương lai, các hướng tiếp cận mới để giải quyết vấn đề độ tin cậy

dựa nhiều hơn vào các công nghệ phần mềm hơn là các phần cứng đắt tiền.
Grid là sự khởi đầu cho các công nghệ đó. Các hệ thống trong Grid thường rẻ
và phân tán theo địa lý, do đó, nếu có sự cố về nguồn điện hay các lỗi hệ
thống khác tại một vị trí, toàn bộ phần còn lại không bị ảnh hưởng.
Các phần mềm quản trị Grid có khả năng thực thi lại công việc trên một
node khác khi phát hiện có lỗi trong hệ thống. Nếu quan trọng hơn nữa, trong
các hệ thống theo thời gian thực, nhiều bản dự phòng của các công việc quan
trọng có thể được chạy trên nhiều máy tính khác nhau trong Grid để đảm bảo
độ tin cậy tối đa.
1.7.6 Tăng khả năng quản trị các hệ thống
Mục tiêu “ảo hóa” tất cả các tài nguyên và cung cấp giao diện quản lý
đơn nhất các hệ thống hỗn tạp đem lại những cơ hội mới để quản trị tốt hơn
trong các cơ sở hạ tầng công nghệ thông tin lớn, phân tán. Bên cạnh đó đối
với tầm quản lý vĩ mô có nhiều dự án sử dụng hạ tầng thông tin, grid cho
phép quản lý độ ưu tiên sử dụng tài nguyên của các dự án này.
Trước đây mỗi dự án thường chịu trách nhiệm quản lý một số tài
nguyên, thường xảy ra tình trạng các các tài nguyên của dự án này đang nhàn
rỗi trong khi dự án kia đang gặp vấn đề, thiếu tài nguyên do gặp các sự cố
không lường trước được. Với tầm nhìn rộng hơn do grid cung cấp các tình
huống trên có thể được giải quyết một cách dễ dàng.
1.8 Các dự án nghiên cứu – phát triển công nghệ điện toán lưới trên thế giới
1.1.1 Các dự án của các công ty đa quốc gia và các tổ chức quốc tế
HVTH: CH1101098 Nguyễn Ngọc Lâm
13
GVPT: PGS.TS Nguyễn Phi Khứ 2013
[1] IBM IntraGrid & Service on Demand. www.ibm.com. Hỗ trợ bởi IBM.
Mục đích: Kết nối các phòng thí nghiệm của IBM.
[2] Hỗ trợ mô hình kinh doanh kiểu mới Oracle 10g. www.oracle.com. Hỗ
trợ bởi Oracle.
Mục đích: Cơ sở dữ liệu trên nền Grid Computing.

[3] International Virtual Data Grid Laboratory (iVDGL). www.ivdgl.org.
Hỗ trợ bởi NSF.
Mục đích: Kiến tạo dữ liệu mạng lưới quốc tế để hỗ trợ các thí nghiệm
quy mô lớn trên nền mạng lưới và ứng dụng mạng lưới.
[4] Global Grid Forum. www.ggf.org.
Mục đích: Cộng đồng quốc tế và là cơ quan chuẩn hoá trong lĩnh vực
tính toán mạng lưới.
Hội thảo GGF được tổ chức hàng quý.
[5] Global Virtual Observatory. Hỗ trợ bởi nhiều tổ chức vật lý thiên văn.
Xem U.K. AstroGrid và U.S. NVO.
[6] Sun Grid Engine. www.sun.com. Hỗ trợ bởi Sun Microsystems.
Mục đích: Phát triển hạt nhân tính toán mạng lứơi cho máy chủ hỗ trợ
bởi Sun (Solaris, Linux).
[7] NSF MiddleWare. www.nms.org. Hỗ trợ bởi NSF.
Mục đích: Website chuyển giao công nghệ nền cho grid computing.
[8] GLOBUS. www.globus.org. Hỗ trợ bởi NSF. Tổ chức phi lợi nhuận do
một số chính phủ và công ty tài trợ để phát triển công nghệ và công cụ
tính toán mạng lưới.
1.1.2 Các dự án của vùng Châu Á – Thái bình dương
[1] APGrid. www.apgrid.net. Hỗ trợ bởi E-Japan. Là diễn đàn khu vực về
các công nghệ mạng lưới.
[2] PRAGMA. www.pragma-grid.org. Hỗ trợ bởi NSF và các viện, trường.
Là tổ chức liên kết các trường đại học, viện nghiên cứu trong khu vực
để giải quyết các vấn đề tầng trung của mạng lưới.
[3] BioGrid. www.biogrid.jp. Hỗ trợ bởi E-Japan. Ứng dụng công nghệ
mạng lứơi trong các lĩnh vực nghiên cứu sinh học, y học, dược phẩm.
[4] EcoGrid. www.ecogrid.org. Hỗ trợ bởi chính phủ Đài Loan. Dự án bảo
vệ môi sinh vùng núi.
[5] NanoGrid. www.kyushu-u.ac.jp. Hỗ trợ bởi E-Japan. Ứng dụng grid
trong nghiên cứu và phát triển vật liệu nano.

[6] MolecularGrid. Ứng dụng grid trong phân tích và phát triển vật liệu
nano của Hàn quốc.
[7] N*Grid. Hỗ trợ bởi Korea MIC. Phát triển các ứng dụng cộng đồng
[8] Singapore National Grid Project. Hỗ trợ bởi A*start. Phát triển các ứng
dụng Grid.
[9] BioGrid IO-IT VN (): Hệ thống Grid nghiên
cứu về sinh học của phân viện CNTT Hồ Chí Minh.
[10] EDAGrid (): Hệ thống Grid cấp
đại học của Đại học Bách Khoa TP.HCM.
HVTH: CH1101098 Nguyễn Ngọc Lâm
14
GVPT: PGS.TS Nguyễn Phi Khứ 2013
1.1.3 Các dự án của Châu Âu
[1] CrossGrid. www.crossgrid.org. Hỗ trợ bởi European Union. Phát triển,
cài đặt và khia thác các thành phần mới của mạng lưới cho các ứng
dụng tính toán tương tác, ứng dụng dữ liệu lớn.
[2] DATATAG. www.datatag.org. Hỗ trợ bởi European Union. Nghiên cứu
và phát triển công nghệ cho dự án transAtlantic Grid.
[3] European Union (EU) DataGrid. www.eu-datagrid.org. Hỗ trợ bởi
European Union. Kiến tạo và ứng dụng mạng lưới trong lĩnh vực vật lý
năng lượng cao, khoa học môi trường, sinh tin học.
[4] Damien. www.hlrs.de/organization/pds/projects/damien. Hỗ trợ bởi
European Union. Phát triển các thành phần chuẩn để tạo nên môi
trường trung tầng (midle-ware) cho các ứng dụng mô phỏng và hiển thị
phân tán.
[5] European Grid of Solar Observatories (EGSO). Hỗ trợ bởi European
Union. Kiến tạo kho dữ liệu ảo tạo lập bới các dữ liệu về mặt trời trong
các trung tâm dữ liệu trải rộng khắc Châu Âu trở thành tập hợp dữ liệu
mạng lứơi (Data Grid). www.mssl.ucl.ac.uk/grid/egso.
[6] EuroGrid & Grid Interoperability (GRIP). www.eurogrid.org. Hỗ trợ

bởi European Union. Kiến tạo các công nghệ giúp truy cập từ xa các
các tài nguyên siêu tính toán và mã mô phỏng, tương tác với Globus.
[7] Grid Resources for Industrial Applications (GRIA). Hỗ trợ bởi
European Union. Thử nghiệm mạng lưới hướng ứng dụng, tập trung
vào gia công các dịch vụ tính toán phân tích cấu trúc.
[8] GridLab. www.gridlab.org. Hỗ trợ bởi European Union. Ứng dung và
phát triển công nghệ Grid.
[9] INFN Grid. www.server11.infn.it/grid/. Hỗ trợ bởi chính phủ Ý. Ứng
dụng và phát triển công nghệ Grid.
[10] Unicore. Hỗ trợ bởi chính phủ Đức. Các công nghệ truy cập từ xa vào
các siêu máy tính.
1.1.4 Các dự án của U.K
[1] AstroGrid. Hỗ trợ bởi U.K.eScience
Program. Xây dựng hạ tầng mạng lưới cho Đài thiên văn ảo, tích hợp
giao tiếp với CSDL thiên văn và cho phép truy cập từ xa cũng như mô
phỏng dữ liệu.
[2] Comb-e-chem. Hỗ trợ bởi U.K. eScience
Program. Hỗ trợ tổng hợp của các mẫu phát âm bằng cách kết hợp cấu
trúc và nguồn dữ liệu bên trong hệ thống chia sẻ thông tin mạng lưới và
mô trường chia sẻ kiến thức.
[3] Discovery Net. Hỗ trợ bởi U.K. eScience Program. Thử nghiệm e-
Science để xử lý dữ liệu với khối lượng lớn trong các lĩnh vực hoá sinh,
nghiên cứu môi trường, v.v.v
[4] Distributed Aircraft Maintenance Environment. Hỗ trợ bởi U.K.
eScience Program. Xây dựng hệ thống hỗ trợ quyết định dựa trên nền
Grid để bảo trì động cơ máy bay. />HVTH: CH1101098 Nguyễn Ngọc Lâm
15
GVPT: PGS.TS Nguyễn Phi Khứ 2013
[5] Grid Enabled Optimisation & DesIgn Search for Engineering
(GEODISE). Hỗ trợ bởi U.K. eScience

Program. Hỗ trợ truy cập dựa trên grid tới các kho tri thức, tối ưu hoá
các công cụ tìm kiếm, phân tích độ bền vững của các mẫu thiết kế.
[6] GridPP. www.gridpp.ac.uk . Hỗ trợ bởi U.K. eScience Program. Tạo
lập và ứng dụng mô hình tính toán mạng lưới trong nghiên cứu vật lý
hạt tử (Particle Physics) của U.K.
[7] MyGrid. www.mygrid.org.uk. Hỗ trợ bởi U.K. eScience Program. Phát
triển và ứng dụng khoa học điện tử eScience trong sinh tin học.
[8] Reality Grid. Hỗ trợ bởi U.K. eScience
Program. Hỗ trợ mô hình hoá và mô phỏng thực của các khối vật chất
đặc ở mức phân tử và hạt tử.
[9] UK Grid Center. www.grid-support.ac.uk. Hỗ trợ bởi U.K. eScience
Program. Trung tâm hỗ trợ các các dự án Grid trên lãnh thổ U.K.
1.1.5 Các dự án của Mỹ
[1] Access Grid. www.accessgrid.org. Hỗ trợ bởi DOE, NSF. Tạo lập hệ
thống cộng tác trên mạng, sử dụng các công cụ hiển thị truyền thống.
[2] DISCOM. www.cs.sandia.gov/discom. DOE Defense Programs. Kiến
tạo hệ thống tác nghiệp Grid với khả năng truy xuất tới các phòng thí
nghiệm chế tạo vũ khí của Bộ năng lượng Mỹ.
[3] DOE Science Grid. www.sciencegrid.org . DOE Office of Science.
Kiến tạo hệ thống tác nghiệp Grid với khả năng truy cập tới các tài
nguyên và ứng dụng tại các phòng thí nghiệm của Bộ năng lượng Hoa
kỳ và các trường đại học tham gia.
[4] Earth System Grid (ESG). www.earthsystemgrid.org . DOE Office of
Science.Cung cấp và phân tích các tập hợp mô hình khí hậu lớn phục
vụ cộng đồng dự báo thời tiết.
[5] Fusion Collaboratory.www.fusiongrid.org. DOE Office of Science.
Kiến tạo phòng thí nghiệm hợp tác tính toán quốc gia cho nghiên cứu
khuếch xạ.
[6] Globus. www.globus.org . DARPA, DOE, NASA, NSF.Nghiên cứu xây
dựng hạ tầng và công cụ cho Grid dựa trên cộng đồng, mã nguồn mở,

kiến trúc mở của Grid.
[7] Grid Research Integration Development & Support (GRIDS) Center.
www.grids-center.org . NSF. Tích hợp, triển khai, hỗ trợ của hạ tầng lớp
trung cho nghiên cứu – giáo dục của NSF.
[8] Grid Application Development Software.
www.hipersoft.rice.edu/grads .NSF. Nghiên cứu phương pháp luận, mô
hình khung phát triển ứng dụng mạng lưới.
[9] Grid Physics Network (GriPhyN). www.griphyn.org. NSF. Nghiên cứu
- Phát triển công nghệ trong lĩnh vực phân tích dữ liệu của vật lý thực
nghiệm: ATLAS, CMS, LIGO, …
[10] Information Power Grid. www.ipg.nasa.gov. NASA. Kiến tạo và ứng
dụng Grid cho khoa học hàng không vũ trụ.
HVTH: CH1101098 Nguyễn Ngọc Lâm
16
GVPT: PGS.TS Nguyễn Phi Khứ 2013
[11] Network for Earthquake Eng. Simulation Grid. www.neesgrid.org. NSF.
Kiến tạo và ứng dụng Grid trong nghiên cứu động đất.
[12] National Virtual Observatory (NVO). www.srl.caltech.edu/nvo. NSF.
Kiến tạo và ứng dụng Grid để phân tích xử lý dữ liệu trong thiên văn.
[13] Particle Physics Data Grid (PPDG). www.ppdg.net. DOE Office of
Science. Kiến tạo và ứng dụng mạng lưới nhằm phân tích dữ liệu trong
vật lý năng lượng cao và các thí nghiệm vật lý hạt nhân.
[14] Sothern California Earthquake Center 2. www.scec.org. NSF. Hệ
thống mô hình hoá địa chất đầy đủ, sử dụng Grid và hệ thống dựa trên
tri thức.
[15] TeraGrid. www.teragrid.org. NSF. Hạ tầng mạng kết nối bốn vị trí tài
nguyên khoa học lớn của Mỹ với băng thông 40 Gb/s.
II. KIẾN TRÚC VÀ MÔI TRƯỜNG PHÁT TRIỂN MẠNG LƯỚI
2.1 Kiến trúc của hệ thống điện toán lưới
Lưới được xây dựng trên nền tảng kiến trúc mở và phân tầng. Trong mỗi

tầng của lưới, các thành phần chia sẻ những thuộc tính chung và được bổ sung
những tính năng mới mà không làm ảnh hưởng đến các tầng khác.
Kiến trúc 5 tầng của Grid như sau:
Hình 2.1 Kiến trúc phân tầng của Grid so với kiến trúc phân tầng Internet
2.1.1 Tầng Fabric (Tầng chế tác)
HVTH: CH1101098 Nguyễn Ngọc Lâm
17
GVPT: PGS.TS Nguyễn Phi Khứ 2013
Bao gồm các tài nguyên cục bộ phân tán trên mạng, chúng bị ràng buộc
bởi cơ chế quản lý tài nguyên và cơ chế thẩm tra. Tài nguyền của tầng Fabric
gồm các nhóm sau:
 Tài nguyên tính toán: đó là các kỹ thuật cần thiết để kiểm soát cũng
như điều khiển việc thực thi công việc.
 Tài nguyên lưu trữ: là kỹ thuật cần cho việc lấy về/tải lên các tập tin,
cho phép đọc một phần tập tin hoặc chọn lọc dữ liệu từ tập tin ở xa.
 Tài nguyên mạng: đó là các kỹ thuật quản lý đối với các tài nguyên
được cấp cho môi trường mạng truyền thông.
 Các kho mã nguồn: đây là một dạng đặc biệt của tài nguyên lưu trữ.
Là nơi quản lý tất cả các loại tài nguyên và các phiên bản của mã
nguồn.
 Các bảng danh mục (catalog): đây là một dạng đặc biệt của các tài
nguyên lưu trữ.
2.1.2 Tầng kết nối (Connectivity layer)
Tầng này đóng vai trò rất quan trọng, nó gồm các giao thức xác thực và
truyền thông. Truyền thông bao gồm việc truyền thông tin, định tuyến và đặt
tên.
Những giao thức này tương tự các giao thức IP, TCP, UDP trong bộ
giao thức TCP/IP và các giao thức tầng ứng dụng như DNS, OSPF, RSVP,…
Vấn đề bảo mật được giải quyết bằng giải pháp xác thực như:
 Cơ chế đăng nhập một lần (Single Sign On): cho phép người dùng chỉ

cần đăng nhập vào mạng lưới một lần duy nhất cho tất cả các truy cập
các tài nguyên được phép trong tầng chế tác cho đến khi kết thúc đăng
nhập.
 Cơ chế ủy quyền (Delegation, Proxy): người dùng có thể ủy quyền
truy cập tài nguyên hợp pháp lại cho một chương trình trong một
khoảng thời gian xác định. Chương trình này cũng có thể ủy quyền có
điều kiện một phần các tập quyền của nó cho chương trình con khác.
 Cơ chế tích hợp đa giải pháp bảo mật địa phương (Integration with
various local security solutions): cơ chế bảo mật mạng lưới phải có
khả năng giao tiếp trong với các cơ chế bảo mật địa phương mà không
yêu cầu thay thế toàn bộ các giải pháp bảo mật hiện có, nhưng cần có
cơ chế ánh xạ bảo mật trong các môi trường cục bộ khác nhau.
 Cơ chế quan hệ tin tưởng dựa trên người dùng (User-based Trust
Relationships): người dùng có thể sử dụng các loại tài nguyên có
được từ sự kết hợp của nhiều nhà cung cấp khác nhau.
2.1.3 Tầng tài nguyên (Resource layer)
Tầng này được xây dựng trên nền tảng sẵn có của tầng kết nối. Những
giao thức trong tầng tài này sẽ gọi các chức năng trong tầng chế tác để truy
cập và sử dụng các loại tài nguyên cục bộ.
 Giao thức thông tin (Information protocol): cho phép lấy các thông tin
về cấu trúc, tình trạng của một loại tài nguyên nào đó trong mạng lưới
HVTH: CH1101098 Nguyễn Ngọc Lâm
18
GVPT: PGS.TS Nguyễn Phi Khứ 2013
 Giao thức quản lý (Management protocol): dùng để sắp xếp quản lý
thứ tự các truy cập đến các tài nguyên được chia sẻ
2.1.4 Tầng kết hợp (Collective layer)
Trong khi tầng tài nguyên chỉ cho phép truy cập đến một loại tài
nguyên đơn thì tầng kết hợp lại chứa các giao thức và dịch vụ cho phép giao
tiếp giữa các tài nguyên trong mạng lưới. Tầng này bao gồm các dịch vụ

chính như sau:
 Các dịch vụ thư mục (Directory Services): cho phép tìm hiểu sự tồn
tại cũng như thuộc tính của các nguyên như loại tài nguyên, tính khả
dụng …
 Các dịch vụ cấp phát chung, lập lịch, môi giới (Co-allocation,
Scheduling & Broker Services): cho phép gửi yêu cầu đến một hay
nhiều máy chủ cho mục đích cấp phát, lập lịch và môi giới tài nguyên
tương ứng.
 Các dịch vụ giám sát và dự báo (Monitoring and Diagnostic
Services): cho phép hệ thống hỗ trợ kiểm soát tài nguyên trong lưới.
 Các dịch vụ nhân bản dữ liệu (Data Replication Services): hỗ trợ việc
quản lý lưu trữ tài nguyên, giúp việc truy cập tài nguyên lưới trở nên
dễ dàng hơn.
 Các hệ hỗ thống trợ lập trình lưới (Grid-enable Programming
Systems): gồm các thư viện lập trình.
 Hệ thống quản lý tải và môi trường cộng tác (Workload Management
System & Collaboration Framework): cung cấp các đặc tả, quản lý
tính đồng bộ, đa luồng, đa thành phần… trong các tiến trình tính toán.
 Dịch vụ tìm kiến phần mềm (Software Discovery Service): hỗ trợ tìm
kiếm và lựa chọn phần mềm cài đặt và làm nền tảng cho mạng lưới.
2.1.5 Tầng ứng dụng (Application layer)
Đây là tầng trên cùng trong kiến trúc phân tầng điện toán lưới. Các ứng
dụng lưới này được xây dựng trên cơ sở gọi các hàm, các dịch vụ được cung
cấp bởi các tầng phía dưới. Vì vậy, ở tầng này ta phải thiết kế và cài đặt các
dịch vụ, hàm cụ thể cho các thao tác như quản lý tài nguyên, truy cập dữ liệu,
tìm kiếm tài nguyên.
Người dùng yêu cầu chạy ứng dụng, nhận về kết quả mà không hề biết
ứng dụng có được chạy ở đâu trên hệ thống lưới, sử dụng tài nguyên gì, ở
đâu. Vì vậy, hệ thống lưới được coi như một máy tính ảo được kết hợp bởi
nhiều tài nguyên khác nhau.

Như vậy, môi trường lưới hứa hẹn rất nhiều lợi thế không những cho
người sử dụng mà còn cho cả các doanh nghiệp, tổ chức. Vấn đề cấp thiết đặt
ra là cần phải xây dựng một nền tảng cho môi trường lưới hay nói cách khác
là phải thiết kế cơ sở hạ tầng lưới, các thành phần và các dịch vụ cơ bản mà
một lưới có thể cung cấp.
2.2 Cấu trúc một hệ thống lưới
Hiện nay có rất nhiều giải pháp về phần mềm khác nhau để xây dựng một
hệ thống lưới. Các giải pháp này tuy có nhiều điểm khác nhau về mặt kỹ thuật
HVTH: CH1101098 Nguyễn Ngọc Lâm
19
GVPT: PGS.TS Nguyễn Phi Khứ 2013
nhưng tương đối thống nhất về cấu trúc cơ bản của hệ thống. Điều này giúp cho
việc hợp tác giữa các hệ thống lưới trong tương lai có thể trở nên dễ dàng hơn.
Sau đây, là cấu trúc một hệ thống lưới ở mức tổng quan và cơ bản nhất,
được đề xuất bởi IBM.
Hình 2.2 Cấu trúc một hệ thống lưới do IBM đề xuất
 Portal (Cổng giao tiếp): là một giao diện cho phép người dùng sử dụng
các ứng dụng lưới, do đó lưới trở nên trong suốt với người dùng.
 GSI – Grid Security System (Thành phần bảo mật): thành phần bảo mật sẽ
kiểm tra, chứng thực thông tin người dùng cũng như kiểm tra quyền hạn
của người dùng khi thao tác với hệ thống. Thành phần này còn chịu trách
nhiệm mã hóa dữ liệu trao đổi giữa người dùng và hệ thống nếu có nhu
cầu.
 MDS (Monitoring and Discovery Service): hệ thống lưới là một hệ thống
biến động, các tài nguyên nằm phân tán, có thể tham gia và rời bỏ hệ
thống một cách thường xuyên. Do đó, nhiệm vụ của MDS là lưu trữ thông
tin và luôn cập nhật những thay đổi về hệ thống.
 Broker (Thành phần giao tiếp): khi người dùng thực thi một ứng dụng, hệ
thống cần xác định tài nguyên tính toán nào phù hợp nhất để thực thi ứng
dụng đó. Vai trò này sẽ do broker đảm nhận. Broker sẽ giao tiếp với MDS

để lấy những thông tin của hệ thống, dựa vào các giải thuật được cài đặt
sẵn để lựa chọn tài nguyên phù hợp.
 Scheduler (Bộ lập lịch ): sau khi đã xác định được tài nguyên đảm nhận
ứng dụng, ứng dụng cần được điều phối lên tài nguyên để thực thi vào
thời điểm thích hợp. Một tài nguyên vào một thời điểm có thể đảm nhận
nhiều ứng dụng, quá trình điều phối trên tài nguyên sẽ do scheduler quyết
định. Ở nhiều hệ thống, scheduler không được đặt ở mức chung toàn hệ
HVTH: CH1101098 Nguyễn Ngọc Lâm
20
GVPT: PGS.TS Nguyễn Phi Khứ 2013
thống mà ở mỗi tài nguyên, tài nguyên có chính sách riêng và tự quyết
định hoạt động của mình.
 GASS (Grid Access to Secondary Storage): đảm trách nhiệm vụ vận
chuyển ứng dụng và các dữ liệu cần thiết đến tài nguyên thực thi.
 GRAM (Grid Resource Allocation Manager): đảm nhận việc kích hoạt
thực thi ứng dụng trên tài nguyên, kiểm tra trạng thái của ứng dụng (thất
bại/thành công) và nhận kết quả trả về khi hoàn tất.
2.3 Các chuẩn cho môi trường lưới
2.3.1 Tại sao phải xây dựng các chuẩn cho môi trường lưới ?
Lưới tính toán thường gồm một tập các tài nguyên không đồng nhất.
Một ứng dụng lưới thường có nhiều thành phần, dịch vụ khác nhau.
Các dịch vụ Grid thường xuyên tương tác với nhau. Càng nhiều dịch vụ
thì số tương tác giữa chúng càng tăng và rất dễ dẫn đến tình trạng hỗn loạn.
Vấn đề giao tiếp giữa các dịch vụ lưới sẽ rất phức tạp. Do đó, cần thiết
là phải có chuẩn định nghĩa giao diện giao tiếp chung cho các dịch vụ này.
2.3.2 OGSA/OGSI và Grid Services là gì?
OGSA và OGSI được Global Grid Forum (GGF) phát triển cho mục tiêu
chuẩn hoá. GGF định nghĩa các chuẩn mạng lưới trong phạm vi các trình ứng
dụng, các mô hình lập trình, quản trị dữ liệu, bảo mật, thực thi, lập lịch và
quản lý tài nguyên.

2.3.2.1 OGSA (Open Grid Services Architecture)
OGSA là kiến trúc dịch vụ lưới mở cho phép liên lạc qua nhiều môi
trường hỗn tạp và phân tán về địa lý. OGSA định nghĩa một chuẩn kiến
trúc mới cho các ứng dụng chạy trên nhưng không đưa ra đặc tả chi tiết
và kỹ thuật cần để triển khai một dịch vụ lưới.
2.3.2.2 OGSI (Open Grid Services Infrastructure)
OGSI nặng về đặc tả kỹ thuật cho các khái niệm được đưa ra trong
OGSA. OGSI định nghĩa các cơ chế tạo mới, quản trị và trao đổi thông
tin giữa các dịch vụ lưới. Đặc biệt, OGSI còn định nghĩa các giao diện
chuẩn và qui tắc của dịch vụ lưới - xây dựng trên cơ sở các dịch vụ web.
2.3.2.3 Grid Services
Grid Services là các dịch vụ lưới được mở rộng dựa trên nền tảng
Web Services (XML, WSDL - Ngôn ngữ mô tả dịch vụ Web, SOAP
-Giao thức cho kiến trúc hướng dịch vụ, UDDI).
HVTH: CH1101098 Nguyễn Ngọc Lâm
21
GVPT: PGS.TS Nguyễn Phi Khứ 2013
Hình 2.3 Các chuẩn cho môi trường lưới
2.3.3 Chuẩn OGSA
OGSA xác định phạm vi các định dạng dịch vụ để hỗ trợ cho hệ thống
mạng lưới. Nó xác định tập các dịch vụ nền tảng thiết yếu cho trình ứng dụng
và hệ thống, xác định các chức năng được yêu cầu ở mức cao đối với mối
quan hệ tương tác giữa các dịch vụ lõi.
Mục tiêu của OGSA định nghĩa các phương thức và cơ chế chuẩn cho
của các hệ thống lưới như: cách giao tiếp giữa các dịch vụ, thiết lập định
danh, cách định quyền truy cập, phát hiện tài nguyên-dịch vụ, thông báo lỗi,
và quản lý tập các dịch vụ…
2.3.3.1 Các thành phần cơ bản của OGSA
Cơ sở hạ tầng dịch vụ lưới mở OGSI: xây dựng trên các kỹ thuật
dịch vụ web và lưới, OGSI định nghĩa cơ chế tạo, quản lý và chuyển đổi

thông tin giữa các dịch vụ lưới.
Các dịch vụ OGSA: xây dựng trên các cơ chế OGSI để định nghĩa
các giao diện và các hành vi kết hợp cho các chức năng không được hỗ
trợ trực tiếp bởi OGSI như phát hiện dịch vụ, truy xuất dữ liệu, tích hợp
dữ liệu…
Các mô hình OGSA: hỗ trợ các đặc tả giao diện bằng cách định
nghĩa các mô hình cho các tài nguyên chung và các kiểu dịch vụ.
2.3.3.2 Các dịch vụ nền (Platform Services)
OGSA dùng thuật ngữ platform services để chỉ những dịch vụ cung
cấp các chức năng cơ bản:
 Cung cấp các chức năng nền dùng để xây dựng các dịch vụ lưới
khác.
 Cung cấp các chức năng chung dùng trong một số các dịch vụ
mức cao.
HVTH: CH1101098 Nguyễn Ngọc Lâm
22
GVPT: PGS.TS Nguyễn Phi Khứ 2013
 Cung cấp các chức năng được thiết kế để dùng cho các quan hệ
mở rộng.
Một chức năng được cung cấp bởi một dịch vụ nền sẽ được mô tả
trong một số các dịch vụ mức cao. Hiện tại, tập các dịch vụ nền của
OGSA bao gồm:
 WS-Agreement: cung cấp một tập giao diện hỗ trợ việc điều chỉnh
các chính sách, các thoả thuận mức dịch vụ, đặt trước, …
 CMM (Common Management Model): cung cấp một cơ sở hạ
tầng có thể quản lý được cho các tài nguyên trong OGSA. CMM
định nghĩa mô hình cư xử cơ sở cho tất cả các tài nguyên và các
bộ quản lý tài nguyên trong lưới, công thêm chức năng quản lý
các mối quan hệ và quản lý vòng đời.
 OGSA Data Services (các dịch vụ dữ liệu OGSA): cung cấp các

chức năng cơ bản để quản lý dữ liệu trong một môi trường lưới.
2.3.4 Chuẩn OGSI
OGSI giới thiệu một mô hình tương tác cho các dịch vụ lưới. Mô hình
này cung cấp một phương thức cố định bằng cách đưa ra các giao diện dùng
trong phát hiện, quản lý vòng đời, trạng thái, tạo-huỷ, thông báo sự kiện và
quản lý tham chiếu.
Hình 2.4 Mối quan hệ giữa OGSA va OGSI
2.3.4.1
Factory
Factory là cơ chế (giao diện) cung cấp cách tạo các dịch vụ lưới
mới. Các Factory có thể tạo ra nhiều thể hiện tạm của một chức năng hạn
chế, chẳng hạn một bộ lập lịch tạo một dịch vụ để mô tả cách thực hiện
một công việc thông thường hoặc chúng có thể tạo ra các dịch vụ tồn tại
trong thời gian dài như việc nhân bản cục bộ một tập dữ liệu được sử
dụng liên tục.
2.3.4.2 Life cycle
Life cycle là cơ chế dùng để ngăn các dịch vụ lưới truy cập đến các
tài nguyên không được yêu cầu. Các dịch vụ lưới được tạo với vòng đời
xác định.
HVTH: CH1101098 Nguyễn Ngọc Lâm
23
GVPT: PGS.TS Nguyễn Phi Khứ 2013
2.3.4.3 State management
Mọi dịch vụ lưới đều có một trạng thái. OGSI xác định một khung
để biểu diễn các trạng thái và một cơ chế để kiểm duyệt hoặc sửa đổi
chúng. OGSI cũng quy định số các trạng thái tối thiểu mà mỗi dịch vụ
lưới phải có.
2.3.4.4 Service groups
Service groups là tập các dịch vụ lưới được chỉ định cho một mục
đích riêng nào đó.

2.3.4.5 Notification
Notification là các dịch vụ tương tác với nhau thông qua cơ chế
trao đổi thông điệp trên các lời triệu gọi dịch vụ. Thông tin trạng thái
được mô hình cho các dịch vụ lưới sẽ thay đổi khi hệ thống chạy.
2.3.4.6 Handle Map
Dùng cho các vấn đề nhận dạng. Khi các Factory được sử dụng để
tạo ra một thể hiện mới của dịch vụ lưới, Factory trả về định danh của
thể hiện mới này. Định danh này là sự kết hợp của Grid Service Handle
(GSH) và một Grid Service Reference (GSR). GSH cung cấp tham chiếu
đến định danh của dịch vụ lưới còn GSR có thể thay đổi theo thời gian
sống của các dịch vụ lưới.
2.3.5 Các tiêu chuẩn liên quan đến dịch vụ Web
SOAP (Simple Object Access Protocol): là cơ chế truyền thông độc lập
với cấu hình nền và các giao thức khác. Nó dùng XML để trao đổi thông tin
trong môi trường phân tán. Nó hỗ trợ nhiều kiểu trao đổi thông tin khác nhau
bao như: mô hình trao đổi thông tin sau khi gọi thủ tục từ xa hoặc mô hình
trao đổi thông tin trong một cơ chế hướng thông báo. SOAP thường độc lập
về giao thức, độc lập về ngôn ngữ, độc lập về cấu hình và hệ điều hành, hỗ
trợ các thông báo XML SOAP.
UDDI (Universal Description Discoverry and Intergation): kho chứa
phần lưu trữ các dịch vụ Web. UDDI là phần định dạng mô tả dịch vụ Web
chuẩn. Một đăng ký UDDI có thể chứa siêu dữ liệu cho bất kỳ kiểu dịch vụ
nào. UDDI cho phép tìm kiếm và khai thác các dịch vụ Web hiệu quả hơn.
WSDL (Web Service Definition Language): ngôn ngữ định nghĩa các
dịch vụ web. Là ngôn ngữ cung cấp cách mô tả giao diện đặc biệt của các
dịch vụ web và các API. WSDL có thể được xem như là tài liệu được viết
bằng XML.
XML (eXtensible Markup Language): ngôn ngữ đánh dấu mở rộng. Là
một siêu ngôn ngữ, sử dụng để mô tả ngữ nghĩa của đối tượng và mô tả phần
cấu trúc bên trong một kiểu mở.

WSIL (WS-Inspection Language): tận dụng định dạng của XML làm
tăng khả năng khai thác và tập hợp những mô tả của dịch vụ web đơn giản và
mở rộng hơn. WSIL là cơ chế đơn giản để khai thác dịch vụ web, nó là một
định dạng XML.
2.4 Hạ tầng trong môi trường lưới
2.4.1 Yêu cầu về hạ tầng lưới
HVTH: CH1101098 Nguyễn Ngọc Lâm
24
GVPT: PGS.TS Nguyễn Phi Khứ 2013
Yêu cầu chức năng cơ bản: khám phá và môi giới; đo đạc và tính toán;
chia sẻ dữ liệu; triển khai; tổ chức ảo; giám sát; chính sách
Yêu cầu bảo mật: bảo mật đa phần; giải pháp bảo mật phạm vi; xác
thực, uỷ quyền và cấp quyền; mã hoá; chứng thực
Các yêu cầu về đặc tính của hệ thống: phải có khả năng chịu lỗi, phát
hiện được hiểm hoạ, tự "chăm sóc sức khỏe" của tài nguyên
Quản lý tài nguyên: đồng nhất cách cung cấp, ảo hoá tài nguyên, tối ưu
việc sử dụng
2.4.2 Yêu cầu về đặc tính của hệ thống lưới
Có khả năng giám sát, theo dõi sự tấn công, quấy rầy, quản lý được các
ứng dụng kế thừa, có thể "hệ thống hoá" và "tự động hoá" các hoạt động
chuẩn cho bộ quản trị.
Có khả nằng khởi tạo yêu cầu tương tác theo thoả thuận giữa client và
server và tạo nhóm/tập các dịch vụ.
Cho phép một số dịch vụ được kế thừa và sử dụng lại các dịch vụ đã
tồn tại.
2.4.3 Yêu cầu về quản lý tài nguyên
Có khả năng lập lịch và cung cấp băng thông động, có khả năng truy
cập theo lô và truy cập tương tác.
Hỗ trợ quản lý và giám sát việc sử dụng, lập lịch động cho các tác vụ,
đảm bảo các tài nguyên được sử dụng như nhau.

Có khả năng đặt trước tài nguyên, có cơ chế ghi lại các xử lý, và phải
quản lý được luồng công việc và phải định giá được việc sử dụng tài nguyên
để lập hoá đơn cho người dùng.
2.4.4 Yêu cầu bảo mật trong môi trường lưới
Xác thực, đăng nhập (Authentication): thẩm định tính hợp lệ của người
được khai báo và định danh người này là ai.
Quyền hạn (Access Control): đảm bảo mỗi người dùng chỉ sử dụng các
tài nguyên, dịch vụ được phép
Toàn vẹn dữ liệu: đảm bảo dữ liệu không bị thay đổi hay bị xóa đi bởi
người không có thẩm quyền.
Bảo mật dữ liệu: Các thông tin nhạy cảm cần đảm bảo không bị phát
hiện bởi những người khác.
Quản lý khóa: liên quan đến các vấn đề cấp phát khóa, xác thực, tạo ra
phiên bản bảo mật.
2.4.5 Hạ tầng an ninh mạng lưới
Hạ tầng an ninh mạng lưới là cơ chế cho phép xác thực và truyền thông
an toàn trên mạng lưới. Nó cung cấp một số dịch vụ như: khả năng xác thực
lẫn nhau, cơ chế đăng nhập một lần, cơ chế uỷ quyền.
Hạ tầng an ninh mạng lưới dựa trên các công nghệ mã khoá công khai
(Public Key Infrastructure hay PKI), Chứng thư X.509 (Certificate), Nghi
thức truyền thông bảo mật (Secure Socket Layer hay SSL).
HVTH: CH1101098 Nguyễn Ngọc Lâm
25

×