Tải bản đầy đủ (.docx) (22 trang)

Tiểu luận môn Điện toán lưới và đám mây TÌM HIỂU VỀ GLITE MIDDLEWARE

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.99 MB, 22 trang )

ĐIỆN TOÁN LƯỚI VÀ ĐÁM MÂY
CH1301016 - Vũ Quốc Hưng
Tr. 1
TÌM HIỂU VỀ
GLITE MIDDLEWARE
Đề tài:
TIỂU LUẬN MÔN HỌC:
ĐIỆN TOÁN LƯỚI VÀ ĐÁM MẤY
ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
GVHD: PGS. TS. NGUYỄN PHI KHỨ
HVTH: VŨ QUỐC HƯNG
MSHV: CH1301016

ĐIỆN TOÁN LƯỚI VÀ ĐÁM MÂY
CH1301016 - Vũ Quốc Hưng
Tr. 1
Mục lục
ĐIỆN TOÁN LƯỚI VÀ ĐÁM MÂY
CH1301016 - Vũ Quốc Hưng
Tr. 1
Danh mục hình vẽ
ĐIỆN TOÁN LƯỚI VÀ ĐÁM MÂY
CH1301016 - Vũ Quốc Hưng
Tr. 1
Tóm tắt
Hiện nay, tính toán lưới đang nổi lên như một công nghệ nhiều hứa hẹn trong
tương lai, với khả năng tập hợp các nguồn tài nguyên nhàn rỗi, nhằm hướng tới các
mục tiêu về hiệu năng tính toán và khả năng chia sẻ, truyền thông dữ liệu. Nhiều trung
tâm nghiên cứu và các tổ chức trên thế giới đáng áp dụng và triển khai công nghệ này
vào thực tiễn, mở ra các khả năng mới trong lĩnh vực công nghệ thông tin cũng như


các lĩnh vực khác.
Môi trường tính toán lưới là một hạ tầng kết nối nhiều hệ thống máy tính, hệ
thống mạng, hệ thống cơ sở dữ liệu được sở hữu và quản lý bởi nhiều tổ chức, cá nhân
nhằm cung cấp môi trường tính toán ảo duy nhất với hiệu năng cao cho người sử
dụng. Nhờ đó tính toán lưới là một giải pháp hiệu quả đối với các bài toán đòi hỏi một
lượng tài nguyên lớn nhất định. Để xây dựng một hệ thống tính toán lưới, cần có một
middleware đảm nhiệm vai trò làm trung gian, cung cấp môi trường và các dịch vụ cơ
bản cần thiết. Các bộ công cụ được xây dựng nhằm mục đích trợ giúp việc xây dựng
hệ thống grid như Globus, gLite, UNICORE vẫn không ngừng phát triển. Đặc biệt,
gLite là một middleware được cộng đồng nghiên cứu Châu Âu hỗ trợ và phát triển
mạnh trong những năm gần đây. Bài tiểu luận này chủ yếu nói về glite và cách glite
hoạt động trên grid.
ĐIỆN TOÁN LƯỚI VÀ ĐÁM MÂY
CH1301016 - Vũ Quốc Hưng
Tr. 1
I. Giới thiệu chung về Grid và Grid Middleware
Hệ thống Grid là một tập hợp những tài nguyên tính toán, tài nguyên lưu trữ,
tài nguyên kết nối, và thiết bị khoa học. Những tài nguyên này là những yếu tố tạo nên
phần fabric của Grid. Tài nguyên tính toán có thể là siêu máy tính, máy chủ, hệ thống
cụm máy tính hoặc là máy tính cá nhân thường là được phân bố trên những vùng địa lí
khác nhau, những tổ chức khác nhau.
Những dụng cụ khoa học như kính thiên văn hoặc mạng cảm biến cung cấp dữ
liệu thời gian thực để lưu trữ vào cơ sở dữ liệu. Những thiết bị khoa học này thường
không tập trung, không đồng nhất và lai ghép. Để sử dụng những tài nguyên này một
cách hiệu quả, ta cần phải có một số middleware để truy cập tới tài nguyên trên Grid,
điều phối sử dụng tài nguyên theo chính sách của các VO và bảo vệ cho người cung
cấp dịch vụ.
Grid Middleware cung cấp cho người dùng khả năng tính toán giống nhau trên
mọi nền tảng, truy cập đồng nhất vào các tài nguyên không đồng nhất trên Grid. Quá
trình phát triển phần grid middleware cần phải có khả năng chia sẻ, khả năng sử dụng

lại, và khả năng mở rộng để làm giàm thiểu thời gian cần thiết cho việc phát triển và
triển khai lại. Grid middleware là một tập hợp những API, giao thức, và phần mềm
cho phép tạo ra và sử dụng hệ thống Grid. Mặc dù grid thường được sử dụng bên
trong một hoặc một số tổ chức, và việc phát triển các API như là một phần của các
middleware là có thể nhưng nó không cung cấp một giao diện trừu tượng cho những
dự án thực tế. Bởi vì sự phức tạp trong kiến trúc của Grid và sự đa dạng về tính năng
nên sự tương tác giữa middleware và những phần mềm khác là rất cần thiết.
Để dễ dàng ứng dụng vào thực tế, một grid middleware thường có kiến trúc
phân tầng. Trong kiến trúc chung của một Grid, tầng dưới cùng, là tầng fabric – tập
hợp các nguồn tài nguyên trên Grid, tầng trên cùng là lớp ứng dụng. Tầng middleware
là tầng nằm giữa hai tầng trên. Ngoài ra tầng middleware còn có thể chia thành hai
tầng con tách biệt. Theo cách tiếp cận này thì toàn bộ grid gồm bốn thành phần:
 Fabric
 core middleware
 user-level middleware
 ứng dụng và portal
Hình dưới đây minh họa kiến trúc của Grid và Grid middleware ở trong đó.
ĐIỆN TOÁN LƯỚI VÀ ĐÁM MÂY
CH1301016 - Vũ Quốc Hưng
Tr. 1
Hình 1.1. Mô hình Grid
Trong mô hình này, tầng middleware được chia làm hai mức: core middleware và
user-level middleware.
 Core middleware cung cấp những dịch vụ cơ bản như: quản lý công việc từ
xa, đăng ký tài nguyên, truy xuất dữ liệu, đăng ký thông tin dịch vụ, phát hiện
dịch vụ, bảo mật và chất lượng dịch vụ như đặt chỗ tài nguyên. Những dịch vụ
này có nhiệm vụ trừu tượng hóa, che dấu sự phức tạp và không đồng nhất của
tầng fabric bằng cách cung cấp một phương thức duy nhất và ổn định để truy
cập tới những tài nguyên phân bố trên Grid.
 User-level middleware là một dạng middleware mà trong đó có sử dụng

những giao diện đã được cung cấp ở lớp dưới để tạo nên những dịch vụ ở mức
cao hơn. Đó là những bộ công cụ phát triển, môi trường phát triển, quản lý tài
nguyên và định thời cho những ứng dụng chạy trên một tài nguyên chung.
ĐIỆN TOÁN LƯỚI VÀ ĐÁM MÂY
CH1301016 - Vũ Quốc Hưng
Tr. 1
II. Những chức năng trên Grid Middleware
Những thành phần trong Grid Middleware cung cấp cho người dùng những
chức năng cần thiết để tối ưu việc sử dụng Grid. Những chức năng này gồm có chức
năng cơ bản như: xác thực, cấp quyền, truy cập tài nguyên, truyền tải dữ liệu và giám
sát. Ngoài ra còn có những chức năng phức tạp khác như quản lý tài nguyên, đăng ký
tài nguyên, quản lý công việc, quản lý thông tin có thể được phát triển dựa trên
những chức năng cơ bản.
1. Những chức năng cơ bản
Những chức năng cơ bản trong Grid middleware gồm có thực thi công việc,
bảo mật, dịch vụ thông tin và truyền tải file.
 Dịch vụ thực thi công việc hỗ trợ việc nhận công việc để chạy trên một tài
nguyên ở xa. Trên tài nguyên này đã được thiết lập những yếu tố bảo mật do
dịch vụ bảo mật cung cấp để những người có đúng thẩm quyền mới được sử
dụng. Cơ chế bảo mật có liên quan đến xác thực người dùng, cấp quyền, và
truy xuất thông tin an toàn đến tài nguyên trên lưới. Trong quá trình thực thi,
dịch vụ này phải cung cấp được thông tin về tiến độ và trạng thái của công
việc. Do đó việc quản lý các công việc này đều dựa vào một mã số duy nhất ở
trong tài nguyên grid nhằm tạo thuận lợi cho việc quản lý cũng như là lập lịch
để chạy chúng.
 Dịch vụ bảo mật cung cấp cơ chế xác thực và cấp quyền cho người sử dụng để
truy xuất tới tài nguyên trên grid. Những cơ chế này được dựa trên nền bảo mật
của mạng máy tính. Những giao thức và phương thức cổ điển của bảo mật
mạng đã được ứng dụng vào Grid như mã hóa, chữ ký số và nhiều cơ chế bảo
mật cơ bản khác. Đối với việc xác thực người dùng thì PKI và Kerberos là hai

cơ chế được sử dụng nhiều nhất. Ngoài ra hệ thống Grid cần phải hỗ trợ chế độ
đăng nhận một lần (single sign-on) để hỗ trợ việc thực thi các công việc cần sử
dụng những tài nguyên trên grid ở nhiều site khác nhau, trường hợp này người
ta thường sử dụng một chứng nhận ủy quyền để thực hiện.
 Dịch vụ thông tin: thông tin trên môi trường grid luôn luôn biến động như
trạng thái của tài nguyên, một tài nguyên có thể được kết nối hoặc ngắt kết nối
ra khỏi grid bất kì lúc nào, địa chỉ của những dịch vụ có thể bị thay đổi. Một
dịch vụ thông tin cung cấp khả năng truy vấn thông tin về tài nguyên và những
dịch vụ, ví dụ như mức độ hoạt động của CPU, tổng dung lượng bộ nhớ còn
trống hay đã sử dụng, trạng thái của một dịch vụ . Những thông tin này sẽ
được ghi lại và được phân tích nhờ những dịch vụ mức cao hơn như thực thi
công việc. Gần đây, dịch vụ thông tin thường được gắn kèm với web ngữ nghĩa
để cung cấp khả năng truy vấn thông tin hiệu quả hơn.
ĐIỆN TOÁN LƯỚI VÀ ĐÁM MÂY
CH1301016 - Vũ Quốc Hưng
Tr. 1
 Truyền tải dữ liệu: cung cấp khả năng truyền dữ liệu an toàn và hiệu quả mà
một công việc cần từ địa chỉ gốc tới nút tính toán, truy xuất cần thiết. Người sử
dụng chỉ cần ra một lệnh đơn giản kiểu như: “chuyển file A từ máy chủ X tới
máy chủ Y với tên mới là file B một cách nhanh nhất có thể”. Một số chức
năng phụ như chia nhỏ file lên nhiều nơi hoặc truyền tải dữ liệu song song
thường được áp dụng khi có lượng dữ liệu lớn.
2. Những chức năng nâng cao
Dựa trên những chức năng cơ bản được cung cấp bởi Grid Middleware, một số
lượng các dịch vụ cấp cao hơn, phức tạp hơn được phát triển thêm. Dịch vụ quản lý
file, dịch vụ quản lý thông tin và dịch vụ quản lý công việc có thể được coi là các
thành phần chính của các dịch vụ loại này.
 Dịch vụ quản lý file: cho phép người sử dụng điều khiển quá trình truyền tải
file và giám sát trạng thái của chúng. Grid Middleware cần phải cung cấp
những chức năng này cho người sử dụng và che giấu hiện thực phức tạp bên

trong. Dịch vụ replica là một phương pháp để tăng cường dư thừa dữ liệu nhằm
mục đích giảm bớt chi phí chuyển đổi file. Một tập hợp các dịch vụ liên replica
được cung cấp bởi middleware như dịch vụ theo dõi vị trí của replica, quản lý
replica.
 Quản lý thông tin cho phép truy vấn thông tin về dung lượng lưu trữ và tài
nguyên tính toán cũng như thông tin xuất ra từ những thành phần khác trong
Grid. Nó cũng bao gồm trạng thái thực thi các công việc để sử dụng cho việc
thu thập, lưu trữ và phân tích. Thông tin về tài nguyên và cách truy cập các tài
nguyên đó sẽ cung cấp cho người sử dụng một cái nhìn tổng quát về sự chiếm
dụng tài nguyên trên Grid. Ngoài ra, dịch vụ thông tin này thường đi kèm với
dịch vụ giám sát. Dịch vụ thông tin và giám sát giúp cho người sử dụng tìm
kiếm tài nguyên và thông tin liên quan tới tài nguyên đó nên nó giữ một vai trò
rất quan trọng trong hệ thống Grid.
 Quản lý công việc là một dịch vụ khá quan trọng khác nhằm giải quyết sự liên
quan giữa những dịch vụ với nhau như bảo mật, truyền tải dữ liệu và dịch vụ
thông tin. Một công việc được người dùng nhập vào thường có nhiều công việc
con bên trong và sử dụng dữ liệu lớn, và có thể là khối lượng tính toán lớn, khả
năng chịu lỗi.

ĐIỆN TOÁN LƯỚI VÀ ĐÁM MÂY
CH1301016 - Vũ Quốc Hưng
Tr. 1
III. Glite
1. Giới thiệu
gLite là một tập hợp của các thành phần được thiết kế để cho phép chia sẻ tài
nguyên trên lưới. gLite được tạo ra bởi dự án Enabling Grids for E-sciencE project
(EGEE) và hiện đang được phát triển bởi dự án EMI với mục đích hỗ trợ xây dựng
các hệ thống tính toán lưới của dự án, dùng trong các lĩnh vực : Khoa học máy tính và
công nghiệp, Khoa học về sự sống, Hóa học, Khoa học về trái đất, Vật lý năng lượng
cao, Vật lý hạt nhân, Nghiên cứu vũ trụ,… gLite gắn liền với những tổ chức ảo –

VO( Virtual Organization) và được phát triển dùng cho việc tính toán trên Grid. Phiên
bản đầu tiên của gLite ra đời năm 2005, và gLite đang ngày càng được phát triển và
không ngừng ra phiên bản mới với sự tích hợp của những nét mới và những công nghệ
đã phát triển trước đó (như globus, condor, ) nên có thể dùng thay thế cho các phần
mềm middleware hiện nay và vẫn đảm bảo được chất lượng dịch vụ.
gLite cung cấp cho người dùng với dịch vụ cấp cao như: lập lịch và thực thi các
công việc tính toán truy cập và chuyển dữ liệu thu thập thông tin về cơ sở hạ tầng lưới
cũng như các ứng dụng lưới. Các dịch vụ có sẵn trong bản phân phối gLite có thể
được chia thành hai loại chính:
 Các dịch vụ cơ bản (Grid Middleware Foundation): bao gồm các cơ sở hạ
tầng bảo mật, thông tin, giám sát và hệ thống kế toán, truy cập các tài nguyên
máy tính và lưu trữ, cung cấp thành phần cơ sở cho một cơ sở hạ tầng phù hợp
và đáng tin cậy
 Các dịch vụ mức cao (Higher-level Grid Middleware): bao gồm các dịch vụ
để quản lý công việc, danh mục dữ liệu và sao chép dữ liệu, cung cấp các ứng
dụng với giải pháp withend-to-end.
Các ứng dụng hoạt động trên môi trường gLite phải truy cập đến cả hai tầng
dịch vụ cơ bản và dịch vụ mức cao như hình bên dưới. Các truy cập này có thể thông
qua CLI hoặc API.
ĐIỆN TOÁN LƯỚI VÀ ĐÁM MÂY
CH1301016 - Vũ Quốc Hưng
Tr. 1
Hình 3.1. Các thức truy cập dịch vụ từ ứng dụng trong gLite
2. Kiến trúc gLite
gLite được phát triển dựa trên kiến trúc hướng dịch vụ (SOA) do đó nó dễ dàng
tương tác của các dịch vụ, thích ứng tốt với tiêu chuẩn mở và đáp ứng thuận lợi hơn
các tiêu chuẩn được công bố sau này như OGSA. Các dịch vụ có thể làm việc độc lập
hoặc có thể làm việc cùng nhau, tuy vậy nó vẫn có thể được triển khai và sử dụng một
cách độc lập cho phép việc khai thác chúng trong những ngữ cảnh khác nhau. gLite
đồng thời còn đưa ra framework chung cho phát triển ứng dụng trong môi trường lưới.

Hình sau mô tả các dịch vụ ở cấp cao có thể được chia thành 5 nhóm dịch vụ.
ĐIỆN TOÁN LƯỚI VÀ ĐÁM MÂY
CH1301016 - Vũ Quốc Hưng
Tr. 1
Hình 3.2. Kiến trúc dịch vụ gLite
 Dịch vụ Security bao gồm các dịch vụ Authentication, Authorization,
Auditing, Dynamic Connectivity cho phép nhận dạng các thực thể (người sử
dụng, hệ thống và dịch vụ), cho phép hoặc từ chối truy cập đến dịch vụ hay tài
nguyên và cung cấp thông tin cho việc phân tích các sự kiện liên quan đến bảo
mật. Nó cũng cung cấp các chức năng cho việc bí mật dữ liệu và một dịch vụ
kết nối động.
o Authentication: xác định các thực thể (người sử dụng, hệ thống, và dịch vụ),
căn cứ vào chứng nhận X.509
o Authorization: cho phép hoặc từ chối truy cập đến các dịch vụ và nguồn lực
cụ thể, ba mô hình phân quyền cơ bản: đại diện (agent), đẩy (push) và kéo
(pull).
o Auditing: theo dõi và cung cấp thông tin phân tích thử nghiệm các sự kiện
bảo mật liên quan. Tìm hiểu về Grid Middleware
o Dynamic Connectivity: nhằm giải quyết những vấn đề phát sinh khi kết nối
bị hạn chế bởi các chủ sở hữu tài nguyên
 Dịch vụ Information và Monitoring cung cấp một cơ chế xuất bản và tiêu thụ
thông tin và sử dụng nó cho mục đích giám sát. Hệ thống thông tin và giám sát
có thể được sử dụng trực tiếp để xuất bản, ví dụ như thông tin liên quan đến tài
ĐIỆN TOÁN LƯỚI VÀ ĐÁM MÂY
CH1301016 - Vũ Quốc Hưng
Tr. 1
nguyên trên Grid. Các dịch vụ đặc biệt hơn như Job Monitoring và Network
Performance Monitoring có thể được xây dựng trên đỉnh.
o R-GMA Components: cung cấp một phương pháp thống nhất để truy
cập và công bố thông tin phân phối và giám sát dữ liệu.

o Job Mornitoring service: giám sát tình trạng thực thi của các công việc
trên lưới.
o Discovery service: cung cấp một tiêu chuẩn thiết lập các phương
pháp để định vị lưới dịch vụ
o Network Performance Monitoring: giám sát hiệu suất của mạng
 Dịch vụ Job Management. Các dịch vụ chính có liên quan đến việc quản trị và
thực thi job là thành phần tính toán, quản trị workload, tài khoản, phát sinh job
và các dịch vụ quản trị gói. Các thành phần tính toán CE cung cấp trừu tượng
hóa của một tài nguyên tính toán (điển hình như là một hàng đợi khối của một
cluster của siêu máy tính hay thậm chí là workstation đơn). Nó cung cấp thông
tin về các tài nguyên bên dưới và cung cấp một giao diện chung để xác nhận và
quản lý job trên tài nguyên.
o Accounting: tích lũy thông tin về cách sử dụng các nguồn tài nguyên
trong lưới
o Computing element: đại diện cho một nguồn tài nguyên máy tính (một
cụm, siêu máy tính, máy trạm duy nhất).
o Workload Management: bao gồm một tập hợp các thành phần Grid
middleware chịu trách nhiệm phân phối và quản lý các tác vụ trên các
tài nguyên trong lưới
o Job Provenance: cung cấp thông tin liên tục trên các job được xử lý trên
hạ tầng Grid cho việc xem xét sau đó, các hoạt động data-mining và quá
trình làm lại có thể xảy ra. Cuối cùng dịch vụ quản lý gói PM cung cấp
việc triển khai động của các phần mềm ứng dụng.
o Package Manager: là một dịch vụ trợ giúp tự động hóa quá trình cài đặt,
nâng cấp, cấu hình, và loại bỏ các gói phần mềm từ một khu vực được
chia sẻ
 Dịch vụ Data. Ba dịch vụ chính có liên quan đến việc truy cập file và dữ liệu:
Storage Element, File & Replication Catalog và Data Management. Trong tất
cả các dịch vụ quản lý dữ liệu miêu tả bên dưới có tính chất của dữ liệu ở cấp
độ file. Tuy nhiên, các dịch vụ này thì đủ khái quát để mở rộng đến các cấp độ

khác.
o Storage Element (SE): cung cấp các triều tượng hóa về tài nguyên lưu
trữ (mà có thể tiếp cận từ dịch vụ đĩa đơn giản đến hệ thống lưu trữ băng
phân cấp phức tạp) nhiều như CE làm cho các tài nguyên tính toán. Dịch
vụ danh mục sẽ nắm giữ vị trí dữ liệu cũng như các siêu dữ liệu liên
quan (checksum hoặc kích thước file) và dịch vụ di chuyển dữ liệu cho
phép dữ liệu được quản trị được truyền giữa các SE. Việc truy cập file
ĐIỆN TOÁN LƯỚI VÀ ĐÁM MÂY
CH1301016 - Vũ Quốc Hưng
Tr. 1
được điều khiển bởi Access Control Lists (ACLs). Siêu dữ liệu đặc tả
ứng dụng được mong muốn không chỉ được lưu trữ trong các dịch vụ
gLite cơ bản mà còn trong thư mục siêu dữ liệu đặc tả ứng dụng. Tất cả
các dịch vụ quản trị dữ liệu hoạt động trên các file đơn hoặc là tập hợp
các file.
o Metadata catalog services: theo dõi các vị trí dữ liệu và siêu dữ liệu liên
quan (kích thước file, )
o Data movement services: cho phép quản lý truyền dữ liệu hiệu quả giữa
các thành phần lưu trữ
 Dịch vụ Helper gồm các dịch vụ hỗ trợ người dùng và giám sát, điều chỉnh hệ
thống:
o Configuration and Instrumentation Service: Truy vấn trạng thái các dịch
vụ
o Agreement Service: hiện thực một giao thức truyền thông cho các cấp
dịch vụ.
o Bandwidth Allocation & Reservation service (BAR): Kiểm soát, cân
bằng và quản lý network flow.
2.1. Security
Kiến trúc bảo mật EGEE dựa trên việc thiết lập tốt trong cộng đồng Grid. Về
mặt authentication việc lưu trữ ủy nhiệm bảo đảm đúng việc bảo mật ủy nhiệm trong

khi chứng nhận proxy hỗ trợ sign-on. Giao thức bảo mật cấp độ thông điệp và vận
chuyển TLS, GSI, và WS-Security đảm bảo tích hợp, xác thực và tin cậy.
Thuộc tính cấp quyền (authority) cho phép VO quản trị việc điều khiển truy
cập. Trong khi dịch vụ xác nhận chính sách cho phép việc hợp nhất và quản trị trung
tâm của chính sách thông dụng. Một nền tảng Authorization cho phép việc tùy chọn,
phân xử, tập hợp các chính sách từ các miền quản trị khác nhau cũng như việc tích
hợp các bộ chức dịch vụ và các dịch vụ kế thừa.
Các chức năng miêu tả trong kiến trúc bảo mật EGEE trong trường hợp tốt nhất
nhúng vào các bộ chứa dịch vụ hay chính trong ứng dụng, Vì những lý do hoạt động,
nó không đưa vào như là các Web Service riêng biệt. Vấn đề quan trọng là kiến trúc
bảo mật được sử dụng bởi EGEE cho phép việc mở rộng với các triển khai Grid và
các dự án Middleware khác.
ĐIỆN TOÁN LƯỚI VÀ ĐÁM MÂY
CH1301016 - Vũ Quốc Hưng
Tr. 1
Hình 3.3. Quá trình tương tác của các thành phần bảo mật
Hình trên mô tả một cách tổng quát về các thành phần kiến trúc bảo mật tương tác
với một số luồng yêu cầu tiêu biểu người sử dụng truy cập đến tài nguyên
 Người sử dụng thu được ủy quyền Grid từ các lưu trữ ủy quyền và các token
cần thiết mà xác nhận quyền người sử dụng truy cập tài nguyên. Các ủy quyến
này có thời gian sống ngắn và được truyền từ các ủy quyền dài hạn hơn, chẵn
hạn như chứng nhận nhận dạng X.509 được đưa ra bởi CA. EGEE sử dụng
myProxy là bộ lưu trữ ủy nhiệm và Virtual Organization Membership Service
VOMS như một cấp quyền thuộc tính. VOMS cũng còn được sử dụng để quản
lý các thành viên của VO.
 Người sử dụng và các bộ chứa dịch vụ sẽ xác thực nhận dạng lẫn nhau và thiết
lập một kênh kết nối bảo mật qua mạng (mở) với việc bảo vệ tích hợp, xác thực
và tin cậy và trên đó thông điệp SOAP được truyền. Mặc định nó được hoàn tất
bởi việc sử dụng HTTP qua TLS. Và sự kiện kết nối được thiết lập sẽ được ghi
lại.

 Trong việc xác thực ở bước 2, lớp xác thực đánh giá việc nhận dạng người
dùng với anchor và thông tin thu hồi ủy quyền nếu nó tồn tại. Kết quả của việc
đánh giá này sẽ ghi lại. Các bộ chứa dịch vụ tiếp nhận payload và định hướng
nó đến các điểm cuối chính xác. Trong trường hợp bảo mật cấp độ thông điệp,
việc kiểm tra tính xác thực và tích hợp diễn ra ở đây (sau khi thông điệp được
tiếp nhận từ mạng).
 Thủ tục cấp quyền bảo đảm rằng người dùng sẽ được cho phép truy cập đến tài
nguyên, bởi việc xác nhận thuộc tính kết hợp và chính sách VO (gởi cùng với
yêu cầu) với chính sách site nội bộ và các nguồn khác của điều khiển truy cập.
 Trong trường hợp sự ủy quyền đại diện được sử dụng, người dùng sử dụng ủy
quyền đến tài nguyên được ủy quyền đóng vai trò nhân danh người dùng. Chú
ý tuy vậy việc ủy quyền thông thường diễn ra bởi một yêu cầu điểm cuối riêng
ĐIỆN TOÁN LƯỚI VÀ ĐÁM MÂY
CH1301016 - Vũ Quốc Hưng
Tr. 1
lẻ và là phần của luồng thông điệp cấp độ ứng dụng giữa người dùng và dịch
vụ.
 Đặc tả ứng dụng lấy yêu cầu. Thủ tục cấp quyền có thể sử dụng cho việc đánh
giá và tham khảo thêm.
 Dịch vụ tích hợp với tài nguyên, mà lần lượt có thể được ủy quyền. Kỹ thuật
Sand-boxing và kỷ thuật cô lập giới hạn tác động người dùng vào tài nguyên
trong phạm vi mong muốn tránh việc sử dụng có ý hay không định trước hay
trong tình huống xấu nhất vi phạm bảo mật. Điều đó bao gồm:
o Sử dụng tải nguyên trong không gian người dùng khác nhau hơn
trong bộ chứa dịch vụ đó.
o Hỏi ý kiến Dynamic Connectivity Service để thực hiện tạm thời cho
phép việc kết nối mạng bên ngoài lẫn bên trong đến tài nguyên.
o Cung cấp sự bảo vệ thêm của các ủy quyền bởi việc sử dụng Active
Credential Store. Nó hữu dụng trong trường hợp sử dụng dài hạn một
tài nguyên, nơi mà một sự khôi phục ủy quyền có thể cần thiết.

2.2. Information and monitoring services
Hệ thống gLite cho thông tin và giám sát là R-GMA, là một đặc tả mối quan hệ
của Grid Monitoring Architecture từ GCF. R-GMA được thiết kế để dễ dàng cho
người dùng cuối xuất bản thông tin và truy vấn thông tin trên môi trường Grid. Hình
sau sẽ chỉ nguyên lý tổng quát của R-GMA. Dữ liệu sẽ được viết trong cơ sở dữ liệu
ảo R-GMA bởi các producer và đọc từ nó bởi các consumer. R-GMA thì không là một
hệ thống quản trị dữ liệu phân tán. Thay vào đó nó cung cấp một hệ thống thông tin
dự đoán trước và hữu dụng.
Hình 3.4. Schema
Defining the schema
Tác vụ đầu tiên cho người dùng là định nghĩa cái cần thiết để xuất bản. Nó có
một hay nhiều bảng theo mô hình mối quan hệ. Một kỹ thuật thông dụng trong việc
thiết kế các giản đồ quan hệ là việc sử dụng khóa đại diện: là một số nguyên nhỏ có
ĐIỆN TOÁN LƯỚI VÀ ĐÁM MÂY
CH1301016 - Vũ Quốc Hưng
Tr. 1
thể được sử dụng như khóa ngoại để thiết lập mối quan hệ. Một trường hợp tiêu biểu
là ký nhận một departmentId đến mỗi bộ phận và sau đó sẽ chứa như một cột trong
bảng nhân viên. Điều này làm việc tốt cho cơ sở dữ liệu được quản lý đơn với một cơ
chế ký nhận giá trị departmentId, nhưng nó sẽ không làm việc trong Grid. Bạn không
nên thừa nhận bất cứ điều gì về cái mà bất cứ người nào đó đang xuất bản.
Producers
Producer là người cung cấp dữ liệu cho cơ sở dữ liệu ảo. Việc viết dữ liệu sang
cơ sở dữ liệu ảo được biết như là publishing, và dữ liệu luôn luôn xuất bản trong
những dòng hoàn thành, gọi là tuple. Có 3 lớp producer: Primary, Secondary và On-
demand. Mỗi loại được tạo bởi ứng dụng của người dùng và trả về tuple đáp lại truy
vấn từ comsumer. Sự khác nhau chính là ở nới tuple đến.
Có ba cách xem xét ở đây để một job xuất bản dữ liệu qua R-GMA. Sự xâm
phạm ít nhất là sử dụng một job swapper mà có thề xuất bản thông tin trên trạng thái
của job. Job swapper sẽ chèn dữ liệu sang hệ thống R-GMA bởi một primary producer

mà có bốn lời gọi R-GMA quan trọng.
 Tạo primary producer với thuộc tính thích hợp
 Biểu diễn bảng với thuộc tính – thông tin này đi đến registry
 Chèn các tuple sang cơ sở dữ liệu ảo
 Đóng primary producer
Một thay thế thứ hai là chèn lời gọi R-GMA trực tiếp sang mã ứng dụng. Điều này có
thể được làm bẳng việc dùng các API có hỗ trợ: C, C++, Java và Python.
Cách tiếp cận thứ ba là sử dụng logging API (log4cxx hay log4j) để ghi lại những vấn
đề hữu dụng.
Consumer
Trong R-GMA, mỗi consumer đưa ra một truy vấn SQL SELECT đơn trên cơ
sở dữ liệu ảo. Truy vấn này đầu tiên sẽ đối xánh với danh sách các producer có sẵn
trong registry và một tập các producer có khả năng trả lời truy vấn được lựa chọn.
Có bốn kiểu truy vấn: continuous, lastest, history và static. Tất cả chúng đều
được trình bày bởi một truy vấn SQL bình thường qua đó sẽ có một số hạn chế trên
truy vấn liên tục.
Command Line Tool
Một cách dễ dàng để sử dụng công cụ dòng lệnh (viết bẳng Python) được cung
cấp bởi một hệ thống help. Công cụ này chấp nhận những lệnh ngắn và cung cấp
những tùy chọn mặc định nhiều nhất có thể.
Ví dụ rgma> SELECT Name, Endpoint FROM Service
ĐIỆN TOÁN LƯỚI VÀ ĐÁM MÂY
CH1301016 - Vũ Quốc Hưng
Tr. 1
Service Discovery
Khám phá dịch vụ là một API ẩn trong hệ thống thông tin bên dưới. Hệ thống
thông tin này được liên kết qua một cơ chế plug-in cho cái mà chúng ta hỗ trợ R-
GMA, bdII và một file XML. Các API được cung cấp trong C và Java và cho phép
một người dùng (hay một dịch vụ khác) để lựa chọn một dịch vụ phù hợp.
2.3. Workload management services

Workload Management System (WMS) bao gồm một tập các thành phần Grid
middleware đáp ứng được các tác vụ quản trị và phân tán qua tài nguyên Grid, theo đó
các ứng dụng sẽ được xử lý một cách hiệu quả. Loại đặc trưng của các tác vụ mà yêu
cầu tính toán thì thường được nói đến như các job. Trong WMS, phạm vi của các tác
vụ cần được mở rộng để đưa vào sổ kế toán các loại tài nguyên khác chẵn hạn như
việc lưu trữ hay khả năng mạng.
Thành phần lõi của Workload Management System là Workload Manager
(WM), mà mục đích của nó là để chấp nhận và thỏa mãn yêu cầu của việc quản trị job
đến từ các client của nó. Thành phần cơ bản khác là Job Logging và Bookkeeping
Service. Cho job liên quan tính toán sẽ có hai yêu cầu chính: submission và
cancellation. Trạng thái của yêu cầu sẽ được quản lý bởi dịch vụ Logging và
Bookkeeping.
The gLite Job Description Language
Một job sẽ được thông qua đến gLite WMS cần được mô tả trong một ngôn
ngữ đặc trưng, gLite Job Description Language (JDL). JDL được sử dụng cho gLite
và khởi đầu phát triển cho dự án EU DataGrid, dựa trên ngôn ngữ Condor ClassAd.
Khái niệm trung tâm của nó là cấu trúc giống bản ghi, classad, gồm một số giới hạn
tên thuộc tính phân biệt ánh xạ đến biểu thức. Một biểu thức sẽ chứa chữ và các tham
khảo thuộc tính chứa các toán tử có cú pháp giống C/C++.
WMS User Interfaces
Sau khi đã tạo được phần mô tả ứng dụng, người dùng mong muốn có thể lờ đi
tính phức tạp của tài nguyên Grid và có thể xem xét chúng đến Workload
Management System và giám sát quá trình phát triển của chúng trên Grid. Các chức
năng của WMS bao gồm như sau:
 Đề trình Job (bao gồm các DAG) cho việc xử lý trên một Computing Element,
cũng bao gồm:
o sự lựa chọn và khám phá tài nguyên một cách tự động
o trạng thái của sandbox đầu vào ứng dụng
o khởi động lại job từ trạng thái checkpoint được lưu từ trước
o giao tiếp tương tác với job đang chạy

 Danh sách các tài nguyên phù hợp để chạy job đặc trưng theo yêu cầu job
 Hủy bỏ một hay nhiều job
 Thu hồi những file đầu ra của một hay nhiều job
ĐIỆN TOÁN LƯỚI VÀ ĐÁM MÂY
CH1301016 - Vũ Quốc Hưng
Tr. 1
 Thu hồi thông tin bookkeeping và logging của các job
Tất cả các chức năng này được tạo sẵn qua một giao diện dòng lệnh và một
API cung cấp từ C++ và Java. Thành phần GUI được phát triển trên đỉnh của Java
API.
Logging and Bookkeeping
Dịch vụ Logging và Bookkeeping được sử dụng bởi WMS nội tại để tập hợp
các thông tin khác nhau trên các job đang chạy và cung cấp cho người dùng cái nhìn
tổng quan về trạng thái job. Dịch vụ thu thập các sự kiện trong một cách non-blocking
bất động bộ với cơ chế truyền mạnh mẽ.
2.4. Data management service
Với chồng dịch vụ quản trị dữ liệu gLite, chúng ta có thể giả sử rằng tính chất
thấp nhấn của dữ liệu là ở cấp độ file. Chúng ta sẽ xử lý với file tốt hơn đối tượng dữ
liệu hay các bảng trong cơ sở dữ liệu quan hệ nếu như nó đến từ dữ liệu ứng dụng. Có
hai lý do chính giải thích. Thứ nhất, hai nhóm ứng dụng khởi đầu là cộng đồng High
Energy Physics và Biomedical làm việc với đặc tả EGEE gLite lưu trữ dữ liệu của họ
bằng định dạng file. Thứ hai, mặc ngữ nghĩa của file rất dễ hiểu cho mọi người với cả
hai người cung cấp dịch vụ lẫn phần ứng dụng.
Trong Grid, người dùng định nghĩa các file bởi logical file name (LFN). LFN
namespace là hệ phân cấp, giống với hệ thống file quy ước. Mặc ngữ nghĩa của LFN
namespace cũng rất giống với hệ thống file Unix. LFN thì không chỉ tên/nhận dạng
mà được kết hợp với một file trên Grid, mặc dù người dùng trung bình có thể không
bao giờ sử dụng tên file khác.
Chúng ta có các tên sau nhận dạng dữ liệu trong Grid: LGN – Logic File
Name, GUID – Global Unique Identifier, Logical Symlink, SURL, TURL.

Dịch vụ dữ liệu có thể được đặt qua ba danh mục: storage, catalog và movement.
2.5. Quá trình gửi một công việc đến khi nhận kết quả
Công việc được người dùng gửi lên qua giao diện người dùng, WMS phân tích
và chọn các tài nguyên phù hợp cho tác vụ và gửi đến các đơn vị tính toán, công việc
được chia thành các tiểu công việc và được gửi đến các node trên lưới thực hiện. Sau
khi có kết quả tính toán, thông tin được tổng hợp lại tại đơn vị tính toán ban đầu đã
gửi đi tiểu công việc đến các node, WMS tổng hợp và trả kết quả lại người dùng. Quá
trình này được mô ta qua hình sau.
ĐIỆN TOÁN LƯỚI VÀ ĐÁM MÂY
CH1301016 - Vũ Quốc Hưng
Tr. 1
Hình 3.5. Quá trình gửi công việc và nhận kết quả
3. Các ưu điểm của Grid khi dùng gLite
 gLite kế thừa từ các dự án Grid trước đó nên tận dụng nhiều ưu điểm của các
thành phần vốn đã hoạt động rất ổn định và hiệu quả như bộ lập lịch và điều
phối công việc Condor, cơ chế bảo mật lưới GSI, Globus Gatekeeper, …
 Xây dựng thêm nhiều dịch vụ nhằm tăng cường khả năng quản lý người dùng
và các tài nguyên, đồng thời hỗ trợ cho người dùng khả năng sử dụng lưới một
cách hiệu quả nhất.
 Được xây dựng theo hướng dịch vụ, các thành phần được phân phối theo kiểu
mô đun nên dễ dàng chọn lựa những thành phần cần thiết khi xây dựng một hệ
thống lưới theo nhu cầu riêng.
 Được hỗ trợ mạnh mẽ từ dự án EGEE và nhiều tổ chức cũng như chính phủ các
nước trên thế giới.
ĐIỆN TOÁN LƯỚI VÀ ĐÁM MÂY
CH1301016 - Vũ Quốc Hưng
Tr. 1
IV. Nhận xét
Hiện nay, hơn 50 quốc gia đã gia nhập vào hệ thống Grid chung của thế giới.
Hệ thống Grid chung này mang lại lợi ích rất to lớn từ nguồn tài nguyên của nó, tuy

nhiên, để gia nhập hệ thống này đòi hỏi một số qui định nghiêm ngặt về tính an toàn,
sự tin cậy và yêu cầu hạ tầng. Trong khi đó, nhu cầu triển khai các ứng dụng trên một
hệ thống tính toán lưới phục vụ nghiên cứu ở nước ta hiện tại rất lớn. Tuy nhiên,
không phải cá nhân hay tổ chức nào cũng có thể gia nhập hệ thống lưới thế giới nên
việc xây dựng một hệ thống lưới cục bộ dành riêng là rất cần thiết. Với hệ thống lưới
do chính chúng ta xây dựng, các chính sách về quản trị sẽ phù hợp hơn với điều kiện
thực tế, giúp cho các cá nhân hay tổ chức có nhu cầu sử dụng lưới tiếp cận với tính
toán lưới một cách dễ dàng hơn.
ĐIỆN TOÁN LƯỚI VÀ ĐÁM MÂY
CH1301016 - Vũ Quốc Hưng
Tr. 1
V. Kết luận
Bài tiểu luận này đã trình bày được một số đặc điểm của glite, đồng thời tìm
hiểu về cách nó hoạt động trên hệ thống Grid. Tuy nhiên việc xây dựng, quản trị hệ
thống tính toán lưới với gLite thực sự không đơn giản. Nó đòi hỏi sự tham gia cộng
tác của nhiều cá nhân, với sự hiểu biết tường tận và được huấn luyện tốt.
ĐIỆN TOÁN LƯỚI VÀ ĐÁM MÂY
CH1301016 - Vũ Quốc Hưng
Tr. 1
VI. Tài liệu tham khảo
[1] E. Laure, S. M. Fisher, A. Frohner, C. Grandi, P. Kunszt, A. Krenek, O. Mulmo, F.
Pacini, F. Prelz, J. White, M. Barroso, P. Buncic, F. Hemmer, A. Di Meglio, A.
Edlund, Programming the Grid with gLite, Computational Methods In Science And
Technology 12(1), 33-45 (2006)
[2] Esther Montes Prado, Overview of gLite Middleware, CIEMAT 10
th
EELA
Tutorial Madrid, 07/05/2007
[3] Malik Ehsanullah, Introduction to gLite Middleware
[4] Trần Văn Lăng, Ninh Khánh Trung, Nguyễn Thị Thu Dự, Đào Văn Tuyết, gLite

và việc triển khai ứng dụng Grid
[5] , 05/2014
[6] 05/2014
[7] , 05/2014

×