Tải bản đầy đủ (.docx) (54 trang)

Tiểu luận môn điện toán lưới và đám mây GRID COMPUTING SECURITY - BẢO MẬT ĐIỆN TOÁN LƯỚI

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.38 MB, 54 trang )

Đại Học Quốc Gia TP.HCM
Trường Đại Học Công Nghệ Thông Tin
BÁO CÁO THU HOẠCH CHUYÊN ĐỀ:
ĐIỆN TOÁN LƯỚI VÀ ĐÁM MÂY
ĐỀ TÀI:
GRID COMPUTING SECURITY - BẢO MẬT ĐIỆN TOÁN LƯỚI
GVHD: PGS.TS. NGUYỄN PHI KHỨ
HV thực hiện: Phan Tử Ánh
MSSV: CH1301080
Lớp: Cao học khóa 8
TP.HCM – 2014
Báo cáo chuyên đề: Điện toán lưới GVHD: PGS.TS. NGUYỄN PHI KHỨ
MỤC LỤC
***
HVTH: Phan Tử Ánh Trang 2
Báo cáo chuyên đề: Điện toán lưới GVHD: PGS.TS. NGUYỄN PHI KHỨ
LỜI NÓI ĐẦU

Điện toán lưới đã phát triển rất mạnh trên thế giới, nhằm liên kết những hệ
thống tính toán với nhau để giải những bài toán cực lớn. Nó cho phép tận dụng
năng lực xử lý, lưu trữ và các tài nguyên nhàn rỗi để cung cấp môi trường xử lý
tính toán, khả năng lưu trữ lớn để giải quyết các bài toán phức tạp. Hệ thống bao
gồm phần cứng, phần mềm, đường truyền và nhiều thiết bị khác… trong những
không gian thích hợp tạo một môi trường tính toán gọi là môi trường lưới. Một yêu
cầu quan trọng cho điện toán lưới là vấn đề bảo mật. Cơ bản ở bất kỳ môi trường
lưới, phải có cơ chế để cung cấp cho bảo mật điện toán lưới, bao gồm xác thực, cho
phép mã hóa dữ liệu,….
Trong khuôn khổ bài thu hoạch này, ngoài những kiến thúc tổng quát về điện
toán lưới, trọng tâm đề tài là tìm hiểu về bảo mật điện toán lưới như: yêu cầu và
chính sách bảo mật lưới; bảo mật thông tin; phân tích các thành phần trong mô
hình bảo mật trong hệ thống lưới; cơ sở hạ tầng bảo mật lưới GSI; mô hình bảo


mật lưới được phát triển trong các phiên bản của Globus Tookit.
Với thời lượng lên lớp hạn chế nhưng thầy Nguyễn Phi Khứ đã tận tình truyền
tải một khối lượng lớn kiến thức. Đặc biệt, với kỹ năng sư phạm, phong thái diễn
giải thiết phục cùng hệ thống kiến thức sâu rộng, thầy đã đưa ra những ứng dụng
thực tế, trực quan giúp học viên thuận thiện cho việc định hướng nghiên cứu của
mình. Cảm ơn thầy đã tận tình giảng dạy và hướng dẫn hoàn tất bài thu hoạch này.
Chúc thầy được nhiều sức khoẻ.
Trân trọng.
Học viên thực hiện
Phan Tử Ánh.
HVTH: Phan Tử Ánh Trang 3
Báo cáo chuyên đề: Điện toán lưới GVHD: PGS.TS. NGUYỄN PHI KHỨ
PHẦN I: TỔNG QUAN VỀ ĐIỆN TOÁN LƯỚI

I.1- Khái niệm về điện toán lưới
Lịch sử phát triển
Mặc dù công nghệ Grid được nhắc nhiều trong thời gian gần đây, nhưng thực
ra nhiều ý tưởng cơ bản về Grid đã xuất hiện dưới dạng này hay dạng khác trong
lịch sử tính toán. Ví dụ “chia sẻ năng lực tính toán” đã xuất hiện từ những năm 60-
70 của thế kỷ XX, lúc đó năng lực tính toán được chia sẻ từ các máy mainframe.
Năm 1965, những người phát triển hệ điều hành Multics (tiền thân của hệ điều
hành Unix) đã đề cập đến năng lực tính toán như một tiện ích, một quan điểm rất
gần với quan điểm Grid hiện nay. Đó là một hệ thống cung cấp năng lực tính toán
tương tự như hệ thống cung cấp điện, nước hiện được đang sử dụng trong cuộc
sống hàng ngày. Người dùng khi muốn sử dụng tài nguyên tính toán để sử lý công
việc, chỉ cần cắm thiết bị vào hệ thống cung cấp, sử dụng và trả tiền giống như cắm
thiết bị điện vào lưới điện.
Tuy trước đó có nhiều ý tưởng về Grid nhưng nguồn gốc của Grid chính thức
được xác định vào năm 1990, khi thuật ngữ “siêu tính toán” (metacomputing) ra
đời, dùng để mô tả các dự án kết nối cá trung tâm siêu máy tính của Mỹ nhằm kết

hợp sức mạnh xử lý của nhiều máy tính lại với nhau.
Đến năm 1995, 2 dự án siêu tính toán quan trọng, ảnh hưởng lớn đến các công
nghệ nền tảng trong các dự án Grid ngày nay là FAFNER (Factoring via Network –
Enabled Recursion) và I-WAY (Information Wide Area Year) ra đời.
Khái niệm Grid đã ra đời ở phòng thí nghiệm Argonne National Laboratory vào
tháng 7/1997, sau đó được đưa vào quyển sách "The Grid: Blueprint for a New
Computing Infrastructure" viết bởi tiến sỹ Ian Foster (Argonne National
Laboratory) và Carl Kesselman (University of Southern California) năm 1998. Ian
Foster đã từng tham gia dự án I-WAY, Carl Kesselman là người tham gia dự án
Globus Toolkit, một dự án nền tảng của công nghệ Grid và Metacomputing.
Từ đó đến nay, việc phát triển công nghệ Grid trở nên rất sôi động với sự tham
gia nghiên cứu, đầu tư của nhiều tổ chức, tập đoàn công nghệ thông tin, nhiều quốc
gia, và đã thu được những thành tựu bước đầu.
Có thể nói, việc phát triển và xây dựng hệ thống Grid là sự kế thừa và phát triển
các ý tưởng, các công nghệ hiện hành ở mức cao hơn. Sự phát triển không ngừng của
cơ sở hạ tầng, phần cứng máy tính, mạng đã giúp các hệ thống Grid ngày nay thực
hiện được nhiều điều hơn những ý tưởng trước đây.
Khái niệm điện toán lưới
HVTH: Phan Tử Ánh Trang 4
Báo cáo chuyên đề: Điện toán lưới GVHD: PGS.TS. NGUYỄN PHI KHỨ
Cũng như các công nghệ tính toán khác, điện toán lưới (grid computing) ra đời
xuất phát từ nhu cầu tính toán của con người. Thực tế, ngày càng có nhiều bài toán
phức tạp hơn được đặt ra và do đó các tổ chức cũng cần phải có những năng lực tính
toán mạnh mẽ hơn. Có thể giải quyết vấn đề này bằng hai cách:
Thứ nhất: Đầu tư thêm trang thiết bị, cơ sở hạ tầng tính toán (mua thêm máy
chủ, máy trạm, siêu máy tính, cluster ). Rõ ràng là cách làm này hết sức tốn kém.
Thứ hai: Một cách thực hiện hiệu quả hơn là phân bố lại hợp lý các nguồn tài
nguyên trong tổ chức hoặc thuê thêm các nguồn tài nguyên từ bên ngoài (dĩ nhiên là
với chi phí rẻ hơn nhiều so với việc đầu tư cho cơ sở hạ tầng tính toán). Thực tế cho
thấy có một phần lớn các nguồn tài nguyên của chúng ta đang bị sử dụng lãng phí: các

máy để bàn công sở thường chỉ hoạt động khoảng 5% công suất, ngay cả các máy chủ
cũng có thể chỉ phải hoạt động với 20% công suất. Việc tận dụng hiệu quả các nguồn
tài nguyên này có thể mang lại một sức mạnh tính toán khổng lồ.
Hình I.2.1: Mô hình Grid Computing và các tài nguyên mạng
Cách giải quyết thứ hai này chính là mục tiêu của điện toán lưới. Điện toán lưới
hướng đến việc chia sẻ và sử dụng hiệu quả các nguồn tài nguyên thuộc về nhiều tổ
chức trên một quy mô rộng lớn (thậm chí là quy mô toàn cầu). Chính các công nghệ
mạng và truyền thông phát triển mạnh mẽ trong những năm qua đã biến những khả
năng này dần trở thành hiện thực. Các nghiên cứu về điện toán lưới đã và đang được
tiến hành nhằm tạo ra một cơ sở hạ tầng lưới cho phép dễ dàng chia sẻ và quản lý các
tài nguyên đa dạng và phân tán trong môi trường lưới.
Các thách thức mà công nghệ điện toán lưới đang phải giải quyết bao gồm:
- Các tài nguyên hết sức đa dạng, không đồng nhất. Tài nguyên ở đây được hiểu
theo nghĩa hết sức tổng quát. Đó có thể là các tài nguyên phần cứng: tài
nguyên tính toán, tài nguyên lưu trữ, các thiết bị đặc biệt khác ; các tài
nguyên phần mềm: các CSDL, các phần mềm đặc biệt và đắt giá ; các đường
truyền mạng Các tài nguyên này có thể rất khác nhau về mặt kiến trúc, giao
HVTH: Phan Tử Ánh Trang 5
Báo cáo chuyên đề: Điện toán lưới GVHD: PGS.TS. NGUYỄN PHI KHỨ
diện, khả năng xử lý Việc tạo ra một giao diện thống nhất cho phép khai
thác và sử dụng hiệu quả các nguồn tài nguyên này hoàn toàn không dễ dàng.
Ban đầu điện toán lưới được đặt ra chủ yếu là để tận dụng các nguồn tài
nguyên tính toán nhưng hiện nay mục tiêu của nó đã được mở rộng sang rất
nhiều nguồn tài nguyên khác như đã kể trên.
- Các tài nguyên không chỉ thuộc về một tổ chức mà thuộc về rất nhiều tổ chức
tham gia lưới. Các tổ chức phải tuân thủ một số quy định chung khi tham gia
vào lưới còn nhìn chung là hoạt động độc lập tức là các tài nguyên này đều có
quyền tự trị. Các tổ chức khác nhau thường có chính sách sử dụng hay cho
thuê tài nguyên của họ khác nhau và do vậy cũng gây khó khăn cho việc quản
lý.

- Các tài nguyên phân tán rộng khắp về mặt địa lý do vậy phải có các cơ chế
quản lý phân tán.
- Đảm bảo an toàn thông tin cho một môi trường phức tạp như môi trường lưới
là rất khó khăn trong khi đây là một trong những điểm ưu tiên hàng đầu.
Các định nghĩa điện toán lưới:
Khái niệm Điện toán lưới đã bắt đầu xuất hiện vào đầu thập niên 90 với nghĩa ẩn
dụ là làm cho việc sử dụng sức mạnh của máy tính dễ dàng như là việc sử dụng điện
năng. Ngày nay có rất nhiều định nghĩa về điện toán lưới. Một định nghĩa về Grid khá
hoàn chỉnh được đưa ra bởi tiến sỹ Ian Foster như sau:
“Grid là một loại hệ thống song song, phân tán cho phép chia sẻ, lựa chọn, kết
hợp các tài nguyên phân tán theo địa lý, thuộc nhiều tổ chức khác nhau dựa trên tính
sẵn sàng, khả năng, chi phí của chúng và yêu cầu về chất lượng dịch vụ (QoS) của
người dùng để giải quyết các bài toán, ứng dụng có quy mô lớn trong khoa học, kỹ
thuật và thương mại. Từ đó hình thành nên các VO (Virtual Organization (VO)), các
liên minh tạm thời giữa các tổ chức và tập đoàn, liên kết với nhau để chia sẻ tài
nguyên và/hoặc kỹ năng nhằm đáp ứng tốt hơn các cơ hội kinh doanh hoặc các dự án
có nhu cầu lớn về tính toán và dữ liệu, toàn bộ việc liên minh này dựa trên các mạng
máy tính”.
Một hệ thống Grid có 3 đặc điểm chính:
- Có sự kết hợp, chia sẻ các tài nguyên không được quản lý tập trung: Grid tích
hợp và phối hợp tài nguyên, người dùng thuộc nhiều vùng quản lý khác
nhau, nhiều đơn vị khác nhau trong một tổ chức, hay nhiều tổ chức khác nhau.
Công nghệ Grid tập trung giải quyết các vấn đề về bảo mật, chính sách quản
trị, chi phí, thành viên,… nảy sinh trong quá trình chia sẻ và sử dụng
tài nguyên.
- Sử dụng các giao diện và giao thức chuẩn, mang tính mở, đa dụng: Grid được
xây dựng trên các giao thức và giao diện tổng quát, đa dụng để giải quyết các
vấn đề cơ bản như chứng thực người dùng, phân quyền, tìm kiếm và truy xuất
tài nguyên.
HVTH: Phan Tử Ánh Trang 6

Báo cáo chuyên đề: Điện toán lưới GVHD: PGS.TS. NGUYỄN PHI KHỨ
- Đáp ứng yêu cầu cao về chất lượng dịch vụ: Grid cho phép sử dụng phối hợp
các tài nguyên để cung cấp nhiều loại dịch vụ với các mức chất lượng khác
nhau, liên quan đến ví dụ như thời gian đáp ứng, hiệu suất, tính sẵn sàng, bảo
mật, cho phép kết hợp nhiều kiểu tài nguyên để đáp ứng nhu cầu phức tạp của
người dùng. Mục tiêu là phải phối hợp làm sao để khả năng của hệ thống sau
khi kết hợp phải lớn hơn hẳn tổng khả năng của từng đơn vị cấu thành nên
Grid.
Hình I.2.2: Mô hình Grid Computing
Các định nghĩa khác:
- Plaszczak/Weller định nghĩa kỹ thuật lưới là “kỹ thuật cho phép ảo hoá tài
nguyên dự trữ theo yêu cầu, và chia sẻ dịch vụ, tài nguyên giữa các tổ chức”.
- IBM thì định nghĩa, “Lưới là khả năng sử dụng một tập các nguồn mở và
giao thức để có thể truy nhập tới các ứng dụng và dữ liệu, năng lực xử lý, khả
năng lưu trữ và một loạt các tài nguyên tính toán khác trên Internet. Một lưới
là một loại hệ thống song song và phân tán cho phép chia sẻ giữa nhiều khu
vực dựa trên sự sẵn có, dung lượng, hiệu năng, giá cả và các yêu cầu về chất
lượng dịch vụ của người sử dụng”.
- Buyya định nghĩa Lưới là “một kiểu hệ thống song song và phân tán cho
phép chia sẻ, lựa chọn và kết hợp động các tài nguyên phân tán theo địa lý tại
thời điểm thực thi dựa trên sự sẵn sàng, dung lượng, hiệu năng, giá và những
yêu cầu về chất lượng dịch vụ.
- CERN, một trong những tổ chức lớn nhất sử dụng công nghệ Lưới, nói về
Lưới như sau: “một dịch vụ để chia sẻ năng lực của máy tính và dung lượng
lưu trữ dữ liệu qua Internet”.
Bản chất của điện toán lưới giống một nền tảng dạng khái niệm hơn là một tài
nguyên vật lý. Lưới được tận dụng để cung cấp tài nguyên cho một nhiệm vụ tính
toán. Mục tiêu của công nghệ lưới liên quan tới những yêu cầu của việc cung cấp tài
nguyên linh hoạt vượt ra khỏi các khu vực cục bộ.
HVTH: Phan Tử Ánh Trang 7

Báo cáo chuyên đề: Điện toán lưới GVHD: PGS.TS. NGUYỄN PHI KHỨ
So sánh điện toán lưới với một số mô hình tính toán khác
- World Wide Web (Web computing): WWW hiện nay đang phát triển mạnh mẽ
và được sử dụng rộng khắp. Sử dụng các chuẩn mở và các giao thức mở (TCP,
HTTP, XML, SOAP), WWW có thể được sử dụng để xây dựng các tổ chức ảo
tuy nhiên nó thiếu một số đặc tính quan trọng như các cơ chế chứng thực một
lần, ủy nhiệm, các cơ chế phối hợp sự kiện
- Các hệ thống tính toán phân tán (Distributed computing systems): Các công
nghệ tính toán phân tán hiện tại bao gồm CORBA, J2EE và DCOM rất thích
hợp cho các ứng dụng phân tán tuy nhiên chúng không cung cấp một nền tảng
phù hợp cho việc chia sẻ tài nguyên giữa các thành viên của tổ chức ảo. Một
số khó khăn có thể kể ra trong việc khai phá tài nguyên, đảm bảo an ninh và
xây dựng động các tổ chức ảo. Thêm nữa việc tương tác giữa các công nghệ
này cũng gặp phải khó khăn. Tuy nhiên cũng đã có một số nghiên cứu nhằm
mở rộng những công nghệ này cho môi trường lưới, ví dụ như Java JINI.
- Các hệ thống tính toán ngang hàng (Peer - to - peer Computing Systems):
Tính toán ngang hàng cũng là một lĩnh vực của tính toán phân tán. Những
điểm khác biệt chính giữa tính toán ngang hàng và điện toán lưới là:
o Điện toán lưới có cộng đồng người sử dụng có thể nhỏ hơn tuy nhiên tập
trung nhiều vào các ứng dụng và có yêu cầu cao hơn về an ninh cũng như
tính toàn vẹn của ứng dụng. Trong khi đó các hệ thống mạng ngang hàng
có thể có số người sử dụng rất lớn bao gồm cả các người dùng đơn lẻ và
các tổ chức tuy nhiên không đòi hỏi cao về an ninh và mô hình chia sẻ tài
nguyên cũng đơn giản hơn.
o Môi trường lưới liên kết các nguồn tài nguyên mạnh hơn, đa dạng hơn và
chặt chẽ hơn.
- Tính toán cụm: Điện toán lưới thường bị nhầm lẫn với tính toán cụm. Tuy
nhiên sự khác biệt giữa hai kiểu tính toán này là: một cụm tính toán là một tập
đơn các nút tính toán tập trung trên một khu vực địa lý nhất định, trong khi
một lưới bao gồm nhiều cụm tính toán và những loại tài nguyên khác (như

mạng, các thiết bị lưu trữ).
I.2- Tài nguyên của điện toán lưới
Tài nguyên tính toán
Đây là tài nguyên phổ biến nhất, là các chu kỳ tính toán (computing
cycles) được cung cấp bởi bộ vi xử lý của các thiết bị trong Grid. Các bộ vi xử lý
không cần phải cùng loại mà có thể có tốc độ, kiến trúc, chạy phần mềm khác
nhau.
Có 3 cách để khai thác tài nguyên tính toán của Grid:
- Cách đơn giản nhất là chạy các ứng dụng hiện có trên một node của Grid thay
vì chạy trên máy tính cục bộ.
HVTH: Phan Tử Ánh Trang 8
Báo cáo chuyên đề: Điện toán lưới GVHD: PGS.TS. NGUYỄN PHI KHỨ
- Thiết kế ứng dụng, tách các công việc thành các phần riêng rẽ để có thể thực
thi song song trên nhiều bộ xử lý khác nhau.
- Chạy ứng dụng thực thi nhiều lần trên nhiều node khác nhau trong Grid.
Tài nguyên lưu trữ
Tài nguyên phổ biến thứ nhì trong Grid là tài nguyên lưu trữ. Mỗi thiết bị
trong Grid thường cung cấp một số dung lượng lưu trữ phục vụ cho việc
thực thi ứng dụng trên Grid. Tài nguyên lưu trữ có thể là bộ nhớ trong, ổ đĩa cứng
hoặc các thiết
bị lưu trữ khác. Bộ nhớ trong thường dùng để lưu trữ dữ liệu
tạm thời cho ứng
dụng, trong khi các thiết bị lưu trữ ngoài có thể được sử dụng
để tăng không gian lưu trữ, tăng hiệu suất, khả năng chia sẻ và đảm bảo tính tin
cậy của dữ liệu.
Phương tiện liên lạc
Khả năng liên lạc giữa các máy tính phát triển nhanh chóng đã giúp cho
công nghệ Grid trở nên hiện thực, do đó đây cũng là một tài nguyên quan trọng.
Ở đây bao gồm việc liên lạc, trao đổi dữ liệu giữa các thành phần trong Grid và
giao tiếp giữa Grid với bên ngoài. Một số công việc đòi hỏi một lượng dữ liệu lớn

nhưng các dữ liệu này thường không nằm trên máy đang thực thi công việc. Khả
năng về băng thông trong những trường hợp như vậy là một tài nguyên then chốt,
ảnh hưởng đến khả năng của Grid.
Việc giao tiếp với bên ngoài được thực hiện thông qua mạng Internet. Grid
có thể sử dụng các kết nối Internet để liên lạc giữa các node. Vì các kết nối này
không chia sẻ một đường truyền nên làm tăng băng thông truy cập Internet.
Các đường truyền dự phòng đôi khi cần thiết để giải quyết tốt hơn các vấn đề
về hư hỏng mạng và truyền dữ liệu lớn.
Phần mềm, và ứng dụng
Grid có thể được cài đặt các phần mềm mà có thể quá mắc để cài trên tất cả
mọi máy tính trong Grid. Các phần mềm này chỉ cần được cài trên một số node.
Thông qua Grid, khi một công việc cần đến chúng, nó sẽ gửi dữ liệu đến node đã
được cài đặt phần mềm và cho thực thi. Đây có thể là một giải pháp tốt để tiết
kiệm chi phí về bản quyền phần mềm.
Các thiết bị đặc biệt
Là các thiết bị dùng trong khoa học, kỹ thuật như kính viễn vọng, các bộ
cảm biến (sensor),… Các thiết bị này chủ yếu thu thập các dữ liệu khoa học, phục
vụ cho các bước phân tích, xử lý sau này.
Các tài nguyên trên đây đến từ nhiều nguồn khác nhau, có thể không thuộc
quyền quản lý của một tổ chức, của một đơn vị mà có thể thuộc nhiều tổ
chức, ở nhiều nơi khác nhau. Một số tài nguyên có thể được sử dụng tự do,
trong khi một số khác được sử dụng dưới những chính sách nhất định. Các tài
nguyên được “ảo hóa” (virtualize) để che dấu sự phức tạp, đa dạng nhằm đưa
ra một cái nhìn thống nhất, đơn giản về toàn bộ tài nguyên trên Grid sao cho
dưới mắt của người dùng, các tài nguyên Grid là một khối thống nhất. Hình I.2.1
HVTH: Phan Tử Ánh Trang 9
Báo cáo chuyên đề: Điện toán lưới GVHD: PGS.TS. NGUYỄN PHI KHỨ
minh hoạ ý tưởng
này.
Hình I.2.1: Tài nguyên Grid dưới quan điểm của người dùng, là một

khối thống nhất có được nhờ sự ảo hoá.
Các tài nguyên ảo được tổ chức lại thành các VO, đến lượt nó, các tổ chức
ảo lại thực hiện chia sẻ tài nguyên của mình để hình thành Grid lớn hơn, tạo
thành một kho tài nguyên khổng lồ.
I.3- Phân loại lưới và công nghệ lưới
Các kiểu Grid
Công nghệ Grid có thể được sử dụng theo nhiều cách khác nhau để giải
quyết các loại yêu cầu ứng dụng. Thông thường Grid được phân loại bởi kiểu
của ứng dụng cần giải quyết. Có 3 loại Grid như trình bày dưới đây. Tuy
nhiên không có ranh giới phân biệt rõ ràng giữa các loại Grid và trong thực tế,
các giải
pháp Grid thường là sự kết hợp 2 hay nhiều loại khác nhau.
Grid tính toán (Computation Grid)
Loại Grid này tập trung chủ yếu vào việc sử dụng năng lực tính toán. Ở
dạng Grid này, phần lớn các node là các máy tính hay các nhóm máy tính
(cluster) có năng lực xử lý, tính toán rất lớn.
Hình thức thực hiện là chia tác vụ tính toán lớn thành nhiều công việc nhỏ
thực thi song song trên các node của Grid. Việc phân tán các tác vụ tính toán
trong Grid sẽ làm giảm rất đáng kể toàn bộ thời gian xử lý và tăng khả năng tận
dụng hệ thống. Thông thường một hệ thống chính sẽ chia khối dữ liệu cần xử
lý thành các phần nhỏ, sau đó phân phối đến các node trên Grid. Mỗi node sẽ
thực hiện xử lý dữ liệu và trả kết quả về hệ thống chính để hệ này tổng hợp và
trình diễn kết quả toàn cục
cho người dùng. Hình I.3.1 minh họa quá trình này.
HVTH: Phan Tử Ánh Trang 10
Báo cáo chuyên đề: Điện toán lưới GVHD: PGS.TS. NGUYỄN PHI KHỨ
Hình I.3.1: Hình thức hoạt động của Grid Tính toán
Grid dữ liệu (Data Grid)
Ở đây, không gian lưu trữ là tài nguyên. Một Grid Dữ liệu chịu trách nhiệm
lưu trữ và cung cấp khả năng truy cập dữ liệu cho nhiều tổ chức khác nhau.

Người dùng không cần biết chính xác vị trí dữ liệu khi thao tác với dữ liệu.
Các cơ sở dữ liệu, đặc biệt các cơ sở dữ liệu liên hợp, đóng vai trò
quan trọng trong các Grid Dữ liệu, nhất là khi có nhiều nguồn dữ liệu và xuất
hiện nhu
cầu kết hợp các thông tin từ các nguồn dữ liệu này.
Các Grid Dữ liệu có thể được sử dụng trong lĩnh vực khai thác dữ liệu(data
mining) hoặc các hệ thống thương mại thông minh. Trong trường hợp này,
không chỉ có hệ thống file hay các cơ sở dữ liệu mà toàn bộ dữ liệu của tổ chức
cần tập hợp lại. Ở đây có thể phải kết hợp giữa Grid Dữ liệu và Grid Tính toán.
Scavenging Grid
Một Scavenging Grid thường được dùng với một lượng lớn các máy tính để
bàn. Các máy tính thường được kiểm tra định kỳ để xem khi nào bộ xử lý và các
tài nguyên khác rảnh rỗi để thực hiện các tác vụ Grid. Chủ nhân của máy
để bàn thường có quyền xác định khi nào thì chia sẻ chiếc máy của mình.
Sơ đồ Grid (Grid Topology)
Grid có thể được xây dựng theo nhiều kích cỡ khác nhau, từ một nhóm vài
máy tính đặt trong một phòng ban đến hàng trăm nhóm máy tính tổ chức theo kiểu
phân cấp trải rộng khắp thế giới. Grid Topology đơn giản nhất là SimpleGrid, chỉ
bao gồm một số máy tính đồng nhất ở cùng một vị trí. Độ phức tạp của Grid
Topology tương ứng với số lượng tổ chức tham gia Grid và các ràng buộc về địa
lý. Phần này sẽ giới thiệu sơ nét về một số Grid Topology cơ bản. Hình I.3.2 cho
thấy độ lớn của các Grid Topology
.
HVTH: Phan Tử Ánh Trang 11
Báo cáo chuyên đề: Điện toán lưới GVHD: PGS.TS. NGUYỄN PHI KHỨ
Hình I.3.2: Các Grid Topology
SimpleGrid
Hình I.3.3: SimpleGrid Grid Topology
Một SimpleGrid chỉ bao gồm vài máy tính, tất cả đều có cùng kiến trúc phần
cứng, chạy cùng một hệ điều hành, kết nối vào mạng cục bộ. Dạng Grid này sử

dụng các hệ thống đồng nhất nên ít phức tạp, thường chỉ dùng để thử nghiệm,
làm quen với các phần mềm Grid. Các máy tính thuộc một phòng ban trong tổ
chức nên việc sử dụng chúng cho Grid không cần các chính sách đặc biệt về quản
lý cũng như bảo mật. Các máy tính chạy cùng hệ điều hành, cùng kiến trúc
phần cứng nên việc chọn các phần mềm ứng dụng khá đơn giản, dễ dàng.
SimpleGrid này
khiến người ta liên tưởng đến các cluster hơn là Grid.
IntraGrid
HVTH: Phan Tử Ánh Trang 12
Báo cáo chuyên đề: Điện toán lưới GVHD: PGS.TS. NGUYỄN PHI KHỨ
Hình I.3.4: IntraGrid Grid Topology
Mở rộng hơn một chút so với SimpleGrid là IntraGrid. Lúc này xuất hiện các
hệ thống không đồng nhất, nhiều loại tài nguyên mới trong Grid. Sử dụng cùng
một chính sách bảo mật, sử dụng mạng nội bộ để kết nối các hệ thống trong Grid
là các đặc tính quan trọng của Grid Topology này.
Hệ thống Grid cần có các module lập lịch. Việc chia sẻ file có thể sử dụng các
hệ thống file mạng (network filesytem). Các máy tính tham gia Grid có thể thuộc
nhiều phòng ban khác nhau nhưng vẫn trong cùng một tổ chức.
Khi Grid mở rộng ra nhiều phòng ban, các chính sách mới về cách sử dụng
Grid cần phải được xác lập và áp dụng. Ví dụ: cần phải có chính sách quy định
những công việc nào được thực hiện trên Grid, vào thời điểm nào; độ ưu
tiên của các phòng ban,… Bên cạnh đó vấn đề bảo mật cũng cần được quan
tâm, các dữ liệu nhạy cảm của một phòng ban cần được bảo vệ khỏi sự truy cập từ
các công việc của các phòng ban khác.
Các máy tính dành riêng cho Grid bắt đầu được đưa vào để làm tăng chất
lượng
dịch vụ của Grid, thay vì phải trông chờ vào các tài nguyên rảnh rỗi.
ExtraGrid
Vẫn trong cùng một tổ chức, ExtraGrid là sự kết hợp 2 hay nhiều IntraGrid.
Như trong hình I.3.5, ExtraGrid liên quan đến nhiều vùng quản lý khác nhau,

phân tán theo địa lý, sử dụng các kết nối truy cập từ xa hay WAN, do đó độ
phức tạp trong quản lý tăng lên rất nhiều. Đối với ExtraGrid, các tài nguyên
mang tính động hơn, Grid cần phải linh động trong việc quản lý các tài nguyên,
cần có cơ chế kiểm soát và phục hồi lỗi.
Cần có các dịch vụ cung cấp thông tin (information service) để tìm
kiếm tài nguyên.
HVTH: Phan Tử Ánh Trang 13
Báo cáo chuyên đề: Điện toán lưới GVHD: PGS.TS. NGUYỄN PHI KHỨ
Hình I.3.5: ExtraGrid Grid Topology
InterGrid
Theo thời gian, các Grid mở rộng ra khỏi một tổ chức và bắt đầu liên kết
nhiều tổ chức với nhau, được dùng để phối hợp giữa các tổ chức trong các dự án
lớn. Một InterGrid đòi hỏi việc liên kết động các ứng dụng, tài nguyên và dịch
vụ. Khách hàng hay bất kỳ tổ chức hợp lệ nào khác đều có thể truy cập Grid thông
qua các kết nối Internet và WAN.
Trong dạng Grid này, cấp độ bảo mật cao nhất cần được áp dụng để ngăn
ngừa các khả năng bị tấn công và gián điệp. InterGrid cung cấp khả năng trao
đổi, mua bán, tìm kiếm tài nguyên ở mức toàn cầu. Các tài nguyên có thể được
mua từ các nhà cung cấp tin cậy.
Hình I.3.6: InterGrid Grid Topology
I.4- Các yêu cầu của điện toán lưới
Quản lý tài nguyên (Resource Management)
Mục tiêu của công nghệ Grid Computing là chia sẻ, phối hợp, sử dụng hiệu quả
nhiều loại tài nguyên đến từ nhiều nguồn khác nhau. Để thực hiện được điều đó,
HVTH: Phan Tử Ánh Trang 14
Báo cáo chuyên đề: Điện toán lưới GVHD: PGS.TS. NGUYỄN PHI KHỨ
cần phải giải quyết các thách thức và yêu cầu chính sau đây:
Tài nguyên thuộc nhiều vùng quản trị khác nhau
Các tài nguyên Grid phân tán theo địa lý qua nhiều vùng quản trị và được sở
hữu và quản lý bởi nhiều tổ chức khác nhau. Không thể chờ đợi một sự thống

nhất chung về các chính sách sử dụng, chia sẻ, bảo mật giữa các tổ chức. Grid
cần phải tôn trọng, tương thích với các chính sách quản trị và sử dụng tài nguyên
cục bộ. Cần có một cơ chế chia sẻ có tính mềm dẻo cao, từ mô hình client-
server đến peer-to-peer để kiểm soát chi tiết, chính xác cách sử dụng các tài
nguyên chia sẻ, bao gồm kiểm soát truy cập, ủy quyền, áp dụng các chính sách
cục bộ và toàn cục. Để chia sẻ nhiều loại tài nguyên khác nhau từ các chương
trình, file, dữ liệu đến các máy tính, sensor,…và cho nhiều phương thức sử dụng
khác nhau từ đơn người dùng đến đa người dùng, từ hướng hiệu suất đến hướng
chi phí, từ đó đưa ra mô hình chất lượng dịch vụ, lập lịch, phối hợp cấp phát tài
nguyên và thanh toán chi
phí.
Cần có cơ chế dàn xếp việc chia sẻ tài nguyên giữa các bên tham gia (bên
cung cấp và bên sử dụng) hợp lý. Việc chia sẻ này phải được quản lý chặt chẽ
và đặc tả rõ ràng giữa các bên cung cấp và sử dụng về những gì được chia sẻ, ai
được phép chia sẻ, ở điều kiện nào thì việc chia sẻ được thực hiện.
Tài nguyên đa dạng, hỗn tạp
Grid phải quản lý nhiều tài nguyên không đồng nhất về bản chất, sử dụng
nhiều công nghệ, các hệ thống quản lý tài nguyên cục bộ khác nhau. Ngay cả khi
có 2 site cùng sử dụng một công nghệ, một hệ quản lý tài nguyên cục bộ nhưng có
cấu hình khác nhau cũng dẫn đến có các chức năng khác nhau.
Dưới đây là bảng đặc tính các đối tượng cần quản lý cho thấy sự phức tạp
trong quản lý tài nguyên:
HVTH: Phan Tử Ánh Trang 15
Báo cáo chuyên đề: Điện toán lưới GVHD: PGS.TS. NGUYỄN PHI KHỨ
Việc tồn tại của tài nguyên trong Grid thay đổi theo thời gian
Trong Grid, các tài nguyên có thể xuất hiện hoặc biến mất mà không hề báo
trước do nhiều nguyên do khác nhau như lỗi hệ thống, lỗi mạng, các chính sách
chia
sẻ của nhà cung cấp,…Đây cũng là một thách thức lớn để đảm bảo tính tin
cậy của

hệ thống. Cần có các cơ chế tìm kiếm, xác định tài nguyên, phát hiện và
phục hồi
lỗi.
Vấn đề phối hợp cấp phát tài nguyên
Các ứng dụng có nhiều đòi hỏi về tài nguyên mà chỉ có thể đáp ứng bằng cách
sử dụng song song các tài nguyên trên nhiều site khác nhau. Các chính sách quản
trị cục bộ của các site cùng với khả năng bị lỗi trong quá trình cấp phát tài nguyên
đòi hỏi phải có các cơ chế đặc biệt để phối hợp cấp phát nhiều tài nguyên, khởi tạo
các quá trình tính toán, theo dõi, và quản lý chúng trên các tài nguyên.
Vấn đề điều khiển trực tuyến, theo thời gian thực (online)
Cần có cơ chế cho phép thoả thuận sử dụng tài nguyên trong thời gian thực
thi để đáp ứng nhu cầu của ứng dụng, nhất là trong trường hợp các yêu cầu và
tính chất các tài nguyên thay đổi trong quá trình thực thi.
Bảo mật (Security)
Các hệ thống Grid cần phải cung cấp đầy đủ các chức năng bảo mật
truyền thống như chứng thực, phân quyền, bảo vệ thông điệp, toàn vẹn dữ liệu, …
ngoài ra cần đáp ứng các yêu cầu sau:
Đăng nhập một lần (Single sign-on)
HVTH: Phan Tử Ánh Trang 16
Báo cáo chuyên đề: Điện toán lưới GVHD: PGS.TS. NGUYỄN PHI KHỨ
Một tính toán đơn giản cũng cần phải sử dụng nhiều tài nguyên khác nhau, vì
thế nếu cứ mỗi lần truy xuất tài nguyên lại cần phải chứng thực người dùng là
điều không thực tế và không thể chấp nhận được. Thay vào đó, hệ thống Grid cần
có cơ chế cho phép người dùng chỉ cần chứng thực một lần mà có thể sử dụng
nhiều tài nguyên khác nhau.
Cho phép ủy quyền
Đây là một yêu cầu quan trọng, để thực hiện được yêu cầu “đăng nhập một
lần” thì cần phải có sự uỷ quyền. Người dùng cần có khả năng uỷ quyền cho
các chương trình sử dụng các quyền của mình, để chương trình có thể truy cập
đến các tài nguyên được phép khác của người dùng, và chương trình, đến lượt nó

cũng cần có khả năng ủy quyền cho các chương trình khác.
Có khả năng tích hợp được với các chính sách bảo mật cục bộ
Mỗi site hoặc nhà cung cấp tài nguyên đều có chính sách bảo mật riêng của
mình. Do đó, các giải pháp bảo mật trên Grid cần phải liên kết được với các
giải pháp cục bộ, không được thay thế toàn bộ các giải pháp này mà cho phép kế
thừa, sử dụng lại.
Sử dụng các quan hệ tin cậy lẫn nhau dựa theo người dùng
Để cho phép người dùng sử dụng kết hợp tài nguyên từ nhiều nhà cung cấp
khác nhau, hệ thống bảo mật không được yêu cầu các nhà cung cấp phải hợp
tác, liên lạc với nhau để thiết lập môi trường bảo mật. Ví dụ, nếu người dùng có
quyền sử dụng 2 site A và B, thì người dùng cũng có thể sử dụng kết hợp 2 site A,
B cùng lúc mà không cần các chuyên gia bảo mật của site A, B liên lạc với nhau.
Hỗ trợ bảo mật liên lạc nhóm
Một quá trình tính toán được cấu thành từ nhiều tiến trình khác nhau, những
tiến trình này cần phải liên lạc với nhau theo từng nhóm. Các nhóm có thể thay
đổi trong suốt quá trình tính toán. Grid cần có giải pháp để thực hiện bảo mật cho
các nhóm này.
Đảm bảo tính riêng tư
Một trong những khả năng của Grid là cho phép xử lý dữ liệu trên máy tính ở
xa. Từ đây cũng nảy sinh vấn đề cần bảo vệ tính riêng tư của dữ liệu, sao cho
các người dùng hay nhà quản trị trên máy tính ở xa không thể xâm nhập, sử
dụng các dữ liệu đang được xử lý trên máy tính của mình.
Cho phép có nhiều cài đặt khác nhau
Các giải pháp bảo mật không nên chỉ tập trung vào một cài đặt cụ thể mà nên
cài đặt theo nhiều công nghệ khác nhau dựa trên một nền tảng chung. Điều này
đảm bảo tính tương thích với nhiều hệ thống khác nhau.
Các giải pháp bảo mật trên Grid cũng nên cung cấp sự hỗ trợ mềm dẻo cho
công tác bảo vệ liên lạc (ví dụ như điều khiển được mức độ bảo vệ, bảo vệ các
gói dữ liệu trong các protocol không đảm bảo tính tin cậy (UDP), hỗ trợ
HVTH: Phan Tử Ánh Trang 17

Báo cáo chuyên đề: Điện toán lưới GVHD: PGS.TS. NGUYỄN PHI KHỨ
các protocol vận chuyển tin cậy khác ngoài TCP,…) và cho phép các nhà cung
cấp ra
quyết định về phân quyền cũng như hạn chế ủy quyền theo nhiều cách khác
nhau.
Quản lý thông tin
- Hệ thống thông tin Grid cần có các cơ chế hỗ trợ việc truy cập, tìm
kiếm thông tin các loại về hệ thống Grid một cách nhanh chóng, chính xác.
Cần có các chức năng để xác định đặc tính phần cứng, phần mềm cũng như
các thông tin trạng thái như tải hiện tại và trạng thái hàng đợi trong trường
hợp tài nguyên được lập lịch sử dụng và có các cơ chế cung cấp các thông tin
này gần như theo thời gian thực.
- Hệ thống thông tin cần hỗ trợ theo dõi thông tin của một lượng rất lớn các
thành phần, cho phép nhiều loại thực thể truy cập, tìm kiếm thông tin
trong khi giảm thiểu các chi phí về công sức và tài nguyên cần thiết để tạo
lập, cập nhật các thông tin cả ở từng site lẫn toàn bộ Grid.
- Một trong những mục tiêu của hệ thống thông tin là đơn giản hoá việc tìm
kiếm thông tin để ra các quyết định sử dụng tài nguyên thích hợp, do đó hệ
thống thông tin cần phải được xây dựng theo mô hình dữ liệu đơn nhất
(uniform), cung cấp một giao diện chung để truy xuất nhiều thông tin khác
nhau.
- Mô hình quản lý thông tin cần đủ bao quát để biểu diễn các cấu trúc thông tin
trong môi trường tính toán phân tán. Một trong những thách thức là biểu diễn
được các thuộc tính liên quan đến nhiều site cùng lúc (ví dụ như : băng thông
liên lạc giữa các site).
- Do tài nguyên của Grid rất đa dạng, có thể được thêm bớt theo thời gian, do
đó khả năng tích hợp thêm các thông tin mới vào hệ thống là rất quan trọng.
Các hệ thống thông tin Grid cần phải có khả năng này.
- Các hệ thống thông tin Grid cần có khả năng phát sinh thông tin từ nhiều
nguồn khác nhau để cung cấp các thông tin tổng hợp về hệ thống.

- Đưa ra các cách thức truy xuất mềm dẻo đến hệ thống thông tin, người dùng
cần có khả năng đọc, cập nhật cùng với khả năng tìm kiếm, định vị thông tin.
- Hệ thống thông tin chỉ có thể hữu dụng khi nó được triển khai rộng rãi, do đó
cần có những kỹ thuật cho phép cài đặt, triển khai, bảo trì dễ dàng trên các
site khác nhau.
- Cần có mô hình quản lý thông tin phân tán, nên cho phép uỷ quyền tạo lập và
quản lý thông tin tài nguyên cho các site.
Quản lý dữ liệu
- Cần có mô hình quản lý dữ liệu phân tán, cho phép kết hợp dữ liệu từ nhiều
nơi khác nhau, hệ thống quản lý dữ liệu cần có các cơ chế quản lý sao cho có
thể che đi sự phức tạp của dữ liệu, cung cấp cho người dùng cách thức truy
HVTH: Phan Tử Ánh Trang 18
Báo cáo chuyên đề: Điện toán lưới GVHD: PGS.TS. NGUYỄN PHI KHỨ
cập đơn giản, hiệu quả thông qua một giao diện chung mà không cần biết đến
vị trí của dữ liệu.
- Cho phép sắp xếp các vị trí dữ liệu và có cơ chế lập lịch truy xuất dữ liệu tối
ưu nhằm nâng cao hiệu suất của Grid
- Cần có cơ chế di chuyển dữ liệu đến nơi xử lý mà không tạo ra hiệu ứng cổ
chai trong hệ thống mạng hoặc các vấn đề về truy xuất dữ liệu khác.
- Cần có các cơ chế truyền file hiệu suất cao, đọc ghi một loạt các file hoặc các
chức năng chọn lựa, tinh giảm dữ liệu từ xa, các cơ chế điều khiển việc cấp
phát tài nguyên phục vụ truyền dữ liệu (không gian, băng thông, CPU).
Phát triển ứng dụng
- Việc xây dựng Grid gặp khó khăn hơn nhiều so với các ứng dụng
bình thường hiện nay, cần phải đưa ra các mô hình, phương pháp giải quyết
các vấn đề như chia sẻ, chia nhỏ, phân tích, di chuyển , bảo mật, quản lý, dữ
liệu, đồng bộ hoá các tiến trình, công việc,… nhằm tận dụng tối đa khả năng
của hệ thống.
- Cần xây dựng các mô hình, các môi trường lập trình, các bộ công cụ phát
triển ứng dụng cho Grid nhằm đơn giản hóa việc phát triển ứng dụng, tạo điều

kiện đưa công nghệ Grid Computing vào thực tế.
Các vấn đề khác
- Khi kích cỡ Grid tăng lên, chi phí quản lý cũng tăng theo, hiệu suất của Grid
cũng giảm xuống, do đó khi xây dựng các công nghệ Grid cần tính toán khả
năng mở rộng của hệ thống.
- Cần có các cơ chế quản lý tiến trình để đặt chỗ trước trên tài nguyên, khởi
động, kiểm soát, điều khiển việc thực thi của các tiến trình.
- Về mã thực thi ứng dụng, dạng đặc biệt của tài nguyên lưu trữ này đòi hỏi các
cơ chế để quản lý phiên bản mã nguồn và mã thực thi của các đối tượng để
đảm bảo tính tương thích.
- Nguời dùng mong muốn có thể dùng môi trường ảo của Grid với chất lượng
gần giống như trên hệ thống cục bộ. Do đó, Grid cần phải cung cấp các công
cụ đơn giản để hỗ trợ người dùng để xác định các dịch vụ, số lượng và chất
lượng (QoS ) của chúng, chất lượng trong trường hợp này liên quan đến khả
năng truy cập dịch vụ một cách nhanh chóng thông qua các giao diện hoàn
hảo, các hệ thống chứng thực thông minh và các đường truyền tốc độ cao.
- Cần có một hệ thống quản lý phân phối hợp lý giữa các nhu cầu của người
dùng với khả năng của tài nguyên, theo dõi việc sử dụng các dịch vụ, và cung
cấp các dịch vụ cộng thêm khác như quản lý tài nguyên cục bộ, quản lý hiệu
suất, trạng thái tài nguyên, quản lý đăng nhập và bảo mật.
- Cần có một giao diện chuẩn để chuyển các yêu cầu của người dùng và khả
năng của tài nguyên thành một ngôn ngữ duy nhất bất kể nền tảng phần
HVTH: Phan Tử Ánh Trang 19
Báo cáo chuyên đề: Điện toán lưới GVHD: PGS.TS. NGUYỄN PHI KHỨ
cứng, phần mềm của mỗi tài nguyên phân tán nhằm mục đích phối hợp hoạt
động.
I.5- Lợi ích của công nghệ điện toán lưới
Khai thác, tận dụng các tài nguyên nhàn rỗi
Hầu hết các tổ chức đều có một lượng lớn các tài nguyên tính toán nhàn rỗi,
các máy tính cá nhân thường chỉ sử dụng hết 5% thời gian xử lý CPU, ngay cả

các server cũng thường “rảnh rỗi”. Grid có thể tối ưu sử dụng các tài nguyên
nhàn rỗi này theo nhiều cách khác nhau, ví dụ, gửi một công việc trên một máy
tính đang bận rộn đến một máy khác rảnh rỗi hơn để xử lý, hoặc phân nhỏ một
công việc rồi gửi các công việc con đến các máy tính nhàn rỗi khác cho xử lý song
song,…
Grid cho phép kết hợp nhiều không gian lưu trữ nhàn rỗi để tạo thành một
không gian lưu trữ lớn hơn, được cấu hình để tăng hiệu suất, độ tin cậy hơn so
với các máy đơn lẻ thông qua các cơ chế quản lý dữ liệu.
Một chức năng của Grid nữa là cân bằng sử dụng tài nguyên tốt hơn. Một tổ
chức thường gặp các vấn đề không mong đợi khi các hoạt động đòi hỏi thêm
nhiều tài nguyên hơn. Với Grid, có thể chuyển hoạt động đến các tài
nguyên nhàn rỗi khác, hoặc có thể thêm các tài nguyên mới một cách dễ dàng,
từ đó làm tăng khả năng chịu đựng của hệ thống. Grid có thể quản lý nhiều loại
tài nguyên, do đó có thể cho phép theo dõi tổng quan về các hoạt động sử dụng
tài nguyên trong các tổ chức lớn, hỗ trợ hoạch định các chiến lược sử dụng tài
nguyên.
Sử dụng CPU song song
Khả năng sử dụng các CPU song song là một đặc tính tuyệt vời của Grid,
ngoài việc hỗ trợ các nhu cầu tính toán của các nhà khoa học, sức mạnh tính toán
do Grid cung cấp có thể giúp giải quyết các bài toán đòi hỏi năng lực xử lý lớn
trong các ngành khác như y dược, tính toán tài chính, kinh tế, khai thác dầu hoả,
dự báo thời tiết, công nghiệp vũ trụ, thiết kế sản phẩm, … và rất nhiều lĩnh vực
khác.
Cho phép hợp tác trên toàn thế giới
Một trong những đóng góp quan trọng của công nghệ Grid Computing là cho
phép và đơn giản hoá hợp tác chia sẻ, làm việc giữa một cộng đồng rộng lớn
trên toàn thế giới. Các công nghệ tính toán phân tán trước đây cũng cho phép
hợp tác
nhưng chỉ trong một phạm vi nhỏ, còn Grid cho phép mở rộng trên
phạm vi toàn

cầu khi đưa ra những chuẩn quan trọng cho phép các hệ thống không
đồng dạng làm việc chung với nhau để tạo nên một hệ thống tính toán ảo cung
cấp rất nhiều dạng tài nguyên khác nhau.
Cho phép chia sẻ, sử dụng tất cả các loại tài nguyên
Không chỉ cho phép chia sẻ các chu kỳ tính toán, dữ liệu, Grid có thể cho
HVTH: Phan Tử Ánh Trang 20
Báo cáo chuyên đề: Điện toán lưới GVHD: PGS.TS. NGUYỄN PHI KHỨ
phép chia sẻ tất cả các loại tài nguyên mà trước đây chưa được chia sẻ, như
băng thông mạng, các thiết bị đặc biệt, phần mềm, bản quyền, các dịch vụ,… Ví
dụ, nếu một người dùng muốn tăng băng thông kết nối Intenet của mình lên để
thực hiện một ứng dụng khai thác dữ liệu, ứng dụng đó có thể được gửi đến
nhiều máy tính trong Grid có các kết nối Internet riêng, từ đó băng thông truy cập
Internet của anh ta tăng lên rất nhiều lần,…
Tăng tính tin cậy cho các hệ thống máy tính
Hiện nay, các hệ thống tính toán sử dụng các phần cứng chuyên dụng, đắt đỏ
để tăng độ tin cậy. Ví dụ, có thể sử dụng các “chip” có các mạch dự phòng để có
thể phục hồi lỗi khi có sự cố về phần cứng. Một máy tính có thể sử dụng các bộ vi
xử lý đôi, cho phép “cắm nóng”, để khi có một vi xử lý bị hỏng, có thể thay thế
cái khác mà không làm ngưng hoạt động của hệ thống. Các giải pháp này làm tăng
độ tin cậy của hệ thống, tuy nhiên với chi quá đắt khi phụ kiện đi kèm cũng phải
nhân lên.
Trong tương lai, các hướng tiếp cận mới để giải quyết vấn đề độ tin cậy dựa
nhiều hơn vào các công nghệ phần mềm hơn là các phần cứng đắt tiền. Grid là
sự khởi đầu cho các công nghệ đó. Các hệ thống trong Grid thường rẻ và phân tán
theo địa lý, do đó, nếu có sự cố về nguồn điện hay các lỗi hệ thống khác tại một
vị trí, toàn bộ phần còn lại không bị ảnh hưởng. Các phần mềm quản trị Grid có
khả năng thực thi lại công việc trên một node khác khi phát hiện có lỗi hệ thống.
Nếu quan trọng hơn nữa, trong các hệ thống theo thời gian thực, nhiều bản dự
phòng của các các công việc quan trọng có thể được chạy trên nhiều máy
tính khác nhau trong Grid để đảm bảo độ tin cậy tối đa.

Tăng khả năng quản trị các hệ thống
Mục tiêu ảo hoá tất cả các tài nguyên và cung cấp giao diện quản lý đơn nhất
các hệ thống hỗn tạp đem lại những cơ hội mới để quản trị tốt hơn trong các cơ
sở hạ tầng công nghệ thông tin lớn, phân tán.
Bên cạnh đó, đối với tầm quản lý vĩ mô, có nhiều dự án sử dụng cơ sở hạ
tầng công thông tin, Grid cho phép quản lý độ ưu tiên sử dụng tài nguyên của các
dự án này. Trước đây, mỗi dự án thường chịu trách nhiệm quản lý một số tài
nguyên, thường xảy ra tình trạng các tài nguyên của dự án này đang nhàn rỗi
trong khi dự án khác đang gặp vấn đề, thiếu tài nguyên do gặp các sự kiện
không lường trước. Với tầm nhìn rộng hơn do Grid cung cấp, các tình huống trên
có thể được giải quyết dễ dàng.
Trên đây giới thiệu một số ích lợi khi sử dụng công nghệ Grid Computing,
Grid còn mang lại rất nhiều lợi ích khác mà không thể kể hết ở đây, tuỳ vào tình
huống cụ thể mà đem lại các lợi ích khác nhau. Vấn đề là phải hiểu rõ bản chất
Grid, sử dụng tốt các công cụ nhằm khai khác tốt nhất trong các tình huống cụ thể.
Công nghệ Grid Computing có thể được ứng dụng trong các bài toán trong
khoa học lẫn thương mại:
- Đòi hỏi năng lực xử lý lớn (High-performance computing), yêu cầu rút ngắn
thời gian hoàn thành kết quả càng nhanh càng tốt.
HVTH: Phan Tử Ánh Trang 21
Báo cáo chuyên đề: Điện toán lưới GVHD: PGS.TS. NGUYỄN PHI KHỨ
- Hướng dữ liệu, đòi hỏi phải thu thập, lưu trữ, phân tích một lượng lớn dữ liệu,
mang tính phân tán.
- Cần sự hợp tác, chia sẻ giữa các cộng đồng.
I.6- Cơ sở hạ tầng điện toán lưới
Một cơ sở hạ tầng (infrastructure) là một công nghệ cho phép chúng ta thực
hiện các hoạt động của mình, ví dụ hệ thống đường giao thông cho phép đi lại
bằng xe, hệ thống ngân hàng cho phép chuyển tiền một các nhanh chóng.
Để có thể hữu dụng, cơ sở hạ tầng cần phải được triển khai rộng rãi, điều đó
cũng có nghĩa là nó phải đơn giản hoặc có giá trị to lớn hoặc cả hai. Do đó, cơ sở

hạ tầng Grid cần phải vừa đơn giản, vừa hỗ trợ được nhiều dạng tài nguyên khác
nhau.
Phần này sẽ giới thiệu tổng quan về các thành phần chính yếu của một
môi
trường Grid. Tuỳ theo thiết kế và cách sử dụng Grid, một số thành
phần có thể
không cần thiết và đôi khi trong một số trường hợp, có thể kết hợp
nhiều thành phần lại thành một thành phần phức hợp.
Portal/Giao diện người dùng
Truy cập thông tin trên Grid là việc rất quan trọng, thành phần giao
diện người dùng
đảm
nhiệm chức năng này. Giao diện người dùng thuộc một
trong 2 dạng:
- Giao diện cung cấp bởi ứng dụng đang chạy của người dùng.
- Giao diện cung cấp bởi các nhà quản trị Grid giống như portal cho phép khả
năng truy xuất đến các ứng dụng và tài trong Grid như trong một không gian
ảo duy nhất. Một Grid portal đưa ra một giao diện cho người dùng để chạy
các ứng dụng sử dụng các tài nguyên và dịch vụ của Grid. Giao diện kiểu
portal cũng có thể giúp người dùng học cách sử dụng Grid.
Bảo mật
Các máy tính trong Grid đều được nối mạng và chạy các ứng dụng, chúng có
thể phải xử lý các dữ liệu nhạy cảm hoặc có giá trị lớn, do đó thành phần bảo
mật của Grid là hết sức quan trọng. Ở mức cơ sở, bất kỳ môi trường Grid nào
cũng phải có các cơ chế bảo mật.
Broker
Khi đã được chứng thực, người dùng sẽ thực thi ứng dụng. Tùy thuộc vào
ứng dụng và các thông số cung cấp bởi người dùng, bước tiếp theo là phải xác
định được các tài nguyên thích hợp để sử dụng. Việc này đòi hỏi các chức năng
của một broker.

Bộ lập lịch (scheduler)
Khi các tài nguyên đã được xác định và cấp phát, bước tiếp theo là lập lịch
HVTH: Phan Tử Ánh Trang 22
Báo cáo chuyên đề: Điện toán lưới GVHD: PGS.TS. NGUYỄN PHI KHỨ
điều phối các công việc chạy trên đó. Cần có các bộ lập lịch để xác định các
node thực thi ứng dụng và gửi các công việc được yêu cầu đến các node. Việc này
có thể đơn giản là lấy tài nguyên sẵn sàng tiếp theo trong hệ thống, nhưng
thường thì nó liên quan đến các hàng đợi công việc ưu tiên, quản lý tải, tìm kiếm
các tài nguyên đã đăng ký sử dụng, theo dõi tiến trình. Nếu có một tập các
công việc riêng lẻ,
không phụ thuộc vào nhau thì không cần các bộ lập lịch
phức tạp. Tuy nhiên, nếu
muốn giữ chỗ các tài nguyên đặc biệt hay chắc chắn
rằng các công việc chạy song song thì nên sử dụng các bộ lập lịch để phối hợp
hoạt động của các công việc. Lưu ý, các cluster có thể được xem là một tài
nguyên đơn lẻ, chúng có bộ lập lịch riêng để quản lý các node của nó. Một bộ lập
lịch cấp cao hơn dùng để quản lý các công việc cần thực hiện trên cluster trong
khi bộ lập lịch cục bộ của cluster sẽ điều phối các công việc cụ thể trên từng máy
tính con.
Thành phần quản lý dữ liệu (Data management)
Nếu bất cứ dữ liệu nào, bao gồm cả các module thực thi của ứng dụng, cần
phải di chuyển thì cần phải có các phương pháp an toàn, tin cậy để di chuyển
các file và dữ liệu qua lại giữa các node trong Grid. Do đó, cần phải có thành phần
này.
Thành phần quản lý công việc và tài nguyên (Job and resource
management)
Sau khi đã có các tiện nghi như trên, việc tiếp theo là xây dựng các dịch vụ
hỗ trợ việc thực hiện các công việc thật sự trong môi trường Grid. Để giải quyết
các tác vụ nòng cốt như khởi chạy ứng dụng với các tài nguyên cụ thể, theo dõi
trạng thái các công việc, nhận kết quả, hệ thống Grid cần có thành phần quản lý

công việc và tài nguyên.
Các thành phần khác
Còn có nhiều thành phần khác để đưa vào môi trường Grid và cần được xem
xét khi thiết kế và cài đặt ứng dụng. Ví dụ : Các tiện ích như liên lạc giữa các
tiến trình (Inter Process Communication) và các dịch vụ hỗ trợ tính toán chi phí
và chi trả là những tiện ích được yêu cầu nhiều nhất.
Trên đây là giới thiệu vắn tắt và tổng quan về các thành phần chính của môi
trường Grid. Tuỳ thuộc vào việc triển khai Grid và các yêu cầu của ứng dụng,
có nhiều cách khác nhau để kết hợp các thành phần này lại với nhau để tạo nên
một
giải pháp Grid.
I.7- Kiến trúc điện toán lưới
Bản chất kiến trúc Grid
VO là đơn vị cơ bản quan trọng trong hệ thống Grid. Việc thiết lập, quản lý,
khai thác các quan hệ chia sẻ tài nguyên giữa các tổ chức ảo đòi hỏi phải có kiến
trúc hệ thống mới, kiến trúc Grid. Kiến trúc Grid dưới đây được xây dựng dựa
HVTH: Phan Tử Ánh Trang 23
Báo cáo chuyên đề: Điện toán lưới GVHD: PGS.TS. NGUYỄN PHI KHỨ
trên quan niệm “để các VO hoạt động hiệu quả đòi hỏi phải thiết lập được các
quan hệ chia sẻ với bất kỳ đơn vị tham gia tiềm năng nào”. Để làm được điều này,
vấn đề “liên kết hoạt động” (interoperability) cần phải được tập trung giải
quyết. Trong môi trường mạng, “liên kết hoạt động” đồng nghĩa với việc sử dụng
các protocol chung. Do đó, kiến trúc Grid sẽ là kiến trúc protocol, với các
protocol xác định các cơ chế nền tảng để người dùng và nhà cung cấp tài
nguyên thương lượng, thiết lập, quản lý và khai thác các mối quan hệ chia sẻ tài
nguyên.
Kiến trúc Grid phải là kiến trúc dựa chuẩn, hướng mở, để dễ mở rộng, liên
kết hoạt động tốt, có tính khả chuyển (portability) cao. Các protocol chuẩn sẽ giúp
định nghĩa các service chuẩn, nhờ đó có thể xây dựng các service cao cấp hơn
một cách dễ dàng. Sau khi có được kiến trúc Grid, việc tiếp theo là xây dựng các

hàm API và các bộ SDK để cung cấp các công cụ cần thiết để phát triển các ứng
dụng chạy trên nền Grid.
Sở dĩ vấn đề “liên kết hoạt động” được xem là vấn đề cơ bản vì các mối quan
hệ chia sẻ có thể phải được thiết lập giữa các bên tham gia khác nhau về các
chính sách, giữa các môi trường khác nhau về nền tảng, ngôn ngữ, môi
trường lập trình,…Nếu không có nó, các thành viên trong VO sẽ thực hiện các
chính sách chia sẻ song phương và không chắc rằng các cơ chế sử dụng cho 2
thành viên này sẽ mở rộng được cho các thành viên khác. Điều này khiến cho việc
thành lập các VO động là không thể thực hiện hoặc cũng chỉ thành lập được VO
theo một kiểu nào đó mà thôi. Cũng giống như Web đã làm bùng nổ việc chia sẻ
thông tin bằng cách cung cấp các protocol và cú pháp chuẩn (HTTP và HTML)
dùng cho việc trao đổi thông tin, ở đây cũng cần các protocol và cú pháp chuẩn để
chia sẻ tài nguyên.
Để giải quyết vấn đề “liên kết hoạt động”, việc xây dựng các protocol là
quan trọng. Vì protocol xác định cách các thành phần phân tán trao đổi với nhau
để đạt được một mục đích nào đó, xác định các cấu trúc thông tin cần thiết trong
quá trình trao đổi. Các VO thường hay thay đổi, nên các cơ chế xác định, chia sẻ
và sử dụng tài nguyên cần phải mềm dẻo, gọn nhẹ, để các thỏa thuận chia sẻ tài
nguyên có thể được thiết lập, thay đổi một cách nhanh chóng. Các cơ chế chia sẻ
không được ảnh hưởng đến các chính sách cục bộ, và phải cho phép các thành viên
quản lý được các tài nguyên của họ. Vì các protocol quy định việc giao tiếp giữa
các thành viên chứ không quy định thành viên đó phải như thế nào, nên khi
dùng các protocol, các chính sách cục bộ được giữ lại. Do đó các protocol được
cần đến.
Khi đã có các protocol, thì việc xây dựng các service là cần thiết và quan
trọng, các service là bản cài đặt cụ thể của các protocol. Việc xây dựng các service
cơ bản phục vụ truy cập đến tài nguyên tính toán, dữ liệu, tìm kiếm tài nguyên,
lập lịch và đồng bộ hoá, sao chép dữ liệu,… cho phép xây dựng các service cao
cấp hơn cho ứng dụng đồng thời trừu tượng hoá các chi tiết về tài nguyên.
Cũng cần phải xây dựng các bộ API và SDK, vì các nhà phát triển ứng dụng

cần phải có công cụ để hỗ trợ phát triển các ứng dụng phức tạp trong môi trường
Grid, người dùng cũng phải có khả năng thực thi được các ứng dụng này. Sức
mạnh, tính đúng đắn của ứng dụng, chi phí phát triển và bảo trì là những mối
HVTH: Phan Tử Ánh Trang 24
Báo cáo chuyên đề: Điện toán lưới GVHD: PGS.TS. NGUYỄN PHI KHỨ
quan tâm quan trọng. Các API và SDK có thể giúp tăng tốc việc phát triển mã,
cho phép chia sẻ mã, tăng tính khả chuyển cho ứng dụng. Tất nhiên, API và SDK
chỉ hỗ trợ thêm chứ không thể thay thế các protocol được.
Kiến trúc Grid tổng quát
Sau gần 10 năm tập trung nghiên cứu, phát triển, tích luỹ kinh nghiệm, các
nhà phát triển công nghệ Grid đã có những thống nhất đáng kể về kiến trúc Grid.
Một trong những kiến trúc Grid được chấp nhận nhiều nhất được đưa ra bởi Ian
Foster, phần dưới đây sẽ giới thiệu về kiến trúc này.
Kiến trúc Grid, theo Ian Foster, là một kiến trúc phân tầng như trong hình
I.7.1.
Các thành phần trong một tầng có chung đặc điểm, tính chất, có thể được
xây dựng
từ bất cứ tầng dưới nào. Các thành phần được phân tầng dựa theo vai trò
của chúng trong hệ thống Grid. Đây là một kiến trúc mở.
Kiến trúc này chỉ quy định các yêu cầu chung nhất về thiết kế và triển khai
với mục đích chính là để tham khảo. Việc xây dựng, cài đặt cụ thể tuỳ thuộc vào
từng dự án, từng lĩnh vực ứng dụng.
Dưới đây là chi tiết của kiến trúc:
Hình I.7.1: Kiến trúc Grid tổng quát.
Tầng Fabric
Đây là tầng thấp nhất của kiến trúc, đại diện cho các thiết bị vật lý và toàn bộ
tài nguyên của Grid mà các tổ chức, người dùng muốn chia sẻ, sử dụng. Các tài
nguyên có thể tồn tại dưới dạng vật lý như các máy tính, hệ thống lưu trữ, các danh
mục, tài nguyên mạng, các loại sensor, cũng có thể là các thực thể logic, một thực
thể trừu tượng, đại diện cho một tập các tài nguyên vật lý, như hệ thống file phân

tán, các cluster,… Trong trường hợp các thực thể logic, việc triển khai có thể liên
quan đến các protocol cục bộ (ví dụ các protocol phục vụ dạng truy cập NFS,
hoặc protocol quản lý tài nguyên, tiến trình trong cluster,…) nhưng các protocol
này không liên quan đến kiến trúc Grid.
Các thành phần của tầng Fabric thực hiện các hoạt động cục bộ trên
các tài nguyên cụ thể (vật lý lẫn logic) như là bước tiếp sau của các hoạt động
HVTH: Phan Tử Ánh Trang 25

×