Tải bản đầy đủ (.doc) (18 trang)

Tiểu luận môn tính toán lưới chủ đề TÍNH TOÁN LƯỚI VÀ ỨNG DỤNG

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (463.36 KB, 18 trang )

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
CHƯƠNG TRÌNH ĐÀO TẠO THẠC SỸ CNTT QUA MẠNG
CHƯƠNG TRÌNH ĐÀO TẠO THẠC SỸ CNTT QUA MẠNG



BÀI THU HOẠCH
BÀI THU HOẠCH
Môn học:
Môn học:
TÍNH TOÁN LƯỚI
TÍNH TOÁN LƯỚI
Đề tài:
Đề tài:
TÍNH TOÁN LƯỚI VÀ ỨNG DỤNG
Giảng viên : PGS.TS. Nguyễn Phi Khứ
Học viên : Phạm Hùng Phương.
MSHV : CH1102006
Lớp : CAO HỌC CNTT QM KHOÁ 6.
Hà Nội, tháng 6/2013
Hà Nội, tháng 6/2013
LỜI CẢM ƠN
Em xin chân thành cảm ơn khoa sau đại học trường Đại học Công nghệ
thông tin – Đại học Quốc gia TP.HCM đã tạo điều kiện giúp chúng em hoàn thành
môn học.
Em xin cám ơn sâu sắc đến PGS.TS. Nguyễn Phi Khứ. Thầy đã tận tình
giảng dạy và hướng dẫn chúng em trong suốt thời gian học tập và nghiên cứu môn
Tính toán lưới.
Với thời lượng được học và nghiên cứu là không nhiều, bằng lượng kiến
thức đã học tập và nghiên cứu được em cố gắng hoàn thành bài thu hoạch trong


phạm vi cho phép, nhưng do thời gian và kiến thức còn hạn chế nên bài thu hoạch
có thể vẫn còn thiếu sót, mong Thày lượng thứ.
Một lần nữa em xin được tỏ lòng biết ơn thày đã giảng dạy và chỉ bảo tận
tình, cám ơn các thày cô khoa sau đại học và nhà trường đã tạo điều kiện để chúng
em hoàn thành môn học.
Hà Nội, ngày 13 tháng 7 năm 2013
Người làm bài thu hoạch
Phạm Hùng Phương
MỤC LỤC
MỤC LỤC 4
TÓM TẮT BÀI BÁO
VIẾT VỀ TÍNH TOÁN LƯỚI VÀ MỘT SỐ ỨNG DỤNG

Tóm tắt: Tính toán lưới đang nổi lên như một công nghệ tính toán đầy hứa hẹn
trong tương lai. Nó là mô hình tính toán đánh dấu một bước phát triển mới trong
lĩnh vực tính toán hiệu năng cao.
Bài báo giới thiệu về tính toán lưới và một số ứng dụng của nó đã và đang được
nghiên cứu triển khai ứng dụng
Summary: Grid computing is standing out as a promising computing technology
in the future. It is a computing form which marks a new developing step in high
efficency computing.
This paper introduces grid computing and some of its applications which have
been studying anh deploying.
CHI TIẾT VÀ PHÂN TÍCH BÀI BÁO
I. KHÁI NIỆM TÍNH TOÁN LƯỚI
Trong những năm gần đây, tính toán lưới – grid computing nổi lên như một
nền tảng hỗ trợ tính toán phân tán trên những bộ dữ liệu lớn, thực hiện những
công việc tính toán phức tạp. Tư tưởng của Grid là kết hợp sức mạnh tính toán của
hàng trăm, hàng nghìn máy tính bình thường nằm phân tán về mạnh địa lý, tạo
thành một cơ sở hạ tầng tính toán tổng hợp tương đương hoặc thậm chí vượt xa

sức mạnh của những siêu máy tính hiện đại đắt tiền.
Michael Di Stefano đưa ra định nghĩa về tính toán lưới như sau:
“Tính toán lưới là bất kỳ cụm tài nguyên tính toán nào cung cấp môi trường hỗ
trợ chia sẻ và quản lý tài nguyên cho các công việc phân tán dựa trên chính sách
nào đó”.
Còn Ian Foster đưa ra ba đặc điểm của một lưới thực sự:
• Phối hợp sử dụng tài nguyên mà không dựa trên điều khiển tập trung.
• Sử dụng các giao thức chuẩn và có tính mở rộng.
• Cung cấp chất lượng dịch vụ không tầm thường, theo nghĩa tài nguyên hoạt
động kết hợp trên môi trường lưới tạo ra chất lượng dịch vụ tốt hơn nhiều so với
tổng chất lượng dịch vụ của các tài nguyên đơn lẻ.
Hiện nay, nhiều người vẫn lẫn lộn khái niệm “tính toán lưới” với “tính toán
ngang hàng”. Cả hai có điểm chung là cùng giải quyết bài toán chia sẻ tài nguyên
phân tán giữa các tổ chức ảo, cùng được xây dựng dựa trên kiến trúc phân tầng, và
mỗi hướng tiếp cận có điểm mạnh, điểm yếu riêng. Lưới được xây dựng trên nền
tảng kiến trúc chặt chẽ, phục vụ cộng đồng người dùng quy mô nhỏ, thường nằm
trong cùng lĩnh vực nghiên cứu mà họ quan tâm, hỗ trợ khả năng tích hợp tài
nguyên mạnh mẽ đa dạng hơn tính toán ngang hàng. Ứng dụng trên lưới thường là
ứng dụng khoa học, đòi hỏi khả năng tính toán cao, và hướng người dùng. Ngược
lại, tính toán ngang hàng được xây dựng trên nền kiến trúc linh hoạt hơn, phục vụ
cho một số lượng lớn người dùng, có thể lên đến hàng triệu, chủ yếu hỗ trợ ứng
dụng chia sẻ tài nguyên như chia sẻ chu kỳ tính toán hoặc tệp.
Cũng như các công nghệ tính toán khác, tính toán lưới (grid computing) ra đời
xuất phát từ nhu cầu tính toán của con người. Thực tế, ngày càng có nhiều bài
toán phức tạp hơn được đặt ra và do đó các tổ chức cũng cần phải có những năng
lực tính toán mạnh mẽ hơn. Có thể giải quyết vấn đề này bằng hai cách:
Thứ nhất: Đầu tư thêm trang thiết bị, cơ sở hạ tầng tính toán (mua thêm máy
chủ, máy trạm, siêu máy tính, cluster ). Rõ ràng là cách làm này hết sức tốn kém.
Thứ hai: Một cách thực hiện hiệu quả hơn là phân bố lại hợp lý các nguồn tài
nguyên trong tổ chức hoặc thuê thêm các nguồn tài nguyên từ bên ngoài (dĩ nhiên

là với chi phí rẻ hơn nhiều so với việc đầu tư cho cơ sở hạ tầng tính toán). Thực tế
cho thấy có một phần lớn các nguồn tài nguyên của chúng ta đang bị sử dụng lãng
phí: các máy để bàn công sở thường chỉ hoạt động khoảng 5% công suất, ngay cả
các máy chủ cũng có thể chỉ phải hoạt động với 20% công suất. Việc tận dụng
hiệu quả các nguồn tài nguyên này có thể mang lại một sức mạnh tính toán khổng
lồ.
Cách giải quyết thứ hai này chính là mục tiêu của tính toán lưới. Tính toán
lưới hướng đến việc chia sẻ và sử dụng hiệu quả các nguồn tài nguyên thuộc về
nhiều tổ chức trên một quy mô rộng lớn (thậm chí là quy mô toàn cầu). Chính các
công nghệ mạng và truyền thông phát triển mạnh mẽ trong những năm qua đã
biến những khả năng này dần trở thành hiện thực. Các nghiên cứu về tính toán
lưới đã và đang được tiến hành nhằm tạo ra một cơ sở hạ tầng lưới cho phép dễ
dàng chia sẻ và quản lý các tài nguyên đa dạng và phân tán trong môi trường lưới.
Cấu trúc mô hình tính toán lưới như sau:
Các thách thức mà công nghệ tính toán lưới đang phải giải quyết bao gồm:
- Các tài nguyên hết sức đa dạng, không đồng nhất. Tài nguyên ở đây được
hiểu theo nghĩa hết sức tổng quát. Đó có thể là các tài nguyên phần cứng: tài
nguyên tính toán, tài nguyên lưu trữ, các thiết bị đặc biệt khác ; các tài nguyên
phần mềm: các CSDL, các phần mềm đặc biệt và đắt giá ; các đường truyền
mạng Các tài nguyên này có thể rất khác nhau về mặt kiến trúc, giao diện, khả
năng xử lý Việc tạo ra một giao diện thống nhất cho phép khai thác và sử dụng
hiệu quả các nguồn tài nguyên này hoàn toàn không dễ dàng. Ban đầu tính toán
lưới được đặt ra chủ yếu là để tận dụng các nguồn tài nguyên tính toán nhưng hiện
nay mục tiêu của nó đã được mở rộng sang rất nhiều nguồn tài nguyên khác như
đã kể trên.
- Các tài nguyên không chỉ thuộc về một tổ chức mà thuộc về rất nhiều tổ chức
tham gia lưới. Các tổ chức phải tuân thủ một số quy định chung khi tham gia vào
lưới còn nhìn chung là hoạt động độc lập tức là các tài nguyên này đều có quyền
tự trị. Các tổ chức khác nhau thường có chính sách sử dụng hay cho thuê tài
nguyên của họ khác nhau và do vậy cũng gây khó khăn cho việc quản lý.

- Các tài nguyên phân tán rộng khắp về mặt địa lý do vậy phải có các cơ chế
quản lý phân tán.
- Đảm bảo an toàn thông tin cho một môi trường phức tạp như môi trường lưới
là rất khó khăn trong khi đây là một trong những điểm ưu tiên hàng đầu.
Các định nghĩa tính toán lưới:
Khái niệm Tính toán lưới đã bắt đầu xuất hiện vào đầu thập niên 90 với nghĩa
ẩn dụ là làm cho việc sử dụng sức mạnh của máy tính dễ dàng như là việc sử dụng
điện năng. Ngày nay có rất nhiều định nghĩa về tính toán lưới. Một định nghĩa về
Grid khá hoàn chỉnh được đưa ra bởi tiến sỹ Ian Foster như sau :
“Grid là một loại hệ thống song song, phân tán cho phép chia sẻ, lựa chọn,
kết hợp các tài nguyên phân tán theo địa lý, thuộc nhiều tổ chức khác nhau dựa
trên tính sẵn sàng, khả năng, chi phí của chúng và yêu cầu về chất lượng dịch vụ
(QoS) của người dùng để giải quyết các bài toán, ứng dụng có quy mô lớn trong
khoa học, kỹ thuật và thương mại. Từ đó hình thành nên các “tổ chức ảo”
(Virtual Organization (VO)), các liên minh tạm thời giữa các tổ chức và tập đoàn,
liên kết với nhau để chia sẻ tài nguyên và/hoặc kỹ năng nhằm đáp ứng tốt hơn các
cơ hội kinh doanh hoặc các dự án có nhu cầu lớn về tính toán và dữ liệu, toàn bộ
việc liên minh này dựa trên các mạng máy tính”.
Một hệ thống Grid có 3 đặc điểm chính:
- Có sự kết hợp, chia sẻ các tài nguyên không được quản lý tập trung.
- Sử dụng các giao diện và giao thức chuẩn, mang tính mở, đa dụng.
- Đáp ứng yêu cầu cao về chất lượng dịch vụ.

Mô hình Grid Computing
Các định nghĩa khác:
* Plaszczak/Weller định nghĩa kỹ thuật lưới là “kỹ thuật cho phép ảo hoá tài
nguyên dự trữ theo yêu cầu, và chia sẻ dịch vụ, tài nguyên giữa các tổ chức”.
* IBM thì định nghĩa, “Lưới là khả năng sử dụng một tập các nguồn mở và
giao thức để có thể truy nhập tới các ứng dụng và dữ liệu, năng lực xử lý, khả
năng lưu trữ và một loạt các tài nguyên tính toán khác trên Internet. Một lưới là

một loại hệ thống song song và phân tán cho phép chia sẻ giữa nhiều khu vực dựa
trên sự sẵn có, dung lượng, hiệu năng, giá cả và các yêu cầu về chất lượng dịch vụ
của người sử dụng”.
* Buyya định nghĩa Lưới là “ một kiểu hệ thống song song và phân tán cho
phép chia sẻ, lựa chọn và kết hợp động các tài nguyên phân tán theo địa lý tại thời
điểm thực thi dựa trên sự sẵn sàng, dung lượng, hiệu năng, giá và những yêu cầu
về chất lượng dịch vụ.
* CERN, một trong những tổ chức lớn nhất sử dụng công nghệ Lưới, nói về
Lưới như sau: ”một dịch vụ để chia sẻ năng lực của máy tính và dung lượng lưu
trữ dữ liệu qua Internet”.
Bản chất của tính toán lưới giống một nền tảng dạng khái niệm hơn là một tài
nguyên vật lý. Lưới được tận dụng để cung cấp tài nguyên cho một nhiệm vụ tính
toán. Mục tiêu của công nghệ lưới liên quan tới những yêu cầu của việc cung cấp
tài nguyên linh hoạt vượt ra khỏi các khu vực cục bộ.
II. SO SÁNH TÍNH TOÁN LƯỚI VỚI MỘT SỐ MÔ HÌNH TÍNH TOÁN
KHÁC
1. World Wide Web (Web computing):
WWW hiện nay đang phát triển mạnh mẽ và được sử dụng rộng khắp. Sử
dụng các chuẩn mở và các giao thức mở (TCP, HTTP, XML, SOAP), WWW có
thể được sử dụng để xây dựng các tổ chức ảo tuy nhiên nó thiếu một số đặc tính
quan trọng như các cơ chế chứng thực một lần, ủy nhiệm, các cơ chế phối hợp sự
kiện
2. Các hệ thống tính toán phân tán (Distributed computing systems):
Các công nghệ tính toán phân tán hiện tại bao gồm CORBA, J2EE và DCOM
rất thích hợp cho các ứng dụng phân tán tuy nhiên chúng không cung cấp một nền
tảng phù hợp cho việc chia sẻ tài nguyên giữa các thành viên của tổ chức ảo. Một
số khó khăn có thể kể ra trong việc khai phá tài nguyên, đảm bảo an ninh và xây
dựng động các tổ chức ảo. Thêm nữa việc tương tác giữa các công nghệ này cũng
gặp phải khó khăn. Tuy nhiên cũng đã có một số nghiên cứu nhằm mở rộng những
công nghệ này cho môi trường lưới, ví dụ như Java JINI.

3. Các hệ thống tính toán ngang hàng (Peer - to - peer Computing
Systems):
Tính toán ngang hàng cũng là một lĩnh vực của tính toán phân tán. Những
điểm khác biệt chính giữa tính toán ngang hàng và tính toán lưới là:
- Tính toán lưới có cộng đồng người sử dụng có thể nhỏ hơn tuy nhiên tập
trung nhiều vào các ứng dụng và có yêu cầu cao hơn về an ninh cũng như tính
toàn vẹn của ứng dụng. Trong khi đó các hệ thống mạng ngang hàng có thể có số
người sử dụng rất lớn bao gồm cả các người dùng đơn lẻ và các tổ chức tuy nhiên
không đòi hỏi cao về an ninh và mô hình chia sẻ tài nguyên cũng đơn giản hơn.
- Môi trường lưới liên kết các nguồn tài nguyên mạnh hơn, đa dạng hơn và
chặt chẽ hơn.
4. Tính toán phân cụm:
Tính toán lưới thường bị nhầm lẫn với tính toán phân cụm. Tuy nhiên sự khác
biệt chính giữa hai kiểu tính toán này là: một cụm tính toán là một tập đơn các nút
tính toán tập trung trên một khu vực địa lý nhất định, trong khi một lưới bao gồm
nhiều cụm tính toán và những loại tài nguyên khác (như mạng, các thiết bị lưu
trữ).
III. MỘT SỐ ÍCH LỢI KHI SỬ DỤNG CÔNG NGHỆ GRID COMPUTING
1. Khai thác, tận dụng các tài nguyên nhàn rỗi
Hầu hết các tổ chức đều có một lượng lớn các tài nguyên tính toán nhàn rỗi,
các máy tính cá nhân thường chỉ sử dụng hết 5% thời gian xử lý CPU, ngay cả các
server cũng thường “rảnh rỗi”. Grid có thể tối ưu sử dụng các tài nguyên nhàn rỗi
này theo nhiều cách khác nhau, ví dụ, gửi một công việc trên một máy tính đang
bận rộn đến một máy khác rảnh rỗi hơn để xử lý, hoặc phân nhỏ một công việc rồi
gửi các công việc con đến các máy tính nhàn rỗi khác cho xử lý song song,… Một
chức năng của Grid nữa là cân bằng sử dụng tài nguyên tốt hơn. Một tổ chức
thường gặp các vấn đề khó khăn khi các hoạt động đòi hỏi thêm nhiều tài nguyên
hơn. Với Grid, có thể chuyển hoạt động đến các tài nguyên nhàn rỗi khác, hoặc có
thể thêm các tài nguyên mới một cách dễ dàng, từ đó làm tăng khả năng chịu đựng
của hệ thống.

2. Sử dụng CPU song song

Khả năng sử dụng các CPU song song là một đặc tính tuyệt vời của Grid,
ngoài việc hỗ trợ các nhu cầu tính toán của các nhà khoa học, sức mạnh tính toán
do Grid cung cấp có thể giúp giải quyết các bài toán đòi hỏi năng lực xử lý lớn
trong các ngành khác như y dược, tính toán tài chính, kinh tế, khai thác dầu hoả,
dự báo thời tiết, công nghiệp vũ trụ, thiết kế sản phẩm, … và rất nhiều lĩnh vực
khác.
3. Cho phép hợp tác trên toàn thế giới
Một trong những đóng góp quan trọng của công nghệ Grid Computing là cho
phép và đơn giản hoá hợp tác chia sẻ, làm việc giữa một cộng đồng rộng lớn trên
toàn thế giới. Các công nghệ tính toán phân tán trước đây cũng cho phép hợp tác
nhưng chỉ trong một phạm vi nhỏ, còn Grid cho phép mở rộng trên phạm vi toàn
cầu khi đưa ra những chuẩn quan trọng cho phép các hệ thống không đồng dạng
làm việc chung với nhau để tạo nên một hệ thống tính toán ảo cung cấp rất nhiều
dạng tài nguyên khác nhau.
4. Cho phép chia sẻ, sử dụng tất cả các loại tài nguyên
Không chỉ cho phép chia sẻ các chu kỳ tính toán, dữ liệu, Grid có thể cho phép
chia sẻ tất cả các loại tài nguyên mà trước đây chưa được chia sẻ, như băng thông
mạng, các thiết bị đặc biệt, phần mềm, bản quyền, các dịch vụ,… Ví dụ, nếu một
người dùng muốn tăng băng thông kết nối Internet của mình lên để thực hiện một
ứng dụng khai thác dữ liệu, ứng dụng đó có thể được gửi đến nhiều máy tính trong
Grid có các kết nối Internet riêng, từ đó băng thông truy cập Internet của anh ta
tăng lên rất nhiều lần,…
5. Tăng tính tin cậy cho các hệ thống máy tính.
Hiện nay, các hệ thống tính toán sử dụng các phần cứng chuyên dụng, đắt đỏ
để tăng độ tin cậy. Ví dụ, một máy tính có thể sử dụng các bộ vi xử lý đôi, cho
phép “cắm nóng”, để khi có một vi xử lý bị hỏng, có thể thay thế cái khác mà
không làm ngưng hoạt động của hệ thống. Các giải pháp này làm tăng độ tin cậy
của hệ thống, tuy nhiên với chi quá đắt khi phụ kiện đi kèm cũng phải nhân lên.

Trong tương lai, các hướng tiếp cận mới để giải quyết vấn đề độ tin cậy dựa nhiều
hơn vào các công nghệ phần mềm hơn là các phần cứng đắt tiền. Grid là sự khởi
đầu cho các công nghệ đó. Các hệ thống trong Grid thường rẻ và phân tán theo địa
lý, do đó, nếu có sự cố về nguồn điện hay các lỗi hệ thống khác tại một vị trí, toàn
bộ phần còn lại không bị ảnh hưởng. Các phần mềm quản trị Grid có khả năng
thực thi lại công việc trên một node khác khi phát hiện có lỗi hệ thống. Nếu quan
trọng hơn nữa, trong các hệ thống theo thời gian thực, nhiều bản dự phòng của các
các công việc quan trọng có thể được chạy trên nhiều máy tính khác nhau trong
Grid để đảm bảo độ tin cậy tối đa.
6. Tăng khả năng quản trị các hệ thống
Mục tiêu ảo hoá tất cả các tài nguyên và cung cấp giao diện quản lý đơn nhất
các hệ thống hỗn tạp đem lại những cơ hội mới để quản trị tốt hơn trong các cơ sở
hạ tầng công nghệ thông tin lớn, phân tán.


Trên đây giới thiệu một số ích lợi khi sử dụng công nghệ Grid Computing,
Grid còn mang lại rất nhiều lợi ích khác mà không thể kể hết ở đây, tuỳ vào tình
huống cụ thể mà đem lại các lợi ích khác nhau. Vấn đề là phải hiểu rõ bản chất
Grid, sử dụng tốt các công cụ nhằm khai khác tốt nhất trong các tình huống cụ thể.
IV. MỘT SỐ ỨNG DỤNG ĐÃ ĐƯỢC TRIỂN KHAI
Lưới cung cấp một giải pháp cho những bài toán về tính toán hiệu năng cao
như tạo nếp protein, mô hình hoá tài chính, mô phỏng động đất và dự đoán khí
hậu thời tiết. Ngoài ra lưới còn có thể giúp các tổ chức, doanh nghiệp sử dụng một
cách tối ưu hoá tài nguyên công nghệ thông tin và tạo ra các dịch vụ tính toán theo
nhu cầu cho các khách hàng thương mại và miễn phí trong đó khách hàng chỉ phải
trả những gì họ đã sử dụng giống như điện và nước. Sau đây là một số ứng dụng
đã được triển khai:
1. IBM: ứng dụng công nghệ và Tính toán lưới giúp nghiên cứu ung thư:
IBM nói nhiều đến một cơ sở hạ tầng thông minh. IBM phối hợp với ĐH
TexasMedical Branch (UTMB) sử dụng Big Blue (siêu máy tính ảo) để xác định

các hợp chất hóa học có nhiều khả năng ngăn chặn sự lây lan của virus cúm gia
cầm và các loại virus khác. Dự án nghiên cứu nhân đạo này sửdụng một nguồn lực
tính toán lớn đến hàng triệu máy tính của hơn 400.000 người sẵn sàng hiến thời
gian máy của họ cho việc xử lý. DV IBMSmart Business (IBM kinh doanh thông
minh) với công nghệ tính toán mây cung cấp cho người dùng khả năng nâng cao
chất lượng công việc, đảm bảo an toàn thông tin và tìm kiếm mô hình kinh doanh
sáng tạo. IBM đang sở hữu một mạng lưới tính toán mây rất lớn.
Ngoài lắp đặt ở nước ta, IBM còn có những trung tâm khác như ở Hàn Quốc,
Ấn Độ, Brazil…Từ tháng 5/2008, IBM đã cho ra mắt siêu máy tính Road Runner
(trị giá 133 triệu USD), tốc độ tính toán đạt 1triệu tỷ phép tính/giây(petaflop).
Chúng ta liên tưởng đến những máy tính “cực lớn” của IBM trước đây và các
trung tâm tính toán tập trung mà người dùng chỉ có thể tiếp cận thông qua các máy
trạm trong những năm 60, 70 của thế kỷ trước. Thời kỳ “tập trung cửa quyền” ấy
qua đi, nhường chỗ cho các máy tính cá nhân để bàn (PC) làm việc trong môi
trường khách/chủ (client/server), rồi tiếp đến là hình thành các mạng máy tính mà
nổi bật là mạng Internet. Ngày nay, sự hình thành tính toán mây với những TTDL
cực lớn, người dùng có thể truy cập nhờ Web services bằng các phương tiện như
điện thoại di động, netbook, desktop…, làm chúng ta lại nghĩ đến một sự tập trung
mới! Nhưng lần này là sự tập trung tiến bộ, nâng cao, ảo hóa.
“Help defeat Cancer” - dự án “Giúp chiến thắng ung thư” là dự án do các nhà
nghiên cứu tại Đại học Nha khoa và Y khoa tại New Jersey và Viện Nghiên cứu
Ung thư của New Jersey đang cộng tác với tập đoàn IBM thực hiện. Dự án “Help
Defeat Cancer” có mục đích giúp các nhà nghiên cứu hiểu rõ hơn về nguyên nhân
cơ bản của căn bệnh ung thư để có thể tăng cường hiệu quả điều trị và lập kế
hoạch điều trị cho bệnh nhân ung thư. Với sự hỗ trợ của World Community Grid
của IBM, dự án này là cơ hội cho các nhà nghiên cứu phân tích số lượng lớn mô
ung thư cùng một lúc và cho phép thực hiện nhiều thí nghiệm trong một khoảng
thời gian ngắn hơn. Thông qua máy tính mạng lưới cộng đồng toàn cầu, tất cả mọi
người có thể đóng góp thời gian nhàn rỗi của máy tính họ sau khi việc tải về máy
tính phần mềm miễn phí World Community Grid và đăng ký tại

.
2. Vài nét về ứng dụng Tính toán lưới và Điện toán đám mây trong nước
Ở nước ta đã có những đề tài nghiên cứu về tính toán lưới như đề tài Xây dựng
dữ liệu lưới cho khí tượng Việt Nam (Construction a Data Grid forMeteorology in
Viet Nam) của Đại học Bách khoa Hà Nội và nhiều đề tài khác của Viện CNTT-
Viện Khoa học Công nghệ Việt Nam và của chương trình Nghiên cứu cấp nhà
nước KC-01.
VN, đã đồng hành cùng thế giới vào “tính toán mây”. Bộ KH&CN phối hợp
với hãng IBM xây dựng cổng thông tin VIP (Vietnam Information for Science and
TechnologyAdvance Innovation Portal) với công nghệ tính toán mây từ năm 2007
nhằm tạo một môi trường sáng tạo cho các nhà nghiên cứu, giảng viên, sinh viên
các trường ĐH chia sẻ thông tin, thiết lập một cộng đồng hợp tác nghiên cứu.
Ngay từ năm 2005, CISCO cũng đã giới thiệu một mô hình chuẩn Trung tâm dữ
liệu (Data Center) tính toán lưới có khả năng tích hợp các DV web và khả năng tự
động hoá cao cho các doanh nghiệp lớn ngành ngân hàng - tài chính. Tại TPHCM
và Hà Nội đã có nhiều Trung tâm dữ liệu (TTDL) đạt tiêu chuẩn của Hiệp hội
Viễn thông Quốc tế TIA, nhưcủa FPT Telecom, CMC Telecom, Ngân hàng Sài
gòn Thương tín- Sacombank. Ngân hàng Đông Nam Á Tất cả đều cho biết nhờ
dùng công nghệ tínhtoán lưới đã tiết kiệm đến 50% chi phí…
3. Dự đoán cấu trúc protein:
Từ các dãy amino-acid là một ứng dụng quan trọng nhất của tin sinh học. Bài
toán dự đoán cấu trúc protein có thể được mô hình hóa như bài toán tối ưu hóa.
Nó đòi hỏi số lượng tính toán rất lớn. Do đó cần có các kỹ thuật metaheuristic,
tính toán hiệu năng cao, tính toán lưới.
4. Tính toán lưới và bài toán quản trị mạng:
Ngày nay bộ phận quản trị mạng phải phân tích, xử lý một khối lượng thông
tin khổng lồ nhằm đưa ra các giải pháp, phản ứng theo thời gian thực để đảm bảo
cho các hệ thống mạng hoạt động thông suốt, tin cậy, an toàn. Để có thể thực hiện
tốt công việc của mình, bộ phận quản trị mạng cần phải có những công cụ phân
tích, cung cấp thông tin hoạt động của hệ thống mạng mạnh mẽ. Công nghệ Grid

Computing được chọn ứng dụng vào bài toán phân tích, cung cấp thông tin hỗ trợ
quản trị mạng với hy vọng tận dụng được năng lực xử lý nhàn rỗi hiện có trong
các hệ thống mạng để giải quyết bài toán hiệu quả hơn, trong giới hạn chi phí có
thể chấp nhận được. Mục tiêu lâu dài là xây dựng một hệ thống nhằm hỗ trợ bộ
phận quản trị mạng trong các lĩnh vực: quản lý hiệu năng, quản lý lỗi và bảo mật.
Đưa các công nghệ khai thác dữ liệu (data mining) và trí tuệ nhân tạo vào hệ
thống để phân tích các dữ liệu thu được, tìm ra các quy luật sử dụng của người
dùng, các quy luật tấn công, … nhằm huấn luyện hệ thống có thể tự động nhận
dạng các mối nguy hiểm và đưa ra các phản ứng thích hợp, hiệu quả.
5. Mô hình lập lịch trong hệ thống tính toán lưới do Buyya đề xuất
Bài toán lập lịch hay lập kế hoạch là một bài toán ta rất hay gặp trong thực tế.
Có thể kể ra như lập thời khóa biểu, lập kế hoạch quản lý dự án đều là các bài
toán lập lịch tiêu biểu và rất kinh điển. Nội dung của bài toán là tìm ra một bản kế
hoạch thực hiện các công việc một cách tối ưu nhất dựa vào tất cả các thông tin
đầu vào có được từ tình trạng hiện tại của hệ thống, tuy nhiên tùy theo bài toán cụ
thể mà yêu cầu và phương pháp giải quyết của các bài toán này rất khác nhau.
Buyya đề nghị một phương pháp lập lịch cho các ứng dụng nghiên cứu tham
số (bao gồm một tập lớn các công việc độc lập trên tập các dữ liệu độc lập). Mô
hình này cũng giống như mô hình lập trình đơn chương trình đa dữ liệu (Single
Program Multiple Data). Việc lập lịch và điều phối hoạt động của các ứng dụng
dạng này trên môi trường tính toán phân tán trên diện rộng tưởng chừng khá đơn
giản tuy nhiên các vấn đề phức tạp sẽ nảy sinh khi người dùng đặt ra một số các
tham số về chất lượng dịch vụ như thời hạn kết thúc ứng dụng và giới hạn về kinh
phí. Những đảm bảo như thế về chất lượng dịch vụ là rất khó thực hiện trong một
môi trường như môi trường lưới khi mà các tài nguyên lưới phân tán, không đồng
nhất, được sở hữu bởi nhiều tổ chức khác nhau với những chính sách và cơ chế
tính giá khác nhau. Thêm vào đó các thuật toán lập lịch phải được thiết kế để thích
ứng được với sự thay đổi tải và sự sẵn dùng của tài nguyên cùng lúc với việc phải
đảm bảo được thời hạn và kinh phí.
Tư tưởng chủ đạo của việc thiết kế các thuật toán lập lịch cho lưới là: không

sử dụng các thuật toán tối ưu truyền thống vẫn hay thường được sử dụng trong các
bài toán lập lịch mà chủ yếu sử dụng các heuristic.
6. Từ tính toán lưới đến tính toán đám mây
Tính toán lưới đã phát triển rất mạnh trên thế giới để liên kết những hệ thống
tính toán với nhau nhằm giải những bài toán cực lớn. Hệ thống bao gồm phần
cứng, phần mềm (PM), đường truyền và hàng bao nhiêu thiết bị khác…trong
những không gian thích hợp tạo một môi trường tính toán gọi là môi trường lưới.
Nói đến tính toán lưới là nói đến những cơ sở hạ tầng cực mạnh, những siêu
máy chủ, những thiết bị lưu trữ lớn,những clusters, những PM ứng dụng và sự
quản trị hệ thống phức hợp; là nói đến tính toán song song, phân chia thời gian,
các thuật toán tối ưu xử lý phân bố tài nguyên tính toán, lưu trữ…Những mô hình
tính toán lưới gần đây cũng tiếp cận đến cách khai thác PM như một DV, khai
thác nền tảng như một DV, đã có DV máy chủ ảo và thực sự chúng đã chuyển
hoá dần sang tính toán mây. Tính toán mây đều có những đặc điếm nói trên của
tính toán lưới, nhưng còn phát triển cao hơn ở những khía cạnh sau:
Tính toán mây là một mô hình tính toán năng động cao, có khả năng mở rộng
đến các tài nguyên ảo trên Internet. Hạ tầng cơ sở của tính toán mây được khai
thác như một DV (IaaS –Infrastructure as aService). Người dùng không phải đầu
tư vốn vào thiết bị và không phải lo bảo trì thiết bị và hàng nhiều công việc khác
liên quan mà chỉ chịu chi phí khai thác thiết bị ảo trên Internet do nhà cung cấp
phân bố, quản lý. Người dùng truy cập đến tính toán mây thông qua các DV
Webservices.
Hình 5: Mô hình tính toán mây (hình lấy trên Internet)
Nền tảng của một ứng dụng nào đó được khai thác nhưmột DV (PaaS-
Platform as a Service). Người dùng không phải chịu chi phí cho toàn bộ nền tảng
của ứng dụng mà chỉ chịu chi phí cho phần nềntảng nào được sử dụng.
PM được khai thác như một DV (SaaS-Software as a Service). Không phải trả
bản quyền cho PM mà ngườidùng chỉ trả tiền khai thác PM đó.
Tiện ích tính toán (UtilityComputing). Người dùng chỉ chịu chi phí cho những
tài nguyên, tiện ích được khai thác, không khác gì trả tiền điện, tiền nước theo

đồng hồ đo mà ta đã rất quen thuộc trong cuộc sống hàng ngày.
V. CÁC TỔ CHỨC HỖ TRỢ VÀ PHÁT TRIỂN TÍNH TOÁN LƯỚI
Diễn đàn điện toán lưới toàn cầu GGF: Diễn đàn Grid toàn cầu có mục đích
định nghĩa các đặc tả cho tính toán lưới. GGF được phát triển với hợp tác giữa
khu vực công nghiệp và khoa học với những hỗ trợ quan trọng từ cả hai khu vực
này.
Tổ chức Globus Alliance: Globus Alliance triển khai một số chuẩn được phát
triển tại diễn đàn GGF thông qua bộ phần mềm lưới trung gian Globus Toolkit.
Với chức năng là một thành phần trung gian trong kiến trúc lưới, bộ phần mềm
này cung cấp nền tảng chuẩn để thiết lập các dịch vụ trên lưới tính toán, nhưng
tính toán lưới còn cần có nhiều thành phần khác và rất nhiều công cụ để thiết lập
và duy trì môi trường lưới.
VI. KẾT LUẬN
Công nghệ tính toán lưới ra đời đánh dấu một bước phát triển mới trong lĩnh
vực tính toán hiệu năng cao. Nội dung bài báo này đã trình bày khá chi tiết và đầy
đủ về tính toán lưới từ khái niệm, các lợi ích đến các hướng ứng dụng cũng như
các ứng dụng cụ thể.
Tính toán lưới đã được khoảng vài năm nay, lợi thế của nó rất nhiều. Lưới điện
toán có thể được định nghĩa theo nhiều cách nhưng đối với bài thu hoạch em chỉ
hướng tới những điều đơn giản gọi nó là một cách để thực hiện tính toán công
việc (ví dụ: perl script, các truy vấn cơ sở dữ liệu, vv) trên một phân phối thiết lập
các nguồn tài nguyên thay vì nguồn tài nguyên trung tâm. Trong quá khứ hầu hết
các máy tính đã được thực hiện ở silo hoặc lớn SMP như hộp. Thậm chí ngày nay
chúng ta vẫn sẽ thấy các công ty thực hiện các tính toán về SMP hộp lớn (ví dụ
của E10K, HP Superdomes). Tuy nhiên, mô hình này có thể khá đắt tiền và cũng
không quy mô.
Cùng đến lưới điện toán và bây giờ chúng ta có khả năng phân phối công việc
để các thành phần nhỏ hơn bằng cách sử dụng nhiều máy chủ tải phần mềm chia
sẻ tải trọng phân phối đồng đều dựa trên nguồn lực và chính sách. Bây giờ thay vì
có một gánh nặng rất nhiều máy chủ tải được trải đều trên nhiều máy tính nhỏ hơn

mà có thể lây lan xung quanh các địa điểm khác nhau.
Cuối cùng cũng cần phải nói rằng tính toán lưới không phải là chìa khóa vạn
năng dùng để giải quyết mọi vấn đề. Nó được dùng để bổ trợ chứ không phải là
thay thế hoàn toàn các công nghệ tính toán hiện tại. Các công nghệ tính toán đã có
tồn tại cũng đã giải quyết từng phần các yêu cầu của tính toán lưới đặt ra (các yêu
cầu về chia sẻ tài nguyên phân tán) tuy nhiên tính toán lưới hiện nay chính thức
giải quyết các vấn đề đó một cách tập trung và bài bản hơn với một ngữ cảnh rộng
hơn rất nhiều.
Tài liệu tham khảo
[1] What is the Grid? A three points checklist. Ian Foster. http://www-
fp.mcs.anl.gov/~foster/Articles/WhatIsTheGrid.pdf
[2]. Viktors Berstis, Fundamentals of Grid Computing, , Redbooks, IBM
[3]. Bart Jacob – Michael Brown – Kenaro Fukui – Nihar Trivedi, Introduction to
grid computing, , Red books, IBM, 2002
[4] Grid FAQ. [4]. Grid computing.
Joshy Joseph, Craig Fellenstein. Prentice Hall PTR, 2003.
[5]. />[6]. IBM, Introduction to Grid Computing with Globus, 2003
[7]. “IBM: Tính toán lưới (grid computing) giúp nghiên cứu ung thư”, PC
World.VN
[8]. technet.aivietnam.net
[9]. Ks. Nguyễn Long - Nguyễn Huy Văn – Ks. Lê Công Trung, Mô hình lập
lịch trong hệ thống tính toán lưới do Buyya đề xuất, Tạp chí Công nghệ thông tin
& Truyền thông ♦
[10].
[11]. "A Gentle Introduction to Grid Computing and Technologies",

[12]
[13] />[14] />[15] />

×