Tải bản đầy đủ (.docx) (58 trang)

ĐIỆN TOÁN ĐÁM MÂYMỘT PHƯƠNG PHÁP MỚI ĐỂ CHIA SẺ THÔNG TIN Y SINH

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.82 MB, 58 trang )

Đại Học Quốc Gia TP.HCM
Trường Đại Học Công Nghệ Thông Tin
BÀI TIỂU LUẬN MÔN
ĐIỆN TOÁN LƯỚI
ĐỀ TÀI:
ĐIỆN TOÁN ĐÁM MÂY:
MỘT PHƯƠNG PHÁP MỚI ĐỂ CHIA SẺ
THÔNG TIN Y SINH
GVHD: PGS.TS Nguyễn Phi Khứ
HVTH: Tô Hồ Hải
Mã số: CH1101011
Lớp: Cao học khóa 6
TP.HCM – 07/2013
Khóa luận môn học: Điện toán lưới
MỤC LỤC

2
Khóa luận môn học: Điện toán lưới
Điện toán đám mây là một cuộc dịch chuyển cách mạng trong đó việc tính toán
sẽ được chuyển từ máy tính cá nhân và thậm chí cả các máy chủ ứng dụng doanh
nghiệp, cá nhân đến một đám mây máy tính. Đám mây là một hình tượng để chỉ đến
tập các máy chủ ảo hóa có thể cung cấp các nguồn tài nguyên của máy tính khác
nhau cho khách hàng của họ. Người sử dụng của hệ thống này chỉ cần được quan
tâm tới các dịch vụ máy tính đang được yêu cầu. Cái chi tiết bên dưới hệ thống của
nó như thế nào thì được ẩn khỏi người dùng. Các dữ liệu và các dịch vụ cung cấp
nằm trong các trung tâm dữ liệu của đám mây có khả năng mở rộng lớn và có thể
được truy cập ở bất kỳ đâu, từ bất kỳ thiết bị được kết nối trên thế giới.
Điện toán đám mây là một kiểu tính toán mà ở đó các công việc CNTT được
cung cấp như một dịch vụ trên internet đến nhiều khách hàng bên ngoài và khách
hàng được tính tiền theo sự sử dụng dịch vụ của họ. Nhiều nhà cung cấp điện toán
đám mây đã xuất hiện và có một sự tăng trưởng đáng kể trong việc sử dụng dịch vụ


này. Google, Microsoft, Yahoo, IBM và Amazon đã bắt đầu cung cấp dịch vụ điện
toán đám mây. Trong đó Amazon là nhà tiên phong trong lĩnh vực này. Các công ty
nhỏ hơn như SmugMug, một trang web lưu trữ hình ảnh trực tuyến, có sử dụng dịch
vụ điện toán đám mây để lưu trữ tất cả các dữ liệu và thực hiện một số dịch vụ của
mình.
Điện toán đám mây được sử dụng trong các lĩnh vực khác nhau như web
hosting, lập trình song song, dựng hình đồ hoạ, mô hình tài chính (IBM Clouds),
các phương pháp duyệt và tìm kiếm trên web (web spider), phân tích gen (Amazon
Clouds), v.v
Thông qua việc tìm hiểu công nghệ, em xin trình bày chi tiết việc ứng dụng
công nghệ điện toán đám mây vào việc chia sẽ thông tin y sinh.
Và người hướng dẫn em về môn học này là thầy Nguyễn Phi Khứ. Thầy rất tận
tâm và nhiệt tình, luôn tìm ra những cách tiếp cận mới hướng đến người học, giúp
người học dễ dàng tiếp thu những kiến thức mà thầy truyền đạt. Bên cạnh đó thầy
rất vui tính và có kiến thức rất sâu, rộng ở nhiều lĩnh vực nên luôn tạo cho bài giảng
của mình một cách rất sinh động, tự nhiên.
Em xin gởi lời cám ơn đến thầy, em chúc thầy cùng luôn khỏe mạnh và đạt
nhiều thành quả trong công việc của mình.
3
Khóa luận môn học: Điện toán lưới
PHẦN I. ĐIỆN TOÁN ĐÁM MÂY
1. Giới thiệu
Trong chương giới thiệu chúng tôi định nghĩa khái niệm tính toán đám mây và dịch
vụ đám mây, các tầng (layers) của mô hình tính toán đám mây và kiểu (types) mô
hình tính toán đám mây. Chúng tôi cũng thảo luận sự khác nhau giữa tính toán đám
mây và dịch vụ đám mây. Các công nghệ mới đã tạo điều kiện cho tính toán đám
mây ra đời sẽ được trình bày tiếp theo. Chúng tôi thảo luận về các đặc tính, các tiêu
chuẩn và an ninh của tính toán đám mây. Chúng tôi giới thiệu cloud computing
platforms (nền tảng của tính toán đám mây), các nhà cung cấp platforms và dịch vụ.
Chúng tôi cũng giới thiệu các thách thức và tương lai của tính toán đám mây.

Tính toán đám mây có thể được định nghĩa là một kiểu tính toán mới (new style of
computing) trong đó sự cân bằng động (dynamically scalable) và các tài nguyên ảo
hóa (virtualized resource) được cung cấp như dịch vụ trên Internet. Tính toán đám
mây đã trở thành một khuynh hướng công nghệ quan trọng, nhiều chuyên gia kỳ
vọng tính toán đám mây sẽ định hình lại các quy trình công nghệ thông tin và thị
trường IT. Với tính toán đám mây, người dùng có thể dùng các thiết bị như PCs,
laptops, smartphones, PDAs để truy nhập các chương trình, các platforms lưu trữ và
triển khai ứng dụng trên Internet thông qua các dịch vụ được các nhà cung cấp tính
toán đám mây chào mời. Lợi thế của tính toán đám mây là tiết kiệm chi phí, khả
năng sẵn sàng cao, khả năng cân bằng dễ dàng.
Hình 1.1 (dẫn theo Voas và Zhang 2009), thể hiện sáu giai đoạn của mô hình tính
toán, hay có thể gọi là sáu mô hình tính toán.
4
Khóa luận môn học: Điện toán lưới
Hình 1.1. Sáu giai đoạn của mô hình tính toán - từ tính toán mainframe tới tính
toán Internet, tính toán lưới và tính toán đám mây.
Trong giai đoạn 1, nhiều người dùng chia sẻ mainframes công suất cao thông qua
các terminal giả (dummy terminals). Trong giai đoạn 2, chỉ một PC cũng đã đủ sức
mạnh để đáp ứng nhu cầu tính toán của người dùng. Giai đoạn 3, PCs, laptops, và
các servers được kết nối vào mạng cục bộ để chia sẻ tài nguyên và nâng cao hiệu
năng. Giai đoạn 4, mạng cục bộ này được kết nối với mạng cục bộ khác tạo thành
một mạng toàn cầu như Internet để sử dụng các ứng dụng và tài nguyên từ xa. Giai
đoạn 5, tính toán lưới (grid computing) cung cấp năng lực tính toán và năng lực lưu
trữ dùng chung thông qua một hệ thống tính toán phân tán. Giai đoạn 6, tính toán
5
Khóa luận môn học: Điện toán lưới
đám mây cung cấp các tài nguyên dùng chung trên Internet theo một cách đơn giản
và cân bằng .
So sánh sáu mô hình tính toán trên, có thể nhận thấy rằng tính toán đám mây là sự
trở lại của mô hình tính toán mainframe ban đầu. Tuy nhiên, hai mô hình này cũng

có những khác biệt căn bản. Mô hình mainframe chỉ cung cấp năng lực tính toán
hạn chế, trong khi tính toán đám mây cung cấp năng lực tính toán không giới hạn.
Thêm nữa, trong mô hình tính toán mainframe, các terminal giả được coi là thiết bị
giao diện người dùng, trong khi đó với mô hình tính toán đám mây, PCs có thể cung
cấp năng lực tính toán cục bộ và hỗ trợ việc chuyển tiền từ người tiêu dùng cho nhà
cung cấp dịch vụ tính toán đám mây.
1.1. Các tầng của mô hình tính toán đám mây (Layers of Cloud computing)
Hình 1.2. Kiến trúc phân tầng của mô
hình tính toán đám mây (Theo Jones)
Tính toán đám mây có thể coi như một tập hợp dịch vụ, tập hợp này có thể được
trình bày như một kiến trúc phân tầng theo hình 1.2. Các dịch vụ tính toán đám mây
được cung cấp thường bao gồm như dưới đây.
6
Khóa luận môn học: Điện toán lưới
SaaS (Software-as-a-Service, phần mềm như là dịch vụ), đó là tầng đỉnh của
kiếntrúc. SaaS cho phép người dùng chạy các ứng dụng từ xa của đám mây.
IaaS (Infrastructure-as-a-Service, hạ tầng cơ sở như là dịch vụ) là tài nguyên tính
toán được cung cấp như là một dịch vụ. Đó là các máy tính được ảo hóa với năng
lực xử lý được đảm bảo và băng thông dự trữ đủ để lưu trữ và truy nhập Internet.
PaaS (Platform-as-a-Service, Platform-như-là-dịch-vụ) tương tự IaaS, ngoài ra còn
có các hệ điều hành và dịch vụ cần thiết cho một ứng dụng cụ thể. Nói cách khác,
PaaS là IaaS cộng thêm một số phần mềm riêng dành cho một ứng dụng cho trước.
dSaaS (data-Storage-as-a-Service, lưu-trữ-dữ-liệu-như-là-dịch-vụ) cung cấp không
gian lưu trữ mà khách hàng có thể sử dụng, bao gồm cả băng thông cho lưu trữ.
Hình 1.3. Ý tưởng về Platform-as-a-Service, Zoho Creator
/>Một ví dụ về PaaS cloud computing được thể hiện trên hình 1.3 (Platform as a
Service, PaaS cung cấp Môi trường Phát
triển Tích hợp (Integrated Development Environment, IDE) gồm an ninh dữ liệu,
sao lưu và khôi phục dữ liệu, hosting ứng dụng, kiến trúc cân bằng (scalable
architecture). Theo Chappel (2008) có ba kiểu dịch vụ đám mây như được minh họa

trên hình 1.4. Hình 1.4a thể hiện dịch vụ đám mây SaaS, theo đó toàn bộ ứng dụng
chạy trên đám mây. Client chỉ đơn giản dùng một trình duyệt (browser) để truy
nhập ứng dụng. Một ví dụ điển hình của SaaS là salesforce.com.
7
Khóa luận môn học: Điện toán lưới
Hình 1.4. Các loại dịch vụ đám mây (Theo Chappell 2008).
Hình 1.4b minh họa một kiểu khác của dịch vụ đám mây, theo đó ứng dụng chạy
trên client; tuy nhiên nó truy nhập các chức năng và dịch vụ tiện ích được cung cấp
trên đám mây. Một ví dụ điển hình của kiểu dịch vụ đám mây này trên desktop là
Apple’s iTunes. Ứng dụng trên desktop là để chơi nhạc, trong khi dịch vụ đám mây
được sử dụng để người dùng mua nội dung audio và video. Một ví dụ của dịch vụ
đám mây này là Microsoft Exchange Hosted Services – đám mây cung cấp bộ lọc
spam, lưu trữ tài liệu và các chức năng khác. Hình 1.4c thể hiện một cloud platform
để tạo ra các ứng dụng, chúng được các developers sử dụng. Họ tạo một ứng dụng
SaaS mới bằng cách dùng cloud platform.
1.2. Các kiểu mô hình tính toán đám mây (Types of Cloud computing)
Có 3 kiểu mô hình tính toán đám mây (xem
là: (a) public cloud, (b) private
cloud, (c) hybrid cloud, như minh họa Hình 1.5.
8
Khóa luận môn học: Điện toán lưới
Hình 1.5. Ba
kiểu mô hình
tính toán đám
mây.
Trong mô hình public cloud computing (hoặc external cloud computing), tài nguyên
tính toán được cung cấp linh hoạt trên Internet thông qua các Web applications hoặc
Web Services từ một nhà cung cấp thứ ba phi trực tuyến (off-site third-party
provider). Public cloud được vận hành bởi các bên thứ ba, nhu cầu ứng dụng của
các khách hàng khác nhau là tương tự nhau và được hợp nhất trên các cloud servers,

các hệ thống lưu trữ và các mạng. Private cloud (hoặc internal cloud) tham chiếu tới
tính toán đám mây trên các private networks. Private cloud được xây dựng để dùng
riêng cho một client, client được kiểm soát hoàn toàn về dữ liệu, an ninh và chất
lượng dịch vụ. Private cloud được xây dựng và được quản lý bởi một công ty thuộc
sở hữu của một tổ chức IT hoặc một nhà cung cấp đám mây. Một môi trường hybrid
cloud kết hợp nhiều mô hình public và private clouds. Hybrid cloud thể hiện sự
phức tạp khi quyết định cách phân bổ các ứng dụng trên cả public và private cloud.
1.3. Tính toán đám mây và dịch vụ đám mây (Cloud computing vs Cloud
Services)
Trong mục này, chúng tôi trình bày hai bảng thể hiện sự khác nhau và các thuộc
tính chính của cloud computing đối lập với cloud services (Jens, 2008). Cloud
computing là nền tảng IT cho cloud services và nó chứa đựng các công nghệ tạo
9
Khóa luận môn học: Điện toán lưới
điều kiện cho cloud services hoạt động. Các thuộc tính chính của cloud computing
được thể hiện trong Bảng 1.1
Bảng 1.1. Các thuộc tính chính của cloud computing (Theo Jens, 2008)
Thuộc tính Mô tả
Hệ thống cơ sở hạ tầng Bao gồm các servers, hệ thống lưu trữ,
mạng có thể cung cấp theo nhu cầu của
người dùng một cách cân bằng.
Phần mềm ứng dụng Cung cấp giao diện người dùng dựa trên
Web, Web Services APIs, và sự đa dạng
về các cấu hình.
Phần mềm triển khai và phát triển ứng
dụng
Phát triển và tích hợp phần mềm ứng
dụng đám mây.
Phần mềm quản lý ứng dụng và hệ thống Cung cấp dịch vụ tự quản lý nhanh, cấu
hình và giám sát sự sử dụng.

IP networks Kết nối người dùng cuối với đám mây
các components của cơ sở hạ tầng.
Các thuộc tính chính của cloud services xem trong Bảng 1.2 (Jens, 2008).
Bảng 1.2. Các thuộc tính chính của Cloud Services (Jens, 2008)
Thuộc tính Mô tả
Nhà cung cấp thứ ba phi trực tuyến Trong sự thực thi tính toán đám mây, giả
định rằng bên thứ ba cung cấp dịch vụ.
Nhưng cũng hoàn toàn có khả năng dịch
vụ được chính nhà cung cấp tính toán
đám mây thực hiện.
Truy nhập thông qua Internet Dịch vụ được truy nhập thông qua mạng
toàn cầu, dựa trên các chuẩn thông dụng,
bao gồm cả các lựa chọn an ninh và chất
lượng dịch vụ.
Yêu cầu tối thiểu hoặc không yêu cầu gì
về kỹ năng IT của người dùng
Có bản đặc tả yêu cầu được đơn giản
hóa
Dịch vụ được cung cấp Triển khai thời gian gần-thực (near real-
time), cân bằng động.
Giá cả Giá cả căn cứ trên sự sử dụng thực tếvà
được chia nhỏ
Giao diện người dùng Trình duyệt cho nhiều loại thiết bị
Giao diện hệ thống Dựa trên Web Services APIs, cung cấp
một khung làm việc tiêu chuẩn
(standard framework) để truy nhập và
tích hợp trong dịch vụ đám mây
Tài nguyên dùng chung Tài nguyên được dùng chung giữa
những người dùng của dịch vụ đám mây,
10

Khóa luận môn học: Điện toán lưới
tuy nhiên, thông qua các lựa chọn cấu
hình của dịch vụ, người dùng có thể tùy
biến.
2. Các công nghệ tạo điều kiện cho sự hình thành của tính toán đám mây
(Enabling Technologies)
Các công nghệ chính tạo điều kiện hình thành tính toán đám mây được mô tả ở mục
này, chúng gồm: công nghệ ảo hóa (virtualization), Web service and service-
oriented architechture, service flows and workflows, Web 2.0 and Mashup.
2.1. Công nghệ ảo hóa (virtualization)
Lợi thế của tính toán đám mây là khả năng ảo hóa và chia sẻ tài nguyên giữa các
ứng dụng khác nhau với mục tiêu sử dụng server tốt hơn. Hình 1.6 thể hiện một ví
dụ.
Trong tính toán phi đám mây ba platforms độc lập nhau được dùng cho ba ứng dụng
khác nhau chạy trên mỗi server của riêng mỗi ứng dụng. Trong tính toán đám mây,
servers có thể được dùng chung, hoặc ảo hóa, cho các hệ điều hành và ứng dụng, vì
vậy cần ít servers hơn.
Công nghệ ảo hóa gồm các kỹ thuật máy ảo nhưVmware and Xen, virtual networks
như VPN. Máy ảo cung cấp cơ sở hạ tầng IT ảo hóa theo nhu cầu (virtualized IT-
infrastructures), trong khi đó virtual networks hỗ trợ người dùng một môi trường
mạng tùy biến để truy nhập các tài nguyên đám mây.
11
Khóa luận môn học: Điện toán lưới
Hình 1.6. Ví dụ về ảo hóa: trong tính toán phi đám mây, cần 3 servers; trong tính
toán đám mây, chỉ 2 servers được sử dụng (Theo Jones)
2.2. Web service and service-oriented architechture
Web Service và service-oriented architechture (SOA) không phải là các ý tưởng
mới; tuy nhiên, chúng là các công nghệ cơ sở cho tính toán đám mây. Các dịch vụ
đám mây được thiết kế điển hình như Web services, tuân theo các chuẩn công
nghiệp gồm WSDL, SOAP, UDDI. Một SOA tổ chức và quản lý các Web services

trong đám mây (Vouk, 2008). MộtSOA cũng gồm một tập hợp dịch vụ đám mây,
chúng sẵn sàng hoạt động trên các platforms được phân bố nhiều nơi.
2.3. Service flows and workflows
Ý tưởng về service flows and workflow muốn nói đến một sự tích hợp của các hoạt
động trên nền dịch vụ (service-based activities) được cung cấp trên đám mây.
Workflows đã trở thành một trong số những lĩnh vực nghiên cứu quan trọng của cơ
sở dữ liệu và hệ thống thông tin (Vouk, 2008).
2.4. Web 2.0 and Mashup
Web 2.0 là một ý tưởng mới với nội dung là sử dụng công nghệ Web và thiết kế
Web để nâng cao sự sáng tạo, chia sẻ thông tin và hợp tác giữa những người dùng
12
Khóa luận môn học: Điện toán lưới
(Wang, Tao & Kunze, 2008). Mặt khác, Mashup là một ứng dụng Web kết hợp dữ
liệu từ một vài nguồn thành một công cụ lưu trữ tích hợp duy nhất (single integrated
storage tool). Cả hai công nghệ này rất hữu ích đối với tính toán đám mây.
Hình 1.7. Kiến trúc tính toán đám mây sử dụng nhiều components đa dạng ở các
mức khác nhau (Theo Hutchinson and Ward, 2009)
3. Đặc tính của tính toán đám mây (Cloud Computing Features)
Tính toán đám mây có một số đặc tính mới so với các mô hình tính toán khác
(Wang et al., 2008; Grossman, 2009) như sau:
• Dịch vụ cân bằng và đáp ứng theo nhu cầu (Scalability and on-demand
services). Tính toán đám mây cung cấp các tài nguyên và dịch vụ cho người
dùng theo nhu cầu của họ. Tài nguyên đáp ứng ở trạng thái cân bằng (cần
đến đâu đáp ứng đến đấy).
• Giao diện hướng người dùng (User-centric interface). Giao diện đám mây
được thiết kế để truy nhập thông qua các trình duyệt.
• Chất lượng dịch vụ được đảm bảo (Guaranteed Quality of Service). QoS
được đảm bảo về mặt hiệu năng phần cứng/CPU, băng thông, và công suất
bộ nhớ.
13

Khóa luận môn học: Điện toán lưới
• Hệ thống tự quản (Autonomous system). Các hệ thống tính toán đám mây là
các hệ thống tự quản lý và trong suốt đối với người dùng. Tuy nhiên, phần
mềm và dữ liệu trong đám mây có thể được tái cấu hình và được hợp nhất tự
động thành một platform đơn giản theo nhu cầu của người dùng. Định giá
(Pricing). Tính toán đám mây không yêu cầu người dùng phải đầu tư lớn
ngay từ đầu. Người dùng trả tiền cho dịch vụ và công suất mà họ cần đúng
theo nhu cầu.
3.1. Các tiêu chuẩn tính toán đám mây (Cloud computing standards)
Các tiêu chuẩn của tính toán đám mây chưa được phát triển đầy đủ; tuy nhiên, một
số tiêu chuẩn mở và không chặt chẽ (lightweight and open standards) đã tạo điều
kiện cho sự phát triển của tính toán đám mây. Bảng 1.3 minh họa một số tiêu chuẩn
như vậy.
Bảng 1.3. Các tiêu chuẩn của tính toán đám mây
( />Ứng dụng (Applications) Truyền thông: HTTP, XMPP.
An ninh: Oauth, OpenID, SSL/TLS
Syndication: Atom
Client Trình duyệt: AJAX
Ngoạituyến(Offline): HTML5
Thi công Ảo hóa: OVF
Platform Solution stack: LAMP
Dịch vụ Dữ liệu: XML, JSON
Web Services: REST
3.2. An ninh của tính toán đám mây (Cloud computing security)
Một trong những vấn đề then chốt khi xây dựng giải pháp tính toán đám mây là
thực hiện các máy ảo (virtual machines), chúng chứa các ứng dụng then chốt và dữ
liệu nhạy cảm trong môi trường đám mây dùng chung và công khai. Vì vậy, người
dùng của dịch vụ tính toán đám mây quan tâm đến các vấn đề an ninh sau (“Cloud
computing security”, Third Brigade, www.cloudreadysecurity.com):
• Người dùng sẽ vẫn kiểm soát được an ninh thông tin của họ đối với các ứng

dụng và dịch vụ?
• Liệu có thể chứng minh cho người dùng tổ chức rằng các hệ thống đảm bảo
an ninh và đáp ứng SLAs?
14
Khóa luận môn học: Điện toán lưới
• Liệu kiểm toán của công ty có biết những rắc rối của hệ thống cung cấp dịch
vụ không?
Trong các trung tâm dữ liệu truyền thống, cách tiếp cận an ninh thông thường là bức
tường lửa, vùng giới hạn, phân mảnh mạng, hệ thống phòng ngừa và phát hiện xâm
nhập, cung cấp giám sát mạng.
Các yêu cầu về an ninh đối với nhà cung cấp tính toán đám mây bắt đầu với các kỹ
thuật và công cụ tương tự như trung tâm dữ liệu truyền thống ứng dụng một vành
đai an ninh mạng thật tốt. Tuy nhiên, các biện pháp dựa trên phần cứng và phân
vùng vật lý (physical segmentation) không thể áp dụng cho các cuộc tấn công giữa
các máy ảo trên cùng một server. Các servers trong hệ thống tính toán đám mây sử
dụng cùng các hệ điều hành, các ứng dụng xí nghiệp và ứng dụng web (enterprise
and web applications) được gói lại thành các máy ảo trên cùng những servers vật lý.
Vì vậy, một kẻ tấn công có thể khai thác từ xa các điểm yếu trong các hệ thống và
ứng dụng đó. Ngoài ra, sự định vị của nhiều máy ảo (VM) trên cùng một vị trí làm
tăng khả năng tấn công bề mặt và rủi ro về sự tấn công giữa các VMs (VM-to-VM).
Các hệ thống phòng ngừa và phát hiện xâm nhập cần phải có khả năng phát hiện
các hoạt động xấu ở mứcVM, bất chấp vị trí của VM trong môi trường đám mây ảo
(“Cloud computing security”, Third Brigade, www.cloudreadysecurity.com).
Tóm lại, các môi trường ảo triển khai các cơ chế an ninh trên các máy ảo bao gồm
tưởng lửa, hệ thống phòng ngừa và phát hiện xâm nhập, giám sát tích hợp, thanh tra
truy nhập (log inspection).
4. Platforms tính toán đám mây (Cloud computing platforms)
Tính toán đám mây có tiềm năng thương mại rất lớn. Theo nghiên cứu thị trường
của IDC, các dịch vụ đám mây sẽ tăng từ16 tỷUSD năm 2008 đến khoảng 42 tỷ
USD năm 2012 và tăng thị phần trên tổng chi phí IT từ 4,2% lên 8,5%.

Bảng 1.4 thể hiện các công ty chính cung cấp cloud computing platforms và một số
dịch vụ
Bảng 1.4. Các công ty chính cung cấp cloud computing platforms
(Theo Lakshmanan 2009)
Công ty Cloud
computing
platforms
Năm bắt đầu Dịch vụ
15
Khóa luận môn học: Điện toán lưới
Amazon.com AWS (Amazon
Web Services)
2006 Cơ sở hạ tầng như là dịch vụ
IaaS (Lưu trữ, Tính toán,
Message queues, Datasets,
Content distribution)
Microsoft Azure 2009 Application platforms như là
dịch vụ (.NET, SQL data
services)
Google Google App
Engine
2008 Web Application Platform như
là dịch vụ (Python run time
environnement)
IBM Blue Cloud 2008 Virtualized Blue cloud data
center
Salesforce.co
m
Force.com 2008 Proprietary 4GL Web
application framework as an on

Demandplatform
4.1. Định giá (Pricing)
Việc định giá cloud platforms và cloud services căn cứ trên ba yếu tố chính: (i) lưu
trữ (storage), (ii) băng thông (bandwidth), (iii) tính toán (compute).
• Lưu trữ thường được đo lường theo lượng dữ liệu trung bình hàng ngày tính
theo GB, chi phí tính trên mỗi tháng.
• Băng thông được đo lường bằng cách tính toán tổng lượng dữ liệu được
chuyển vào và ra khỏi platform service thông qua các giao dịch và xử lý lô
(batch processing). Nói chung, việc chuyển dữ liệu giữa các dịch vụ trong
cùng platform thì được miễn phí trong nhiều platforms.
• Tính toán được đo lường như là đơn vị thời gian (time unit) cần thiết để chạy
một instance, hoặc một ứng dụng, hoặc một máy (machine) để phục vụ các
requests. Bảng 6 so sánh giá của ba cloud computing platforms chính.
Bảng 1.6. So sánh giá của các cloud computing platforms
(Theo “Which cloud platform is right for you?”, www.cumulux.com)
Tài nguyên Đơn vị tính Amazon Google Microsoft
Strored data GB/tháng 0,1 USD 0,15 USD 0,15 USD
Storage
transaction
Per 10K
requests
0,1 USD 0,1 USD
Outgoing
bandwidth
GB 0,1-0,17 USD 0,12 USD 0,15 USD
Incoming
bandwidth
GB 0,1 USD 0,1 USD 0,1 USD
Compute time Instance 0,1-0,12 USD 0,1 USD 0,12 USD
16

Khóa luận môn học: Điện toán lưới
Hours
Tóm lại, bằng cách phân tích chi phí của cloud computing, phụ thuộc vào các đặc
tính của ứng dụng, chi phí triển khai một ứng dụng có thể biến đổi dựa trên
platform được lựa chọn. Theo Bảng 1.6, dường như chi phí đơn vị của ba platforms
chính khá giống nhau. Bên cạnh định phí đơn vị, thì điều quan trọng là chuyển đổi
phí này thành phí bảo trì, triển khai và phát triển ứng dụng hàng tháng.
4.2. Cloud computing components và các nhà cung cấp
Các phần tử chính hợp thành cloud computing platforms là phần cứng máy tính
(computer hardware), hệ thống lưu trữ (storage), cơ sở hạ tầng (infrastructure), phần
mềm máy tính (computer software), hệ điều hành (OS), sự ảo hóa platform
(platform virtualization). Các nhà cung cấp hàng đầu về cloud computing
components được thể hiện trên Bảng 1.7. (“Cloud Computing”,
/>Bảng 1.7. Các nhà cung cấp hàng đầu cloud computing components
Cloud computing components Nhà cung cấp
Phần cứng Dell, HP, IBM, Sun
Hệ thống lưu trữ Sun, EMC, IBM
Cơsở hạ tầng Cisco, Juniper Network, Brocade
Communication
Phần mềm 3tera, Eucalyptus, G-Eclipse, Hadoop
Hệ điều hành Solaris, AIX, Linux (Red Hat, Ubuntu)
Ảo hoá platform Citrix, VMWare, IBM, Xen, Linux
KVM, Microsoft, Sun xVM
5. Ví dụ về triển khai ứng dụng Web
Trong mục này, chúng tôi sẽ giới thiệu một ví dụ về triển khai ứng dụng web hai
tầng sử dụng đám mây, minh họa trong Hình 1.8.
17
Khóa luận môn học: Điện toán lưới
Hình 1.8. Ví dụ về triển khai một ứng dụng thành kiến trúc two-tier Web server sử
dụng tính toán đám mây (Theo Sun Microsystems, 2009)

Thông thường, khách hàng sử dụng dịch vụ tính toán đám mây thường là doanh
nghiệp vừa và nhỏ. Tuy nhiên, gần đây đã xuất hiện một số dịch vụ tính toán đám
mây dành cho doanh nghiệp lớn. Bảng 1.8 minh họa ba ví dụ tính toán đám mây
cho doanh nghiệp lớn (Lakshmanan, 2009).
Bảng 1.8. Các ví dụ về tính toán đám mây cho doanh nghiệp lớn
Nhà cung
cấp
Đáp ứng Sử dụng Lợi ích
Eli Lilly R&D High
Performance
Computing
Amazon server and
storage cluster for drug
discovery analysis and
modeling
Thời gian triển
khai nhanh với chi
phí thấp
New York
Times
Data Conversion Conversion of archival
articles (3 million) into
newdata format using
Amazon elastic compute
services
Cung cấp nhanh và
rất linh hoạt tài
nguyên cơ sở hạ
tầng
Pitney Bowes B2B Application Hosted model mail

printing application for
clients. Uses MS
Azure.net and SQL
services for the hosted
model option
Độ linh hoạt với
chi phí thấp hơn và
cơ hội mới cho
doanh nghiệp
18
Khóa luận môn học: Điện toán lưới
6. Thách thức của tính toán đám mây
Nói ngắn gọn, mô hình tính toán đám mây cung cấp một số lợi ích và lợi thế cho
người dùng so với các mô hình tính toán khác mà nhiều tổ chức đang sử dụng. Tuy
nhiên, vẫn có một số thách thức được các nhà nghiên cứu và thực hành kê ra dưới
đây (Leavitt, 2009).
6.1. Hiệu năng (Performance)
Vấn đề chính về hiệu năng có thể gặp đối với các ứng dụng hướng giao dịch và
hướng dữ liệu (intensive transaction-oriented and data – intensive applications).
Những người dùng ở một khoảng cách xa so với nhà cung cấp đám mây có thể có
kinh nghiệm về độ trễ của dịch vụ.
6.2. An ninh và tính riêng tư (Security and Private)
Các doanh nghiệp khi sử dụng dịch vụ tính toán đám mây vẫn còn cân nhắc về vấn
đề an ninh thông tin. Khách hàng băn khoăn về các điểm yếu có thể bị tấn công khi
thông tin và các tài nguyên IT trọng yếu ở bên ngoài bức tường lửa. Giải pháp về an
ninh là giả định cho rằng các nhà cung cấp tính toán đám mây tuân thủ các hướng
dẫn thực hành an ninh tiêu chuẩn như được mô tả trong Mục 3.2.
6.3. Kiểm soát (Control)
Một số khách hàng băn khoăn về việc nhà cung cấp tính toán đám mây kiểm soát
hoàn toàn các platforms.

6.4. Chi phí băng thông (Bandwidth costs)
Với tính toán đám mây, các công ty có thể tiết kiệm tiền bạc mua sắm phần cứng và
phần mềm, tuy nhiên, có thể họ sẽ phải trả chi phí khá cao cho băng thông. Chi phí
này có thể thấp đối với các ứng dụng dựa trên Internet có kích thước nhỏ, không sử
dụng nhiều dữ liệu, nhưng có thể là đáng kể đối với các ứng dụng sử dụng nhiều dữ
liệu.
6.5. Độ tin cậy (Reliability)
Tính toán đám mây vẫn không thể cung cấp dịch vụ có độ tin cậy suốt ngày đêm.
Vẫn có những trường hợp dịch vụ tính toán đám mây có sự cố một vài giờ mỗi
ngày.
19
Khóa luận môn học: Điện toán lưới
Trong tương lai, chúng ta có thể kỳ vọng có nhiều nhà cung cấp dịch vụ tính toán
đám mây hơn, dịch vụ phong phú hơn, các tiêu chuẩn và hướng dẫn thực hành tốt
nhất được xác lập. Trong lĩnh vực nghiên cứu, HP Labs, Intel, Yahoo đã khởi động
distributed Cloud Research Test Bad, với các thiết bị ở Châu Á, Châu Âu và
BắcMỹ, nhằm mục tiêu tìm kiếm các sáng kiến về các con chíp dành riêng cho tính
toán đám mây. IBM đã khởi động Research Computing Cloud - một tập hợp các tài
nguyên tính toán có thể truy nhập theo nhu cầu trên toàn thế giới để hỗ trợ các quy
trình kinh doanh.
7. Tính toán đám mây trong tương lai
Tóm lại, tính toán đám mây vẫn là một kiểu mô hình/kiến trúc tính toán cần một
thời gian dài nữa để hoàn thiện. Trong tương lai gần, tính toán đám mây có thể xuất
hiện dưới nhiều hình thức. Một kịch bản khả thi là doanh nghiệp có thể sử dụng
đám mây lai phân tán (distributed hybrid cloud) như minh họa trong Hình 1.9.
Hình 1.9. Kiến trúc đám mây lai phân tán (Theo Lakshmanan 2009)
Theo kịch bản này, doanh nghiệp sẽ sử dụng các ứng dụng lõi trên đám mây riêng
của họ, trong khi đó một số ứng dụng khác sẽ được phân tán trên một vài đám mây
riêng, chúng được tối ưu hóa cho các ứng dụng cụ thể
20

Khóa luận môn học: Điện toán lưới
21
Khóa luận môn học: Điện toán lưới
PHẦN II. ĐIỆN TOÁN ĐÁM MÂY: MỘT PHƯƠNG
PHÁP MỚI ĐỂ CHIA SẺ THÔNG TIN Y SINH
Chúng tôi kiểm chứng những thông tin y sinh (BMI) được chia sẻ như thế nào ở,
đặc biệt là các tập đoàn mà chia sẻ dữ liệu và các ứng dụng, có thể tận dụng lợi thế
của tài nguyên mới được gọi là “điện toán đám mây”. Đám mây thường cung cấp
nguồn tài nguyên dựa vào yêu cầu. Trong hầu hết các đám mây, phí được trả tiền
mỗi lần sử dụng, dựa trên việc thuê các máy chủ chuyên dụng với chi phí thấp, đôi
khi hỗ trợ tính toán song song. Nó có chi phí thấp hơn so với các hệ thống phòng thí
nghiệm chuyên dụng hoặc thậm chí các trung tâm dữ liệu. Nhìn chung, ngay cả với
giả định thận trọng, cho các ứng dụng mà không phải là I/O chuyên sâu và không
đòi hỏi một môi trường hoàn chỉnh, các con số cho rằng đám mây đôi khi có thể
cung cấp những cải tiến lớn, và cần được xem xét nghiêm túc để tính BMI. Về
phương pháp, đó là rất thuận lợi để xây dựng các phân tích về công nghệ thành
phần, tập trung vào những chi tiết cụ thể cho phép chúng ta bỏ qua một số các định
nghĩa đi kèm (ví dụ, thành phần cấu hình nên điện toán đám mây, . . .) và phân tích
cần thuê những thiết bị nào (ví dụ các trung tâm dữ liệu). Phân tích các thành phần
còn lại tương đối đơn giản hơn. Thay vì liệt kê những điểm mạnh tuyệt đối và điểm
yếu của hệ thống dựa trên đám mây (ví dụ, để bảo mật dữ liệu hoặc bảo quản),
chúng tôi tập trung vào những thay đổi từ một điểm khởi đầu đặc biệt, ví dụ như hệ
thống phòng thí nghiệm tư nhân. Chúng ta thường tìm một khía cạnh ngang hàng
(về nguyên tắc), nhưng người ta phải xem xét ở khía cạnh lợi ích cá nhân - là một
phòng thí nghiệm quản lý lỏng lẻo di chuyển đến một đám mây được quản lý tốt,
hoặc một trung tâm dữ liệu bệnh viện quản lý chặt chẽ di chuyển đến một đám mây
kém đảm bảo an toàn?
1. Giới thiệu
“'Đám mây” đã nhận được rất nhiều sự chú ý như là một thay thế cho cả lưới đặc
thù và việc sở hữu và quản lý máy chủ của chính mình. Hiện tại các bài viết, blog,

và các diễn đàn tập trung áp dụng đám mây để ngành công nghiệp bên ngoài của tin
học y sinh. Trong bài viết này, chúng tôi mô tả các nguyên tắc cơ bản của điện toán
22
Khóa luận môn học: Điện toán lưới
đám mây và minh họa cách người ta có thể đánh giá một đám mây riêng cho các
mục đích y sinh.
Thông thường, các phòng thí nghiệm mua máy chủ cục bộ để tính toán hoặc dữ liệu
chuyên sâu công việc mà không thể được thực hiện trên máy tính để bàn. Máy chủ
này ngày càng được sử dụng để chia sẻ dữ liệu và các ứng dụng trong hợp tác
nghiên cứu, ví dụ như, trong y sinh học Tin học Mạng lưới Nghiên cứu (BIRN) và
Lưới thông tin về ung thư y sinh (caBIG), cả hai được tài trợ bởi Viện Y tế Quốc gia
Hoa Kỳ (NIH).
Trong khi đó, phân tích hình ảnh, khai thác dữ liệu, tạo hình protein, và chuỗi gen là
tất cả các công cụ quan trọng cho các nhà nghiên cứu y sinh học.
Các ứng dụng chia sẻ tài nguyên chuyên sâu thường liên quan đến bộ lớn dữ liệu,
danh mục sản phẩm, và lưu trữ, theo nhiều chủ sở hữu, thường với khối lượng công
việc bùng phát. Trong phản ứng, các tập đoàn y sinh học (thường liên quan đến
nhiều tổ chức) đã thực hiện các ứng dụng của họ trên các máy chủ trong phòng thí
nghiệm lưu trữ trong một cấu trúc lưới điện phân phối, như mô tả trong phần 2. Để
duy trì máy chủ như vậy, các phòng thí nghiệm và các tổ chức của họ đòi hỏi không
gian, làm mát, năng lượng, quản lý hệ thống cấp thấp, và đàm phán (ví dụ, về tiêu
chuẩn phần mềm và tường lửa giữa các tổ chức). Thường các khoản chi phí mua
sắm bị lờ đi hoặc chậm trễ và có thể gây ra các hậu quả rất đáng kể.
Đám mây chuyển trách nhiệm cài đặt và duy trì phần cứng và dịch vụ tính toán cơ
bản đi từ khách hàng (ví dụ, một phòng thí nghiệm hoặc tổ hợp) đến các nhà cung
cấp điện toán đám mây. Cấp độ cao hơn của ứng dụng ngăn xếp, điều hành chia sẻ
vẫn còn nguyên vẹn, và vẫn là trách nhiệm của khách hàng
Đối với người dùng, điện toán đám mây là một mô hình kinh doanh mới, như trái
ngược với một mô hình kỹ thuật mới, một nhà cung cấp điện toán đám mây (một
công ty thương mại) cung cấp phần cứng, cơ sở hạ tầng phần mềm (nền tảng), hoặc

một ứng dụng như một dịch vụ cho khách hàng. Trong kịch bản đơn giản, một nhà
cung cấp điện toán đám mây cho phép khách hàng của mình có được khả năng của
một máy chủ đơn giản (mặc dù chỉ là máy ảo) trong việc xử lý, nối mạng và lưu trữ
được điều khiển tự động. Đám mây phức tạp hơn cung cấp tập dữ liệu có ích hơn
(ví dụ như các vấn đề về di truyền hoặc các dữ liệu điều tra dân số), khả năng quản
23
Khóa luận môn học: Điện toán lưới
lý, môi trường lập trình (ví dụ như .Net trong Microsoft Azure), nền tảng dịch vụ
web (ví dụ, Google App Engine), hoặc truy cập vào các ứng dụng cụ thể ( ví dụ,
BLAST [1]). Người sử dụng điện toán đám mây có thể chọn sử dụng dịch vụ hoặc
không chỉ trong vài phút, bằng cách gửi một yêu cầu dịch vụ cho các nhà cung cấp
điện toán đám mây. Các máy chủ (hoặc lưu trữ, hoặc kênh thông tin liên lạc) là “ảo”
theo nghĩa là các nhà cung cấp cung cấp dung lượng khi cần thiết, ví dụ như, một
máy chủ, hoặc phần của một máy chủ từ nguồn tài nguyên của đám mây đó.
Mục đích của bài viết này là để giúp chúng ta ra quyết định tại các phòng thí
nghiệm y sinh học, các cơ quan tài trợ, và đặc biệt là các tập đoàn hiểu được những
gì phù hợp với điện toán đám mây và cách đánh giá một đám mây đặc thù. Chúng
tôi tập trung vào các phòng thí nghiệm mà cần phải chia sẻ thông tin với bên ngoài,
chẳng hạn như các tổ chức điều tra, khảo sát – và cung cấp nguồn tài nguyên tính
toán rẻ hơn.
Hai khía cạnh của phân tích của chúng tôi đề cập đến. Đầu tiên, chúng tôi chỉ lướt
qua việc cần có một điện toán đám mây hay không .
Ngoài ra, định nghĩa liên quan đến một danh sách các tạp và loại trừ, mà người đọc
khó có thể nhớ lại. Vì vậy, chúng tôi trình bày một danh sách tính năng, chứ không
phải là hoàn toàn có nhu cầu hoặc cấm các tính năng.
Phân tích kỹ thuật đề cập đến hệ thống có hoặc thiếu một tính năng đặc biệt, cho dù
hệ thống được phân loại như một đám mây, trung tâm dữ liệu thể chế, hoặc lưới tập
đoàn. Các tính năng hữu ích như tìm kiếm thông tin từ khóa, chúng ta gọi là một hệ
thống điện toán đám mây nếu nó có một ưu thế của các tính năng mà tác giả nhấn
mạnh trong hệ thống mà họ gọi là những đám mây. Thứ hai, chúng tôi làm rõ các

cuộc thảo luận của cả chi phí và bảo mật bằng cách sử dụng một cách tiếp cận
tương đối. Đó là, thay vì danh sách ưu và nhược điểm của các đám mây trong sự cô
lập, chúng ta xem xét “trước” và “sau”. Bằng cách xác định những vấn đề mà
không thay đổi đáng kể, chúng tôi giảm đáng kể phạm vi so sánh.
Trong phần 2 chúng tôi trình bày những thông tin cơ bản về lưới điện toán lưới và
điện toán đám mây.
Phần 3 cung cấp một tổng quan về tính toán cộng tác.
24
Khóa luận môn học: Điện toán lưới
Phần 4 thảo luận về cơ sở hạ tầng điện toán đám mây cho các tập đoàn y tế và mô tả
các nhà cung cấp đám mây mẫu. Hai phần tiếp theo có các đánh giá trung tâm.
Phần 5 đánh giá một số phương pháp trao đổi khác, và phần 6 thảo luận về an ninh
điện toán đám mây, một mối quan tâm lớn của nhiều người áp dụng phí thu được.
Phần 7 xác định thuộc tính mà làm cho một dự án tuân theo (hoặc không) đến điện
toán đám mây, và 8 trình bày kết luận
2. Tổng quan
Công cụ mạnh mẽ, vệ tinh, và các mạng cảm biến có thể dễ dàng tạo hàng terabyte
đến petabyte dữ liệu khoa học trong một ngày [2]. Khi nghiên cứu để chuyển thông
tin y sinh sang mô hình dữ liệu trung tâm, các nhà khoa học cần phải làm việc cộng
tác hơn, vượt qua các khoảng cách về địa lý, vùng miền, và các rào cản xã hội. Phối
hợp liên ngành thông qua Internet là nhu cầu tất yếu, điều này cần thiết cho các
phòng thí nghiệm cá nhân tự trang bị cơ sở hạ tầng kỹ thuật cần thiết cho việc quản
lý thông tin và chia sẻ dữ liệu. Ví dụ, một nhóm nghiên cứu có thể cần phải bao
gồm dữ liệu từ hồ sơ bệnh án, nghiên cứu động vật, gen, và phân tích chất độc. Thời
đại của bảng tính dựa trên các dữ liệu nghiên cứu đang đi đến gần giới hạn của nó
[3].
2.1. Kiến trúc hệ thống phân phối
Điện toán lưới, trung tâm dữ liệu ảo hóa, và những đám mây là ba cách để chia sẻ
tài nguyên và dữ liệu máy tính để dễ dàng cộng tác. Các kiến trúc này đan xen nhau
trong kỹ thuật thực hiện và trong các tính năng trong quá trình thực hiện.

Hơn nữa, hệ thống đang sử dụng được phát triển từ những ý tưởng tốt có chọn lọc
từ các hệ thống khác và sự cân bằng thường phụ thuộc vào sự thể hiện của các tính
năng, không phải trên việc phân loại tổng thể. Chúng tôi chỉ tóm tắt các kiến trúc
một cách ngắn gọn và so sánh về tính năng của từng loại.
Công nghệ lưới điện là phổ biến trong cộng đồng khoa học. Người tham gia mạng
lưới thường chia sẻ tài nguyên tính toán chạy trên các máy độc lập quản lý, sử dụng
giao thức mạng tiêu chuẩn. Lưới các bộ công cụ thường cung cấp quản lý và bảo
mật khả năng. Khi chạy công việc tính toán chuyên sâu, người ta thường nhận được
một máy tính toàn bộ, hoặc một số.
25

×