Tải bản đầy đủ (.pdf) (27 trang)

BÁO CÁO THỰC TẬP VỀ Điện toán đám mây

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.1 MB, 27 trang )

Mục lục
1. TỔNG QUÁT VỀ ĐIỆN TOÁN ĐÁM MÂY 1
1.1. KHÁI NIỆM 1
1.2. ĐẶC ĐIỂM CỦA ĐIỆN TOÁN ĐÁM MÂY 2
1.2.1. Tự sửa chữa 2
1.2.2. Nhiều người sử dng 2
1.2.3. Khả năng m rộng tuyến tính 2
1.2.4. Hướng dch vụ 2
1.2.5. Điều khiển SLA(Service Level Agreement). 2
1.2.6. Khả năng ảo hóa 2
1.2.7. Linh hoạt 3
1.3. ƯU VÀ NHƯỢC ĐIỂM CỦA ĐIỆN TOÁN ĐÁM MÂY 3
1.3.1. Ưu điểm 3
1.3.2. Nhược điểm. 4
1.4. SỰ CẦN THIẾT CỦA ĐIỆN TOÁN ĐÁM MÂY. 5
2. HOẠT ĐỘNG CỦA ĐIỆN TOÁN ĐÁM MÂY 6
2.1. KIẾN TRÚC CỦA ỨNG DỤNG ĐIỆN TOÁN ĐÁM MÂY 6
2.2. KIẾN TRÚC MÁY CHỦ 8
2.3. MAP REDUCE. 10
2.4. GOOGLE FILE SYSTEM (GFS) 17
2.5. HADOOP 19
3. ĐIỆN TOÁN ĐÁM MÂY CỦA MICROSOFT 20
4. TỔNG KẾT. 26

















1

1. Tổng quát về Điện toán đám mây
1.1. Khái niệm.
Điện toán đám mây (Thut ng ting Anh: Cloud Computing, hay cn bit
đn vi tên gi “Đin ton máy ch o”) l mô hnh máy tnh dựa trên nn tng
pht trin của Internet.


Đin toán đám mây l s nâng cp t mô hình máy ch mainframe sang mô
hnh cleint-server. Cụ th, ngưi dng s không cn phi c cc kiến thức v
chuyên mục đ điu khin cc công ngh, máy mc v cơ s h tng, m cc
chuyên gia trong “đám mây” ca cc hãng cung cp s giúp thực hin điu đ.


Thut ng "đám mây"  đây l lối nói ẩn dụ chỉ mng Internet (dựa vào cách
được bố trí ca n trong sơ đồ mng máy tnh) v như một liên tưng v độ phức
tp ca cc cơ s h tầng chứa trong nó. Ở mô hnh đin toán này, mi kh năng
liên quan đến công ngh thông tin đu được cung cp dưi dạng các "dịch vụ",
cho phép ngưi sử dụng truy cp các dịch vụ công ngh t một nhà cung cp no
đ "trong đám mây" m không cn phi có các kin thức, kinh nghiệm v công
ngh đ, cũng như không cn quan tâm đến các cơ s h tng phục vụ công ngh

đ.


V dụ đơn giản, nu một website được chứa trên một máy ch, ngưi
dng
phi
lựa chn h điu hnh đ ci đặt (Linux/Windows/Mac), tiến hành cc thit
lp đ máy ch v website c th hot động. Tuy nhiên, nu trang web được chứa
trên “đám mây”, ngưi dng s không cn phải thực hin thêm bt c điu g
khc. Điu này cũng đảm bo yu tố đu tư v phn cũng được giảm ti  mức tối
đa.



Sơ đ đin ton đm mây, với cc dịch v được cung cp nm bên trong “đm mây”
được truy cp t cc máy tính  bên ngoi.
2

Ti nguyên, d liệu, phn mềm v cc thông tin liên quan đu được chứa trên
cc server (chnh l cc “đám mây”).


Nói một cch đơn gin nht “ứng dụng đin ton đám mây” chnh l những ứng
dụng trực tuyến trên Internet. Trình duyệt l nơi ứng dụng hiện hữu và vn hành
còn d liu được lưu tr và xử lý  máy ch ca nhà cung cp ứng dụng đ.


1.2. Đặc điểm của Điện toán đám mây.
1.2.1. Tự sửa chữa.
Bt kỳ ứng dụng hoc dịch vụ no đang chạy trong một môi trưng đin

ta n đám mây c một tính cht t sửa chữa. Trong trưng hợp ứng dụng tht
bi, luôn luôn có một d phòng tức thi ca ứng dụng sẵn sằng đ cho công
vic không bị gin đoạn. Có nhiều bn sao của một ứng dụng – mỗi bn cp
nht chnh n thưng xuyên, vì vậy  những ln tht bi, có ít nhất một bn
sao ca ứng dụng có th lấy lên hoạt động mà không cn một thay đổi
nhỏ
nào
trong trng thái chạy ca nó.
1.2.2. Nhiều người sử dng.
Vi điện ton đám mây, bt k ứng dụng no cũng hỗ trợ đa người dung.
H thống cho phép một số khách hàng chia sẻ cơ s h tng được phân bổ
cho h mà không ai trong số h nhận bit v s chia sẻ này. Điu này được
thực hin bi vic áo hóa các máy ch trong một di cc máy tnh v sau đ
cp phát các máy ch đn nhiu người sử dụng.
1.2.3. Khả năng m rộng tuyến tính.
H thống có kh năng phân chia các luồng công vic thành các phn nhỏ
và phục vụ n qua cơ s h tng. Một ý tưởng chính xác có th lấy t thực t
là nu một máy ch c th xử lý 1000 giao dịch trong 1 giây, thì hai máy ch
có th xử lý 2000 giao dịch trong 1 giây.
1.2.4. Hướng dch vụ.
Cho phép tái sử dụng các dịch vụ khác nhau sẵn có v đang được to ra.
Bằng vic sử dụng các dịch vụ được to ra trưc đ, những dịch vụ khác c
th được tạo ra t đ.
1.2.5. Điều khiển SLA(Service Level Agreement).
Thông thưng các công ty có thỏa thuận v số lượng dịch vụ. Nhưng
do
kh
năng m rộng và các vn đ có sẵn có th làm cho các thỏa thuận này bị
phá vỡ. Tuy nhiên các dịch vụ điện ton đám mây c đc tnh hưng SLA nên
khi h thống có kinh nghiệm đt đỉnh ca ti, nó s t động điu chỉnh chnh

n đ tuân th các thỏa thun  cấp độ dịch vụ. Các dịch vụ s to ra thêm
những thực th ca ứng dụng trên nhiu server đ cho vic ti có th dễ dng
qun lý.
1.2.6. Khả năng ảo hóa
Các ứng dụng trong đin ton đám mây hon ton tch ri khỏi
3

phn cứng nằm bên dưi. Môi trường đin toán đám mây l một môi trưng
o ha đầy đ.
1.2.7. Linh hoạt.
Một tnh năng khc ca các dịch vụ đin ton đám mây l linh hoạt.
Chúng có th được dng đ phục vụ rt nhiu loi công việc có khối lượng
khác nhau t ti nhỏ của một ứng dụng nhỏ cho đn ti rất nng của một
ứng dụng thương mi.


1.3. Ưu và nhược điểm của Điện toán đám mây.
1.3.1. Ưu điểm
Những ưu điểm và th mnh dưi đây đ gp phn gip "điện toán đám
mây" tr thnh mô hnh đin ton được áp dụng rộng rãi trên toàn th gii.
a. Tốc độ xử lý nhanh, cung cp cho ngưi dng những dịch vụ nhanh
chng v gi thnh rẻ dựa trên nn tng cơ s h tng tp trung (đám
mây).
b. Chi ph đầu tư ban đầu v cơ s h tng, máy móc v nguồn nhân lựa ca
ngưi sử dụng điện toán đám mây được giảm đn mức thp nht.
c. Không cn phụ thuộc vo thit bị v vị tr địa lý, cho phép ngưi
dùng
truy
cp v sử dụng h thống thông qua trnh duyệt web  bt kỳ đâu v
trên bt kỳ thit bị no m h sử dụng (chng hn l PC hoc l đin thoi

di động…)
d. Chia sẻ ti nguyên v chi ph trên một địa bn rộng ln, mang li cc loi
ch cho ngưi dng như:
 Tp trung cơ s h tng ti một vị tr giúp ngưi dng không
tốn

nhiu gi thnh đu tư v trang thiết bị.
 Công sut xử lý nhanh hơn do ti nguyên được tp trung. Ngoi ra,
ngưi dng không cần phi đu tư v nguồn nhân lực qun lý h
thống.
 Kh năng khai thc v hiu sut được ci thiện hơn 10-20% so vi
h thống máy tnh c nhân thông thưng.
e. Vi độ tin cậy cao, không chỉ ginh cho ngưi dng phổ thông, điện ton
đám mây ph hợp vi cc yêu cu cao v liên tục ca cc công ty kinh
doanh v cc nghiên cứu khoa hc. Tuy nhiên, một vi dịch vụ ln của
đin ton đám mây đôi khi rơi vào trng thi qu ti, khiến hot động bị
ngưng tr. Khi rơi vào trng thi này, ngưi dng không c kh năng đ
xử lý cc s cố m phải nh vo cc chuyên gia t đám mây tin hnh xử
lý.
f. Kh năng m rộng được, gip ci thin cht lượng cc dịch vụ được cung
cp trên “đám mây”.
4

g. Kh năng bo mt được ci thin do s tp trung v d liu.
h. Cc ứng dụng ca đin ton đám mây dễ dng đ sửa chữa hơn bi l
chng không được ca đt cố định trên một m tnh no. Chng cũng dễ
dng hỗ trợ v ci thin v tnh năng.
i. Ti nguyên sử dụng của đin ton đám mây luôn được qun lý v thống
kê trên từng khch hng v ứng dụng, theo từng ngày, từng tun, từng
thng. Điu này đảm bo cho vic định lượng gi c ca mỗi dịch vụ do

đin ton đám mây cung cp đ ngưi dng c th lựa chn ph hợp.
1.3.2. Nhược điểm.
a. Tnh riêng tư: Cc thông tin ngưi dng v d liu được chứa trên điện
ton đám mây c đảm bo được riêng tư, v liu cc thông tin đ c bị sử
dụng v một mục đch no khc?
b. Tnh sn dng: Liu các dịch vụ đám mây c bị “treo” bt ng, khin cho
ngưi dng không th truy cp cc dịch vụ v d liu ca mnh trong
những khong thi gian no đ khin nh hưởng đn công vic?
c. Mt dữ liu: Một vi dịch vụ lưu tr d liu trực tuyến trên đám mây bt
ng ngừng hot động hoc không tip tục cung cp dịch vụ, khiến cho
ngưi dng phi sao lưu d liu ca h t “đám mây” v máy tnh c
nhân. Điu này s mt nhiu thi gian. Thậm ch một vi trưng hợp, v
một lý do no đ, d liu ngưi dng bị mt v không th phục hồi được.



Dữ liệu chứa trên các "đám mây" sẽ phải giao phó toàn bộ"số phận" cho "đám mây


d. Tnh di động ca dữ liệu v quyền s hữu: Một câu hỏi đặt ra, liu ngưi
dng c th chia sẻ d liệu t dịch vụ đám mây này sang dịch vụ ca đám
mây khc? Hoc trong trưng hợp không muốn tip tục sử dụng dịch vụ
cung cp t đám mây, liu ngưi dng c th sao lưu ton bộ d liu ca
h t đám mây? V làm cch nào đ ngưi dng c th chc chn rằng
5

cc dịch vụ đám mây s không hủy ton bộ d liu của h trong trưng
hợp dịch vụ ngừng hoạt động.
e. Khả năng bảo mật: Vấn đ tp trung d liu trên cc “đám mây” l cch
thức hiu qu đ tăng cưng bo mt, nhưng mt khc cũng li chnh l

mối lo ca ngưi sử dụng dịch vụ ca đin toán đám mây. Bi l một khi
cc đám mây bị tn công hoc đột nhp, ton bộ d liu s bị chiếm dụng.
Tuy nhiên, đây không thực s l vn đ của riêng “đin ton đám mây”,
bi l tn công đnh cắp d liu l vn đ gp phi trên bt kỳ môi trưng
no, ngay c trên cc máy tnh c nhân.


1.4. Sự cần thiết của Điện toán đám mây.
Đin toán đám mây c kh năng s m ra những giá trị vĩ đi cho các nguồn
lực ngoài (Outsourcing) ca ngành CNTT v lm thay đổi bộ mặt ca ngành dịch
vụ CNTT truyền thống. Dưi đây s là những gì ngành công nghip Outsourcing
đang phn ứng tương tc vi s phát trin ca đin ton đám mây.





Các hợp đồng dịch vụ Outsourcing truyền thống luôn mang những nội dung
khá rõ ràng vi các máy ch, các trung tâm d liu, mng lưi, các chỉ tiêu kỹ
thut, hiu sut công vic và dòng mã sn phẩm. S xut hiện của điện ton đám
mây li đang làm thay đổi tt c những điu đ nh s xut hin của các dịch vụ
CNTT năng động như một cơ s cn thit cho những viễn cảnh công ngh dành
cho doanh nghip.


Nh các dịch vụ đám mây điện toán, nhiu đơn vị CNTT sẵn lng đi trưc một
bưc hơn trong vic tạo ra các tùy bin: Chúng giúp các hãng CNTT dn loi bỏ
được những chi phí vốn khá tốn kém t cơ s h tng đn các phn mm tip cn
khách hàng và những vn đ trung gian khác. Và h qu là, đin ton đám mây
đang làm thay đổi hoàn toàn bộ mặt ca các dịch vụ CNTT truyn thống



Susan Tan, giám đốc dịch vụ CNTT và nghiên cứu nguồn lực ca Gartner cho
rằng: “Điện ton đm mây l bước chuyển cơ bản ca các công ty trong vic chi
6

tiền và tiếp cn các dch v CNTT”. Trên thực t, Gartner d đon cho đn năm
2012, 20% công vic kinh doanh s là ảo và không có bt kỳ tài sn CNTT nào.
Đây s l ngưi thay đổi cuộc chơi dnh cho cc nh sn xut dịch vụ
Outsourcing, t các nhà cung cp v tư vn dịch vụ “onshore” đn dịch vụ thuê
ngoài, các nhà tích hợp h thống đn các nhà sn xut mi riêng bit, nhằm làm
cuộc chơi tốt hơn hoc xu đi.


Phil Fersht, sáng lp viên ca công ty tư vấn dịch vụ thuê ngoài Horses for
Sources cho rằng:“Nếu đin ton đm mây chỉ l một ngnh khai thác cc cơ s
hạ tầng đắt đỏ, rắc rối v không thân thiện với môi trường trong đó, Amazon v
các công ty khác phân phối cc năng lượng đin ton, thì đin ton đm mây đơn
giản chỉ là ngành cung cp các ích lợi về cơ s hạ tầng. Tuy nhiên, nếu để các dữ
liu và trình ứng dng được lưu giữ bên ngoi đm mây, người sử dụng liu có
cần phải tự mình quản lý chúng nữa không? Người sử dng có tht sự cần phải
đạt được các lợi ích cạnh tranh đi cng với vic thực hin các hợp đng
bảo
hiểm?
Hay đã đến lúc tìm kiếm các nhà cung cp dch v có chức năng quản lý
trình ứng dng, cơ s hạ tầng có liên quan và thực hin các giao dịch chưa?”


Fersht gi các dịch vụ đám mây l nn tng cho các giải pháp nguồn dành cho
doanh nghip th h k tip. Ông tin rằng các dịch vụ đám mây s làm cho quá

trình phân phối truyền thống ca các dịch vụ CNTT hiu qu hơn v tit kiệm chi
ph hơn. “Chúng cũng giúp tạo ra một cơ cấu phân phối cho các dch v gia công
thực sự. Thế h dch v thuê ngoài mới này có khả năng m ra những giá tr to
lớn cho khch hng”.


2. Hoạt động của Điện toán đám mây.
2.1. Kiến trúc của ứng dụng Điện toán đám mây.
7




Chúng ta bit rằng đin ton đám mây l một tổ hợp tính toán dựa trên
cc
thi
t bị h tng phần cứng trong một đám mây ca nhà cung cp dịch vụ. H tng
phn cứng bao gồm các sn phẩm máy ch chứa d liu nhỏ được kết nối li vi
nhau như một h thống phục vụ cho việc lưu tr và xử lý d liu và các ứng dụng
tnh ton trên cc ti nguyên khc. Đin toán đm mây gọi một ứng dụng
chạy
trên
máy ch ảo như l n đang chạy tại chỗ trên h tng phn cứng phân
tán
trong
đám mây. Những máy ch o được to ra theo những cách m  đ những
thỏa thun dịch vụ (SLA) khác nhau và s tin cậy đu được đảm bo. Có th c
nhiu thực th khc nhau ca cùng một máy ch o truy cp vào những phn sẵn
sàng ca cơ s h tng phn cứng. Điều này đm bo rằng có nhiều bn sao ca
các ứng dụng, đ khi xảy ra lỗi chúng sẵn sàng khc phục. Máy ch o phân tán

quá trình xử lý vo cơ s h tng phn cứng v sau khi qu trnh tnh ton được
hoàn thành chúng s tr v kt qu. Quá trình này cn c một phần mm hoc h
điu hành xử lý công vic quản lý h thống phân tán, giống như kỹ thut tính toán
lưi, giúp qun lý các yêu cu khc nhau đến máy ch o. Cơ ch này s đảm bảo
vic to ra nhiều bn sao và c vic bo v s thống nht d liu được lưu trên cơ
s h tng. Đồng thi h điu hnh đ cũng c th t điu chỉnh như l khi
gp
quá
ti các tin trình, phân chia xử lý đ hon thnh đp ứng yêu cu. H thống
qun lý công vic như vậy được che du vi ngưi dùng, hay nói các khác l ẩn
vi ngưi dùng. S độc lp vi ngưi dùng th hin  chỗ nó xử lý và tr v kt
qu đt được, ch không cn phi quan trọng nó  đâu v n thực hiện điu đ
8

bằng cch nào. Ngưi dùng tr tiền trên lưu lượng sử dụng h thống, như đ ni
dịch vụ được tính bằng chu kỳ ca CPU hoc byte. Thực t số tin m khách hàng
phi tr thưng được tính dựa vo lưu lượng dùng CPU trên một gi hoc số
Gb
d
liu di chuyển trong một gi





2.2. Kiến trúc máy chủ.
Đin toán đám mây được to thành bằng cách sử dụng tài nguyên vt lý ln t
nhiu máy ch trong đám mây ca nhà cung cấp dịch vụ. Đây l một ứng
dụng
ca

nguyên tc kt hợp vào trong bài toán cn một h thống tính toán ln mà thit
bị hoc cơ s vt cht không cho phép nên chúng ta cn phi ghép những thit bị,
những h thống nhỏ lại vi nhau đ tr thành một h thống ln đp ứng những
nhu cu lớn hơn cho ngưi sử dụng trong những h thống yêu cầu tnh ton v lưu
tr ln. Như đ ni bên trên, dịch vụ và ứng dụng ca điện ton đám mây dựa
trên máy ch ảo được thit k t ti nguyên góp li này. Có hai ứng dụng (hoc h
điu hành) s giúp quản lý các th hin trên máy trong đám mây, cũng như qun
lý tt c các tài nguyên ca các th hin máy ch o. Đây l một ứng dụng nguyên
lý tách khỏi vào trong h thống đin ton đám mây nhằm tách bit phn cứng
phức tp ca h thống vói giao din bên ngoài. Nhằm to ra một giao din ngưi
dng đơn gin, dễ sử dụng hơn so vi phn cứng phức tp bên dưi v cũng l đ
tách bit giao din ngưi dùng vi h thống phn cứng, khi đ ngưi dùng chỉ cần
quan tâm đến những ứng dụng mà hc cần ch không cn quan tâm đn phn
9

cứng bên dưi được thực hin như th nào. Ứng dụng th nht là Xen hypervisor
cung cp các lp trừu tượng giữa phn cứng và h điu hành o, nh vậy s phân
tán ca các tài nguyên và tin trnh được quản lý giống như l đang thực hin trên
một máy. Ứng dụng th hai cũng được sử dụng rộng rãi l h thống qun lý máy
ch o Enomalism, n được sử dụng đ qun lý h tng phn cứng nền tng.





Khi Xen sử dụng cho các lp ảo ca cc cơ s h tng máy ch, một lp phần
mềm l Xen hypervisor đ được ci đặt giữa máy ch và h điu hành. Nó cung
cp một lớp trừu tượng cho phép mỗi server vt lý có th được chạy như là một
hoc nhiu máy ch o, tách riêng h điu hành và các ứng dụng ca nó khỏi lp
phn cứng vt lý bên dưi. Xen hypervisor là một công ngh mã nguồn m, được

cộng tác phát trin bi Xen và các kỹ sư ca hơn 20 công ty nổi ting v
trung
tâm
d liu có tính chất đổi mi bao gồm : AMD, Cisco, Dell, HP, IBM, Intel,
Mellanox, Network Appliance, Novell, Red Hat, SGI, Sun, Unisys, Veritas,
Voltaire, and Citrix. Xen được đăng ký bi GNU General Public License (GPL2)
v được sử dụng không được thay đổi v mã nguồn v định dng đối tượng. Xen
Hypervisor cũng đặc bit ngn - t hơn 50.000 dng m. V vậy chi phí dịch mã
code rt thp và hiu sut gn giống như trên máy nguyên thủy. Xen tái sử dụng
cc trnh điều khin thit bị hin c (đối vi c hai loi là m v đng m nguồn)
10

t Linux, làm cho thit bị qun lý dễ dng. Hơn nữa Xen rt mnh m đ điu
khin lỗi và bảo v c ngưi dùng và hypervisor khỏi các vn đ vi các lỗi t cc
driver độc hi.





H thống qun lý máy ch o Enomalism là một nn tng h tầng cơ s máy
ch o hoàn chỉnh. Enomalism qun lý nh hưng giữa các tài nguyên trong h
thống. Enomalism có th sử dụng đ dẫn các luồng tnh ton vo đám mây giống
như l luồng t khch hng được đi vo thực hin tính toán trên một máy ch t
xa. Nó mang tất c những tnh năng như: triển khai k hoch tính toán, cân bằng
ti, trnh xung đột ti nguyên… Enomalism cũng l một ứng dụng mã nguồn m,
nó có một giao diện ngưi dùng dựa trên nn web rt đơn gin và dễ sử dụng. Nó
có kin trúc từng phn dễ dàng cho phép tạo và thêm vào h thống các bổ sung và
các tin ích cn thit cho vic sử dụng. Nó hỗ trin khai tổ chức phân tán và to
các ứng dụng dựa trên tổng quang chung. Nó hỗ trợ qun lý cc trường o khác

nhau gồm KVM/Qemu, Amazon EC2 and Xen, OpenVZ, Linux Containers,
VirtualBox. Nó có ch độ phân quyền ngưi dng v đt quyn truy cp.
2.3. Map Reduce.
Map Reduce là một mô hình lập trnh, được Google phát triển vo năm 2003,
đ hỗ trợ cho quá trình tính toán song song trên số lượng tập các d liu cực ln
(vài tỷ byte) lưu tr  các cụm máy tính thành phn trong đám mây đin toán.
Trong mô hnh này, ngưi dng định nghĩa một hàm map đ tính toán một cp
khóa/giá trị đu vào và to nên một tp các cp khóa/giá trị tạm thi, sau đ hàm
reduce s gom nhóm tất c những giá trị tạm thi nào có chung khóa li vi nhau
cho ra kt qu mong muốn. Rt nhiu các tác vụ trong đi sống thực có th được
thực thi bằng mô hình này,chúng ta s xem xét cụ th hơn  phần sau.


Chương trnh được vit theo kiu chức năng này được song song hóa một cách
t động v được thực thi trên một cụm ln các “máy tnh hng ha” (cc máy tnh
thành phn cu to nên đám mây đin toán). H thống khi chạy s quan tâm
chi
ti

t phân vùng ca d liu đu vào, lp lịch quá trình thực thi chương trnh thông
qua một tập các máy tính thành phn, xử lý lỗi và qun lý các kết nối nội giữa các
máy tính thành phần. Điu này cho phép các lập trình viên ngay c chưa c bt kỳ
11

kinh nghiệm nào trong các h thống song song v phân tn đu có th dễ dàng tối
ưu ha các tài nguyên ca một h thống phân tán ln.


Trong vng vi năm trưc đây, cc kỹ sư ca Google phi khi tạo hng trăm
các quá trình tính toán dành cho các mục đích đc bit trên số lượng ln các d

liu thô như cc d liu móc nối, nht ký các trang web yêu cu…Cc qu trnh
tính toán này dùng cho nhiu mục đch khác nhau như tóm tắt số lượng các trang
đ được móc nối bi từng host, tính tn số truy xut ca 1 trang web, tìm ra tp
các câu truy vấn được dùng nhiu nht trong ngày…Hu ht các tính toán này đu
không phức tạp,nhưng d liu đu vo thưng rt ln và quá trình tính toán cn
phi được phân tn cho hng trăm ngn máy nhằm có th thực thi trong khong
thi gian cho phép. Các vn đ v vic song song hóa tính toán,phân tán d liu
và qun lý lỗi đ làm cho cc qu trnh tnh ton vốn đơn gin này tr nên vô
cùng phức tp.


Đ gii quyt vấn đ, các kỹ sư ca Google đ thit k một mô hình trừu tượng
cho phép chúng ta diễn t quá trình tính toán này một cch đơn gin như vốn

ca
n, đồng thi che du đi cc chi tit phức tp trong việc song song hóa, chp
nhn lỗi, cân bằng np, phân tán d liệu trong một thư vin riêng. S trừu tượng
ha này được lấy ý tưởng t 2 thành phn cơ bn là map và reduce trong Lisp v
nhiu loi ngôn ng lập trình hàm khác. Chúng ta có th nhn thấy rằng trong hầu
ht các quá trình tính toán ca chúng ta đều bao gồm một thao tác map, ánh x
cc đu vào vi các giá trị ca “bn ghi” đ thực hin vic tính toán các giá trị đ
thành 1 tp cc cp khóa/giá trị tạm thi, sau đ ta li to thêm một thao tác
reduce, thu gn các giá trị mà có cùng key li vi nhau và cho ra kt qu.Vic sử
dụng mô hình hàm chức năng map và reduce cho phép chúng ta có th thực thi
song song các tính toán ln dễ dàng và có th sử dụng quá trình thực thi li như
một cơ ch chấp nhn lỗi.


Các th mnh chính ca phương php này l cung cp cho chúng ta một giao
din đơn gin và mnh m, cho phép song song hóa và phân tán d liu trong các

phép toán ln một cách t động, gip cho ta thu được hiu năng cao nht trong số
lượng ln các cụm máy tính thành phn của đám mây điện toán. Ở phn sau
chúng ta s ln lượt xem xét mô hình lập trnh cơ bn ca MapReduce và một vài
ví dụ đơn gin.
Mô hình lập trình.
Quá trình tính toán nhận một cp giá trị đầu vào gồm khóa/giá trị, v tính toán
cho ra một tp các cặp khóa/giá trị đu ra. Ngưi dùng sử dụng thư vin
MapReduce đ diễn t quá trình này thông qua hai hàm là Map và Reduce.
12

Map l hàm được định nghĩa bi ngưi dùng, nhn một cp giá trị đu vào v
to ra các cp giá trị trung gian.Thư viện MapReduce nhóm tt c các giá trị trung
gian có liên quan ti key I li vi nhau và chuyển nó cho hàm Reduce.





Hàm Reduce cũng được vit bi ngưi dùng, chp nhận key I và các tp giá trị
trung gian ca key I này. Sau đ tin hành hợp nht các giá trị này thành một tập
các giá trị nhỏ hơn nu có th. Một ln nữa nguyên tc kt hợp li được sử dụng
trong h thống điện toán đám mây nhằm phục vụ cho thuật toán gii quyết yêu
cu bài toán, sau khi chia nhỏ cc chương trnh ln thành các phần nhỏ đ thực
hin tính toán một cách song song nhằm làm gim thi gian thực hiện một bài
toán thì h thống tin hành kt hợp các kt qu tính toán t cc tin trình nhỏ song
song li vi nhau đ đưa ra một kt qu tính toán thống nht ca chương trình tính
ton m người dùng yêu cu. Thông thưng chỉ có một giá trị output được đưa
ra
t


hàm Reduce hoc không có giá trị nào cả.


Ví dụ:
Gi sử chúng ta có một bi toán l đếm số ln xut hiện ca một t trong một
bộ tài liu ln, người dùng cn phải viết một đon code tương t vi mã gi sau
đây:
map(String key,String
value):

//key: tên ca tài liệu
//value:nội dung tài liệu đ
Vi mỗi ch cái w trong value:
EmitIntermediate(w,”1”);
reduce(String key,Iterator values):
//key: ch cái cần đếm
//values:danh sách các số đếm trong map
int result = 0;
vi mỗi giá trị v trong values:
result += ParseInt(v);
Emit(AsString(result)) ;
13

Hàm map thêm vào mỗi t một số tương ứng vi số ln xut hin ca nó
(trong ví dụ đơn gin trên l ‘1’). Hàm reduce lm nhiệm vụ cộng tt c các số
đếm ca t đ.


Sau đ, ngưi dùng cn phi thực hiện thêm các th tục khai bo đc t đối
tượng mapreduce với tên ca các file input, output và các bin tùy chỉnh. Ngưi

dng sau đ gọi hàm MapReduce, chuyn cho n đối tượng đ đc t  trên, lúc
này cc đon code ca ngưi dng được liên kt li thông qua thư viện
MapReduce.


Tổng quan quá trình thực thi.
Quá trình gọi thực thi hàm Map được phân tán trong nhiu các máy thành viên
ca đám mây đin toán bằng cách t động phân vùng các giá trị đầu vào
thành
mộ
t bộ gồm M phn. Các phn này có th được tính toán song song bi các máy
khc nhau. Tương t hm Reduce cũng được phân tán bằng cách phân vùng các
khóa giá trị trung gian thành R mảnh bằng các hàm phân vùng (ví dụ như
hash(key) mod R). Số lượng R và hàm phân vùng có th được chỉ rõ bi ngưi
dùng.
Hnh bên dưi cho chúng ta cái nhìn tổng quát nht v luồng thực thi một thao
tác MapReduce.



Figure 1: Execution overview
14

Khi ngưi dùng gi hàm MapReduce thì các tác vụ sau đây s được diễn ra
một cách tun tự:
Thư vin MapReduce trong chương trnh ngưi dng đầu tiên s chia nhỏ các
file đu vào thành M mnh (thông thưng kích thưc mỗi mnh t 16-64MB,c
th điu chỉnh thông qua các tham số tùy chn). Ở đây, h thống đin ton đám
mây đ đưa nguyên tc chia nhỏ vào đ thực hin quá trình tính toán ca mnh.
Vi một chương trnh ln mà tính toán một lần s tốn rt nhiu thi gian và

không hiu quả, đ tic kiệm thi gian thực thi chương trnh, h thống tin hành
chia chương trnh lớn thành các tin trnh nhỏ đ thực hin tính toán trên các vi
xử lý (h thống phn cứng song song tạo nên h thống đin ton đám mây) đ tiến
hnh tnh ton chương trnh song song đ cuối cùng gộp li một kt qu. Tip
theo, nó s to nhiều bản sao ca chương trnh trên cụm máy tnh trong đám mây
đin toán. Nguyên tc sao chép cũng được đưa vo ứng dụng trong h thống đin
ton đám mây, trên mỗi cụm máy tnh trong đm mây điện toán thực hin một
tin trnh m chương trnh giao ph, tiến trình này s được tạo ra nhiều bn sao đ
cho các máy tính trong cụm máy tính thực hiện.
Một trong số các bản sao ca chương trnh s l chương trnh master. Cc
chương trnh cn li s l worker, l chương trình s thực thi các tác vụ do master
giao phó. Có tất c l M tác vụ Map và R tác vụ Reduce cn được thực thi.
Chương trnh master chn các worker rãnh rỗi đ gán cho tác vụ Map hoc
Reduce.
Worker được gán thực thi tác vụ Map đc nội dung ca mnh giá trị đu vào
tương ứng, nó phân tích giá trị đu vào thành các cp khóa/giá trị và chuyn
chng đn cho hàm Map ngưi dùng t định nghĩa. Cc cặp giá trị key/value
trung gian (kt qu ca hàm Map) s được lưu vo bộ nh đệm.
Sau đ, cc cp giá trị trong vùng nh đệm này s được ghi xuống vùng nh địa
phương, v được phân thành R vùng. Vị tr của các cp khóa/giá trị này (trên bộ
nh địa phương) s được chuyn v cho master. Chương trình master sau đ s
chuyn vị trí của chng cho cc worker được gán tác vụ Reduce.
Khi một worker thực thi tác vụ Reduce nhận được các vị trí ca các vùng
nh
t

master, nó dùng các li gi th tục t xa (RPC- Remote Procedure Call) đ đọc
các giá trị này. Sau khi worker đc xong tt c các cp giá trị trung gian này, nó
s sp xp li chúng theo khóa bằng cách gom nhóm các cặp có cùng khóa li vi
nhau. Nu số lượng các file trung gian này quá ln so vi bộ nh thì chúng ta s

phi cn có một hàm sắp xp ngoài.
Sau đ cc worker thực thi tác vụ Reduce chuyn khóa và tp các d liu
tương ứng đn hàm Reduce do ngưi dng định nghĩa, kt qu output thu được l
kt qu cuối cùng.
Sau khi tt c các tác vụ Map v Reduce đều hoàn tt, chương trình master gọi
đn chương trình user program, tr v đon code tip theo trong chương trnh.
15

Chấp nhận lỗi
Thư vin MapReduce được thit k đ gip tnh ton trên cc lượng d liu vô
cùng ln ca hng trăm hng ngn máy, do đ chng cn phi c cơ ch chp
nhn lỗi.
Đây l s áp dụng ca nguyên tc t phục vụ vào h thống đin ton đám mây,
đám mây đin toán có kh năng t phục hồi lại hot động ca h thống khi xảy ra
một số lỗi no đ trong cc qu trnh thực thi ca từng phn nhỏ trong h thống
tính toán.
Lỗi xảy ra ở Worker
Đ kiểm tra lỗi  worker,chương trnh master tin hành ping các máy worker
sau mỗi một khoảng thi gian nht định, nu một worker nào không tr li thì
Master s xem như n đang xảy ra lỗi, các tác vụ map hay reduce đang thực thi 
worker lỗi s tin hành reset li và gán cho worker khác. Ở đây c áp dụng
nguyên tc linh động đ khc phục lỗi h thống, chương trnh được chia
nhỏ
thành
các tiểu trình nên các tiu trình giống nhau có th linh động thực thi ti các
phn cứng vi xử lý khác nhau và khi một tiu trình bị lỗi thì tiu trnh khác có th
thay th đ thực hin nhiệm vụ ca h thống giao phó.
Đối với tác vụ map đ hon tt  worker lỗi cũng phi tin hành reset li do
kt qu trung gian được lưu tr  vùng nh địa phương v chng ta không th
truy cp đn chng. Đối vi tác vụ reduce th ngược li, ta không cần phi reset

chúng vì kết qu cuối cùng ca tác vụ này được lưu trong vùng nh toàn cục, ta
có th truy xuất chúng một cách dễ dng.
Lỗi xảy ra ở Master
Nhằm có th khôi phục master trong trường hợp xảy ra lỗi, master s tin hành
ghi checkpoint sau khong thi gian cố định. Khi lỗi xảy ra thì một bn sao mới
có th bt đầu t đon checkpoint đ lưu. Nhưng nu chúng ta chỉ c 1 master thì
khi master bị lỗi toàn bộ quá trình tính toán MapReduce s bị hủy, client khi đ
phi kiểm tra trưng hợp này v t khi động li quá trình nu muốn.
Tác vụ backup.
Đây l một áp dụng ca nguyên tc d phòng vào vic gii quyết bài
toán
trong
đám mây điện toán, nó giúp cho hoạt động tính toán không bị mt khi sử ra
s cố. Một trong cc nguyên nhân thưng xảy ra làm tăng thi gian hoàn tt
tc
vụ
MapReduce l các “straggler”. ”Straggler” l cc máy c khong thi gian
hoàn tt một trong số các tác vụ cuối ca Map hoc Reduce dài một cách bt
thưng. ”Straggler” c th là bt c máy nào trong số các máy trong h thống
đám mây đang được sử dụng. Có rt nhiều nguyên nhân tạo nên “straggler”, v dụ
như một máy tính trong h thống có ổ đĩa cứng không tốt, khi hot động có
th
gp
một số trục trc làm giảm tốc độ truy xuất bnh thưng ca ổ cứng t 30Mb/s
xuống thành 1Mb/s chẳng hn. H thống lặp lịch cho các cụm máy tính lúc này
phi gán tc vụ khác cho máy là nguyên nhân làm chậm tốc độ thực thi
16

MapReduce (dựa trên s so sánh tốc độ CPU, truy xut bộ nh, h thống lưu tr
ca máy địa phương, băng thông ca mng). Một vn đ mi nht mà Google gặp

phi là một lỗi trong đon code khi to tác vụ MapReduce, nó làm cho các cache
ca CPU không th hot động, quá trình tính toán ca máy tính bị lỗi do đ m
giảm xuống khong 100 ln.
Google đ to ra một phương pháp nhằm gim bt tác hi do cc “straggler”
gây ra. Khi các tác vụ MapReduce gn hoàn tt, master s to ra các tác vụ back
up
cho các tác vụ đang thực thi và gán cho các workers rãnh rỗi thực hin. Quá
trình MapReduce s kết thúc khi tác vụ nguyên thủy hoc tác vụ back up hoàn tt.
Đối vi các tác vụ MapReduce nhỏ, phương php này chỉ gip ci thin hiu năng
một vài phn trăm, nhưng đối với các tác vụ MapReduce ln thì chúng giúp ci
thin hiu năng rt đng k.





Bên trên là biu đồ so sánh tốc độ thực thi ca chương trình sp xp vit theo
MapReduce của Google. Chương trình thực hin sp xp khong 1 tetrabyte d
liu. Biu đồ đu tiên là tốc độ đc các giá trị input,biu đồ bên dưi là tốc độ
thực hin sp xp và cuối cùng là tốc độ xut ra kt qu.Biu đồ (a) th hin t
ốc
độ
thực thi ca tác vụ MapReduce hot động bnh thưng không có các straggler,
biu đồ (b) là khi thực hin gp phi các straggler trong hóa trình kt thc tác vụ
m không dng cơ ch backup,biu đồ (c) l khi dng cơ ch backup trong quá
trình thực thi MapReduce. Chúng ta nhận thấy tốc độ thực thi bnh thưng vo
khong 1057s, khi gp phi cc straggler m không c cơ ch backup ta s phi
mt 1283s, và cuối cùng khi áp dụng cơ ch backup và phi bỏ đi 200 tc vụ do
cc straggler này gây ra chng ta đt được tốc độ là 933 giây chỉ hơn 5% so vi
17


tốc độ thực thi bnh thưng nhưng li tăng 44% nu so vi tốc độ thực thi khi gp
phi các straggler.
2.4. Google File System (GFS)
Google File System là h thống d liu phân tn được Google phát trin dành
cho các ứng dụng ln. N được thit k nhằm đem li s truy xut d liu tin cậy
và hiu qu cho các d liu ca một cụm ln các máy tính thành phn ca đám
mây đin toán. Nó cung cp ch độ chấp nhn lỗi đ có th chạy được trên các h
thống phn cứng có yêu cu không cao, đem li hiu năng tổng hợp tốt trên số
lượng ln các máy client.
Cc file được chia thành các khúc d liu 64Mb,cc d liu này thưng được
đc vi cưng độ cao hơn nhiu so vi ghi v xa. N được thiết k và tối ưu ha
dành cho các cụm máy tính ln bao gồm c các máy tính có phần cứng nghèo
nn, do đ n phi có kh năng chịu được cường độ lỗi ln ti cc node độc lp
và kh năng mất mát d liu. Ở một số các thit k khác cho h thống d liu
phân tn thường là tối ưu ha thông lượng của d liu.
Cấu trúc của Google File System.
Một cụm GFS chức một máy Master và nhiu máy Chunkserver và nó có th
được truy xut bi nhiều client như trong hnh bên dưi.Một máy có th vừa là
client truy xut d liu t chunkserver khác vừa có th l một chunkserver lưu tr
d liu, tuy nhiên chúng ta cn phi đảm bảo trnh được xung đột và không làm
giảm tốt độ thực thi.
Cc file được chia thành các mảnh c kích thưc xc định. Mỗi mnh được
Master gán cho một tên duy nht không thay đổi dài 64 bit ti thi điểm khi tạo
các mnh. Cc chunkserver lưu tr các mnh này như l một file Linux. Đ đảm
bo độ tin cậy cao, các mảnh file được lp bn sao v lưu tr trên nhiu
chunkserver khác nhau, mc định là chúng ta s lưu tr 3 bn sao.
Node Master không thưng lưu tr bt kỳ một phân khúc d liu nào,nó chỉ
lưu trử các siêu d liu liên quan đn cc phân khc như bn ánh x các nhãn 64-
bit đn vị tr lưu tr vt lý và vị trí trong file gốc, vị trí ca tt c các bn sao d

liu, các tin trnh đang đc hoc ghi lên 1 phân khúc, tình trng các phân khc
hoc nh ca ca phân khc đ dành cho vic to thêm các bn sao…Cc siêu d
liu này được update liên tục bi các chunkserver sau khong thi gian cố định.
Ngoài ra node Master luôn gi kt nối và kiểm tra trng thái ca các chunkserver
bằng các gửi và nhn cc thông điệp phn hồi liên tục sau khong thời gian cố
định.
18




Chúng ta s phân tích một tin trnh đọc file đơn gin theo hình bên trên. Đu
tiên dựa vo kch thưc cố định được quy ưc trưc ca 1 mảnh d liu,client
dng chương trnh biên dịch tên ca file và các byte offset thành một danh mục
các mnh d liệu chứa trong 1 file. Sau đ n gửi đn node master một yêu cu có
chứa tên file và danh mục các mnh d liu. Master phn hồi li vi con trỏ các
mảnh d liu và vị trí các bn sao theo yêu cầu ca client. Cc client lưu tr các
thông tin này trong bộ nh cache và sử dụng chng như cha kha đ cho
phép
truy
xut d liệu.
Sau đ client tiến hành gửi yêu cu truy xut d liu đn 1 trong các bn sao
thưng là bn sao gn nht. Trong yêu cu truy xut ca client phải có con trỏ
mang địa chỉ của mảnh đ v phạm vi byte cần truy xut ttrong mnh. Các qu
trnh đc tip theo không cn có s kết nối đến node master nữa cho đn khi các
thông tin lưu tr trong bộ nh cache bị xóa. Trong thực t th client thưng yêu
cu cho phép truy xut đn nhiu mnh d liệu lưu tr trên nhiều nơi khc nhau
cùng một lc v node master cũng c th gửi các thông tin cn thit cho client
một cách tức thi.
Tri ngược vi các h thống file thông thưng,GFS không được khi to trong

nhân h điều hnh m chng được truy xut thông qua một thư viện riêng nhằm
tránh hao phí quá ln
Kích thước của một mảnh
Kch thưc ca mảnh d liu là một tham số vô cùng quan trọng trong thit
k.Google chn kch thưc là 64MB, ln hơn một block ca h thống d liu
19

truyn thống.Mỗi bn sao ca mnh d liu được lưu tr trên các chunkserver
như l một ht nhân Linux,nó chỉ được m rộng ra khi cần thit
Một kch thưc mnh d liu ln cho chúng ta nhiu lợi th. Đu tiên nó giảm
số lượng kt nối ca client đn node master bởi vì vic đọc và ghi trên cùng một
mảnh d liu chỉ đi hỏi một ln gửi yêu cu đn node master đ lấy vị trí ca
mảnh d liu này. Điều này làm tăng hiu năng ca chương trnh rt nhiu v
đa
số
cc chương trnh đều đc v ghi cc file c kch thưc ln một cách tun tự.
Ngay c đối vi các thao tác đc ngẫu nhiên nhỏ th cc máy client cũng c th dễ
dng lưu trong bộ nh cache thông tin ca vài TetraByte mnh d liệu. Th hai,v
kch thưc các mnh d liu ln hơn nên cc client thưng xuyên thực thi
nhiu
tác
vụ khc nhau (đọc,ghi ) trên cùng một mảnh d liu, điều này làm giảm hao
phí v mng bi lúc này chỉ cn duy trì một kt nối t client đn chunkserver thay
vì phi khi to nhiu kt nối khác nhau. Th ba nó giúp làm giảm kch thưc ca
các siêu d liu lưu tr  máy Master, điều này cho phép chúng ta có th lưu tr
các siêu d liu này trong bộ nh ca Master lm tăng tốc độ phản hồi đn
các
máy
client.
2.5. Hadoop

Hadoop – công ngh khai thc mỏ vng trên Internet.

(JICT) - Mong muốn ca cc doanh nghip l tn dụng lượng d liu khổng lồ
đ đưa ra quyết định kinh doanh, Hadoop gip cc công ty xử lý khối lượng cỡ
terabyte và thậm chí là petabytes d liệu phức tp tương đối hiu qu vi chi ph
thp hơn.
Các doanh nghip đang nỗ lực tìm kiếm thông tin quý gi t khối lượng ln d
liu phi cu trc được to ra bi các web log, công cụ clickstream, các sn phẩm
truyn thông xã hội. Chnh yu tố đ dẫn làm tăng s quan tâm đn công ngh mã
nguồn m Hadoop.
Hadoop, một d án phn mềm qun lý d liu Apache vi nhân trong khung
phn mềm MapReduce ca Google, được thiết k đ hỗ trợ các ứng dụng sử dụng
được số lượng ln d liu cu trúc và phi cấu trúc.
Không giống như các h quản trị cơ s d liu truyn thống, Hadoop được
thit k đ làm vic vi nhiu loi d liu và d liu nguồn. Công ngh HDFS ca
Hadoop cho phép khối lượng ln công vic được chia thành các khối d liu nhỏ
hơn được nhân rộng và phân phối trên các phần cứng ca một cluster đ xử lý
nhanh hơn. Công ngh này đ được sử dụng rộng rãi bi một số trang web ln
nht th gii, chng hạn như Facebook, eBay, Amazon, Baidu, v Yahoo. Cc
20

nhà quan sát nhn mnh rằng Yahoo là một trong những nh đng gp ln nht
đối vi Hadoop.
Công ngh Hadoop ngày cng được sử dụng nhiu hơn trong cc ngân hng,
công ty quảng co, cc vin nghiên cứu, cc công ty dược phẩm và các công ty
CNTT khác.
"Vi Hadoop bn có th chỉ cn một v hai ngưi là có th xử lý cùng một
khối lượng d liu mà một số công ty lớn nht th gii đang xử lý.”
Tynt, ngưi sử dụng Hadoop, một công ty phân tích web, cung cp dịch vụ
phân tch cho hơn 500.000 trang web. Sn phẩm chính ca nó là một dịch vụ cho

phép các nhà cung cấp dịch vụ c được cái nhìn sâu sc v vic các dịch vụ ca
h được chia sẻ như th nào. Một ngày trung bình Tynt thu thp và phân tích gn
1 terabyte d liệu t hàng trăm triệu của cc tương tc web trên cc trang web m
h quan st. Công ty chuyn sang Hadoop khong 18 thng trưc, khi cơ s h
tng d liu MySQL bt đu sụp đổ theo d liu mà Tynt thu thập được.
Cu trúc tp tin ca Hadoop cho phép các công ty v cơ bn nắm bt và cng
cố tốt bt kỳ loi tập tin d liu có cu trúc và phức tp nào, chẳng hn như cc
nht ký trên trang web, siêu d liu, tập tin âm thanh và video, dịch vụ e-mail phi
cu trúc, d liệu dòng Twitter và dịch vụ truyn thông x hội.
Do đ, công ngh này l lý tưng cho các công ty muốn phân tích khối lượng
ln d liu có cu trúc và phi cu trúc.
Lấy d liu thô t các HDFS, tuy nhiên, ch bin nó không phi l dễ dàng
hay thun tin như cc h thống cơ s d liệu đin hình, bi vì d liệu không
được tổ chức hoc cu trúc, Befus nói. "V cơ bn những g Hadoop lm l đưa
các d liu bên ngoài vào trong các tp tin ln. Nó không quan tâm trong các tp
tin có gì. Nó chỉ qun lý chng v đảm bảo rằng trong đ c nhiu bn sao ca
các tp tin."
Ban đu, ngưi dùng phi vit công việc trong một ngôn ng lập trnh như
Java đ phân tch v sau đ truy vn d liu thô trong Hadoop. Nhưng cc công
cụ hin có th được sử dụng đ viết các truy vn SQL như d liệu được lưu tr
trong Hadoop.
Hadoop được sử dụng nhiu hơn cho cc ứng dụng kinh doanh thông minh
thi gian thực.
3. Điện toán đám mây của Microsoft.
♦ Điện toán đám mây: Xu hướng chuyển đổi chính của Microsoft
21


Điện ton đm mây l trọng tâm pht triển ca Microsoft



Trưc s cnh tranh mạnh m ca cc đối th công ngh ln, Microsoft đang t
o

ra những chuyển bin mạnh m v c tnh đột phá, cung cp những sn phẩm đa dng
v đp ứng tốt hơn nữa nhu cu ca thị trưng. Đin ton đám mây chnh đp n tốt
nht nhằm gii quyết bài toán cnh tranh, tăng cưng sức mnh ca Microsoft,
đp
ứng
hơn nữa nhu cầu ca ngưi dùng,
Rõ rng, đ c s phát trin trong chin lược phát triển công ngh ca Microsoft.
Bên cnh các sn phầm phn mềm truyn thống (Office)…phn cứng (cc HĐH
Windows 7, Windows 8 ) lc này Microsoft đang pht triển các hình thức cung cp
và cho thuê các dịch vụ có ứng dụng ca điện ton đám mây cho doanh nghip và
ngưi dng. Đây s là mô hình phát trin, chuyển đổi chính ca Microsoft trong tương
lai.
♦ Công nghệ điện toán đám mây của Microsoft
22


Microsoft đầu tư pht triển mạnh mẽ các ứng dng điện ton đm mây


Microsoft đ pht trin các ứng dụng, nền tng và các lp cơ s h tng ca công
ngh đin toán theo tng lp được xây dựng trong các trung tâm d liu khách hàng,
trung tâm d liu Microsoft hoc trung tâm cung cp dịch vụ d liu (STB).
Sức mnh và tiềm năng ca đin toán đám mây th hin qua những số liu cụ
th
:
- Office 365 phiên bản beta thu ht hng trăm ngưi sử dụng, phiên bản chính

thức ca Office 365 đt thnh công ngoi mong đợi. Theo thống kê, c 25 giây
thì có thêm 1 tài khon Office 365 mi.
- 10 ngn khch hng đang sử dụng nền tng Windows Azure. - Số lượng ngày
cng tăng cc đối tác phát trin ứng dụng thực t và cung cp các gii php đin
ton đám mây.
- Số lượng cc đối tác trên toàn th gii sử dụng các tin ch đám mây (Cloud
Essentials) v Accelerate đ tăng 500% k t thng 7 năm 2010, số lượng sử
dụng tin ích tăng gp 23 ln, số lượng đối tác sử dụng dịch vụ Office 365 tăng
gp 6 ln.
- Số lượng cc đối tác thuê dịch vụ trực tuyn t Microsoft đ tăng 250%. - Số
lượng khch hng điện toán cá nhân sử dụng dịch vụ h điu hành o ha
Hyper-V đ tăng gấp đôi trong 12 thng (k t WPC10).
- Theo thống kê chưa chính thức, 57% đối tác tham d WPC 2011 tuyên bố s
phát trin công ngh đin ton đám mây.

Hin Microsoft c hơn 640.000 đối tác địa phương trên khp th gii vi hơn 15
triu nhân viên c trnh độ cao và tạo ra doanh thu địa phương lên ti 537 tỷ USD
(IDC 2009). Hng cũng đang tăng tốc đu tư mạnh m vào các giải php đin toán
đám mây, cơ s h tng nhằm đp ứng các nhu cu khác nhau ca ngưi dùng, doanh
nghip. Cụ th:

- Tính đn cuối năm 2011, c khong 90% trong tổng số 40000 kĩ sư ca
Microsoft s nghiên cức các ứng dụng và dịch vụ mi ca đin ton đm mây.
23

- 55 tỉ USD đầu tư cho cc ứng dụng đin ton đám mây vi mục đch pht trin
cộng đồng vo năm 2014. (Theo IDC, tháng 06/2011).
- 30% các nhà qun lý trung tâm d liệu đ lên k hoch đầu tư vo ứng dụng
đin toán cá nhân trong năm 2011 (theo Gartner).
- Chi ph đầu tư cho ứng dụng công ngh đin ton đám mây s tăng t 70 tỷ lên

136 tỷ USD, chiếm khong 12% tổng vốn ngân sch đu tư cho lĩnh vực công
ngh thông tin. (Ngiên cứu AMI, tháng 05/2011)

Dịch vụ điện toán đám mây của Microsoft phục vụ lợi ích khách hàng



Các dch v điện ton đám mây ca Microsoft đều hướng đến khách hàng

Những dịch vụ điện ton đám mây do Microsoft đang cung cp hin nay rt đa
dng, nhằm đp ứng tối ưu hiu qu công vic ca khách hàng, giảm chi phí sn xut,
giúp doanh nghip và c những cá nhân có th tn dụng tối đa cc ti nguyên ứng
dụng:
24

- Các dịch vụ đin ton đám mây dành cho doanh
nghip:


Dch v điện ton đm mây dnh cho các doanh nghiệp


Dịch vụ phát trin Cơ s h tầng Windows Server Hyper V: Công ngh o hóa
server th h mi ca Microsoft và là thành phn quan trng trong h điu hành
Windows Server 2008. Kin trúc m ca Hyper-V cho phép các nhóm phát trin
nội bộ và các nhà phát trin phn mềm ca hãng th ba ci tiến công ngh này và
các công cụ. Vi Hyper-V, Microsoft cung cấp một nn tng o ha mạnh và linh
hot, có th đp ứng nhu cu o hóa mi cấp độ cho môi trưng doanh nghip.



Dịch vụ nn tng Windows Azure: Window Azure là h điu hành ca
Microsoft cho đin toán đám mây, gip các ứng dụng c kh năng tăng giảm biên
độ tùy thuộc vào yêu cu ca doanh nghiệp. Giúp các chuyên gia phn mềm
ch

cn
sáng to trên nền tảng sẵn sàng hỗ trợ ngôn ng ca h - .Net, PHP, Java hoc
Ruby. Thêm vo đ, vi mô hình kinh doanh tr ph đ sử dụng, s không phi tốn
chi phí cho những dịch vụ tưng là cn thit nhưng li không bao gi sử
dụng.
Điu
này mang li lợi ích cho c hai bên.
Các dịch vụ Phần mềm:
Microsoft Office 365: được thit k đ làm vic vi các phn mềm, thit bị,
đin thoi, và các trình duyt sẵn có ti doanh nghip. Điều này giúp nhân viên
sức mạnh đ truy cp thông tin và gi năng sut trên tt c cc phương tin truy
cp trong khi vẫn đảm bo an ninh và vẫn gi được các ứng dụng cũ.
Microsoft Dynamics CRM online: Bộ gii pháp qun lý doanh nghip hỗ
trợ

vic qun lý tài chính, mối quan h khch hng v chuỗi cung ứng, thc đẩy
vic

×