Mục lục
1. TỔNG QUÁT VỀ ĐIỆN TOÁN ĐÁM MÂY 1
1.1. KHÁI NIỆM 1
1.2. ĐẶC ĐIỂM CỦA ĐIỆN TOÁN ĐÁM MÂY 2
1.2.1. Tự sửa chữa 2
1.2.2. Nhiều người sử dng 2
1.2.3. Khả năng m rộng tuyến tính 2
1.2.4. Hướng dch vụ 2
1.2.5. Điều khiển SLA(Service Level Agreement). 2
1.2.6. Khả năng ảo hóa 2
1.2.7. Linh hoạt 3
1.3. ƯU VÀ NHƯỢC ĐIỂM CỦA ĐIỆN TOÁN ĐÁM MÂY 3
1.3.1. Ưu điểm 3
1.3.2. Nhược điểm. 4
1.4. SỰ CẦN THIẾT CỦA ĐIỆN TOÁN ĐÁM MÂY. 5
2. HOẠT ĐỘNG CỦA ĐIỆN TOÁN ĐÁM MÂY 6
2.1. KIẾN TRÚC CỦA ỨNG DỤNG ĐIỆN TOÁN ĐÁM MÂY 6
2.2. KIẾN TRÚC MÁY CHỦ 8
2.3. MAP REDUCE. 10
2.4. GOOGLE FILE SYSTEM (GFS) 17
2.5. HADOOP 19
3. ĐIỆN TOÁN ĐÁM MÂY CỦA MICROSOFT 20
4. TỔNG KẾT. 26
1
1. Tổng quát về Điện toán đám mây
1.1. Khái niệm.
Điện toán đám mây (Thut ng ting Anh: Cloud Computing, hay cn bit
đn vi tên gi “Đin ton máy ch o”) l mô hnh máy tnh dựa trên nn tng
pht trin của Internet.
Đin toán đám mây l s nâng cp t mô hình máy ch mainframe sang mô
hnh cleint-server. Cụ th, ngưi dng s không cn phi c cc kiến thức v
chuyên mục đ điu khin cc công ngh, máy mc v cơ s h tng, m cc
chuyên gia trong “đám mây” ca cc hãng cung cp s giúp thực hin điu đ.
Thut ng "đám mây" đây l lối nói ẩn dụ chỉ mng Internet (dựa vào cách
được bố trí ca n trong sơ đồ mng máy tnh) v như một liên tưng v độ phức
tp ca cc cơ s h tầng chứa trong nó. Ở mô hnh đin toán này, mi kh năng
liên quan đến công ngh thông tin đu được cung cp dưi dạng các "dịch vụ",
cho phép ngưi sử dụng truy cp các dịch vụ công ngh t một nhà cung cp no
đ "trong đám mây" m không cn phi có các kin thức, kinh nghiệm v công
ngh đ, cũng như không cn quan tâm đến các cơ s h tng phục vụ công ngh
đ.
V dụ đơn giản, nu một website được chứa trên một máy ch, ngưi
dng
phi
lựa chn h điu hnh đ ci đặt (Linux/Windows/Mac), tiến hành cc thit
lp đ máy ch v website c th hot động. Tuy nhiên, nu trang web được chứa
trên “đám mây”, ngưi dng s không cn phải thực hin thêm bt c điu g
khc. Điu này cũng đảm bo yu tố đu tư v phn cũng được giảm ti mức tối
đa.
Sơ đ đin ton đm mây, với cc dịch v được cung cp nm bên trong “đm mây”
được truy cp t cc máy tính bên ngoi.
2
Ti nguyên, d liệu, phn mềm v cc thông tin liên quan đu được chứa trên
cc server (chnh l cc “đám mây”).
Nói một cch đơn gin nht “ứng dụng đin ton đám mây” chnh l những ứng
dụng trực tuyến trên Internet. Trình duyệt l nơi ứng dụng hiện hữu và vn hành
còn d liu được lưu tr và xử lý máy ch ca nhà cung cp ứng dụng đ.
1.2. Đặc điểm của Điện toán đám mây.
1.2.1. Tự sửa chữa.
Bt kỳ ứng dụng hoc dịch vụ no đang chạy trong một môi trưng đin
ta n đám mây c một tính cht t sửa chữa. Trong trưng hợp ứng dụng tht
bi, luôn luôn có một d phòng tức thi ca ứng dụng sẵn sằng đ cho công
vic không bị gin đoạn. Có nhiều bn sao của một ứng dụng – mỗi bn cp
nht chnh n thưng xuyên, vì vậy những ln tht bi, có ít nhất một bn
sao ca ứng dụng có th lấy lên hoạt động mà không cn một thay đổi
nhỏ
nào
trong trng thái chạy ca nó.
1.2.2. Nhiều người sử dng.
Vi điện ton đám mây, bt k ứng dụng no cũng hỗ trợ đa người dung.
H thống cho phép một số khách hàng chia sẻ cơ s h tng được phân bổ
cho h mà không ai trong số h nhận bit v s chia sẻ này. Điu này được
thực hin bi vic áo hóa các máy ch trong một di cc máy tnh v sau đ
cp phát các máy ch đn nhiu người sử dụng.
1.2.3. Khả năng m rộng tuyến tính.
H thống có kh năng phân chia các luồng công vic thành các phn nhỏ
và phục vụ n qua cơ s h tng. Một ý tưởng chính xác có th lấy t thực t
là nu một máy ch c th xử lý 1000 giao dịch trong 1 giây, thì hai máy ch
có th xử lý 2000 giao dịch trong 1 giây.
1.2.4. Hướng dch vụ.
Cho phép tái sử dụng các dịch vụ khác nhau sẵn có v đang được to ra.
Bằng vic sử dụng các dịch vụ được to ra trưc đ, những dịch vụ khác c
th được tạo ra t đ.
1.2.5. Điều khiển SLA(Service Level Agreement).
Thông thưng các công ty có thỏa thuận v số lượng dịch vụ. Nhưng
do
kh
năng m rộng và các vn đ có sẵn có th làm cho các thỏa thuận này bị
phá vỡ. Tuy nhiên các dịch vụ điện ton đám mây c đc tnh hưng SLA nên
khi h thống có kinh nghiệm đt đỉnh ca ti, nó s t động điu chỉnh chnh
n đ tuân th các thỏa thun cấp độ dịch vụ. Các dịch vụ s to ra thêm
những thực th ca ứng dụng trên nhiu server đ cho vic ti có th dễ dng
qun lý.
1.2.6. Khả năng ảo hóa
Các ứng dụng trong đin ton đám mây hon ton tch ri khỏi
3
phn cứng nằm bên dưi. Môi trường đin toán đám mây l một môi trưng
o ha đầy đ.
1.2.7. Linh hoạt.
Một tnh năng khc ca các dịch vụ đin ton đám mây l linh hoạt.
Chúng có th được dng đ phục vụ rt nhiu loi công việc có khối lượng
khác nhau t ti nhỏ của một ứng dụng nhỏ cho đn ti rất nng của một
ứng dụng thương mi.
1.3. Ưu và nhược điểm của Điện toán đám mây.
1.3.1. Ưu điểm
Những ưu điểm và th mnh dưi đây đ gp phn gip "điện toán đám
mây" tr thnh mô hnh đin ton được áp dụng rộng rãi trên toàn th gii.
a. Tốc độ xử lý nhanh, cung cp cho ngưi dng những dịch vụ nhanh
chng v gi thnh rẻ dựa trên nn tng cơ s h tng tp trung (đám
mây).
b. Chi ph đầu tư ban đầu v cơ s h tng, máy móc v nguồn nhân lựa ca
ngưi sử dụng điện toán đám mây được giảm đn mức thp nht.
c. Không cn phụ thuộc vo thit bị v vị tr địa lý, cho phép ngưi
dùng
truy
cp v sử dụng h thống thông qua trnh duyệt web bt kỳ đâu v
trên bt kỳ thit bị no m h sử dụng (chng hn l PC hoc l đin thoi
di động…)
d. Chia sẻ ti nguyên v chi ph trên một địa bn rộng ln, mang li cc loi
ch cho ngưi dng như:
Tp trung cơ s h tng ti một vị tr giúp ngưi dng không
tốn
nhiu gi thnh đu tư v trang thiết bị.
Công sut xử lý nhanh hơn do ti nguyên được tp trung. Ngoi ra,
ngưi dng không cần phi đu tư v nguồn nhân lực qun lý h
thống.
Kh năng khai thc v hiu sut được ci thiện hơn 10-20% so vi
h thống máy tnh c nhân thông thưng.
e. Vi độ tin cậy cao, không chỉ ginh cho ngưi dng phổ thông, điện ton
đám mây ph hợp vi cc yêu cu cao v liên tục ca cc công ty kinh
doanh v cc nghiên cứu khoa hc. Tuy nhiên, một vi dịch vụ ln của
đin ton đám mây đôi khi rơi vào trng thi qu ti, khiến hot động bị
ngưng tr. Khi rơi vào trng thi này, ngưi dng không c kh năng đ
xử lý cc s cố m phải nh vo cc chuyên gia t đám mây tin hnh xử
lý.
f. Kh năng m rộng được, gip ci thin cht lượng cc dịch vụ được cung
cp trên “đám mây”.
4
g. Kh năng bo mt được ci thin do s tp trung v d liu.
h. Cc ứng dụng ca đin ton đám mây dễ dng đ sửa chữa hơn bi l
chng không được ca đt cố định trên một m tnh no. Chng cũng dễ
dng hỗ trợ v ci thin v tnh năng.
i. Ti nguyên sử dụng của đin ton đám mây luôn được qun lý v thống
kê trên từng khch hng v ứng dụng, theo từng ngày, từng tun, từng
thng. Điu này đảm bo cho vic định lượng gi c ca mỗi dịch vụ do
đin ton đám mây cung cp đ ngưi dng c th lựa chn ph hợp.
1.3.2. Nhược điểm.
a. Tnh riêng tư: Cc thông tin ngưi dng v d liu được chứa trên điện
ton đám mây c đảm bo được riêng tư, v liu cc thông tin đ c bị sử
dụng v một mục đch no khc?
b. Tnh sn dng: Liu các dịch vụ đám mây c bị “treo” bt ng, khin cho
ngưi dng không th truy cp cc dịch vụ v d liu ca mnh trong
những khong thi gian no đ khin nh hưởng đn công vic?
c. Mt dữ liu: Một vi dịch vụ lưu tr d liu trực tuyến trên đám mây bt
ng ngừng hot động hoc không tip tục cung cp dịch vụ, khiến cho
ngưi dng phi sao lưu d liu ca h t “đám mây” v máy tnh c
nhân. Điu này s mt nhiu thi gian. Thậm ch một vi trưng hợp, v
một lý do no đ, d liu ngưi dng bị mt v không th phục hồi được.
Dữ liệu chứa trên các "đám mây" sẽ phải giao phó toàn bộ"số phận" cho "đám mây
d. Tnh di động ca dữ liệu v quyền s hữu: Một câu hỏi đặt ra, liu ngưi
dng c th chia sẻ d liệu t dịch vụ đám mây này sang dịch vụ ca đám
mây khc? Hoc trong trưng hợp không muốn tip tục sử dụng dịch vụ
cung cp t đám mây, liu ngưi dng c th sao lưu ton bộ d liu ca
h t đám mây? V làm cch nào đ ngưi dng c th chc chn rằng
5
cc dịch vụ đám mây s không hủy ton bộ d liu của h trong trưng
hợp dịch vụ ngừng hoạt động.
e. Khả năng bảo mật: Vấn đ tp trung d liu trên cc “đám mây” l cch
thức hiu qu đ tăng cưng bo mt, nhưng mt khc cũng li chnh l
mối lo ca ngưi sử dụng dịch vụ ca đin toán đám mây. Bi l một khi
cc đám mây bị tn công hoc đột nhp, ton bộ d liu s bị chiếm dụng.
Tuy nhiên, đây không thực s l vn đ của riêng “đin ton đám mây”,
bi l tn công đnh cắp d liu l vn đ gp phi trên bt kỳ môi trưng
no, ngay c trên cc máy tnh c nhân.
1.4. Sự cần thiết của Điện toán đám mây.
Đin toán đám mây c kh năng s m ra những giá trị vĩ đi cho các nguồn
lực ngoài (Outsourcing) ca ngành CNTT v lm thay đổi bộ mặt ca ngành dịch
vụ CNTT truyền thống. Dưi đây s là những gì ngành công nghip Outsourcing
đang phn ứng tương tc vi s phát trin ca đin ton đám mây.
Các hợp đồng dịch vụ Outsourcing truyền thống luôn mang những nội dung
khá rõ ràng vi các máy ch, các trung tâm d liu, mng lưi, các chỉ tiêu kỹ
thut, hiu sut công vic và dòng mã sn phẩm. S xut hiện của điện ton đám
mây li đang làm thay đổi tt c những điu đ nh s xut hin của các dịch vụ
CNTT năng động như một cơ s cn thit cho những viễn cảnh công ngh dành
cho doanh nghip.
Nh các dịch vụ đám mây điện toán, nhiu đơn vị CNTT sẵn lng đi trưc một
bưc hơn trong vic tạo ra các tùy bin: Chúng giúp các hãng CNTT dn loi bỏ
được những chi phí vốn khá tốn kém t cơ s h tng đn các phn mm tip cn
khách hàng và những vn đ trung gian khác. Và h qu là, đin ton đám mây
đang làm thay đổi hoàn toàn bộ mặt ca các dịch vụ CNTT truyn thống
Susan Tan, giám đốc dịch vụ CNTT và nghiên cứu nguồn lực ca Gartner cho
rằng: “Điện ton đm mây l bước chuyển cơ bản ca các công ty trong vic chi
6
tiền và tiếp cn các dch v CNTT”. Trên thực t, Gartner d đon cho đn năm
2012, 20% công vic kinh doanh s là ảo và không có bt kỳ tài sn CNTT nào.
Đây s l ngưi thay đổi cuộc chơi dnh cho cc nh sn xut dịch vụ
Outsourcing, t các nhà cung cp v tư vn dịch vụ “onshore” đn dịch vụ thuê
ngoài, các nhà tích hợp h thống đn các nhà sn xut mi riêng bit, nhằm làm
cuộc chơi tốt hơn hoc xu đi.
Phil Fersht, sáng lp viên ca công ty tư vấn dịch vụ thuê ngoài Horses for
Sources cho rằng:“Nếu đin ton đm mây chỉ l một ngnh khai thác cc cơ s
hạ tầng đắt đỏ, rắc rối v không thân thiện với môi trường trong đó, Amazon v
các công ty khác phân phối cc năng lượng đin ton, thì đin ton đm mây đơn
giản chỉ là ngành cung cp các ích lợi về cơ s hạ tầng. Tuy nhiên, nếu để các dữ
liu và trình ứng dng được lưu giữ bên ngoi đm mây, người sử dụng liu có
cần phải tự mình quản lý chúng nữa không? Người sử dng có tht sự cần phải
đạt được các lợi ích cạnh tranh đi cng với vic thực hin các hợp đng
bảo
hiểm?
Hay đã đến lúc tìm kiếm các nhà cung cp dch v có chức năng quản lý
trình ứng dng, cơ s hạ tầng có liên quan và thực hin các giao dịch chưa?”
Fersht gi các dịch vụ đám mây l nn tng cho các giải pháp nguồn dành cho
doanh nghip th h k tip. Ông tin rằng các dịch vụ đám mây s làm cho quá
trình phân phối truyền thống ca các dịch vụ CNTT hiu qu hơn v tit kiệm chi
ph hơn. “Chúng cũng giúp tạo ra một cơ cấu phân phối cho các dch v gia công
thực sự. Thế h dch v thuê ngoài mới này có khả năng m ra những giá tr to
lớn cho khch hng”.
2. Hoạt động của Điện toán đám mây.
2.1. Kiến trúc của ứng dụng Điện toán đám mây.
7
Chúng ta bit rằng đin ton đám mây l một tổ hợp tính toán dựa trên
cc
thi
t bị h tng phần cứng trong một đám mây ca nhà cung cp dịch vụ. H tng
phn cứng bao gồm các sn phẩm máy ch chứa d liu nhỏ được kết nối li vi
nhau như một h thống phục vụ cho việc lưu tr và xử lý d liu và các ứng dụng
tnh ton trên cc ti nguyên khc. Đin toán đm mây gọi một ứng dụng
chạy
trên
máy ch ảo như l n đang chạy tại chỗ trên h tng phn cứng phân
tán
trong
đám mây. Những máy ch o được to ra theo những cách m đ những
thỏa thun dịch vụ (SLA) khác nhau và s tin cậy đu được đảm bo. Có th c
nhiu thực th khc nhau ca cùng một máy ch o truy cp vào những phn sẵn
sàng ca cơ s h tng phn cứng. Điều này đm bo rằng có nhiều bn sao ca
các ứng dụng, đ khi xảy ra lỗi chúng sẵn sàng khc phục. Máy ch o phân tán
quá trình xử lý vo cơ s h tng phn cứng v sau khi qu trnh tnh ton được
hoàn thành chúng s tr v kt qu. Quá trình này cn c một phần mm hoc h
điu hành xử lý công vic quản lý h thống phân tán, giống như kỹ thut tính toán
lưi, giúp qun lý các yêu cu khc nhau đến máy ch o. Cơ ch này s đảm bảo
vic to ra nhiều bn sao và c vic bo v s thống nht d liu được lưu trên cơ
s h tng. Đồng thi h điu hnh đ cũng c th t điu chỉnh như l khi
gp
quá
ti các tin trình, phân chia xử lý đ hon thnh đp ứng yêu cu. H thống
qun lý công vic như vậy được che du vi ngưi dùng, hay nói các khác l ẩn
vi ngưi dùng. S độc lp vi ngưi dùng th hin chỗ nó xử lý và tr v kt
qu đt được, ch không cn phi quan trọng nó đâu v n thực hiện điu đ
8
bằng cch nào. Ngưi dùng tr tiền trên lưu lượng sử dụng h thống, như đ ni
dịch vụ được tính bằng chu kỳ ca CPU hoc byte. Thực t số tin m khách hàng
phi tr thưng được tính dựa vo lưu lượng dùng CPU trên một gi hoc số
Gb
d
liu di chuyển trong một gi
2.2. Kiến trúc máy chủ.
Đin toán đám mây được to thành bằng cách sử dụng tài nguyên vt lý ln t
nhiu máy ch trong đám mây ca nhà cung cấp dịch vụ. Đây l một ứng
dụng
ca
nguyên tc kt hợp vào trong bài toán cn một h thống tính toán ln mà thit
bị hoc cơ s vt cht không cho phép nên chúng ta cn phi ghép những thit bị,
những h thống nhỏ lại vi nhau đ tr thành một h thống ln đp ứng những
nhu cu lớn hơn cho ngưi sử dụng trong những h thống yêu cầu tnh ton v lưu
tr ln. Như đ ni bên trên, dịch vụ và ứng dụng ca điện ton đám mây dựa
trên máy ch ảo được thit k t ti nguyên góp li này. Có hai ứng dụng (hoc h
điu hành) s giúp quản lý các th hin trên máy trong đám mây, cũng như qun
lý tt c các tài nguyên ca các th hin máy ch o. Đây l một ứng dụng nguyên
lý tách khỏi vào trong h thống đin ton đám mây nhằm tách bit phn cứng
phức tp ca h thống vói giao din bên ngoài. Nhằm to ra một giao din ngưi
dng đơn gin, dễ sử dụng hơn so vi phn cứng phức tp bên dưi v cũng l đ
tách bit giao din ngưi dùng vi h thống phn cứng, khi đ ngưi dùng chỉ cần
quan tâm đến những ứng dụng mà hc cần ch không cn quan tâm đn phn
9
cứng bên dưi được thực hin như th nào. Ứng dụng th nht là Xen hypervisor
cung cp các lp trừu tượng giữa phn cứng và h điu hành o, nh vậy s phân
tán ca các tài nguyên và tin trnh được quản lý giống như l đang thực hin trên
một máy. Ứng dụng th hai cũng được sử dụng rộng rãi l h thống qun lý máy
ch o Enomalism, n được sử dụng đ qun lý h tng phn cứng nền tng.
Khi Xen sử dụng cho các lp ảo ca cc cơ s h tng máy ch, một lp phần
mềm l Xen hypervisor đ được ci đặt giữa máy ch và h điu hành. Nó cung
cp một lớp trừu tượng cho phép mỗi server vt lý có th được chạy như là một
hoc nhiu máy ch o, tách riêng h điu hành và các ứng dụng ca nó khỏi lp
phn cứng vt lý bên dưi. Xen hypervisor là một công ngh mã nguồn m, được
cộng tác phát trin bi Xen và các kỹ sư ca hơn 20 công ty nổi ting v
trung
tâm
d liu có tính chất đổi mi bao gồm : AMD, Cisco, Dell, HP, IBM, Intel,
Mellanox, Network Appliance, Novell, Red Hat, SGI, Sun, Unisys, Veritas,
Voltaire, and Citrix. Xen được đăng ký bi GNU General Public License (GPL2)
v được sử dụng không được thay đổi v mã nguồn v định dng đối tượng. Xen
Hypervisor cũng đặc bit ngn - t hơn 50.000 dng m. V vậy chi phí dịch mã
code rt thp và hiu sut gn giống như trên máy nguyên thủy. Xen tái sử dụng
cc trnh điều khin thit bị hin c (đối vi c hai loi là m v đng m nguồn)
10
t Linux, làm cho thit bị qun lý dễ dng. Hơn nữa Xen rt mnh m đ điu
khin lỗi và bảo v c ngưi dùng và hypervisor khỏi các vn đ vi các lỗi t cc
driver độc hi.
H thống qun lý máy ch o Enomalism là một nn tng h tầng cơ s máy
ch o hoàn chỉnh. Enomalism qun lý nh hưng giữa các tài nguyên trong h
thống. Enomalism có th sử dụng đ dẫn các luồng tnh ton vo đám mây giống
như l luồng t khch hng được đi vo thực hin tính toán trên một máy ch t
xa. Nó mang tất c những tnh năng như: triển khai k hoch tính toán, cân bằng
ti, trnh xung đột ti nguyên… Enomalism cũng l một ứng dụng mã nguồn m,
nó có một giao diện ngưi dùng dựa trên nn web rt đơn gin và dễ sử dụng. Nó
có kin trúc từng phn dễ dàng cho phép tạo và thêm vào h thống các bổ sung và
các tin ích cn thit cho vic sử dụng. Nó hỗ trin khai tổ chức phân tán và to
các ứng dụng dựa trên tổng quang chung. Nó hỗ trợ qun lý cc trường o khác
nhau gồm KVM/Qemu, Amazon EC2 and Xen, OpenVZ, Linux Containers,
VirtualBox. Nó có ch độ phân quyền ngưi dng v đt quyn truy cp.
2.3. Map Reduce.
Map Reduce là một mô hình lập trnh, được Google phát triển vo năm 2003,
đ hỗ trợ cho quá trình tính toán song song trên số lượng tập các d liu cực ln
(vài tỷ byte) lưu tr các cụm máy tính thành phn trong đám mây đin toán.
Trong mô hnh này, ngưi dng định nghĩa một hàm map đ tính toán một cp
khóa/giá trị đu vào và to nên một tp các cp khóa/giá trị tạm thi, sau đ hàm
reduce s gom nhóm tất c những giá trị tạm thi nào có chung khóa li vi nhau
cho ra kt qu mong muốn. Rt nhiu các tác vụ trong đi sống thực có th được
thực thi bằng mô hình này,chúng ta s xem xét cụ th hơn phần sau.
Chương trnh được vit theo kiu chức năng này được song song hóa một cách
t động v được thực thi trên một cụm ln các “máy tnh hng ha” (cc máy tnh
thành phn cu to nên đám mây đin toán). H thống khi chạy s quan tâm
chi
ti
t phân vùng ca d liu đu vào, lp lịch quá trình thực thi chương trnh thông
qua một tập các máy tính thành phn, xử lý lỗi và qun lý các kết nối nội giữa các
máy tính thành phần. Điu này cho phép các lập trình viên ngay c chưa c bt kỳ
11
kinh nghiệm nào trong các h thống song song v phân tn đu có th dễ dàng tối
ưu ha các tài nguyên ca một h thống phân tán ln.
Trong vng vi năm trưc đây, cc kỹ sư ca Google phi khi tạo hng trăm
các quá trình tính toán dành cho các mục đích đc bit trên số lượng ln các d
liu thô như cc d liu móc nối, nht ký các trang web yêu cu…Cc qu trnh
tính toán này dùng cho nhiu mục đch khác nhau như tóm tắt số lượng các trang
đ được móc nối bi từng host, tính tn số truy xut ca 1 trang web, tìm ra tp
các câu truy vấn được dùng nhiu nht trong ngày…Hu ht các tính toán này đu
không phức tạp,nhưng d liu đu vo thưng rt ln và quá trình tính toán cn
phi được phân tn cho hng trăm ngn máy nhằm có th thực thi trong khong
thi gian cho phép. Các vn đ v vic song song hóa tính toán,phân tán d liu
và qun lý lỗi đ làm cho cc qu trnh tnh ton vốn đơn gin này tr nên vô
cùng phức tp.
Đ gii quyt vấn đ, các kỹ sư ca Google đ thit k một mô hình trừu tượng
cho phép chúng ta diễn t quá trình tính toán này một cch đơn gin như vốn
dĩ
ca
n, đồng thi che du đi cc chi tit phức tp trong việc song song hóa, chp
nhn lỗi, cân bằng np, phân tán d liệu trong một thư vin riêng. S trừu tượng
ha này được lấy ý tưởng t 2 thành phn cơ bn là map và reduce trong Lisp v
nhiu loi ngôn ng lập trình hàm khác. Chúng ta có th nhn thấy rằng trong hầu
ht các quá trình tính toán ca chúng ta đều bao gồm một thao tác map, ánh x
cc đu vào vi các giá trị ca “bn ghi” đ thực hin vic tính toán các giá trị đ
thành 1 tp cc cp khóa/giá trị tạm thi, sau đ ta li to thêm một thao tác
reduce, thu gn các giá trị mà có cùng key li vi nhau và cho ra kt qu.Vic sử
dụng mô hình hàm chức năng map và reduce cho phép chúng ta có th thực thi
song song các tính toán ln dễ dàng và có th sử dụng quá trình thực thi li như
một cơ ch chấp nhn lỗi.
Các th mnh chính ca phương php này l cung cp cho chúng ta một giao
din đơn gin và mnh m, cho phép song song hóa và phân tán d liu trong các
phép toán ln một cách t động, gip cho ta thu được hiu năng cao nht trong số
lượng ln các cụm máy tính thành phn của đám mây điện toán. Ở phn sau
chúng ta s ln lượt xem xét mô hình lập trnh cơ bn ca MapReduce và một vài
ví dụ đơn gin.
Mô hình lập trình.
Quá trình tính toán nhận một cp giá trị đầu vào gồm khóa/giá trị, v tính toán
cho ra một tp các cặp khóa/giá trị đu ra. Ngưi dùng sử dụng thư vin
MapReduce đ diễn t quá trình này thông qua hai hàm là Map và Reduce.
12
Map l hàm được định nghĩa bi ngưi dùng, nhn một cp giá trị đu vào v
to ra các cp giá trị trung gian.Thư viện MapReduce nhóm tt c các giá trị trung
gian có liên quan ti key I li vi nhau và chuyển nó cho hàm Reduce.
Hàm Reduce cũng được vit bi ngưi dùng, chp nhận key I và các tp giá trị
trung gian ca key I này. Sau đ tin hành hợp nht các giá trị này thành một tập
các giá trị nhỏ hơn nu có th. Một ln nữa nguyên tc kt hợp li được sử dụng
trong h thống điện toán đám mây nhằm phục vụ cho thuật toán gii quyết yêu
cu bài toán, sau khi chia nhỏ cc chương trnh ln thành các phần nhỏ đ thực
hin tính toán một cách song song nhằm làm gim thi gian thực hiện một bài
toán thì h thống tin hành kt hợp các kt qu tính toán t cc tin trình nhỏ song
song li vi nhau đ đưa ra một kt qu tính toán thống nht ca chương trình tính
ton m người dùng yêu cu. Thông thưng chỉ có một giá trị output được đưa
ra
t
hàm Reduce hoc không có giá trị nào cả.
Ví dụ:
Gi sử chúng ta có một bi toán l đếm số ln xut hiện ca một t trong một
bộ tài liu ln, người dùng cn phải viết một đon code tương t vi mã gi sau
đây:
map(String key,String
value):
//key: tên ca tài liệu
//value:nội dung tài liệu đ
Vi mỗi ch cái w trong value:
EmitIntermediate(w,”1”);
reduce(String key,Iterator values):
//key: ch cái cần đếm
//values:danh sách các số đếm trong map
int result = 0;
vi mỗi giá trị v trong values:
result += ParseInt(v);
Emit(AsString(result)) ;
13
Hàm map thêm vào mỗi t một số tương ứng vi số ln xut hin ca nó
(trong ví dụ đơn gin trên l ‘1’). Hàm reduce lm nhiệm vụ cộng tt c các số
đếm ca t đ.
Sau đ, ngưi dùng cn phi thực hiện thêm các th tục khai bo đc t đối
tượng mapreduce với tên ca các file input, output và các bin tùy chỉnh. Ngưi
dng sau đ gọi hàm MapReduce, chuyn cho n đối tượng đ đc t trên, lúc
này cc đon code ca ngưi dng được liên kt li thông qua thư viện
MapReduce.
Tổng quan quá trình thực thi.
Quá trình gọi thực thi hàm Map được phân tán trong nhiu các máy thành viên
ca đám mây đin toán bằng cách t động phân vùng các giá trị đầu vào
thành
mộ
t bộ gồm M phn. Các phn này có th được tính toán song song bi các máy
khc nhau. Tương t hm Reduce cũng được phân tán bằng cách phân vùng các
khóa giá trị trung gian thành R mảnh bằng các hàm phân vùng (ví dụ như
hash(key) mod R). Số lượng R và hàm phân vùng có th được chỉ rõ bi ngưi
dùng.
Hnh bên dưi cho chúng ta cái nhìn tổng quát nht v luồng thực thi một thao
tác MapReduce.
Figure 1: Execution overview
14
Khi ngưi dùng gi hàm MapReduce thì các tác vụ sau đây s được diễn ra
một cách tun tự:
Thư vin MapReduce trong chương trnh ngưi dng đầu tiên s chia nhỏ các
file đu vào thành M mnh (thông thưng kích thưc mỗi mnh t 16-64MB,c
th điu chỉnh thông qua các tham số tùy chn). Ở đây, h thống đin ton đám
mây đ đưa nguyên tc chia nhỏ vào đ thực hin quá trình tính toán ca mnh.
Vi một chương trnh ln mà tính toán một lần s tốn rt nhiu thi gian và
không hiu quả, đ tic kiệm thi gian thực thi chương trnh, h thống tin hành
chia chương trnh lớn thành các tin trnh nhỏ đ thực hin tính toán trên các vi
xử lý (h thống phn cứng song song tạo nên h thống đin ton đám mây) đ tiến
hnh tnh ton chương trnh song song đ cuối cùng gộp li một kt qu. Tip
theo, nó s to nhiều bản sao ca chương trnh trên cụm máy tnh trong đám mây
đin toán. Nguyên tc sao chép cũng được đưa vo ứng dụng trong h thống đin
ton đám mây, trên mỗi cụm máy tnh trong đm mây điện toán thực hin một
tin trnh m chương trnh giao ph, tiến trình này s được tạo ra nhiều bn sao đ
cho các máy tính trong cụm máy tính thực hiện.
Một trong số các bản sao ca chương trnh s l chương trnh master. Cc
chương trnh cn li s l worker, l chương trình s thực thi các tác vụ do master
giao phó. Có tất c l M tác vụ Map và R tác vụ Reduce cn được thực thi.
Chương trnh master chn các worker rãnh rỗi đ gán cho tác vụ Map hoc
Reduce.
Worker được gán thực thi tác vụ Map đc nội dung ca mnh giá trị đu vào
tương ứng, nó phân tích giá trị đu vào thành các cp khóa/giá trị và chuyn
chng đn cho hàm Map ngưi dùng t định nghĩa. Cc cặp giá trị key/value
trung gian (kt qu ca hàm Map) s được lưu vo bộ nh đệm.
Sau đ, cc cp giá trị trong vùng nh đệm này s được ghi xuống vùng nh địa
phương, v được phân thành R vùng. Vị tr của các cp khóa/giá trị này (trên bộ
nh địa phương) s được chuyn v cho master. Chương trình master sau đ s
chuyn vị trí của chng cho cc worker được gán tác vụ Reduce.
Khi một worker thực thi tác vụ Reduce nhận được các vị trí ca các vùng
nh
t
master, nó dùng các li gi th tục t xa (RPC- Remote Procedure Call) đ đọc
các giá trị này. Sau khi worker đc xong tt c các cp giá trị trung gian này, nó
s sp xp li chúng theo khóa bằng cách gom nhóm các cặp có cùng khóa li vi
nhau. Nu số lượng các file trung gian này quá ln so vi bộ nh thì chúng ta s
phi cn có một hàm sắp xp ngoài.
Sau đ cc worker thực thi tác vụ Reduce chuyn khóa và tp các d liu
tương ứng đn hàm Reduce do ngưi dng định nghĩa, kt qu output thu được l
kt qu cuối cùng.
Sau khi tt c các tác vụ Map v Reduce đều hoàn tt, chương trình master gọi
đn chương trình user program, tr v đon code tip theo trong chương trnh.
15
Chấp nhận lỗi
Thư vin MapReduce được thit k đ gip tnh ton trên cc lượng d liu vô
cùng ln ca hng trăm hng ngn máy, do đ chng cn phi c cơ ch chp
nhn lỗi.
Đây l s áp dụng ca nguyên tc t phục vụ vào h thống đin ton đám mây,
đám mây đin toán có kh năng t phục hồi lại hot động ca h thống khi xảy ra
một số lỗi no đ trong cc qu trnh thực thi ca từng phn nhỏ trong h thống
tính toán.
Lỗi xảy ra ở Worker
Đ kiểm tra lỗi worker,chương trnh master tin hành ping các máy worker
sau mỗi một khoảng thi gian nht định, nu một worker nào không tr li thì
Master s xem như n đang xảy ra lỗi, các tác vụ map hay reduce đang thực thi
worker lỗi s tin hành reset li và gán cho worker khác. Ở đây c áp dụng
nguyên tc linh động đ khc phục lỗi h thống, chương trnh được chia
nhỏ
thành
các tiểu trình nên các tiu trình giống nhau có th linh động thực thi ti các
phn cứng vi xử lý khác nhau và khi một tiu trình bị lỗi thì tiu trnh khác có th
thay th đ thực hin nhiệm vụ ca h thống giao phó.
Đối với tác vụ map đ hon tt worker lỗi cũng phi tin hành reset li do
kt qu trung gian được lưu tr vùng nh địa phương v chng ta không th
truy cp đn chng. Đối vi tác vụ reduce th ngược li, ta không cần phi reset
chúng vì kết qu cuối cùng ca tác vụ này được lưu trong vùng nh toàn cục, ta
có th truy xuất chúng một cách dễ dng.
Lỗi xảy ra ở Master
Nhằm có th khôi phục master trong trường hợp xảy ra lỗi, master s tin hành
ghi checkpoint sau khong thi gian cố định. Khi lỗi xảy ra thì một bn sao mới
có th bt đầu t đon checkpoint đ lưu. Nhưng nu chúng ta chỉ c 1 master thì
khi master bị lỗi toàn bộ quá trình tính toán MapReduce s bị hủy, client khi đ
phi kiểm tra trưng hợp này v t khi động li quá trình nu muốn.
Tác vụ backup.
Đây l một áp dụng ca nguyên tc d phòng vào vic gii quyết bài
toán
trong
đám mây điện toán, nó giúp cho hoạt động tính toán không bị mt khi sử ra
s cố. Một trong cc nguyên nhân thưng xảy ra làm tăng thi gian hoàn tt
tc
vụ
MapReduce l các “straggler”. ”Straggler” l cc máy c khong thi gian
hoàn tt một trong số các tác vụ cuối ca Map hoc Reduce dài một cách bt
thưng. ”Straggler” c th là bt c máy nào trong số các máy trong h thống
đám mây đang được sử dụng. Có rt nhiều nguyên nhân tạo nên “straggler”, v dụ
như một máy tính trong h thống có ổ đĩa cứng không tốt, khi hot động có
th
gp
một số trục trc làm giảm tốc độ truy xuất bnh thưng ca ổ cứng t 30Mb/s
xuống thành 1Mb/s chẳng hn. H thống lặp lịch cho các cụm máy tính lúc này
phi gán tc vụ khác cho máy là nguyên nhân làm chậm tốc độ thực thi
16
MapReduce (dựa trên s so sánh tốc độ CPU, truy xut bộ nh, h thống lưu tr
ca máy địa phương, băng thông ca mng). Một vn đ mi nht mà Google gặp
phi là một lỗi trong đon code khi to tác vụ MapReduce, nó làm cho các cache
ca CPU không th hot động, quá trình tính toán ca máy tính bị lỗi do đ m
giảm xuống khong 100 ln.
Google đ to ra một phương pháp nhằm gim bt tác hi do cc “straggler”
gây ra. Khi các tác vụ MapReduce gn hoàn tt, master s to ra các tác vụ back
up
cho các tác vụ đang thực thi và gán cho các workers rãnh rỗi thực hin. Quá
trình MapReduce s kết thúc khi tác vụ nguyên thủy hoc tác vụ back up hoàn tt.
Đối vi các tác vụ MapReduce nhỏ, phương php này chỉ gip ci thin hiu năng
một vài phn trăm, nhưng đối với các tác vụ MapReduce ln thì chúng giúp ci
thin hiu năng rt đng k.
Bên trên là biu đồ so sánh tốc độ thực thi ca chương trình sp xp vit theo
MapReduce của Google. Chương trình thực hin sp xp khong 1 tetrabyte d
liu. Biu đồ đu tiên là tốc độ đc các giá trị input,biu đồ bên dưi là tốc độ
thực hin sp xp và cuối cùng là tốc độ xut ra kt qu.Biu đồ (a) th hin t
ốc
độ
thực thi ca tác vụ MapReduce hot động bnh thưng không có các straggler,
biu đồ (b) là khi thực hin gp phi các straggler trong hóa trình kt thc tác vụ
m không dng cơ ch backup,biu đồ (c) l khi dng cơ ch backup trong quá
trình thực thi MapReduce. Chúng ta nhận thấy tốc độ thực thi bnh thưng vo
khong 1057s, khi gp phi cc straggler m không c cơ ch backup ta s phi
mt 1283s, và cuối cùng khi áp dụng cơ ch backup và phi bỏ đi 200 tc vụ do
cc straggler này gây ra chng ta đt được tốc độ là 933 giây chỉ hơn 5% so vi
17
tốc độ thực thi bnh thưng nhưng li tăng 44% nu so vi tốc độ thực thi khi gp
phi các straggler.
2.4. Google File System (GFS)
Google File System là h thống d liu phân tn được Google phát trin dành
cho các ứng dụng ln. N được thit k nhằm đem li s truy xut d liu tin cậy
và hiu qu cho các d liu ca một cụm ln các máy tính thành phn ca đám
mây đin toán. Nó cung cp ch độ chấp nhn lỗi đ có th chạy được trên các h
thống phn cứng có yêu cu không cao, đem li hiu năng tổng hợp tốt trên số
lượng ln các máy client.
Cc file được chia thành các khúc d liu 64Mb,cc d liu này thưng được
đc vi cưng độ cao hơn nhiu so vi ghi v xa. N được thiết k và tối ưu ha
dành cho các cụm máy tính ln bao gồm c các máy tính có phần cứng nghèo
nn, do đ n phi có kh năng chịu được cường độ lỗi ln ti cc node độc lp
và kh năng mất mát d liu. Ở một số các thit k khác cho h thống d liu
phân tn thường là tối ưu ha thông lượng của d liu.
Cấu trúc của Google File System.
Một cụm GFS chức một máy Master và nhiu máy Chunkserver và nó có th
được truy xut bi nhiều client như trong hnh bên dưi.Một máy có th vừa là
client truy xut d liu t chunkserver khác vừa có th l một chunkserver lưu tr
d liu, tuy nhiên chúng ta cn phi đảm bảo trnh được xung đột và không làm
giảm tốt độ thực thi.
Cc file được chia thành các mảnh c kích thưc xc định. Mỗi mnh được
Master gán cho một tên duy nht không thay đổi dài 64 bit ti thi điểm khi tạo
các mnh. Cc chunkserver lưu tr các mnh này như l một file Linux. Đ đảm
bo độ tin cậy cao, các mảnh file được lp bn sao v lưu tr trên nhiu
chunkserver khác nhau, mc định là chúng ta s lưu tr 3 bn sao.
Node Master không thưng lưu tr bt kỳ một phân khúc d liu nào,nó chỉ
lưu trử các siêu d liu liên quan đn cc phân khc như bn ánh x các nhãn 64-
bit đn vị tr lưu tr vt lý và vị trí trong file gốc, vị trí ca tt c các bn sao d
liu, các tin trnh đang đc hoc ghi lên 1 phân khúc, tình trng các phân khc
hoc nh ca ca phân khc đ dành cho vic to thêm các bn sao…Cc siêu d
liu này được update liên tục bi các chunkserver sau khong thi gian cố định.
Ngoài ra node Master luôn gi kt nối và kiểm tra trng thái ca các chunkserver
bằng các gửi và nhn cc thông điệp phn hồi liên tục sau khong thời gian cố
định.
18
Chúng ta s phân tích một tin trnh đọc file đơn gin theo hình bên trên. Đu
tiên dựa vo kch thưc cố định được quy ưc trưc ca 1 mảnh d liu,client
dng chương trnh biên dịch tên ca file và các byte offset thành một danh mục
các mnh d liệu chứa trong 1 file. Sau đ n gửi đn node master một yêu cu có
chứa tên file và danh mục các mnh d liu. Master phn hồi li vi con trỏ các
mảnh d liu và vị trí các bn sao theo yêu cầu ca client. Cc client lưu tr các
thông tin này trong bộ nh cache và sử dụng chng như cha kha đ cho
phép
truy
xut d liệu.
Sau đ client tiến hành gửi yêu cu truy xut d liu đn 1 trong các bn sao
thưng là bn sao gn nht. Trong yêu cu truy xut ca client phải có con trỏ
mang địa chỉ của mảnh đ v phạm vi byte cần truy xut ttrong mnh. Các qu
trnh đc tip theo không cn có s kết nối đến node master nữa cho đn khi các
thông tin lưu tr trong bộ nh cache bị xóa. Trong thực t th client thưng yêu
cu cho phép truy xut đn nhiu mnh d liệu lưu tr trên nhiều nơi khc nhau
cùng một lc v node master cũng c th gửi các thông tin cn thit cho client
một cách tức thi.
Tri ngược vi các h thống file thông thưng,GFS không được khi to trong
nhân h điều hnh m chng được truy xut thông qua một thư viện riêng nhằm
tránh hao phí quá ln
Kích thước của một mảnh
Kch thưc ca mảnh d liu là một tham số vô cùng quan trọng trong thit
k.Google chn kch thưc là 64MB, ln hơn một block ca h thống d liu
19
truyn thống.Mỗi bn sao ca mnh d liu được lưu tr trên các chunkserver
như l một ht nhân Linux,nó chỉ được m rộng ra khi cần thit
Một kch thưc mnh d liu ln cho chúng ta nhiu lợi th. Đu tiên nó giảm
số lượng kt nối ca client đn node master bởi vì vic đọc và ghi trên cùng một
mảnh d liu chỉ đi hỏi một ln gửi yêu cu đn node master đ lấy vị trí ca
mảnh d liu này. Điều này làm tăng hiu năng ca chương trnh rt nhiu v
đa
số
cc chương trnh đều đc v ghi cc file c kch thưc ln một cách tun tự.
Ngay c đối vi các thao tác đc ngẫu nhiên nhỏ th cc máy client cũng c th dễ
dng lưu trong bộ nh cache thông tin ca vài TetraByte mnh d liệu. Th hai,v
kch thưc các mnh d liu ln hơn nên cc client thưng xuyên thực thi
nhiu
tác
vụ khc nhau (đọc,ghi ) trên cùng một mảnh d liu, điều này làm giảm hao
phí v mng bi lúc này chỉ cn duy trì một kt nối t client đn chunkserver thay
vì phi khi to nhiu kt nối khác nhau. Th ba nó giúp làm giảm kch thưc ca
các siêu d liu lưu tr máy Master, điều này cho phép chúng ta có th lưu tr
các siêu d liu này trong bộ nh ca Master lm tăng tốc độ phản hồi đn
các
máy
client.
2.5. Hadoop
Hadoop – công ngh khai thc mỏ vng trên Internet.
(JICT) - Mong muốn ca cc doanh nghip l tn dụng lượng d liu khổng lồ
đ đưa ra quyết định kinh doanh, Hadoop gip cc công ty xử lý khối lượng cỡ
terabyte và thậm chí là petabytes d liệu phức tp tương đối hiu qu vi chi ph
thp hơn.
Các doanh nghip đang nỗ lực tìm kiếm thông tin quý gi t khối lượng ln d
liu phi cu trc được to ra bi các web log, công cụ clickstream, các sn phẩm
truyn thông xã hội. Chnh yu tố đ dẫn làm tăng s quan tâm đn công ngh mã
nguồn m Hadoop.
Hadoop, một d án phn mềm qun lý d liu Apache vi nhân trong khung
phn mềm MapReduce ca Google, được thiết k đ hỗ trợ các ứng dụng sử dụng
được số lượng ln d liu cu trúc và phi cấu trúc.
Không giống như các h quản trị cơ s d liu truyn thống, Hadoop được
thit k đ làm vic vi nhiu loi d liu và d liu nguồn. Công ngh HDFS ca
Hadoop cho phép khối lượng ln công vic được chia thành các khối d liu nhỏ
hơn được nhân rộng và phân phối trên các phần cứng ca một cluster đ xử lý
nhanh hơn. Công ngh này đ được sử dụng rộng rãi bi một số trang web ln
nht th gii, chng hạn như Facebook, eBay, Amazon, Baidu, v Yahoo. Cc
20
nhà quan sát nhn mnh rằng Yahoo là một trong những nh đng gp ln nht
đối vi Hadoop.
Công ngh Hadoop ngày cng được sử dụng nhiu hơn trong cc ngân hng,
công ty quảng co, cc vin nghiên cứu, cc công ty dược phẩm và các công ty
CNTT khác.
"Vi Hadoop bn có th chỉ cn một v hai ngưi là có th xử lý cùng một
khối lượng d liu mà một số công ty lớn nht th gii đang xử lý.”
Tynt, ngưi sử dụng Hadoop, một công ty phân tích web, cung cp dịch vụ
phân tch cho hơn 500.000 trang web. Sn phẩm chính ca nó là một dịch vụ cho
phép các nhà cung cấp dịch vụ c được cái nhìn sâu sc v vic các dịch vụ ca
h được chia sẻ như th nào. Một ngày trung bình Tynt thu thp và phân tích gn
1 terabyte d liệu t hàng trăm triệu của cc tương tc web trên cc trang web m
h quan st. Công ty chuyn sang Hadoop khong 18 thng trưc, khi cơ s h
tng d liu MySQL bt đu sụp đổ theo d liu mà Tynt thu thập được.
Cu trúc tp tin ca Hadoop cho phép các công ty v cơ bn nắm bt và cng
cố tốt bt kỳ loi tập tin d liu có cu trúc và phức tp nào, chẳng hn như cc
nht ký trên trang web, siêu d liu, tập tin âm thanh và video, dịch vụ e-mail phi
cu trúc, d liệu dòng Twitter và dịch vụ truyn thông x hội.
Do đ, công ngh này l lý tưng cho các công ty muốn phân tích khối lượng
ln d liu có cu trúc và phi cu trúc.
Lấy d liu thô t các HDFS, tuy nhiên, ch bin nó không phi l dễ dàng
hay thun tin như cc h thống cơ s d liệu đin hình, bi vì d liệu không
được tổ chức hoc cu trúc, Befus nói. "V cơ bn những g Hadoop lm l đưa
các d liu bên ngoài vào trong các tp tin ln. Nó không quan tâm trong các tp
tin có gì. Nó chỉ qun lý chng v đảm bảo rằng trong đ c nhiu bn sao ca
các tp tin."
Ban đu, ngưi dùng phi vit công việc trong một ngôn ng lập trnh như
Java đ phân tch v sau đ truy vn d liu thô trong Hadoop. Nhưng cc công
cụ hin có th được sử dụng đ viết các truy vn SQL như d liệu được lưu tr
trong Hadoop.
Hadoop được sử dụng nhiu hơn cho cc ứng dụng kinh doanh thông minh
thi gian thực.
3. Điện toán đám mây của Microsoft.
♦ Điện toán đám mây: Xu hướng chuyển đổi chính của Microsoft
21
Điện ton đm mây l trọng tâm pht triển ca Microsoft
Trưc s cnh tranh mạnh m ca cc đối th công ngh ln, Microsoft đang t
o
ra những chuyển bin mạnh m v c tnh đột phá, cung cp những sn phẩm đa dng
v đp ứng tốt hơn nữa nhu cu ca thị trưng. Đin ton đám mây chnh đp n tốt
nht nhằm gii quyết bài toán cnh tranh, tăng cưng sức mnh ca Microsoft,
đp
ứng
hơn nữa nhu cầu ca ngưi dùng,
Rõ rng, đ c s phát trin trong chin lược phát triển công ngh ca Microsoft.
Bên cnh các sn phầm phn mềm truyn thống (Office)…phn cứng (cc HĐH
Windows 7, Windows 8 ) lc này Microsoft đang pht triển các hình thức cung cp
và cho thuê các dịch vụ có ứng dụng ca điện ton đám mây cho doanh nghip và
ngưi dng. Đây s là mô hình phát trin, chuyển đổi chính ca Microsoft trong tương
lai.
♦ Công nghệ điện toán đám mây của Microsoft
22
Microsoft đầu tư pht triển mạnh mẽ các ứng dng điện ton đm mây
Microsoft đ pht trin các ứng dụng, nền tng và các lp cơ s h tng ca công
ngh đin toán theo tng lp được xây dựng trong các trung tâm d liu khách hàng,
trung tâm d liu Microsoft hoc trung tâm cung cp dịch vụ d liu (STB).
Sức mnh và tiềm năng ca đin toán đám mây th hin qua những số liu cụ
th
:
- Office 365 phiên bản beta thu ht hng trăm ngưi sử dụng, phiên bản chính
thức ca Office 365 đt thnh công ngoi mong đợi. Theo thống kê, c 25 giây
thì có thêm 1 tài khon Office 365 mi.
- 10 ngn khch hng đang sử dụng nền tng Windows Azure. - Số lượng ngày
cng tăng cc đối tác phát trin ứng dụng thực t và cung cp các gii php đin
ton đám mây.
- Số lượng cc đối tác trên toàn th gii sử dụng các tin ch đám mây (Cloud
Essentials) v Accelerate đ tăng 500% k t thng 7 năm 2010, số lượng sử
dụng tin ích tăng gp 23 ln, số lượng đối tác sử dụng dịch vụ Office 365 tăng
gp 6 ln.
- Số lượng cc đối tác thuê dịch vụ trực tuyn t Microsoft đ tăng 250%. - Số
lượng khch hng điện toán cá nhân sử dụng dịch vụ h điu hành o ha
Hyper-V đ tăng gấp đôi trong 12 thng (k t WPC10).
- Theo thống kê chưa chính thức, 57% đối tác tham d WPC 2011 tuyên bố s
phát trin công ngh đin ton đám mây.
Hin Microsoft c hơn 640.000 đối tác địa phương trên khp th gii vi hơn 15
triu nhân viên c trnh độ cao và tạo ra doanh thu địa phương lên ti 537 tỷ USD
(IDC 2009). Hng cũng đang tăng tốc đu tư mạnh m vào các giải php đin toán
đám mây, cơ s h tng nhằm đp ứng các nhu cu khác nhau ca ngưi dùng, doanh
nghip. Cụ th:
- Tính đn cuối năm 2011, c khong 90% trong tổng số 40000 kĩ sư ca
Microsoft s nghiên cức các ứng dụng và dịch vụ mi ca đin ton đm mây.
23
- 55 tỉ USD đầu tư cho cc ứng dụng đin ton đám mây vi mục đch pht trin
cộng đồng vo năm 2014. (Theo IDC, tháng 06/2011).
- 30% các nhà qun lý trung tâm d liệu đ lên k hoch đầu tư vo ứng dụng
đin toán cá nhân trong năm 2011 (theo Gartner).
- Chi ph đầu tư cho ứng dụng công ngh đin ton đám mây s tăng t 70 tỷ lên
136 tỷ USD, chiếm khong 12% tổng vốn ngân sch đu tư cho lĩnh vực công
ngh thông tin. (Ngiên cứu AMI, tháng 05/2011)
Dịch vụ điện toán đám mây của Microsoft phục vụ lợi ích khách hàng
Các dch v điện ton đám mây ca Microsoft đều hướng đến khách hàng
Những dịch vụ điện ton đám mây do Microsoft đang cung cp hin nay rt đa
dng, nhằm đp ứng tối ưu hiu qu công vic ca khách hàng, giảm chi phí sn xut,
giúp doanh nghip và c những cá nhân có th tn dụng tối đa cc ti nguyên ứng
dụng:
24
- Các dịch vụ đin ton đám mây dành cho doanh
nghip:
Dch v điện ton đm mây dnh cho các doanh nghiệp
Dịch vụ phát trin Cơ s h tầng Windows Server Hyper V: Công ngh o hóa
server th h mi ca Microsoft và là thành phn quan trng trong h điu hành
Windows Server 2008. Kin trúc m ca Hyper-V cho phép các nhóm phát trin
nội bộ và các nhà phát trin phn mềm ca hãng th ba ci tiến công ngh này và
các công cụ. Vi Hyper-V, Microsoft cung cấp một nn tng o ha mạnh và linh
hot, có th đp ứng nhu cu o hóa mi cấp độ cho môi trưng doanh nghip.
Dịch vụ nn tng Windows Azure: Window Azure là h điu hành ca
Microsoft cho đin toán đám mây, gip các ứng dụng c kh năng tăng giảm biên
độ tùy thuộc vào yêu cu ca doanh nghiệp. Giúp các chuyên gia phn mềm
ch
ỉ
cn
sáng to trên nền tảng sẵn sàng hỗ trợ ngôn ng ca h - .Net, PHP, Java hoc
Ruby. Thêm vo đ, vi mô hình kinh doanh tr ph đ sử dụng, s không phi tốn
chi phí cho những dịch vụ tưng là cn thit nhưng li không bao gi sử
dụng.
Điu
này mang li lợi ích cho c hai bên.
Các dịch vụ Phần mềm:
Microsoft Office 365: được thit k đ làm vic vi các phn mềm, thit bị,
đin thoi, và các trình duyt sẵn có ti doanh nghip. Điều này giúp nhân viên
sức mạnh đ truy cp thông tin và gi năng sut trên tt c cc phương tin truy
cp trong khi vẫn đảm bo an ninh và vẫn gi được các ứng dụng cũ.
Microsoft Dynamics CRM online: Bộ gii pháp qun lý doanh nghip hỗ
trợ
vic qun lý tài chính, mối quan h khch hng v chuỗi cung ứng, thc đẩy
vic