Tải bản đầy đủ (.docx) (42 trang)

Word TÌM HIỂU VỀ BIG DATA, ỨNG DỤNG TRÊN NỀN TẢNG ĐÁM MÂY

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (407.23 KB, 42 trang )

TRƯỜNG ĐẠI HỌC
KHOA CÔNG NGHỆ THÔNG TIN
-----o0o-----

BÁO CÁO BÀI TẬP NHĨM
ĐIỆN TỐN ĐÁM MÂY
ĐỀ TÀI 12:
TÌM HIỂU VỀ BIG DATA, ỨNG DỤNG TRÊN NỀN TẢNG
ĐÁM MÂY

NHÓM:
LỚP:
SINH VIÊN THỰC HIỆN

HÀ NỘI

1


Mục Lục
LỜI MỞ ĐẦU..............................................................................................3
CHƯƠNG I: LÝ THUYẾT CHUNG...............................................................4
1. Điện toán đám mây là gì? Lợi ích của điện tốn đám mây?.....4
2. Kể tên các nhà cung cấp dịch vụ Cloud Computing phổ biến
hiện nay?................................................................................................5
3. Cơng nghệ ảo hố là gì?.................................................................5
4. Những loại cơng nghệ ảo hóa cơ bản của VMWare...................5
5. Phân biệt ảo hóa trên VMware Workstation và vCenter..........5
6. Những loại cơng nghệ ảo hóa cơ bản của Microsoft (EC2).......6
7. Những loại cơng nghệ ảo hóa cơ bản của Oracle (Vitualbox)..9
8. Những loại cơng nghệ ảo hóa cơ bản của Amazon (AWS)........9


9. Những Cơng nghệ ảo hóa trong điện tốn đám mây?.............10
10. Trình bày mô hình dịch vụ trong điện tốn đám mây:.........11
11. Trình bày mơ hình triển khai điện toán đám mây:................14
12. Những rủi ro về an toàn bảo mật ĐTĐM (tóm lược).............16
13. Bigdata là gì, ứng dụng của Bigdata (tóm lược)...................18
14. IoT là gì, ứng dụng của IoT trong điện tốn đám mây (tóm
lược)......................................................................................................19
15. Trình bày kiến trúc lưu trữ đám mây Hadoop- HDFS (tóm
lược)......................................................................................................21
CHƯƠNG II: NỘI DUNG ĐỀ TÀI..............................................................23
A. TỔNG QUAN VỀ ĐIỆN TOÁN ĐÁM MÂY...........................................23
1.1. Điện toán đám mây....................................................................23
1.2. Đặc trưng của điện toán đám mây..........................................23
1.3. Ưu điểm và nhược điểm.............................................................24
1.2.1. Ưu điểm...................................................................................24
1.2.2. Nhược điểm..............................................................................24
1.4 . Ứng dụng phổ biến của cơng nghệ điện tốn đám mây....25
B. Ứng Dụng Của Big Data Trên Nền Tảng Đám Mây......................25
1. Big Data là gì, ưu điểm và nhược điểm......................................25
2. Tối ưu hóa lưu trữ đám mây........................................................26
3. An toàn dữ liệu trong kho Big Data............................................31
4. Cơ sở hạ tầng mạng để xử lý Big Data.......................................34

2


5. Đồng bộ hóa dữ liệu trên Big Data đảm bảo dộ chính sác dũ
liệu lớn..................................................................................................35
6. Cơng nghệ lưu trữ Đàn hồi (Elastic storage) của IBM.............36
CHƯƠNG III: CÀI ĐẶT/MÔ PHỎNG ĐỀ TÀI BÁO CÁO........................39

TÀI LIỆU THAM KHẢO.............................................................................40

LỜI MỞ ĐẦU
Chúng ta đang sống trong một thời đại mới, thời đại phát triển
rực rỡ của CNTT. CNTT đã ở một bước phát triển cao đó là số hóa tất
cả các dữ liệu thông tin, luân chuyển mạnh mẽ và kết nối tất cả
chúng ta lại với nhau. Mọi loại thông tin, số liệu âm thanh, hình ảnh
có thể được đưa về dạng kỹ thuật số để bất kỳ máy tính nào cũng có
thể lưu trữ, xử lý và chuyển tiếp cho nhiều người. Nhu cầu lưu trữ
ngày càng tăng lên thêm vào đó là sự phát triển mạnh về lưu lượng
ổ cứng. Hằng ngày lượng thông tin được lưu trữ tăng lên cách chóng
mặt. Theo tài liệu của Intel vào tháng 9/2013, hiện nay thế giới đang
tạo ra 1 petabyte dữ liệu trong mỗi 11 giây và nó tương đương với
một đoạn video HD dài 13 năm. Vấn đề đặt ra là với một khối lượng
dữ liệu lớn như thế làm sao chúng ta có thể khai thác và nó có thật
sự cần thiết? Tháng 8 năm 2015, Big Data đã vượt ra khỏi bảng xếp
hạng những công nghệ mới nổi Cycle Hype của Gartner và tạo một
tiếng vang lớn cho xu hướng công nghệ của thế giới.
Bài viết này sẽ giúp chúng ta hiểu rõ khái niệm Big Data,
những nguồn tạo ra Big Data, tầm quan trọng của nó vào các lĩnh
vực đời sống, chương cuối sẽ phân tích một bài tốn Big Data và
tương lai rộng mở của nó

3


CHƯƠNG I: LÝ THUYẾT CHUNG
1. Điện toán đám mây là gì? Lợi ích của điện tốn đám mây?
Khái niệm: Điện toán đám mây là việc phân phối các tài
nguyên CNTT theo nhu cầu qua Internet với chính sách thanh tốn

theo mức sử dụng. Thay vì mua, sở hữu và bảo trì các trung tâm dữ
liệu và máy chủ vật lý, bạn có thể tiếp cận các dịch vụ cơng nghệ,
như năng lượng điện toán, lưu trữ và cơ sở dữ liệu, khi cần thiết, từ
nhà cung cấp dịch vụ đám mây như Amazon Web Services (AWS).
Lợi ích của điện tốn đám mây:
- Nhanh chóng
Đám mây cho phép bạn dễ dàng tiếp cận nhiều cơng nghệ để
bạn có thể đổi mới nhanh hơn và phát triển gần như mọi thứ mà bạn
có thể tưởng tượng. Bạn có thể nhanh chóng thu thập tài nguyên khi
cần–từ các dịch vụ cơ sở hạ tầng, như điện toán, lưu trữ, và cơ sở dữ
liệu, đến Internet of Things, machine learning, kho dữ liệu và phân
tích, v.v.
Bạn có thể triển khai các dịch vụ cơng nghệ một cách nhanh
chóng và tiến hành từ khâu ý tưởng đến khâu hoàn thiện nhanh hơn
một vài cấp bậc cường độ so với trước đây. Điều này cho phép bạn
tự do thử nghiệm, kiểm thử những ý tưởng mới để phân biệt trải
nghiệm của khách hàng và chuyển đổi doanh nghiệp của bạn.
- Quy mơ linh hoạt
Với điện tốn đám mây, bạn không phải cung cấp tài nguyên
quá mức để xử lý các hoạt động kinh doanh ở mức cao nhất trong
tương lai. Thay vào đó, bạn cung cấp lượng tài nguyên mà bạn thực
sự cần. Bạn có thể tăng hoặc giảm quy mô của các tài nguyên này
ngay lập tức để tăng và giảm dung lượng khi nhu cầu kinh doanh
của bạn thay đổi.
- Tiết kiệm chi phí
Nền tảng đám mây cho phép bạn thay chi phí vốn (trung tâm
dữ liệu, máy chủ vật lý, v.v.) bằng chi phí biến đổi và chỉ phải chi trả
cho những tài nguyên CNTT mà bạn sử dụng. Bên cạnh đó, chi phí
biến đổi cũng sẽ thấp hơn nhiều so với chi phí bạn tự trang trải do
tính kinh tế theo quy mơ.

- Triển khai trên tồn cầu chỉ trong vài phút
4


Với đám mây, bạn có thể mở rộng sang các khu vực địa lý mới
và triển khai trên toàn cầu trong vài phút. Ví dụ: AWS có cơ sở hạ
tầng trên tồn thế giới, vì vậy, bạn có thể triển khai ứng dụng của
mình ở nhiều địa điểm thực tế chỉ bằng vài cú nhấp chuột. Đặt các
ứng dụng gần hơn với người dùng cuối giúp giảm độ trễ và cải thiện
trải nghiệm của họ.
2. Kể tên các nhà cung cấp dịch vụ Cloud Computing phổ
biến hiện nay?
- Có 6 dịch vụ điện toán đám mây hàng đầu hiện nay
+ Microsoft (Hay còn gọi là Microsoft Azure)
+ Google Cloud Platform (Hay còn gọi là GCP)
+ VMware Cloud
+ Oracle
+ Amazon Web Service (Hay cịn gọi là AWS)
+ FPT Smart
3. Cơng nghệ ảo hố là gì?
Cơng nghệ ảo hóa là một cơng nghệ được ra đời nhằm khai
thác triệt để khả năng làm việc của một máy chủ vật lý. Ảo hóa cho
phép vận hành nhiều máy ảo trên cùng một máy chủ vật lý, dùng
chung các tài nguyên của một máy chủ vật lý như CPU, Ram, ổ
cứng,… và các tài ngun khác.
4. Những loại cơng nghệ ảo hóa cơ bản của VMWare
Có 3 loại Vmware đó là: Vmware Work Station, Vmware Server
và Vmware Vsphere.
- Vmware work station và vmware server dùng cho
desktop, nó là 1 chương trình ứng dụng chạy trên hệ điều hành

window hoặc linux giúp cho chúng ta tạo ra máy ảo 1 cách dễ dàng
nhằm mục đích thử nghiệm PC hay tần dụng tối đa hiệu năng của PC
để làm được nhiều việc khác
- Vmware vsphere nó là 1 nền tảng giúp chúng ta có thể tạo
ra hạ tầng điện tốn đám mây, nó gồm có các bộ ảo hóa hay được
sử dụng cho các doanh nghiệp, khác với vmware work
station, vmware server thì vmware vsphere khơng được sử dụng
trong các máy tính cá nhân mà nó được sự dụng để cài đặt trực tiếp
trên các máy server (máy chủ)
5


5. Phân biệt ảo hóa trên VMware Workstation và vCenter
- Vmware vCenter Server là một ứng dụng về cơ sở dữ liệu
cho phép triển khai, quản lý, giám sát, tự động hoá, và bảo mật cho
cơ sở hạ tầng ảo một cách dễ dàng.
- Ưu điểm:
Hỗ trợ tất cả các hệ thống truyền dẫn vCenter tính năng như:
DRS, SDRS, HA, Host profiles, dvSwitch…
Không cần mua cửa sổ cấp phép.
Đơn giản triển khai và nhanh chóng.
- Nhược điểm:
SQL và bên ngồi cơ sở dữ liệu khơng hỗ trợ vì nó tích hợp sẵn
cơ sở dữ liệu của Posgres.
Chế độ liên kết chức năng trên vCenter Server khơng hoạt
động.
Heartbeat tính năng trên vCenter Server không hoạt động.
Single-sing on is not used on windows information.
vSphere Storage Appliance (VSA) thì khơng tương thích.
- VMware Workstation là một chương trình cho phép bạn

chạy một máy ảo trên máy tính vật lý. Máy ảo này sẽ chạy độc lập.
Máy ảo là môi trường khá lý tưởng để bạn chạy thử các hệ điều hành
mới như Linux, truy cập các trang web có độ tin cậy thấp, tạo mơi
trường điện tốn đặc biệt cho trẻ em, kiểm tra ảnh hưởng của virus
máy tính.... Bạn thậm chí có thể in và plug in USB drive.
- Ưu điểm:
Đơn giản
Dễ sử dụng
Viết tập tin HTML Help
Great Hardware Compatibility
- Nhược điểm:
Yêu cầu hệ thống cao
6. Những loại cơng nghệ ảo hóa cơ bản của Microsoft (EC2)

6


Microsoft đã phân ra 5 nhánh con đại diên cho các cơng nghệ ảo
hóa:
+ Server virtualization
+ Application virtualization
+ Desktop virtualization
+ Presentation virtualization
+ Profile virtualization
a) Server virtualization
Mục đích chính của việc ảo hóa máy chủ chính là tách rời mối
liên hệ luồng công việc của máy chủ từ máy chủ vật lý để mà chúng
ta có khả năng phân thành nhiều luồng công việc hơn đem đền sự
hiệu quả đáng kể trong doanh nghiệp. Ví dụ đơn cử trung bình với
một máy vật lý dùng làm DHCP chỉ sử dung hết 3/10 khả năng của

máy vật lý vậy còn 7/10 sẽ về đâu đó là sự lãng phí và khơng hiệu
quả. Với ảo hóa máy chủ cho phép bạn sẽ cho phép chúng ta dung
hết 10/10 khả năng máy vật lý lúc này máy vật lý sẽ kiêm nhiều
nhiệm vụ hơn nhu DNS, FTP… tăng cao tính hiệu quả. Và Hyper-V
trên Windows Server 2008 sử dụng nền tảng công nghệ hypervisor
là một minh chứng hiệu quả nó đem lại cho chúng ta khả năng chạy
nhiều hệ điều hành máy khách thường gọi là Partition (phân vùng)
trên một máy chủ đơn lẻ. Khả năng phân luồng công việc máy chủ
trờ thành hiện thực. Bên cạnh đó Hyper-V cũng đem đến những cải
thiện đáng kể cho máy chủ của chúng ta nâng cao tính sẵn sàng cho
hệ thống và khả năng mở rộng hạ tầng, đơn giản hóa việc sao lưu và
phục hồi, và giảm chi phí điều hành của bạn.Hyper-V của Microsoft là
sản phẩm kế thừa trước đó Microsoft Virtual Server và là nền tảng
giải pháp ảo hóa của Microsoft.
b) Application virtualization
Ảo hóa ứng dụng là một dạng cơng nghệ ảo hóa khác cho phép
chúng ta tách rời mối liên kết giữa ứng dụng và hệ điều hành và cho
phép phần phối lại ứng dụng phù hôp mới nhu cầu user. Bằng cách
chạy các ứng dụng một cách tập trung thay vì cài đặt lên mỗi máy
trạm, quản lý việc cập nhât phần mềm trở nên dễ dàng hơn, giải
quyết sự đụng độ giữa các ứng dụng và việc thử nghiệm sự tương
thích của chúng cũng trở nên dễ dàng hơn.

7


Microsoft Application Virtualization (App-V) trước đây được biết
đến với cái tên Microsoft SoftGird Application Virtualization là một
giải pháp ảo hóa ứng dụng cho các doanh nghiệp ngày nay. App-V là
một phần của Microsoft Desktop Optimization Pack (MDOP). Nó đẩy

việc quản lý ứng dụng xưa nay từ
bằng tay sang tự động hóa, xử lý hợp lý. Và do các ứng dụng thật sự
chưa bao giờ được cài đặt trên máy trạm, từ đó giảm thiểu được sự
tác động khơng mong muốn giữa ứng dụng máy trạm và ứng dụng
máy khách. Điều này có nghĩa là cải thiện sự ổn định, độ tin cậy cao
hơn.
c) Desktop Virtualization
Desktop Virtualization là nhóm cơng nghệ mới mục tiêu chính
là tạo nên một mội trường cơ lập hồn tồn trên máy tính. Việc triển
khai cơng nghệ này có thể giúp chúng ta hỗ trợ các ứng dụng cũ
chạy trên hệ điều hành hiện tại và giải quyết được vấn đề tương
thích đang gây khó khăn khi muốn mâng cấp hệ thống. Từ đó việc
cho phép các doanh nghiệp tiến đến các hệ điều hành mới nhất trở
nên dễ dàng và đạt đươc nhiều lợi ích hơn từ những tính năng mới
trên đó.
Sự đột phá đầu tiên của Microsoft vào Desktop Virtualazion là
Microsoft Virtual PC, một sản phẩm phổ biến cho việc phát triển và
triển khai thử nghiệm. Tuy nhiên bên cạnh đó hiện Microsoft đã cho
ra đời một sản phẩm mới nổi bất với giải pháp Desktop
Virtualization. Chúng là Microsoft Enterprise Desktop Virtualization
(MED-V), là một phần của gói sản phẩm MDOP dành cho khách hàng
là doanh nghiệp, Microsoft đã có được khi thâu tóm được Kidaro
thang 5/2008 và sản phẩm tiếp thep là Microsoft Virtual Desktop
Infastructure (VDI).
d) Prestentation virtualization
Ảo hóa trình diễn địi hỏi sự tách rời giữa việc xử lý và việc lưu
trữ data từ máy trạm. Khóa chính của giải pháp này chính là
Terminal Services, là một trong những cơng nghệ ảo hóa sẵn sàng
trên moi phiên bản Windows Server 2008. Việc dùng Terminal
Services đem đến cho chúng ta khả năng chạy một ứng dụng trên

một nơi trong khi có thể dùng nó ở một nơi khác. Loại trừ đi được
quá trình cài đặt các ứng dụng một cách cục bộ trên mỗi máy tính,
từ giờ chúng ta có thể cài đặt và quan lý chúng một cách tập trung
trong phòng quản lý hoặc data center. Terminal Services làm cho
8


mỗi user cảm giác mình đang làm việc với các ứng dụng tại local với
các thao tác được hiển thị trên màn hình, trong khi đó mọi thơng tin
thao tác thật sự đều gởi đến server xử lý.
e) Profile virtualization
Là một nhà quản trị Windows Server thì khái niệm này hồn
tồn quen thuộc với chúng ta nó là các tính năng thông dụng trên
Windows Server: Folder Redirect, Roaming User Profile, và Offline
Files với đặc tính chung là sự tách rời phần dữ liệu và thông tin người
dùng về hệ thống với máy trạm.
User profiles, là một cấu trúc hệ thống file (thư mục và file)
gồm có thơng tin trạng thái cho mỗi người dùng trên một máy tính
Windows. Một số thư mục và file trong user profile thường bị ẩn để
tránh cho người dùng nhầm lẫn với các nội dung của họ. Từ đó
microsoft sản sinh ra 3 tính năng đặc trưng thông dụng như đã nêu ở
trên:
- Folder Redirection, là một kỹ thuật của Windows, cho phép
các quản trị viên redirect (chuyển hướng) các thư mục nào đó bên
trong các user profile đến các thư mục chia sẻ trên mạng với mục
đích khi người dùng lưu các file mà họ đang làm việc thì các file này
sẽ được lưu vào mạng thay vì lưu vào máy tính đang sử lý chúng.
- Offline Files, là một kỹ thuật cho phép người dùng có thể copy
các file cục bộ chứa trong các thư mục chia sẻ trên mạng, thậm chí
khi mạng khơng có sẵn.

- Roaming User Profiles, là một kỹ thuật cho phép bạn có thể
lưu user profile trong các thư mục chia sẻ trên mạng. Khi người dùng
đăng nhập vào máy tính của anh ta, profile của anh ta sẽ được
download về từ mạng và được load để hiển thị trên desktop của anh
ta. Khi người dùng đăng xuất, profile được upload trở lại mạng.
7. Những loại
(Vitualbox)

cơng

nghệ

ảo

hóa



bản

của

Oracle

Dịch vụ Đám mây Ravello của Oracle là dịch vụ điện toán đám
mây đầu tiên trên thị trường cho phép tích hợp và vận hành VMware,
cũng như cơng nghệ ảo hóa trên phần cứng (KVM) dành cho doanh
nghiệp trên nền tảng điện toán đám mây công cộng mà không yêu
cầu bất kỳ thay đổi nào. Với Dịch vụ Đám mây Ravello của Oracle,
khách hàng có thể dễ dàng tận dụng VMware trên điện tốn đám

mây công cộng mà không cần chuyển đổi máy ảo, tái thiết lập lại
9


ứng dụng hay thay đổi mạng lưới đang sử dụng. Đây cũng là dịch vụ
duy nhất có khả năng chuyển đổi linh hoạt giữa mạng L2 và L3 trên
nền tảng điện tốn đám mây cơng cộng.
Dịch vụ Hộp Đám mây (Container Cloud) của Oracle cung cấp
giải pháp tương thích với nền tảng mở Docker, giúp doanh nghiệp
triển khai hàng loạt ứng dụng chỉ với một thao tác. Với kho lưu trữ
tích hợp, quản lý và điều phối ứng dụng cấp doanh nghiệp, cũng như
tính năng lên kế hoạch cho ứng dụng và mở rộng quy mộ dịch vụ,
Dịch vụ Hộp Đám mây của Oracle là một lựa chọn hấp dẫn độc nhất
dành cho các chuyên viên phát triển điện toán đám mây.
8. Những loại cơng nghệ ảo hóa cơ bản của Amazon (AWS)
Amazon Machine Images (AWS AMI) cung cấp hai loại ảo hóa:
Paravirtual (PV) và Hardware Virtual Machine (HVM).
HVM được ảo hóa hồn tồn. Có nghĩa là các máy ảo chạy trên
các trình giám sát của chúng khơng biết rằng chúng đang chia sẻ
thời gian xử lý với các máy khách khác trên cùng một phần cứng.
Máy chủ lưu trữ phải có khả năng mơ phỏng phần cứng bên dưới cho
mỗi máy khách của nó. Loại ảo hóa này cung cấp khả năng chạy hệ
điều hành trực tiếp trên máy ảo mà không cần bất kỳ sửa đổi nào như thể nó được chạy trên phần cứng kim loại thơ. Ưu điểm của điều
này là HVM có thể sử dụng phần mở rộng phần cứng cung cấp khả
năng truy cập rất nhanh vào phần cứng bên dưới trên hệ thống chủ.
Paravirtualization là một dạng ảo hóa nhẹ hơn. Kỹ thuật này
nhanh và cung cấp tốc độ gần như nguyên bản so với ảo hóa hồn
tồn. Với Paravirtualization, hệ điều hành khách yêu cầu một số sửa
đổi trước khi mọi thứ có thể hoạt động. Những sửa đổi này cho phép
trình siêu giám sát xuất phiên bản đã sửa đổi của phần cứng cơ bản

sang các máy ảo, cho phép chúng có hiệu suất gần như nguyên bản.
Tất cả các máy PV chạy trên hypervisor về cơ bản là các hệ điều
hành đã được sửa đổi như Solaris hoặc các bản phân phối Linux khác
nhau.
9. Những Cơng nghệ ảo hóa trong điện tốn đám mây?
1. Ảo hóa mạng
Mạng ảo hóa bao gồm nhiều phần cứng, phần mềm và các thành
phần mạng kết hợp. Nó cho phép quản lý tất cả lưu trữ dưới dạng
một tài nguyên. Mạng ảo hóa có lợi đặc biệt trong trường hợp lưu
lượng mạng biến đổi lớn và nhanh chóng, khơng thể đốn trước
10


trong việc sử dụng (ví dụ như khi số lượng người truy cập tăng đột
biến trên website).
Trong phương pháp này, các tài nguyên có sẵn trong mạng được
kết hợp bằng cách chia băng thơng có sẵn thành các kênh độc lập
với nhau. Các kênh này được chỉ định hoặc gán cho các thiết bị riêng
biệt trong thời gian thực. Các kênh làm giảm độ phức tạp của mạng
và giúp quản lý thiết bị dễ dàng hơn.
2. Ảo hóa lưu trữ
Ảo hóa lưu trữ làm cho cơ sở hạ tầng vật lý tách khỏi máy khách
và máy chủ. Nó cho phép gộp bộ lưu trữ vật lý từ một số thiết bị lưu
trữ được kết nối với nhau thành một bộ phận lưu trữ duy nhất. Kỹ
thuật này chủ yếu được sử dụng trong các mạng khu vực lưu trữ. Nó
giúp quản trị viên lưu trữ sao lưu, lưu trữ và phục hồi dữ liệu hiệu
quả và nhanh chóng hơn. Đây là công nghệ quan trọng trong cả môi
trường ảo và mơi trường đám mây.
3. Ảo hóa máy chủ
Máy chủ ảo VPS là một khái niệm được sử dụng trong việc xây

dựng cơ sở hạ tầng CNTT nhằm giảm thiểu chi phí bằng cách chia sẻ
các tài nguyên phần cứng hiện có trong máy chủ vật lý. Cơng nghệ
ảo hóa máy chủ có bản chất là sao chép, ảo hóa các bộ phận máy
chủ vật lý, từ hệ điều hành cho đến bộ xử lý của chúng.
Máy chủ ảo làm giảm bớt việc quản lý tài nguyên máy chủ vốn
khá phức tạp. Nó cho phép chia sẻ và sử dụng một số lượng lớn tài
nguyên, đồng thời mở rộng các tài nguyên khi có nhu cầu. Máy chủ
ảo vps là giải pháp tốt nhất cho các ứng dụng quy mô vừa và nhỏ
với ngân sách hạn chế.
4. Ảo hóa dữ liệu
Mục đích chính của ảo hóa dữ liệu là cung cấp một điểm truy cập
duy nhất vào thông tin được thu thập từ nhiều nguồn dữ liệu khác
nhau.
Ảo hóa dữ liệu là việc thu thập dữ liệu từ các nguồn thông tin
khác nhau để tạo ra một cái chung duy nhất để ảo hóa về thơng tin.
Những thơng tin này được truy cập bởi người dùng trên giao diện từ
các ứng dụng, bảng điều khiển. Kỹ thuật ảo hóa này bao gồm thu
thập, chuyển đổi, liên kết và cung cấp dữ liệu đã xử lý đến các
nguồn giao diện người dùng.
11


5. Ảo hóa máy tính để bàn
Ảo hóa máy tính để bàn giúp người dùng mô phỏng máy trạm,
tương tự như mơ hình SAAS của điện tốn đám mây cho phép truy
cập mơi trường máy tính để bàn từ xa.
Ảo hóa máy tính để bàn cho phép truy cập an toàn vào cả máy
trạm và trung tâm dữ liệu do máy trạm chạy trong trung tâm dữ
liệu.
6. Ảo hóa ứng dụng

Ảo hóa ứng dụng cịn được gọi là ảo hóa dịch vụ ứng dụng. Trong
điện tốn đám mây, ảo hóa ứng dụng có nghĩa là trừu tượng hóa lớp
ứng dụng để tách nó ra khỏi hệ điều hành. Nó cho phép các tài
nguyên được phân phối linh hoạt trong thời gian thực.
Ảo hóa ứng dụng cho phép khắc phục các vấn đề hiện tại, ví dụ
như khơng tương thích ứng dụng với phần cứng hiện có và xảy ra
các lỗi.
10.

Trình bày mơ hình dịch vụ trong điện tốn đám mây:
Infrastructure as a service (IaaS). Lấy ví dụ, phân tích

Cơ sở hạ tầng như một dịch vụ (IaaS) là một mô hình tự phục
vụ để quản lý cơ sở hạ tầng trung tâm dữ liệu từ xa. IaaS cung cấp
các tài ngun máy tính được ảo hóa qua Internet do bên thứ ba lưu
trữ như Amazon Web Services, Microsoft Azure hoặc Google. Thay vì
một tổ chức mua phần cứng, các cơng ty mua IaaS dựa trên một mơ
hình tiêu thụ. Nó giống như mua điện. Bạn chỉ trả tiền cho những gì
bạn sử dụng. Mơ hình này cho phép các cơng ty thêm, xóa hoặc cấu
hình lại cơ sở hạ tầng CNTT theo yêu cầu. Nhiều tổ chức CNTT dựa
vào IaaS vì họ quen thuộc hơn với IaaS, đặc biệt nếu họ có nhiều
năm kinh nghiệm với mơi trường ảo hoặc các yêu cầu quy định và
bảo mật nghiêm ngặt chỉ có thể được đáp ứng thơng qua IaaS.
Ví dụ: Amazon EC2, Windows Azure, Rackspace, Google
Compute Engine.
- Platform as a service (PaaS). Lấy ví dụ, phân tích
Nền tảng như một dịch vụ (PaaS) cho phép các tổ chức xây
dựng, chạy và quản lý các ứng dụng mà không cần cơ sở hạ tầng
CNTT. Điều này giúp cho việc phát triển, thử nghiệm và triển khai
các ứng dụng trở nên dễ dàng và nhanh chóng hơn. Các nhà phát

triển có thể tập trung vào việc viết mã và tạo ứng dụng mà không
12


cần lo lắng về các hoạt động cơ sở hạ tầng CNTT tốn nhiều thời gian
như cung cấp máy chủ, lưu trữ và sao lưu. PaaS mang lại nhiều giá
trị hơn cho đám mây. Nó có thể giảm chi phí quản lý của bạn và
giảm chi phí của bạn. PaaS cũng giúp bạn dễ dàng hơn trong việc
đổi mới và mở rộng các dịch vụ của mình theo u cầu.
Ví dụ: BeanSalk AWS, Windows Azure, Heroku, Force.com,
Google App Engine, Apache Stratos.
- Software as a service (SaaS). Lấy ví dụ, phân tích
Phần mềm dưới dạng dịch vụ sẽ cung cấp cho bạn sản phẩm
hoàn chỉnh được nhà cung cấp dịch vụ vận hành và quản lý. Trong
hầu hết trường hợp, khi nhắc đến "Phần mềm dưới dạng dịch vụ",
mọi người thường nghĩ đến ứng dụng dành cho người dùng cuối. Với
sản phẩm SaaS, bạn sẽ không phải để tâm đến chuyện bảo trì dịch
vụ hay quản lý cơ sở hạ tầng cơ bản, mà bạn chỉ cần tính xem sẽ sử
dụng phần mềm cụ thể đó như thế nào. Một ví dụ thường thấy của
ứng dụng SaaS là email trên nền tảng web: bạn có thể gửi và nhận
email mà khơng phải quản lý việc bổ sung tính năng vào sản phẩm
email hay bảo trì máy chủ và hệ điều hành dùng cho chương trình
email.
Phần mềm như một dịch vụ (SaaS) thay thế phần mềm truyền
thống trên thiết bị bằng phần mềm được cấp phép trên cơ sở đăng
ký. Nó được lưu trữ tập trung trên đám mây. Một ví dụ điển hình là
Salesforce.com. Hầu hết các ứng dụng SaaS có thể được truy cập
trực tiếp từ trình duyệt web mà không cần tải xuống hoặc cài
đặt. Tuy nhiên, một số ứng dụng SaaS yêu cầu plugin.
Ví dụ: Ứng dụng Google, Microsoft Office 365.

- Mobile "backend" as a service (MBaaS). Lấy ví dụ, phân tích
là một mơ hình hỗ trợ cho việc phát triển ứng dụng trên nền
tảng di động hoặc web bằng cách liên kết các ứng dụng với các đám
mấy lưu trữ ở backend (backend cloud storage) và các giao diện lập
trình ứng dụng (APIs) được cung cấp bởi backend. MBaas cung cấp
các dịch vụ nổi bật như: quản lý người dùng, push notification, tích
hợp với mạng xã hội, dịch vụ dựa trên vị trí... Những dịch vụ này
được cung cấp thông qua việc sử dụng các bộ công cụ phát triển
phần mềm (SDKs) và giao diện lập trình ứng dụng (APIs). MBaas gần
đây có mối quan hệ mật thiết với sự phát triển của lĩnh vực điện
toán đám mây. Mặc dù đây được xem như một lĩnh vực còn non trẻ
13


nhưng hứa hẹn sẽ có những bước phát triển vượt bậc nhất là đối với
khối khách hàng doanh nghiệp.
Bằng cách sử dụng MBaas, các nhà sản xuất và phát triển ứng
dụng có thể tiết kiệm được nhiều thời gian xây dựng hệ thống và các
chi phí vận hành. Thơng qua MBaas các dịch vụ ứng dụng như: push
notify, tích hợp mạng xã hội, message & chat function… được cung
cấp sẵn bằng các bộ SDK và API đồng nhất, nhà phát triển ứng dụng
thay vì phải tự mình xây dựng các hệ thống này từ đầu cho ứng
dụng của mình thì bây giờ có thể sự dụng các dịch vụ này thơng qua
các hệ thống MBaas. Nhờ đó q trình phát triển ứng dụng có thể
được tiết kiệm thời gian hơn, qua đó cũng tiết kiệm được chi phí sản
xuất, nâng cao hiệu quả dự án. Bên cạnh đó MBaas cũng cung cấp
các phương tiện để quản lý dữ liệu ở backend cho các dịch vụ sử
dụng trong ứng dụng.
- Serverless computing là gì?
Serverless Computing là một phương pháp cung cấp backend

service theo thực tế sử dụng. Nhà cung cấp Serverless cho phép
người dùng viết và triển khai mã mà không gặp rắc rối về cơ sở hạ
tầng bên dưới.
Một công ty nhận backend service từ nhà cung cấp serverless
sẽ được tính phí dựa trên việc sử dụng, hồn tồn khơng phải đặt
trước và trả tiền cho một lượng băng thông hoặc số lượng máy chủ
cố định, vì đây là dịch vụ tự động mở rộng. Lưu ý rằng, mặc dù được
gọi là serverless, các máy chủ vật lý vẫn được sử dụng nhưng các
nhà phát triển không cần phải biết về chúng.
Trước đây khi công nghệ chưa phát triển, muốn xây dựng một
ứng dụng web, bạn phải sở hữu phần cứng vật lý để chạy một máy
chủ, các công đoạn này khá cồng kềnh và tốn kém.
Khi công nghệ đám mây phát triển, máy chủ hoặc khơng gian
máy chủ có thể được th từ xa. Các cơng ty có nhu cầu thuê này
thường mua quá mức cần thiết, chỉ để đảm bảo an toàn cho các
trường hợp mà lưu lượng truy cập hoặc hoạt động tăng đột biến vượt
quá giới hạn dẫn đến việc phá vỡ các ứng dụng. Điều này có nghĩa là
phần lớn khơng gian máy chủ được trả tiền đang bị lãng phí. Các nhà
cung cấp đám mây đã giới thiệu các mơ hình tự động mở rộng để
giải quyết vấn đề lãng phí này. Tuy nhiên lãng phí vẫn có thể xảy ra
nếu doanh nghiệp bị đối mặt với các cuộc tấn công DDoS, tự động
nhân rộng với việc mở rộng không mong muốn.
14


Serverless computing cho phép các nhà phát triển mua các
backend service một cách linh hoạt hơn, sử dụng bao nhiêu trả tiền
bấy nhiêu. Cách tính phí này giống như việc bạn chuyển từ gói dữ
liệu điện thoại di động với giới hạn cố định hàng tháng, sang gói chỉ
tính phí cho mỗi byte dữ liệu thực sự được sử dụng.

Thuật ngữ "serverless" khơng hẳn đúng như cái tên của nó, bởi
vì vẫn cịn các máy chủ cung cấp các backend service này, nhưng
tất cả các vấn đề về không gian máy chủ và cơ sở hạ tầng đều được
nhà cung cấp xử lý. Serverless có nghĩa là các nhà phát triển có thể
thực hiện cơng việc của họ mà khơng phải lo lắng về các vấn đề
xung quanh server.
- Function as a service (FaaS). Lấy ví dụ, phân tích
Cloud Computing dưới dạng FaaS này thường được gọi là điện
tốn khơng máy chủ. Nghĩa là bạn có thể tiến hành một cơng việc
nào đó mà khơng cần phải chuẩn bị trước tài nguyên cần thiết. Thay
vào đó, bạn sẽ khai báo cho nền tảng biết cách cung cấp tài nguyên
khi ứng dụng của bạn được thực thi trên đó. Việc cịn lại FaaS sẽ xử
lý.
Như vậy, trong quá trình bạn thực thi một ứng dụng bất kỳ,
quy mô của hạ tầng có thể tự động thay đổi. Việc thay đổi này dựa
trên những biến động về khối lượng công việc bạn đang thực hiện.
Do đó, bạn chỉ phải trả tiền cho những phần tài nguyên nào mà bạn
sử dụng mà thôi. Một số ví dụ về Cloud Computing theo hình thức
FaaS như AWS Lambdas, Azure Functions...
11.

Trình bày mô hình triển khai điện toán đám mây:
- Private cloud
Private Cloud (hay Đám mây riêng) là những dịch vụ được cung

cấp qua mạng nội bộ riêng biệt. Các doanh nghiệp có thể trực tiếp
quản lý “đám mây” này và sử dụng nội bộ thay vì cơng khai hoặc
Internet. Private Cloud cung cấp 2 loại hình dịch vụ là Iaas và PaaS.
Lợi ích của Private Cloud:
Private Cloud có các lợi ích tương tự Public Cloud nhưng có

chứa các đặc tính “tự phục vụ” riêng tư hơn.

15


Hỗ trợ tùy chỉnh và kiểm soát tài nguyên chuyên dùng trên cơ
sở hạ tầng máy tính được lưu trữ tại chỗ.
Cung cấp mức độ bảo mật và sự riêng tư cao nhờ hệ thống
tường lửa và lưu trữ nội bộ
Hạn chế của Private Cloud là bộ phận CNTT của cơng ty sẽ phải
chịu trách nhiệm về chi phí vận hành và việc quản lý Đám Mây.
- Public cloud
Public Cloud hay Đám mây công cộng là các dịch vụ được bên
thứ 3 cung cấp cho người dùng qua mạng Internet. Public Cloud
được xây dựng nhằm phục vụ công cộng (public). Vì vậy mơ hình
này khơng bị giới hạn đối tượng sử dụng. Có hai hình thức sử dụng
dịch vụ Public Cloud là miễn phí hoặc trả phí. Các dịch vụ trả phí
thường áp dụng mơ hình pay-per-usage (trả phí theo lưu lượng sử
dụng).
Lợi ích của Public Cloud:
Khả năng mở rộng theo nhu cầu người dùng nhờ kho tài
nguyên rộng lớn.
Số lượng máy chủ và mạng tham gia vào quá trình tạo ra
Public Cloud là vơ hạn. Vì thế, nếu một thành phần nào đó bị lỗi thì
hồn tồn khơng ảnh hưởng đến các thành phần khác.
Nền tảng để tạo ra các dịch vụ đám mây cơng cộng là Internet.
Vì thế, Public Cloud khơng bị giới hạn về vị trí, địa điểm. Bạn có thể
kết nối với Public Cloud từ bất kỳ đâu.
Mức chi phí tốt, người dùng chỉ phải trả tiền cho những gì họ
thực sự dùng.

Phục vụ được nhiều người dùng hơn
Tiết kiệm hệ thống máy chủ, điện năng và nhân lực

16


Tuy nhiên, Public Cloud vẫn có một số hạn chế như doanh
nghiệp sẽ cần phụ thuộc nhiều vào nhà cung cấp. Việc lưu trữ các
văn bản, thông tin nội bộ cũng gặp khó khăn hơn do tính mở của mơ
hình này.
- Hybrid cloud
Đúng như tên gọi, Hybrid Cloud hay Đám mây kết hợp là sự kết
hợp giữa Public Cloud và Private Cloud. Điều này cho phép Hybrid
Cloud khai thác lợi ích của cả hai mơ hình này để tối ưu cho người
dùng. Doanh nghiệp sẽ tạo ra các Hybrid Cloud và chia quyền quản
lý với nhà cung cấp Public Cloud. Người sử dụng có thể sử dụng đồng
thời các dịch vụ của nhà cung cấp và dịch vụ riêng của doanh
nghiệp.
Lợi ích của Hybrid Cloud:
+ Doanh nghiệp có thể sử dụng đồng thời nhiều dịch vụ
+ Cho phép doanh nghiệp triển khai mơ hình tại chỗ
+ Có lợi cho các cơng việc có tính đột biến
+ Sử dụng Hybrid Cloud để xử lý các dữ liệu lớn (Big Data)
+ Chỉ phải thanh toán cho thời gian sử dụng thêm
+ Tuy nhiên, mơ hình này cũng vấp phải khó khăn trong việc
quản lý và tiêu tốn nhiều chi phí cho việc triển khai và duy trì.
12.

Những rủi ro về an toàn bảo mật ĐTĐM (tóm lược)


1. Khả năng hiển thị hạn chế đối với các hoạt động mạng
Khi di chuyển khối lượng công việc và nội dung lên đám mây,
các tổ chức sẽ mất khả năng hiển thị ở một mức độ nhất định đối với
các hoạt động mạng. Điều này là do trách nhiệm quản lý một số hệ
thống và chính sách chuyển sang nhà cung cấp dịch vụ đám
mây. Tùy thuộc vào loại mơ hình dịch vụ đang được sử dụng, sự thay
đổi trách nhiệm có thể khác nhau trong phạm vi. Do đó, các tổ chức
17


phải có thể giám sát cơ sở hạ tầng mạng của họ mà không cần sử
dụng giám sát dựa trên mạng và ghi nhật ký.
2. Phần mềm độc hại
Bằng cách di chuyển một lượng lớn dữ liệu nhạy cảm sang môi
trường đám mây được kết nối internet, các tổ chức đang mở mình
trước các mối đe dọa mạng bổ sung. Các cuộc tấn công bằng phần
mềm độc hại là mối đe dọa phổ biến đối với bảo mật đám mây, với
các nghiên cứu cho thấy gần 90% tổ chức của các tổ chức có nhiều
khả năng bị vi phạm dữ liệu hơn khi việc sử dụng đám mây tăng
lên. Khi tội phạm mạng tiếp tục trở nên ngày càng hiểu biết hơn với
các phương thức tấn công của chúng, các tổ chức phải nhận thức
được bối cảnh mối đe dọa đang phát triển.
3. Tuân thủ
Quyền riêng tư dữ liệu đang trở thành mối quan tâm ngày càng
tăng và do đó, các quy định tuân thủ và tiêu chuẩn ngành như
GDPR, HIPAA và PCI DSS ngày càng trở nên nghiêm ngặt hơn. Một
trong những chìa khóa để đảm bảo tn thủ liên tục là giám sát ai
có thể truy cập dữ liệu và chính xác họ có thể làm gì với quyền truy
cập đó. Các hệ thống đám mây thường cho phép người dùng truy
cập quy mơ lớn, vì vậy nếu các biện pháp bảo mật thích hợp (ví dụ:

kiểm sốt truy cập) khơng được áp dụng, có thể khó theo dõi việc
truy cập trên tồn mạng.
4. Mất dữ liệu
Rị rỉ dữ liệu là mối quan tâm ngày càng tăng đối với các tổ
chức, với hơn 60% cho rằng đây là mối quan tâm lớn nhất về bảo
mật đám mây của họ. Như đã đề cập trước đây, điện toán đám mây
yêu cầu các tổ chức từ bỏ một số quyền kiểm sốt của họ cho
CSP. Điều này có thể có nghĩa là tính bảo mật của một số dữ liệu
quan trọng của tổ chức bạn có thể rơi vào tay ai đó bên ngồi bộ
phận CNTT của bạn. Nếu nhà cung cấp dịch vụ đám mây gặp phải vi
18


phạm hoặc tấn công, tổ chức của bạn sẽ không chỉ mất dữ liệu và tài
sản trí tuệ mà cịn phải chịu trách nhiệm về bất kỳ thiệt hại nào phát
sinh.
5. Thẩm định không đầy đủ
Việc di chuyển lên đám mây không nên được coi nhẹ. Tương tự
như nhà cung cấp bên thứ ba , khi làm việc với nhà cung cấp dịch vụ
đám mây, điều quan trọng là phải tiến hành thẩm định kỹ lưỡng để
đảm bảo rằng tổ chức của bạn có hiểu biết đầy đủ về phạm vi công
việc cần thiết để chuyển sang đám mây thành công và hiệu
quả. Trong nhiều trường hợp, các tổ chức khơng biết về lượng cơng
việc liên quan đến q trình chuyển đổi và các biện pháp bảo mật
của nhà cung cấp dịch vụ đám mây thường bị bỏ qua.
13.

Bigdata là gì, ứng dụng của Bigdata (tóm lược)
Big Data là gì?


Big Data là các tập dữ liệu có khối lượng lớn và phức tạp. Độ
lớn đến mức các phần mềm xử lý dữ liệu truyền thống khơng có khả
năng thu thập, quản lý và xử lý dữ liệu trong một khoảng thời gian
hợp lý.
Những tập dữ liệu lớn này có thể bao gồm các dữ liệu có cấu
trúc, khơng có cấu trúc và bán cấu trúc, mỗi tập có thể được khai
thác để tìm hiểu insights.
Các giải pháp Big Data cung cấp các công cụ, phương pháp và
công nghệ được sử dụng để nắm bắt, lưu trữ, tìm kiếm và phân tích
dữ liệu trong vài giây để tìm mối quan hệ và hiểu biết về cải tiến và
lợi ích cạnh tranh mà trước đây khơng có.
Ngày nay, 80% dữ liệu là dữ liệu khơng có cấu trúc và khơng
thể được xử lý bởi các cơng nghệ truyền thống. Trước đó, một lượng
dữ liệu được tạo ra không cao. Chúng ta tiếp tục lưu trữ dữ liệu vì chỉ
cần phân tích lịch sử dữ liệu. Nhưng ngày nay việc tạo dữ liệu tính
bằng petabyte và khơng thể lưu trữ dữ liệu nhiều lần và lấy lại khi
cần.
Ứng dụng của Big Data

19


Dưới đây là một số ứng dụng trong mỗi chuyên môn khác
nhau:
 Netflix sử dụng Big Data để cải thiện trải nghiệm của khách
hàng
 Phân tích chiến dịch và kế hoạch xúc tiến của Sears Holding
 Phân tích cảm xúc
 Phân tích khách hàng
 Phân tích dự đốn

 Kết hợp và quảng cáo theo thời gian thực
14.
IoT là gì, ứng dụng của IoT trong điện tốn đám mây
(tóm lược)
Khái niệm IoT:
IoT (Internet of Things) là một hệ thống các thiết bị máy tính,
máy móc cơ khí và kỹ thuật số hoặc con người có liên quan với nhau
được cung cấp các mã UID (mã nhận dạng duy nhất) và khả năng
truyền dữ liệu qua Internet mà không cần người tương tác giữa con
người với máy tính.
Ứng dụng của IoT trong điện toán đám mây:
Một số ứng dụng của IoT trong điện toán đám mây:
- Amazon Web Service (AWS) IoT
Đây là nền tảng điện toán đám mây phổ biến nhất hiện nay. AWS
IoT platform bao gồm các tính năng chính như sau:
+ Registry for recognizing devices: Tất cả các thiết kết nối đến
AWS IoT đều được xem là một Things và AWS IoT cho phép bạn lưu
các thông tin của các thiết bị kết nối đến AWS IoT thông qua tài
khoản AWS IoT.
+ Cung cấp các gói phần mềm phát triển cho các thiết bị phần
cứng.
+ Device Shadows: Khi thiết bị kết nối đến AWS sẽ được xem là
một Device Shadow, đại diện cho danh tính và trạng thái đã biết
cuối cùng của thiết bị và cung cấp kênh để gửi và nhận dữ liệu với
thiết bị.
+ Secure device gateway: Là gateway bảo mật cho các thiết bị
IoT.
20



+ Rules engine: Các công cụ, quy tắc giúp giao tiếp giữa các dịch
vụ của AWS và thiết bị.
Các nền tảng IoT của AWS giúp các nhà phát triễn dễ dàng hơn
trong việc kết nối nhiều loại cảm biến cho nhiều loại ứng dụng khác
nhau.
- Microsoft Azure IoT
Là một nền tảng điện toán đám mây phổ biến trong cộng đồng
Dev, cung cấp nhiều giải pháp mở rộng, các dịch vụ nền tảng và các
công nghệ tiên tiến. Đối với dịch vụ nền tảng đám mây, Microsoft
Azure IoT cung cấp các tính năng chính sau đây:
+ Device shadowing (tương tự như AWS).
+ Rule engine: Các công cụ, quy tắc giúp giao tiếp giữa các dịch
vụ của Azure và thiết bị.
+ Nhận dạng thiết bị.
+ Giao diện giám sát thông tin.
Để xử lý số lượng lớn thông tin thu thập từ hệ thống nhiều cảm
biến, Azure IoT kết hợp với Azure Stream Analytics để xử lý lượng
thông tin khổng lồ theo thời gian ngắn.
- Google Cloud Platform
Google Cloud là một trong những hệ thống IoT cung cấp cơng
nghệ điện tốn đám mây phổ biến nhất hiện nay. Với khả năng xử lý
lượng dữ liệu khổng lồ bằng cách sử dụng Cloud IoT Core, giúp
Google thực sự nổi bật so với đối thủ khác. Một số tính năng của
Google cloud platform:
+ Thúc đẩy phát triển doanh nghiệp: Google Cloud cung cấp các
dịch vụ tích hợp giúp các doanh nghiệp xử lý lượng dữ liệu khổng lồ
bị phân tán trên toàn cầu theo thời gian thực. Các doanh nghiệp cịn
có thể sử dụng kết hợp các giải pháp phân tích dữ liệu tiên tiến kết
hợp với công nghệ học máy từ Cloud Machine Learning Engine.
+ Tăng tốc thiết bị.

+ Cắt giảm chi phí bằng các dịch vụ đám mây.
+ Hệ sinh thái đối tác rộng lớn.
- ThingWorx IoT platform
ThingWorx là một hệ thống IoT được thiết kế để phát triển ứng
dụng doanh nghiệp, nó cung cấp các tính năng chính như:
21


+ Dễ dàng kết nối các thiết bị IoT đến nền tảng điện toán đám
mây phổ biến của ThingWorx.
+ Loại bỏ sự phức tạp khỏi quá trình phát triển ứng dụng IoT.
+ Chia sẻ nền tảng giữa các nhà phát triển để thúc đẩy phát
triển nhanh chóng.
+ Tích hợp học máy để tự động hóa các phân tích dữ liệu lớn
phức tạp.
+ Cung cấp công nghệ đám mây, các giải pháp về hệ thống
nhúng và IoT.
- IBM Watson
IBM Watson là một nền tảng cloud computing được nhiều nhà
phát triển thực hiện. Hệ thống IoT này được hỗ trợ bởi nền tảng
cloud hỗn hợp PaaS của IBM, Watson IoT cho phép các nhà phát triển
dễ dàng triển khai các ứng dụng IoT. Các tính năng cơ bản của IBM
Watson như:
+ Quản lý thiết bị.
+ Bảo mật truyền thông.
+ Truyền nhận dữ liệu thời gian thực.
+ Lưu trữ dữ liệu, máy chủ server
+ Cung cấp dịch vụ dữ liệu về thời tiết.
15. Trình bày kiến trúc lưu trữ đám mây Hadoop- HDFS (tóm
lược)

Khái niệm HDFS (Hadoop Distributed File System)
Hadoop framwork của Apache là một nền tảng dùng để phân tích
các tập dữ liệu rất lớn mà không thể xử lý trên được trên một máy
chủ duy nhất. Hadoop trừu tượng hóa mơ hình tính tốn MapReduce,
làm nó trở nên dễ tiếp cận hơn với các nhà phát triển. Hadoop có
khả năng mở rộng vơ số cácc nút lưu trữ và có thể xử lý tất cả hoạt
động và phân phối liên quan đến việc phân loại dữ liệu.
Kiến trúc HDFS
Giống như các hệ thống tập tin khác, HDFS duy trì một cấu trúc
cây phân cấp các tập tin, thư mục mà các tập tin sẽ đóng vai trị là
các nút lá. Trong HDFS, vì kích thước mỗi tập tin lớn, mỗi tập tin sẽ
được chia ra thành các khối (block) và mỗi khối này sẽ có một block
ID để nhận diện. Các khối của cùng một file (trừ khối cuối cùng) sẽ
22


có cùng kích thước và kích thước này được gọi là block size của tập
tin đó. Mỗi khối của tập tin sẽ được lưu trữ thành nhiều bản sao
(replica) khác nhau vì mục đích an tồn dữ liệu. Các khối được lưu
trữ phân tán trên các máy chủ lưu trữ cài HDFS. HDFS có một kiến
trúc chủ/khách (master/slave). Trên một cluster chạy HDFS, có hai
loại nút (node) là Namenode và Datanode. Một cluster có duy nhất
một Namenode và có một hoặc nhiều Datanode.
Namenode đóng vai trị là master, chịu trách nhiệm duy trì thơng
tin về cấu trúc cây phân cấp các tập tin, thư mục của hệ thống tập
tin và các siêu dữ liệu (metadata) khác của hệ thống tập tin. Cụ thể,
các metadata mà Namenode lưu trữ gồm có:
– File system namespace (khơng gian tên tập tin): là hình ảnh cây
thư mục của hệ thống tập tin tại một thời điểm nào đó. Khơng gian
tên tập tin thể hiện tất cả các file, thư mục có trên hệ thống file và

quan hệ giữa chúng.
– Thông tin để ánh xạ từ tên tập tin ra thành danh sách các khối:
Với mỗi tập tin, ta có một danh sách có thứ tự các khối block của tập
tin đó, mỗi khối đại diện bởi Block ID.
– Nơi lưu trữ các khối: Các khối được đại diện một Block ID. Với
mỗi block, ta có một danh sách các DataNode lưu trữ các bản sao
của khối đó.
Các DataNode sẽ chịu trách nhiệm lưu trữ các khối thật sự của
từng tập tin của HDFS. Mỗi một khối sẽ được lưu trữ như một tập tin
riêng biệt trên hệ thống tập tin cục bộ của DataNode. Trong ngữ
cảnh MapReduce, các DataNode này cịn có chức năng tính tốn với
dữ liệu là chính các khối được lưu trữ.

23


CHƯƠNG II: NỘI DUNG ĐỀ TÀI
A. TỔNG QUAN VỀ ĐIỆN TỐN ĐÁM MÂY
A.1. Điện tốn đám mây.
Điện tốn đám mây là việc phân phối các tài nguyên CNTT
theo nhu cầu qua Internet với chính sách thanh tốn theo mức sử
dụng. Thay vì mua, sở hữu và bảo trì các trung tâm dữ liệu và máy
chủ vật lý, bạn có thể tiếp cận các dịch vụ công nghệ, như năng
lượng điện toán, lưu trữ và cơ sở dữ liệu, khi cần thiết, từ nhà cung
cấp dịch vụ đám mây như Amazon Web Services (AWS).
A.2. Đặc trưng của điện toán đám mây
- Tự phục vụ theo yêu cầu: Khách hàng có thể đơn phương
thiết lập nguồn lực tính tốn để đáp ứng yêu cầu như: thời gian sử
dụng máy chủ, dung lượng lưu trữ cũng như khả năng tự động tương
tác khi có u cầu mà khơng cần phải nhân lực tương tác với nhà

cung cấp dịch vụ.
- Sự truy cập mạng rộng rãi: Hỗ trợ khả năng truy cập thông
qua mạng máy tính và các thiết bị chuẩn mà khơng u cầu nền
tảng cấu hình cao (như điện thoại di động, máy tính xách tay, PDA,
…).
- Tài nguyên chia sẻ độc lập với vị trí địa lý: Tài nguyên
máy tính của nhà cung cấp dịch vụ được tổ chức để phục vụ cho tất
cả các khách hàng thơng qua mơ hình “multi-tenant” (nhiều người
th), với mơ hình này các tài ngun vật lý và tài nguyên ảo hóa
khác nhau được cấp phát và thu hồi một cách tự động theo nhu cầu
của khách hàng.
- Tính mềm dẻo (khả năng co giãn nhanh): Khả năng này
của điện toán đám mây cho phép cung cấp nhanh và dễ dàng co
dãn để mở rộng hoặc thu nhỏ hệ thống một cách nhanh chóng theo
yêu cầu của khách hàng. Khi nhu cầu tăng, hệ thống sẽ tự động mở
rộng bằng cách thêm tài nguyên. Khi nhu cầu giảm, hệ thống sẽ tự
động giảm bớt tài nguyên.
- Chi phí trả theo nhu cầu sử dụng: Khả năng co giãn giúp
cho nhà cung cấp sử dụng tài nguyên hiệu quả, tận dụng triệt để tài
nguyên dư thừa, phục vụ được nhiều khách hàng. Đối với người sử

24


dụng dịch vụ, khả năng co dãn giúp giảm chi phí do người sử dụng
chỉ phải trả phí cho những tài nguyên thực sự dùng.
- Dịch vụ đo lường: Hệ thống điện tốn tự động kiểm sốt và
tối ưu hóa nguồn lực sử dụng bằng cách sử dụng khả năng đo lường
ở một vài mức trừu tượng phù hợp với các loại dịch vụ khác
nhau.Việc sử dụng tài nguyên có thể được kiểm sốt, giám sát, báo

cáo cung cấp thơng tin minh bạch việc sử dụng dịch vụ đối với cả
nhà cung cấp và khách hàng
1.3. Ưu điểm và nhược điểm.
A.2.1.
Ưu điểm.
- Tính linh động: Người dùng có thể thoải mái lựa chọn các dịch
vụ phù hợp với nhu cầu của mình, cùng như có thể bỏ bớt những
thành phần mà mình khơng muốn
- Giảm bớt chi phí: Người dùng khơng chỉ giảm bớt chi phí bản
quyền mà cịn giảm bớt phần lớ cho chi phí mua bán và bảo dưỡng
máy chủ. Việc tập hợp ứng dụng có nhiều tổ chức lại 1 chỗ sẽ giúp
giảm chi phí đầu tư ban đầu, cũng như tăng hiệu năng sửa dụng các
thiết bị này một cách tối đa
- Tạo nên sự độc lập: Người dùng sẽ khơng cịn bị gị bó với 1
thiết bị hay 1 vị trí cụ thể nào nữa. Với điện tốn đám mây, phần
mềm, dữ liệu có thể được truy cập và sử dụng từ bất kì đâu, trên bất
kì thiết bị nào mà khơng cần phải quan tâm đến giới hạn phần cứng
cũng như địa lí.
- Tăng cường độ tin cậy: Dữ liệu trong mơ hình điện toán đám
mây được lưu trữ một cách phân tán tại nhiều cụm máy chỉ tại nhiều
vị trí khác nhau. Điều này giúp tăng độ tin cậy, độ an toàn của dữ
liệu mỗi khi có sự cố hoặc thảm họa xảy ra.
- Bảo mật: Việc tập trung dữ liệu từ nhiều nguồn khác nhau sẽ
giúp các chuyên gia bảo mật tăng cường khả năng bảo vệ dữ liệu
của người dùng, cũng như giảm thiểu rủi ro bị ăn cắp thông tin.
- Bảo trì dễ dàng: Mọi phần mềm đều nẳm trên server. Lúc này.
Người dùng sẽ không cần lo lắng cập nhật hay sửa lơi phầm mềm
nữa. Và các lập trình viên cũng dễ dàng hơn trong công việc cài đặt.
nâng cấp ứng dụng của mình.
A.2.2.

Nhược điểm.
- Tính riêng tư: Các thông tin người dùng và dữ liệu được chứa
trên điện tốn đám mây có đảm bảo được riêng tư.
25


×