Mục lục
Lời Mở Đầu...........................................................................................................4
1.
Đặt vấn đề.................................................................................................4
2.
Mục tiêu của đề tài....................................................................................4
Chương 1: Lý Thuyết Chung Về Đtđm.................................................................5
1.1 Khái niệm điện toán đám mây.....................................................................5
1.2 Các nhà cung cấp dịch vụ Cloud Computing phổ biến hiện nay.................8
1.3 Mô hình dịch vụ trong điện tốn đám mây................................................11
1.4 Những rủi ro về an tồn bảo mật ĐTĐM..................................................22
1.5 Kiến trúc lưu trữ đám mây Hadoop- HDFS..............................................24
Chương 2: Công Nghệ Lưu Trữ Mạng SAN Và Chia Sẻ Dữ Liệu Đám Mây....27
2.1 Khái niệm về hệ thống lưu trữ mạng.........................................................27
Trong............................................................................................................27
2.2 Kiến trúc hệ thống lưu trữ đám mây.......................................................27
2.2.1 Dịch vụ phần mềm (Software as a Service – SaaS).........................28
2.2.2 Dịch vụ nền tảng (Platform as a Service – PaaS).............................30
2.2.3 Dịch vụ cơ sở hạ tầng (Infrastructure as a Service – IaaS )................31
2.3 Hệ thống lưu trữ SAN là gì, ưu điểm hệ thống SAN.................................31
2.3.1 Hệ thống lưu trữ SAN là gì?...............................................................31
2.3.2. Ưu điểm hệ thống SAN......................................................................32
2.4 Mô hình kết nối tới cụm lưu trữ dữ liệu SAN........................................33
2.4.1 SƠ LƯỢC MƠ HÌNH KẾT NỐI........................................................34
2.5 So sánh hệ thống SAN và NAS.................................................................37
2.5.1 NAS: Khi bạn cần hợp nhất, tập trung và chia sẻ...............................38
2.5.2 SAN: Khi bạn cần tăng tốc, mở rộng quy mô và bảo vệ....................38
2.6 So sánh hệ thống SAN và DAS.................................................................39
2.6.1 Định nghĩa (Direct Attached Storage (DAS)).....................................39
2.6.2 Ưu điểm..............................................................................................39
2.6.3 Khuyết điểm........................................................................................40
2.7 Bảo mật dữ liệu trên hệ thống lưu trữ đam mây SAN...............................40
2.7.1 Sử dụng các chính sách của tổ chức để tập trung quyền kiểm soát và xác
định ranh giới tuân thủ.................................................................................41
2.7.2 Cân nhắc sử dụng Cloud IAM để đơn giản hóa việc kiểm sốt truy cập41
2.7.3 Nếu khơng thể sử dụng Chính sách IAM, hãy xem xét các lựa chọn thay
thế cho ACL.................................................................................................42
2.7.4 Sử dụng khóa HMAC cho tài khoản dịch vụ......................................43
Chương 3: Mô Phỏng Đề Tài..............................................................................44
3.1 Demo Lưu trữ mạng SAN.........................................................................44
3.2 Chia sẻ dữ liệu đám mây...........................................................................45
Chương 4. Kết Luận............................................................................................48
Tài Liệu Tham Khảo...........................................................................................49
Lời Mở Đầu
1. Đặt vấn đề
Nếu như NAS không thể thay thế DAS vì chỉ ở mức file-level access, thì SAN
thay thế được DAS vì nó hỗ trợ block-level access, và là phương án mở rộng cho
DAS. Nếu như SCSI là cách truy cập vào DAS, thì iSCSI mở rộng khả năng của
SCSI ra các hệ thống lưu trữ nằm ở xa server (internet SCSI), cũng vẫn là SCSI
nhưng lần này là hoạt động ở môi trường IP của LAN hoặc Internet. Như vậy, ứng
dụng với sự hỗ trợ của iSCSI có thể truy cập và sử dụng 1 ổ cứng SCSI ở xa như
thể ổ cứng đó đang gắn trực tiếp bên trong.
Chi phí triển khai hệ thống SAN là khá đắt, nó địi hỏi phải dùng các thiết bị
Fiber Chennel Networking, Fiber Channel Swich,…Các ổ đĩa chạy trong hệ thống
lưu trữ SAN thường được dùng : FIBRE CHANNEL , SAS , SATA,….
2. Mục tiêu của đề tài
+ Tìm hiểu về hệ thống hệ thống lưu trữ mạng.
+ Tìm hiểu hệ thống lưu trữ đám mây.
+ Tìm hiểu về hệ thống lưu trữ SAN , Ưu điểm của SAN
Chương 1: Lý Thuyết Chung Về Đtđm
1.1 Khái niệm điện toán đám mây
Định nghĩa điện toán đám mây
- Điện tốn đám mây là một mơ hình truy cập mạng theo yêu cầu, phổ biến,
thuận tiện vào một nhóm tài ngun máy tính có thể định cấu hình được chia
sẻ có thể được cung cấp và phát hành nhanh chóng với nỗ lực quản lí hoặc
tương tác với nhà cung cấp dịch vụ tối thiểu
- Từ định nghĩa điện toán đám mây cho thấy:
Tài nguyên hoặc cơ sở hạ tầng máy tính tất cả đều có sẵn từ nahf cung
cấp đám mây, có thể được truy cập qua Internet từ bất kì vị trí từ xa
nào và bằng bất kì thiết bị điện toán cục bộ nào
Việc sử dụng hoặc khả năng truy cập chỉ tính theo mức độ sử dụng cho
khách hàng dựa trên như cầu của họ.Nếu nhu cầu nhiều hơn, nhà cung
cấp sẽ cung cấp nhiều tài ngun tính tốn hơn
- Một số định nghĩa khác về điện toán đám mây: Điện toán đám mây là việc
phân phối các hoạt động liên quan đến điện tốn đám mây dưới dạng dịch vụ
chứ khơng phải là một sản phẩm, theo đó các tài nguyên chia sẻ, phần mềm
và các thông tin được cung cấp cho điện tốn và các thiết bị khác như là một
tiện ích qua mạng ( thường là Internet)
- Hoặc có thể định nghĩa như sau: Điện toán đám mây là khái niệm tổng thể
bao gồm cả các khái niệm như phần mềm dịch vụ, Web 2.0 và các vấn đề
khác xuất hiện gần đây, các xu hướng công nghệ nổi bật, trong đó đề tài chủ
yếu của nó là vấn đề dựa vào Internet để đáp ứng những nhu cầu điện toán
của người dùng. Ví dụ, dịch vụ Google AppEngine cung cấp những ứng
dụng kinh doanh trực tuyến thơng thường, có thể truy nhập từ một trình
duyệt web, còn các phần mềm và dữ liệu đều được lưu trữ trên các máy chủ.
Lợi ích của điện tốn đám mây
- Khả năng mở rộng
- Khả năng biến đổi vô tận :Ứng dụng của điện tốn đám mây vơ cùng
phong phú. Người dùng cịn có thể tùy chọn tạo mơ hình đám mây riêng,
cơng cộng hoặc kết hợp (hybrid), hoặc tùy chọn để quyết định vị trí của
trung tâm dữ liệu ảo của bạn. Điện tốn đám mây đem đến vơ vàn ứng dụng,
biến đổi vô tận tùy theo ngân sách của doanh nghiệp.
- Khả năng tiếp cận: Một trong những điểm hấp dẫn của điện toán đám mây là
khả năng tiếp cận. Nếu các ứng dụng và tài liệu của chúng ta ở trên đám mây
thì chúng ta có thể truy vập và sử dụng mọi lúc, mọi nơi để làm việc, cho dù
chúng ta đang ở cơ quan, ở nhà hay thậm chí ở nhà một người bạn
- Bảo mật dữ liệu:
Dữ liên ln được đồng bộ hóa trên đám mây -> đảm bảo an toàn ,
tránh mất dữ liệu
Tất cả các hoạt động trên đám mây sẽ được bên thứ ba giám sát và
kiểm tra thường xuyên để đảm bảo rằng các tiêu chuẩn an toàn được
đáp ứng
- Tiết kiệm chi phí:
Điện tốn đám mây cho phép sử dụng chính xác lượng sức mạnh tính
tốn và tài ngun cho các ứng dụng
Các nhà cung cấp dịch vụ điện tốn đám mây liên quan đến máy tính
dưới dạng một gói sức mạnh tính tốn và gói nó ra theo yêu cầu.
Trong điện toán đám mây, sức mạnh điện toán của một tổ chức nằm ở
bên ngoài và về cơ bản được đăng kí sử dụng thay vì sở hữu, tổ chức
khơng cần chi tiêu vốn, chỉ có chi phí hoạt động.
Điện toán đám mây giúp người dùng giảm bớt trách nhiệm và chi phí
bảo trì tồn bộ cơ sở hạ tầng điện toán và đẩy tất cả những điều này
cho nhà cung cấp dịch vụ đám mây.
- Độ tin cậy
Cơng nghệ ảo hóa cho biết phần mềm đám mây của nhà cung cấp tự
động di chuyển dữ liệu từ phần cứng bị lỗi hoặc bị kéo ngoại tuyến
sang một phần của hệ thống hoặc phần cứng đang chạy hoặc hoạt
động. Do đó, khách hàng có thể truy cập liên tục và dữ liệu
Các hệ thống sao lưu riêng biệt với các chiến lược khôi phục thảm họa
đám mây, cung cấp một lớp khác về độ tin cậy
- Mơi trường bền vững: Điện tốn đám mây cũng thúc đẩy một giải pháp xanh
thay thế cho các chức năng văn phịng tốn nhiều giấy mực. Vì nó cần ít phần
cứng máy tính hơn trên cơ sở và trên tất cả các tác vụ liên quan đến máy tính
đều diễn ra từ xa với yêu cầu phần cứng máy tính tối thiểu với sự trợ giúp
của các đổi mới cơng nghệ như ảo hóa và đa người th.
- Nổi trội hơn cùng xu hướng hiện đại: Tầm ảnh hưởng của điện tốn đám
mây ngày một gia tăng và khơng có dấu hiệu kết thúc. Đáng chú ý là cả
doanh nghiệp vừa và nhỏ cũng như các doanh nghiệp đa quốc gia đều có nhu
cầu sử dụng và chuyển giao sang điện toán đám mây. Với những ưu điểm
như dịch vụ nhanh chóng, tiết kiệm chi phí và thời gian, thân thiện với môi
trường đồng thời đem đến môi trường hợp tác bền vững, việc áp dụng điện
tốn đám mây sẽ giúp thúc đẩy cơng ty của bạn tiến xa hơn những người vẫn
đang phục thuộc nhiều vào loại hình truyền thống.
1.2 Các nhà cung cấp dịch vụ Cloud Computing phổ biến hiện nay
Amazon :
- Không cịn nghi ngờ gì về vị trí số một của Amazon. Về cơ bản, công ty
này đã phát minh ra thị trường IaaS (Hạ tầng như một dịch vụ Frastructure-as-a-cloud - IaaS). Điện toán đám mây của Amazon cung cấp
một loạt các lựa chọn. Từ cung cấp không gian lưu trữ trị giá một vài xu
một tháng đến cho thuê siêu máy tính với giá 5.000 USD/một giờ.
- Amazon đang tập trung vào phân khúc các khách hàng doanh nghiệp
bằng việc bổ sung nhiều tính năng bảo mật hơn cho đám mây của mình và
tuyển dụng nhân viên bán hàng doanh nghiệp. Chắc chắn gã khổng lồ sẽ
không đứng yên nhìn VMware, Citrix và OpenStack chộp mất các khách
hàng doanh nghiệp. Thật ngạc nhiên khi một nhà bán lẻ trực tuyến lại có
thể tạo ra nhiều sự thay đổi trong ngành công nghiệp CNTT và trong cuộc
sống hằng ngày của chúng ta.
Google
- Năm ngoái, Google đã gây ra những con sóng lớn trong ngành cơng
nghiệp điện tốn đám mây khi tung ra dịch vụ IaaS của riêng mình, dự án
Compute Engine.
- Tuy nhiên, trước đó, Google cũng đã thực hiện một loạt các công cụ trên
đám mây như PaaS công cộng với tên gọi Google App Engine, cung cấp
Google Cloud Storage và tung ra ứng dụng Google BigQuery. Bên cạnh
đó, cơng ty cũng cung cấp các ứng dụng dành cho khách hàng doanh
nghiệp và khách hàng cá nhân như Google Drive và Google Apps. Hệ
điều hành Chrome với Chromebook và Chromebox cùng các thiết bị máy
tính chạy các ứng dụng trên nền điện tốn đám mây.
Microsoft
- Microsoft cũng đang là một doanh nghiệp lớn về điện toán đám mây với
Azure.
- Microsoft cũng cung cấp rất nhiều các ứng dụng doanh nghiệp trên đám
mây của mình từ cơ sở dữ liệu SQL Server đến Microsoft Office 365.
- Đây là một đám mây PaaS phổ biến với nhiều nhà lập trình viết các ứng
dụng sử dụng cơng cụ mã hóa của Microsoft. Cơng ty cũng vừa mở rộng
Azure vào thị trường IaaS, và thậm chí còn cho phép người dùng chạy
Linux trên đám mây của mình với mức giá hứa hẹn sẽ thấp hơn Amazon.
Bên cạnh đó, Microsoft cũng cung cấp rất nhiều các ứng dụng doanh
nghiệp trên đám mây của mình từ cơ sở dữ liệu SQL Server đến
Microsoft Office 365.
Vmware
- Vmware là một trong những đối thủ lớn nhất trong thị trường phần mềm
điện tốn đám mây, cạnh tranh với cơng nghệ OpenStack (được điều hành
bởi một tập đoàn các nhà cung cấp IBM, Rackspace, HP) và Citrix.
- Tuy nhiên, Vmware đã thay đổi chiến lược khi công bố kế hoạch ra mắt
đám mây công cộng riêng của mình. Đây là một sự lựa chọn thú vị vì hiện
có khoảng 200 nhà cung cấp dịch vụ điện toán đám mây được xây dựng
trên nền vCloud và giờ đây Vmware sẽ phải cạnh tranh với họ.
Saleforce.com
- Cái tên Salesforce.com gần như đồng nghĩa với điện toán đám mây.
Salesforce.com đã chứng minh rằng thế giới muốn mua phần mềm-nhưmột-dịch vụ.
-
Salesforce.com được biết đến như là một trong những đám mây PaaS
phổ biến nhất.
Rackspace
- Rackspace đang chạy một đám mây Iaas và tạo nên tên tuổi của mình
bằng cách bảo vệ OpenStack. Không muốn trả tiền cho các cơng ty như
Vmware để có các phần mềm mà mình khơng thể kiểm sốt được,
Rackspace đã hợp tác với NASA sau khi tổ chức này phát minh ra một số
phần mềm điện tốn đám mây hữu ích.
- Rackspace xếp vị trí thứ 6 trên thị trường
- Rackspace đã mời hơn 160 đối thủ tham gia đóng góp mã thơng tin để
OpenStack ngày càng hồn thiện và ln miễn phí. Rackspace khơng sở
hữu riêng OpenStack nhưng vẫn là một trong các tập đồn điện tốn đám
mây mạnh nhất thế giới.
IBM : IBM đóng một vai trị rất quan trọng với công nghệ đám mây
OpenStack trong suốt nhiều năm qua. Và đến tháng ba vừa qua, công ty đã
quyết định tăng mức cổ phần lên một quy mô lớn hơn. Công ty cũng cho biết
họ sẽ sử dụng OpenStack cho tất cả các đám mây của mình, bao gồm “đám
mây thông minh” công cộng được bán như một loại dịch vụ và “đám mây
riêng” được cài đặt cho các trung tâm cơ sở dữ liệu của khách hàng doanh
nghiệp.
Citris : Citrix cũng sản xuất phần mềm dành cho các đám mây để cạnh tranh
với hai đối thủ chính là Vmware và OpenStack. Để cạnh tranh với
OpenStack, cơng ty đã cho phép quỹ Apache, một tổ chức phi lợi nhuận quản
lý nhiều dự án mã nguồn mở phổ biến, sử dụng phần mềm CloudStack của
mình. Động thái này cũng cho phép Citrix bán nhiều hơn các phần mềm
trung tâm dữ liệu khác của mình để cạnh tranh với Vmware.
Joyen
- Joyent cạnh tranh với VMware, OpenStack và Citrix bằng hệ điều hành
điện toán đám mây riêng của mình. Sản phẩm này đã trở thành một lựa
chọn phổ biến cho các nhà cung cấp dịch vụ cần trung tâm dữ liệu đám
mây lớn với chi phí thấp.
- Joyent cho biết, hiện cơng ty đã có hơn 30.000 khách hàng, trong đó có
những tên tuổi lớn như LinkedIn và được hậu thuẫn bởi Intel, Dell, EMC
và Telefonica, công ty điện thoại Tây Ban Nha. VC Peter Thiel cũng đã
đầu tư vào đây.
Soft layer
- IBM và EMC đang chạy đua trong thương vụ mua lại SoftLayer trị giá
hơn 2 tỷ USD. SoftLayer được biết đến như một nhà cung cấp dịch
vụ điện toán đám mây và web-hosting tư nhân lớn nhất.
- Nếu EMC thành công trong việc mua lại SoftLayer, vị thế của EMC sẽ
ngày càng gia tăng do một trong những đối thủ lớn nhất của VmWare là
Citrix hiện là đối tác lớn và là khách hàng của SoftLayer.
- IBM đang có tham vọng tóm gọn khách hàng và trung tâm dữ liệu của
SoftLayer thành của riêng mình.
1.3 Mô hình dịch vụ trong điện toán đám mây
Infrastructure as a service (IaaS) – Cơ sở hạ tầng như 1 dịch vụ
- Trong các trung tâm dữ liệu truyền thống, sức mạnh tính tốn được tiêu
thụ khi có quyền truy cập vào cơ sở hạ tầng vật lí.
- IaaS cung cấp tài nguyên mạng, lưu trữ và tính tốn ảo bằng cách ảo hóa
các tài ngun vật lý
- Cơng nghệ ảo hóa được sử dụng để cung cấp các tài nguyên ảo. Tất cả các
tài nguyên ảo được cung cấp cho các máy ảo (VM) được cấu hình bởi nhà
cung cấp dịch vụ.
- Người dùng cuối ( hay còn gọi là kiến trúc sư CNTT) sẽ sử dụng tài
nguyên cơ sở hạ tầng dưới dạng máy ảo.
- Các kiến trúc sư CNTT không cần phải duy trì các máy chủ vật lí vì nó
được duy trì bởi nhà cung cấp dịch vụ
- Các dịch vụ do nhà cung cấp IaaS cung cấp:
Compute (Tính tốn) : Tính toán dưới dạng dịch vụ (CaaS), bao gồm
các đơn vị xử lí trung tâm ảo (CPU) và bộ nhớ chính ảo cho các máy
ảo được cung cấp cho người dùng cuối.
Storage (Lưu trữ): Lưu trữ dưới dạng dịch vụ (StaaS) cung cấp dịch vụ
lưu trữ cho các hình ảnh máy ảo. Một số nhà cung cấp IaaS cũng cung
cấp dịch vụ để lưu trữ các tệp.
Internet( Mạng) : Mạng dưới dạng dịch vụ(NaaS) cung cấp các thành
phần mạng ảo như bộ định tuyến ảo , bộ chuyển mạch và cầu nối cho
các máy ảo.
Load balancers (Bộ cân bằng tải): Cân bằng tải dưới dạng dịch vụ có
thể cung cấp khả năng cân bằng tải ở lớp cơ sở hạ tầng ảo.
- Đặc trưng cơ bản: tự phục vụ, truy cập mạng rộng, tổng hợp tài nguyên,
độ co giãn nhanh,dịch vụ được đo lường, truy cập tài nguyên trên web,
quản lí tập trung, cơ sở hạ tầng dùng chung, các máy ảo được cấu hình
sẵn…
- Ưu điểm: mô hình trả tiền khi sử dụng; giảm tổng chi phí của quyền sở
hữu; tài nguyên co giãn; sử dụng tài nguyên tốt hơn, hỗ trợ CNTT xanh.
- Nhược điểm: các vấn đề bảo mật, khả năng tương tác, các vấn đề về hiệu
suất
- Ví dụ
Dịch vụ web của Amazon: Ở đâu có Đám mây, Amazon khơng cịn xa
nữa và cơng ty là đối thủ cạnh tranh hàng đầu cho Azure của
Microsoft. Thương hiệu có khả năng nhận dạng cao với Đám mây
công cộng và IaaS nói riêng. Các dịch vụ của nó bao gồm toàn bộ
quang phổ của Đám mây.Amazon Web Services (AWS) rất dễ sử dụng
và đã được biết đến là bao gồm một loạt các cơng cụ. Hơn hết, nó hầu
như vơ hạn nhưng mang lại cho khách hàng lợi thế về tính linh hoạt và
khả năng chi trả, những yếu tố rất quan trọng khi doanh nghiệp mở
rộng quy mô.Tuy nhiên, nó có một vài nhược điểm và một nhược điểm
đặc biệt lớn là liên quan đến giới hạn EC2. Điều này có thể cản trở
hoạt động kinh doanh, tùy thuộc vào cách bạn sử dụng dịch vụ. Nguồn
lực có thể bị hạn chế theo khu vực, có thể dẫn đến tắc nghẽn ngoài ý
muốn.
Cơ sở hạ tầng đám mây của Google : Google luôn được biết đến là
một công ty sáng tạo và hoạt động kinh doanh Cơ sở hạ tầng đám mây
của nó cũng được xây dựng theo cùng một khn mẫu. Sử dụng nhiều
loại cơng nghệ, Google nhằm mục đích xây dựng bảo mật thông qua
các lớp chuyên sâu. Công ty sở hữu một trong những mạng lưới xương
sống lớn nhất, kết nối liền mạch các trung tâm dữ liệu khổng lồ của họ
trên khắp thế giới. Về cơ bản, nó có Đám mây của riêng mình trên quy
mơ tồn cầu - điều mà nó tự hào một cách chính đáng. Thật khơng
may, cơng ty bằng cách nào đó đã không thể thu hút được sự hỗ trợ mà
AWS và Microsoft đã thấy và nó đứng sau hai người khổng lồ này về
thị phần dịch vụ đám mây doanh nghiệp.
Platform as a service (PaaS) – Nền tảng như 1 dịch vụ
- PaaS thay đổi cách phần mềm được phát triển và triển khai.Trong phát
triển ứng dụng dựa trên Web ứng dụng sẽ được phát triển cục bộ và sẽ
được lưu trữ ở vị trí trung tâm.
- Trong triển khai ứng dụng độc lập, các ứng dụng sẽ được phát triển và
phân phối dưới dạng tệp thực thi
- PaaS thay đổi việc phát triển ứng dụng từ máy cục bộ sang trực tuyến.
Các nhà cung cấp PaaS cung cấp PaaS phát triển từ trung tâm dữ liệu.
Các nhà phát triển có thể sử dụng các dịch vụ qua Internet.
- Các dịch vụ do nhà cung cấp PaaS cung cấp:
Ngôn ngữ lập trình: PaaS cung cấp nhiều ngôn ngữ lập trình cho các
nhà phát triển để phát triển các ứng dụng. Một số ngôn ngữ lập trình
phổ biến do nhà cung cấp PaaS cung cấp là Java, Perl, PHP, Python,
Ruby, Scala, Clojure và Go.
Khung ứng dụng: PaaS cung cấp khung ứng dụng giúp đơn giản hóa
việc phát triển ứng dụng. Một số khung phát triển ứng dụng phổ biến
do nhà cung cấp PaaS cung cấp bao gồm Node.js, Rails, Drupal,
Joomla, WordPress, Django, EE6, Spring, Play, Sinatra, Rack và Zend.
Cơ sở dữ liệu: PaaS cung cấp cơ sở dữ liệu với nền tảng PaaS của họ.
Các cơ sở dữ liệu phổ biến được cung cấp bởi các nhà cung cấp PaaS
phổ biến là ClearDB, Postgre SQL, Cloudant, Membase, MongoDB,
Redis.
Các công cụ khác: các nhà cung cấp PaaS cung cấp tất cả các công cụ
cần thiết để phát triển, kiểm thử và triển khai một ứng dụng.
- Đặc điểm của PaaS: tất cả trong một; truy cập web vào nền tảng phát
triển; khả năng mở rộng tích hợp; nền tảng hợp tác; các công cụ máy
khách đa dạng.
- Ưu điểm:
Phát triển và triển khai nhanh chóng
Giảm tổng chi phí quyền sở hữu
Hỗ trợ phát triển phần mềm nhanh
Hỗ trợ làm việc nhóm
Dễ sử dụng
- Nhược điểm:
Vấn đề bảo mật
Ít linh hoạt hơn
Phụ thuộc vào kết nối Internet
- Ví dụ : Công cụ ứng dụng của Google : Google cung cấp Công cụ ứng
dụng của họ như một phần của hệ sinh thái Google Cloud. Nó được thiết
kế để trở thành một PaaS khơng máy chủ có khả năng mở rộng cao được
sử dụng để triển khai nhanh chóng. Google, là gã khổng lồ, có thể cung
cấp các máy chủ có khả năng cao có khả năng đối phó với hầu hết mọi
khối lượng truy vấn. Tuy nhiên, đã có một số vấn đề được các nhà phát
triển đưa ra về dịch vụ này. Chúng bao gồm thiếu hỗ trợ nhẹ trên một số
môi trường ngôn ngữ, thiếu công cụ phát triển, không thể cắm và chạy
một số ứng dụng, cộng với việc Google bị khóa với tư cách là nhà cung
cấp.
Software as a service (SaaS) – phần mềm dưới dạng dịch vụ
- SaaS thay đổi cách giao phần mềm cho khách hàng. Trong mô hình phần
mềm truyền thống, phần mềm được phân phối dưới dạng sản phẩm dựa
trên giấy phép cần được cài đặt trên thiết bị người dùng cuối.
- SaaS được phân phối dưới dạng dịch vụ theo yêu cầu qua Internet nên
không cần cài đặt phần mềm vào thiết bị của người dùng cuối.
- SaaS có thể được truy cập hoặc ngắt kết nối bất kì lúc nào từ người dùng
cuối. Các dịch vụ SaaS có thể được truy cập từ mọi trình duyệt web nhẹ
trên mọi thiết bị như máy tính xách tay, máy tính bảng và điện thoại thơng
minh.
- Các lợi ích quan trọng của việc sử dụng máy khách mỏng để truy cập
ứng dụng SaaS như sau: nó ít bị tấn cơng hơn, có vịng đời dài hơn, tiêu
thụ ít năng lượng hơn và ít tốn kém hơn.
- Các dịch vụ do nhà cung cấp SaaS cung cấp
Dịch vụ kinh doanh: hầu hết các nhà cung cấp SaaS đã cung cấp nhiều
loại dịch vụ kinh doanh thu hút các công ty mới thành lập. Các dịch vụ
kinh doanh bao gồm: hoạch định nguồn lực doanh nghiệp(ERP); quản
lí quan hệ khách hàng(CRM); thanh tốn, bán hàng và quản lí tài
nguyên con người
Mạng xã hội: các trang MXH hiện đang được công chúng sử dụng
rộng rãi, nhiều nhà cung cấp dịch vụ mạng xã hội đã áp dụng SaaS cho
các trang mạng xã hội. Vì số lượng người dùng của các trang mạng xã
hội đang tăng lên theo cấp số nhân, nên điện toán đám mây là giải
pháp phù hợp để xử lí tải thay đổi.
Dịch vụ thư tín: dịch vụ thư điện tử hiện nay được nhiều người sử
dụng. Sự phát triển trong tương lai số người sử dụng e – mail là
khơng thể đốn trước. Để xử lí số lượng người dùng khơng thể đoán
trước và tải các dịch vụ e – mail , hầu hết các nhà cung cấp e – mail
bắt đầu cung cấp dịch vụ của họ dưới dạng dịch vụ SaaS.
Quản lí tài liệu: vì hầu hết các doanh nghiệp sử dụng rộng rãi, tài liệu
điện tử cho nên hầu hết các nhà cung cấp SaaS bắt đầu cung cấp các
dịch vụ được sử dụng để tạo, quản lí và theo dõi tài liệu điện tử.
- Đặc điểm của SaaS: một – nhiều, truy cập web, quản lí tập trung, hỗ trợ
đa thiết bị, khả năng mở rộng tốt hơn, tính sẵn sàng cao
- Ưu điểm: khơng cài đặt phá máy khách, tiết kiệm chi phí, bảo trì ít hơn,
dễ dàn truy cập, co giãn động, khôi phục sau thảm họa, đa người thuê
- Nhược điểm: bảo mật , u cầu kết nối, mất quyền kiểm sốt
- Ví dụ: Lực lượng bán hàng: Salesforce là một trong những công ty đầu
tiên triển khai các ứng dụng của họ lên Đám mây. Mặc dù ngày nay nó là
một trong rất nhiều thương hiệu, nhưng thương hiệu đã bị mắc kẹt và nó
vẫn là một liên kết thống trị giữa các doanh nghiệp và khách hàng. Sức
mạnh của họ nằm ở Quản lý quan hệ khách hàng (CRM) và việc chuyển
sang SaaS là rất quan trọng. Trước đây, CRM đắt tiền và thường có sẵn ở
quy mơ doanh nghiệp do chi phí và độ phức tạp của việc triển khai. Nhờ
mơ hình SaaS, Salesforce có sẵn cho bất kỳ ai với mức giá đầu vào tuyệt
vời chỉ 25 đô la.
Mobile "backend" as a service (MbaaS) – Xu thế phát triển ứng dụng
-
(Baas), là một mô hình hỗ trợ cho việc phát triển ứng dụng trên nền tảng
di động hoặc web bằng cách liên kết các ứng dụng với các đám mấy lưu
trữ ở backend (backend cloud storage) và các giao diện lập trình ứng
dụng (APIs) được cung cấp bởi backend. MBaas cung cấp các dịch vụ nổi
bật như: quản lý người dùng, push notification, tích hợp với mạng xã hội,
dịch vụ dựa trên vị trí... Những dịch vụ này được cung cấp thông qua việc
sử dụng các bộ công cụ phát triển phần mềm (SDKs) và giao diện lập
trình ứng dụng (APIs). MBaas gần đây có mối quan hệ mật thiết với sự
phát triển của lĩnh vực điện toán đám mây. Mặc dù đây được xem như
một lĩnh vực cịn non trẻ nhưng hứa hẹn sẽ có những bước phát triển vượt
bậc nhất là đối với khối khách hàng doanh nghiệp.
- Bằng cách sử dụng MBaas, các nhà sản xuất và phát triển ứng dụng có
thể tiết kiệm được nhiều thời gian xây dựng hệ thống và các chi phí vận
hành. Thơng qua MBaas các dịch vụ ứng dụng như : push notify, tích hợp
mạng xã hội, message & chat function… được cung cấp sẵn bằng các bộ
SDK và API đồng nhất, nhà phát triển ứng dụng thay vì phải tự mình xây
dựng các hệ thống này từ đầu cho ứng dụng của mình thì bây giờ có thể
sự dụng các dịch vụ này thơng qua các hệ thống MBaas. Nhờ đó quá trình
phát triển ứng dụng có thể được tiết kiệm thời gian hơn, qua đó cũng tiết
kiệm được chi phí sản xuất, nâng cao hiệu quả dự án. Bên cạnh đó MBaas
cũng cung cấp các phương tiện để quản lý dữ liệu ở backend cho các dịch
vụ sử dụng trong ứng dụng.
- Các dịch vụ nổi bật
Push notification: tính năng này hiện có mặt trong nhiều ứng dụng trên
nền tảng di động hiện nay. Khi nhà cung cấp dịch vụ cho ra đời một
sản phẩm mới hoặc có một chương trình khuyến mãi mới áp dụng cho
một nhóm khách hàng, các thơng tin quảng bá này có thể được chủn
tới khách hàng thơng qua hình thức push notification.
Dịch vụ quản lý người dùng: Cho phép chứng thực người dùng từ ứng
dụng Android, iOS và JavaScript SDK. Chứng thực người dùng có thể
thực hiện thơng qua tài khoản: Email, Facebook, Twitter, GitHub,
Google và hình thức chứng thực nặc danh. Nhà phát triển ứng dụng
chỉ cần xử lý nghiệp vụ đăng nhập hệ thống ở phía client bằng cách
tương tác với các API của MBaas, điều này giúp họ tiết kiệm thời gian
và công sức với việc phát triển hệ thống backend.
Dịch vụ dựa trên vị trí: Thơng qua dữ liệu về vị trí của khách hàng, các
hệ thống MBaas có thể cung cấp nhiều dịch vụ khác nhau. Các dịch vụ
dựa trên vị trí có thể chia thành các nhóm dịch vụ cá nhân, nhóm dịch
vụ doanh nghiệp và nhóm dịch vụ cơng cộng và ứng cứu khẩn cấp. Có
thể thấy được rõ ràng lợi ích của các nhóm dịch vụ dựa trên vị trí này
trong nhiều lĩnh vực cuộc sống. Điển hình như trong lĩnh vực ứng cứu
khẩn cấp, từ thông tin về vị trí của nạn nhân sẽ giúp hệ thống có thể
điều hướng các phương tiện cứu nạn đến nơi nhanh chóng thơng qua
việc tính tốn lộ trình di chủn phù hợp cho các phương tiện này.
- Ưu điểm: tăng tốc độ phát triển phần mềm, giảm kinh phí phát triển phần
mềm; khơng cần server, do đó bạn khơng cần quản lí hay có kiến thức về
Infra
- Nhược điểm: ít linh hoạt so với việc tự triển khai Back – end; có thể
khơng phù hợp với 1 nền tảng nhất định
- Ví dụ: AnyPresence: Mục tiêu của AnyPresence không chỉ là giúp các
doanh nghiệp build hệ thống backend cho các ứng dụng di động của họ.
Anypresence còn kết hợp cả việc build ứng dụng, dịch vụ back-end và
cung cấp các cổng kết nối API. Anypresence có chức năng cho phép sinh
đoạn mã back-end, đoạn mã sử dụng trên ứng dụng di động hoặc thậm chí
chỉnh sửa các API trực tuyến từ dịch vụ của họ. Tất cả các đoạn mã sinh
ra có thể được tải về, chỉnh sửa và chạy trên các nền tảng tương thích. Ví
dụ một trong những khách hàng nổi tiếng của AnyPresence hiện nay là
Master Card thông qua anyPresence cho phép các đối tác của họ xây dựng
các ứng dụng di động tương tác với các API, dịch vụ mở của MasterCard.
AnyPresence có khả năng sinh ra các đoạn mã sử dụng trên các nền tảng
như: JQuery, Android, iOS, WindownPhone, HTML5…
Serverless computing là gì?
- Khái niệm "serverless" ở đây chỉ đơn giản là loại bỏ các yêu cầu thiết lập
máy chủ đối với người dùng. Theo cách này, khách hàng vẫn được trải
nghiệm dịch vụ khơng có máy chủ, mặc dù thực tế là các server vẫn được
sử dụng rất nhiều để lưu trữ trang web.
- Ưu điểm chính mà serverless computing mang lại là nó thu hút các khách
hàng ít hiểu biết về cơng nghệ nhưng vẫn có nhu cầu muốn lưu trữ trang
web. Serverless computing loại bỏ sự cần thiết phải điều chỉnh thủ công
các cài đặt trên máy chủ, vì vậy khách hàng có thể truy cập ngay vào
trang web của mình và chỉ trả tiền cho những gì họ đang sử dụng.
- Tuy nhiên, serverless computing cịn có một lợi ích bổ sung nữa cho cả
khách hàng và máy chủ lưu trữ. Cách thức hoạt động của serverless
computing cho phép khách hàng chỉ trả tiền cho những gì mình sử dụng.
Chẳng hạn, bạn muốn lưu trữ máy chủ cho một game cùng chơi với bạn
bè. Theo mô hình cũ, bạn sẽ phải trả một khoản phí hàng tháng để thuê
một máy chủ.
- Tuy nhiên, dưới nền tảng dựa trên đám mây này, bạn sử dụng máy chủ để
chơi game và chỉ trả tiền cho các tài nguyên bạn sử dụng trong đám mây.
Có nghĩa là bạn chỉ phải trả tiền khi nào sử dụng máy chủ mà thôi.
Function as a service (FaaS) – Chức năng như một dịch vụ
- Chức năng như một dịch vụ (Faas) đề cập đến các dịch vụ điện toán đám
mây cho phép phát triển ứng dụng serverless và quản lý. Này về cơ bản
có nghĩa là người dùng Faas có thể thực hiện chương trình của họ (và các
nhiệm vụ khác) mà không gặp rắc rối trong việc quản lý máy chủ của
riêng họ. Strings mã được kích hoạt bởi các sự kiện trên người dùng cuối,
và về cơ bản bên ngoài đến các máy chủ từ xa mà có thể thực hiện các
chức năng mong muốn.
- FaaS là một phương pháp sử dụng công nghệ đám mây để mang lại hiệu
quả cao hơn trong các quy trình và quy trình làm việc trên máy tính. Nó
được giới thiệu lần đầu tiên vào năm 2014 với hook.io, nhưng đã được
phổ biến bởi AWS Lambda của Amazon, cũng như Google Cloud
Functions và Microsoft Azure Functions. Ngoài những hệ thống đó, IBM
có một hệ thống FaaS mã nguồn mở có tên OpenWhisk và cơng ty chia sẻ
xe Uber có một FaaS chạy trên nền tảng riêng của họ.
- Ví dụ : Chức năng đám mây của Google
Google Cloud Functions là một dịch vụ điện tốn khơng máy chủ
được Google ra mắt vào năm 2018. Các chức năng đám mây của
Google cho phép các nhà phát triển viết mã để mở rộng và kết nối với
các dịch vụ đám mây, tức là đám mây công cộng của Google.
Với các chức năng đám mây của Google, các nhà phát triển trang web
có thể gọi các chức năng cụ thể có thể thực hiện các tác vụ cụ thể mà
khi được kích hoạt sẽ đưa ra phản hồi cụ thể.
Những phản hồi này được Google Cloud Platform (GCP) tự động kích
hoạt.
Google được biết đến với việc cung cấp trải nghiệm người dùng đơn
giản trên tất cả các nền tảng của mình. Vì vậy, tại sao các Chức năng
đám mây của Google nên được bỏ lại.
Để cung cấp trải nghiệm liền mạch cho các nhà phát triển, Google đã
giới thiệu dịch vụ này.
Google Cloud Functions đã giúp các nhà phát triển viết mã cho ứng
dụng dễ dàng hơn và giờ đây họ có thể tập trung nhiều hơn vào phần
viết mã hơn là phát triển cơ sở hạ tầng cho ứng dụng.
Khả năng mở rộng cũng là một trong những điểm trở lại đáng kể của
dịch vụ này. Dịch vụ này tự động điều chỉnh các tài nguyên bất cứ khi
nào chúng cần thiết và đặt chúng sang một bên khi không.
Với sự hiện diện của các ngơn ngữ mã hóa thơng thường như
JavaScript và Python, các nhà phát triển sẽ dễ dàng hơn trong việc
phát triển mã và tải chúng lên theo các chức năng.
1.4 Những rủi ro về an toàn bảo mật ĐTĐM
Tài sản trí tuệ bị mất hoặc bị đánh cắp: Khi một dịch vụ đám mây bị vi
phạm, tội phạm mạng sẽ chiếm được quyền truy cập vào những dữ liệu nhạy cảm
này. Kể cả khi khơng có vi phạm xảy ra, một số dịch vụ vẫn có thể gây ra rủi ro cho
dữ liệu nếu quyền sở hữu dữ liệu được tải lên.
Vi phạm điều lệ và quy định: Ngày nay, hầu hết các công ty hoạt động và chịu
sự kiểm sốt thơng tin theo các quy định tương ứng, như HIPAA đối với các thông
tin về sức khỏe, FERPA đối với hồ sơ sinh viên, và nhiều quy định khác của chính
phủ và ngành. Theo các bộ quy định này, các doanh nghiệp phải biết dữ liệu của họ
ở đâu, ai có thể truy cập dữ liệu đó và làm thế nào để bảo vệ các dữ liệu này.
BYOC (Bring Your Own Cloud) thường vi phạm mỗi một trong những quy định
này, khiến doanh nghiệp rơi vào tình trạng không tuân thủ quy định về bảo mật, dẫn
đến những hậu quả nghiêm trọng.
Mất quyền kiểm soát hành động của người dùng cuối: Khơng kiểm sốt chặt
chẽ được việc sử dụng dịch vụ đám mây của nhân viên sẽ gây ra những sự cố
khơng đáng có cho doanh nghiệp. Chẳng hạn, một nhân viên bán hàng sắp nghỉ
việc có thể tải xuống tất cả các báo cáo về những thông tin quan trọng của khách
hàng, sau đó lưu trữ những dữ liệu này tại đám mây cá nhân và sử dụng những
thơng tin đó bán cho đối thủ cạnh tranh hoặc sử dụng cho công ty mới chuyển tới.
Đây là một trong những mối đe dọa nội bộ phổ biến đang diễn ra ở hầu hết các
doanh nghiệp hiện nay.
Nhiễm phần mềm độc hại gây ra những cuộc tấn công có chủ đích: Các dịch
vụ đám mây có thể được sử dụng như một vectơ cho việc lọc dữ liệu. Skyhigh đã
phát hiện ra một kỹ thuật lọc dữ liệu mới, theo đó những kẻ tấn cơng đã mã hóa dữ
liệu nhạy cảm vào các tệp video và tải chúng lên YouTube. Bên cạnh đó cịn có một
phần mềm độc hại giúp lọc dữ liệu nhạy cảm thông qua tài khoản Twitter 140 ký tự
một lần. Các biến thể phần mềm độc hại Dyre giúp tội phạm mạng sử dụng các
dịch vụ chia sẻ tệp để phân phối phần mềm độc hại đến các mục tiêu nhằm tiến
hành các cuộc tấn công lừa đảo (phishing attacks).
Vi phạm hợp đồng với khách hàng hoặc đối tác kinh doanh: Hợp đồng giữa
các bên kinh doanh thường hạn chế cách sử dụng dữ liệu và người được phép truy
cập. Khi nhân viên di chuyển những dữ liệu vào đám mây mà không được phép,
hợp đồng kinh doanh có thể bị vi phạm dẫn đến các hành động pháp lý sau đó
Giảm niềm tin của khách hàng: Vi phạm dữ liệu chắc chắn ảnh hưởng nghiêm
trọng đến niềm tin của khách hàng. Trong một vụ vi phạm dữ liệu thẻ thanh toán
lớn chưa từng thấy, tội phạm mạng đã đánh cắp hơn 40 triệu số thẻ tín dụng và thẻ
ghi nợ của khách hàng từ Target. Vi phạm khiến khách hàng tránh xa các cửa hàng
Target và dẫn đến việc kinh doanh của công ty xuống dốc không phanh gây nên sự
tụt dốc thảm hại với doanh thu của công ty.
Vi phạm dữ liệu yêu cầu phải được thông cáo và thông báo cho nạn nhân:
Nếu dữ liệu nhạy cảm được đưa vào đám mây và vi phạm xảy ra, cơng ty có thể
được yêu cầu phải tiết lộ vi phạm và gửi thông báo cho các nạn nhân của mình như
đối với quy định HIPAA và HITECH. Cơng ty có thể đối mặt với các trừng phạt
của cơ quan pháp lý và có nguy cơ bị khởi kiện bởi những nạn nhân bị ảnh hưởng.
Giảm doanh thu: Theo nghiên cứu của Ponemon BYOC, 64% số người được
hỏi nói rằng cơng ty của họ khơng kiểm sốt được việc nhân viên của họ sử dụng
đám mây tại nơi làm việc. Để giảm thiểu rủi ro khi sử dụng đám mây không được
quản lý (unmanaged cloud), trước tiên các cơng ty cần có khả năng hiển thị các
dịch vụ đám mây được sử dụng bởi nhân viên của mình. Họ cần hiểu dữ liệu nào
đang được tải lên dịch vụ đám mây nào và của ai. Với thơng tin này, các nhóm
CNTT có thể bắt đầu thực thi các chính sách bảo mật, tuân thủ và quản trị dữ liệu
của công ty để bảo vệ dữ liệu của công ty trên đám mây. Đám mây vẫn ở đây và
các công ty phải cân bằng rủi ro của dịch vụ đám mây với những lợi ích rõ ràng mà
chúng mang lại.
1.5 Kiến trúc lưu trữ đám mây Hadoop- HDFS
HDFS (tên viết tắt của từ Hadoop Distributed File System” là một hệ thống
lưu dữ dữ dữ liệu được sử dụng bởi Hadoop. Chức năng của hệ thống này là cung
cấp khả năng truy cập với hiệu suất cao đến với các dữ liệu nằm trên các cụm của
Hadoop.
HDFS được xây dựng dựa trên cấu trúc cây phân cấp, thư mục mà các file sẽ
đóng vai trị là các node lá. Trong HDFS, mỗi file sẽ được chia ra làm một hay
nhiều block và mỗi block sẽ có một blockID để nhận diện. Các block của cùng một
file (trừ block cuối cùng) sẽ có cùng kích thước và kích thước này được gọi là block
size của file đó. Mỗi block của file sẽ được lưu trữ thành ra nhiều bản sao (replica)
khác nhau vì mục đích an tồn dữ liệu.
HDFS có một kiến trúc master/slave. Trên một cluster chạy HDFS, có 2 loại
node là Namenode và Datanode. Một cluster có duy nhất một Namenode và có một
hay nhiều Datanode.
Namenode đóng vai trị là master, chịu trách nhiệm và duy trì thông tin về cấu
trúc cây phân cấp các file, thư mục của hệ thống file và các metada khác của hệ
thống file. Cụ thể, các metadata mà Namenode lưu trữ gồm có:
-
File System Namespace: là hình ảnh cây thư mục của hệ thống file tại một thời
điểm nào đó. File System namespace thể hiện tất cả các file, thư mục có trên hệ
thống file và quan hệ giữa chúng.
-
Thơng tin để ánh xạ từ tên file ra thành danh sách các block: với mỗi file, ta có
một danh sách có thứ tự các block của file đó, mỗi block đại diện bởi block id.
-
Nơi lưu trữ các block: các block được đại diện bởi một block id. Với mỗi block
ta có một danh sách các DataNode lưu trữ các bản sao của block đó.
Namenode sẽ chịu trách nhiệm điều phối các thao tác truy cập (đọc/ghi dữ liệu)
của client lên hệ thống HDFS. Và tất nhiên, do các Datanode là nơi thật sự lưu trữ
các block của các file trên HDFS, nên chúng sẽ là nơi trực tiếp đáp ứng các thao tác
truy cập này. Chẳng hạn như khi client của hệ thống muốn đọc 1 file trên hệ thống
HDFS, client này sẽ thực hiện một request (thông qua RPC) đén Namenode để lấy
các metadata của file cần đọc. Từ medata này nó sẽ biết được danh sách các block
của file và vị trí của các Datanode chứa các bản sao của từng block. Client sẽ truy
cập vào các Datanode để thực hiện các request đọc các block.
Namenode thực hiện nhiệm vụ của nó thơng qua một daemon tên namenode
chạy trên port 8021. Mỗi Datanode server sẽ chạy một daemon datanode trên port
8022.