1
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Đồng Thị Tuyết Chinh
TÌM HIỂU MÔ HÌNH QUẢN LÝ VÀ TRUY XUẤT DỮ LIỆU ĐÁM MÂY
IDRAGON ỨNG DỤNG CHO THIẾT BỊ DI ĐỘNG
Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01
TÓM TẮT LUẬN VĂN THẠC SĨ
HÀ NỘI - 2012
2
Luận văn được hoàn thành tại:
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Người hướng dẫn khoa học: ……………………………………………………………
(Ghi rõ học hàm, học vị)
Phản biện 1: ……………………………………………………………………………
Phản biện 2: …………………………………………………………………………
Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học viện Công
nghệ Bưu chính Viễn thông
Vào lúc: giờ ngày tháng năm
Có thể tìm hiểu luận văn tại:
- Thư viện của Học viện Công nghệ Bưu chính Viễn thông
3
Mở đầu
Điện toán đám mây là một chủ đề được quan tâm nghiên cứu và phát triển
mạnh mẽ những năm gần đây, cùng với ứng dụng rộng rãi các công nghệ ảo hóa
máy chủ, cung cấp hạ tầng, nền tảng và phần mềm như là các dịch vụ. Điện toán
đám mây (cloud computing), còn gọi là điện toán máy chủ ảo, là mô hình điện
toán sử dụng các công nghệ máy tính và phát triển dựa vào mạng Internet. Thuật
ngữ "đám mây" ở đây là lối nói ẩn dụ chỉ mạng Internet (dựa vào cách được bố trí
của nó trong sơ đồ mạng máy tính) và như liên tưởng về độ phức tạp của các cơ sở
hạ tầng chứa trong nó. Theo tổ chức IEEE: "Nó là hình mẫu trong đó thông tin
được lưu trữ thường trực tại các máy chủ trên Internet và chỉ được được lưu trữ
tạm thời ở các máy khách, bao gồm máy tính cá nhân, trung tâm giả
i trí, máy tính
trong doanh nghiệp, các phương tiện máy tính cầm tay, ".
Hình 1.1: Mô hình minh họa đám mây
Tuy nhiên cho tới nay, những nghiên cứu và ứng dụng điện toán đám mây
trên thế giới (các công ty đa quốc gia như: IBM, Microsoft, Oracle/Sun, HP,
Cisco…), cũng như tại Việt Nam đưa sản phẩm điện toán đám mây ra thị trường,
4
mới đề cập ở mức ứng dụng ảo hóa (đám mây hóa) tại các trung tâm dữ liệu – nơi
lưu trữ dữ liệu và phần mềm trên máy chủ để cung cấp các dịch vụ liên quan cho
người sử dụng đầu cuối, qua môi trường Internet (các đám mây công cộng –
public). Nhu cầu đặt ra là cần xây dựng các sản phẩm đám mây cho mạng nội bộ
hoặc trong doanh nghiệp (các dịch vụ đám mây riêng – private) và đặc bi
ệt là các
ứng dụng đám mây thích hợp cung cấp cho các thiết bị di động.
Ý tưởng của đồ án được xây dựng dựa trên việc tìm hiểu một số công nghệ
quản lý, lưu trữ, truy xuất, đồng bộ dữ liệu đám mây thông qua các nghi thức là
các chuẩn giao tiếp (protocol) như: NFS, CIFS, WebVAD,…, trên cơ sở đó xây
dựng ứng dụng phát triển phần mềm cho thiết bị di động – ứng dụng trong điệ
n
toán đám mây iDragon Cloud.
Căn cứ vào những vấn đề tìm hiểu và nghiên cứu như trên, luận văn bao
gồm 3 chương:
Chương 1: Lưu trữ và thao tác dữ liệu trong điện toán đám mây
Giới thiệu điện toán đám mây (khái niệm, lịch sử, các dạng điện toán đám
mây); mô hình kiến trúc điện toán đám mây; tìm hiểu lưu trữ dữ liệu trong điện
toán đám mây; các thao tác dữ liệ
u trong dịch vụ đám mây.
Chương 2: Giới thiệu điện toán đám mây iDragon
Mô hình điện toán đám mây iDragon; các dịch vụ nền tảng trong điện toán
đám mây iDragon; lưu trữ và truy xuất dữ liệu trong đám mây iDragon.
Chương 3: Ứng dụng điện toán đám mây iDragon cho thiết bị di động
Các mô hình phát triển phần mềm dựa trên dữ liệu đám mây; mô hình ứng
dụng dữ liệu đám mây cho thiết bị
di động; xây dựng ứng dụng điện toán đám
mây iDragon cho thiết bị di động.
5
Chương 1: Lưu trữ và thao tác dữ liệu trong điện toán đám
mây
1. Khái niệm điện toán đám mây
1.1. Khái niệm điện toán đám mây
Điện toán đám mây có thể được định nghĩa là một kiểu tính toán mới trong
đó sự cân bằng động và các tài nguyên ảo hóa được cung cấp như dịch vụ trên
Internet. Điện toán đám mây đã trở thành một khuynh hướng công nghệ quan
trọng, nhiều chuyên gia kỳ vọng điện toán đám mây sẽ định hình lại các quy trình
công nghệ thông tin và thị trường công nghệ. Với điện toán đám mây, người dùng
có thể dùng các thiế
t bị như: PCs, laptops, smartphones, PDAs (Professional
Development Approval System), hay thiết bị di động để truy nhập các chương
trình, các nền tảng lưu trữ và triển khai ứng dụng trên Internet thông qua các dịch
vụ được các nhà cung cấp điện toán đám mây hỗ trợ.
Đám mây là một tập hợp của phần cứng, mạng, các thiết bị lưu trữ, dịch vụ
và giao diện cho phép các ứng dụng tính toán như một dịch vụ.
1.2. Lịch sử
Thuật ngữ điện toán đám mây bắt nguồn từ ứng dụng điện toán lưới trong
thập niên 1980, tiếp theo là điện toán theo nhu cầu (utilitycomputing) và phần
mềm dịch vụ (SaaS). Sáu giai đoạn của mô hình điện toán hay có thể gọi là sáu mô
hình điện toán bao gồm:
Giai đoạn 1: nhiều người dùng chia sẻ mainframes công suất cao thông qua các
thiết bị đầu cuối giả (dummy terminals).
Giai đoạn 2: chỉ mộ
t PC cũng đã đủ sức mạnh để đáp ứng nhu cầu tính toán của
người dùng.
Giai đoạn3: máy tính cá nhân và các servers được kết nối vào mạng cục bộ để
chia sẻ tài nguyên và nâng cao hiệu năng.
Giai đoạn 4: mạng cục bộ này được kết nối với mạng cục bộ khác tạo thành một
mạng toàn cầu như Internet để sử dụng các ứng dụng và tài nguyên từ xa.
6
Giai đoạn 5: điện toán lưới (grid computing) cung cấp năng lực tính toán và
năng lực lưu trữ dùng chung thông qua một hệ thống tính toán phân tán.
Giai đoạn 6: điện toán đám mây cung cấp các tài nguyên dùng chung trên
Internet theo một cách đơn giản và cân bằng.
1.3. Các loại đám mây
Điện toán đám mây thường được phân loại làm ba loại đám mây chính, theo
vị trí của đám mây là: đám mây công cộng (public cloud), đám mây cục bộ
(private cloud), đám mây lai (hybrid cloud).
1.3.1. Đám mây công cộng
Đám mây công cộng là những đám mây mở cho người dùng mà ứng dụng
lưu trữ, các nguồn tài nguyên khác có sẵn và được cung cấp bởi một số nhà cung
cấp dịch vụ thông qua mạng Internet. Một số các nhà cung cấp dịch vụ như:
Google, Amazon, Microsoft…
Các đám mây công cộng cung cấp tiềm năng tốt nhất về hiệu quả chi phí,
nhưng vấn đề bảo mật dữ liệu chỉ cung cấp trên danh nghĩa dựa vào các ph
ần hỗ
trợ sẵn có. Đám mây công cộng thường tính lệ phí sử dụng hàng tháng cho mỗi
GB kết hợp với phí chuyển băng thông, người dùng có thể mở rộng lưu trữ theo
yêu cầu và sẽ không tốn chi phí mua phần cứng lưu trữ.
1.3.2. Đám mây riêng
Đám mây cục bộ còn được gọi là: “điện toán đám mây nội bộ” hay “đám
mây riêng” là thế hệ tiếp theo của ảo hóa. Trong đám mây cục bộ cơ sở hạ tầng
điện toán đám mây chỉ hoạt động cho một tổ chức duy nhất không chia sẻ cho các
tổ chức khác cho dù quản lý nội bộ hoặc bởi một bên thứ ba và lưu trữ trên máy
nội bộ hay bên ngoài. Đám mây cục b
ộ tương tự như ảo hóa ở mức độ máy chủ,
máy trạm và ứng dụng, điện toán đám mây cục bộ có tính năng nâng cao, thu hút
nhiều doanh nghiệp. Điển hình là mô hình dịch vụ đám mây riêng của Google và
Amazon.
7
1.3.3. Đám mây lai
Điện toán đám mây lai là một thành phần của hai hoặc nhiều đám mây (cục
bộ, công cộng hoặc công cộng) với nhiều nhà cung cấp nội bộ/ bên ngoài, do đó
chúng thừa kế được lợi ích và các tính năng cốt lõi của cả hai loại hình đám mây.
Ngoài ra, gần đây có thêm một mô hình điện toán đám mây cộng đồng
(Community Cloud). Mô hình này thực chất là các đám mây riêng có hạ tầng, cấu
hình hoàn toàn giống nhau được kết nối v
ới nhau.
2. Mô hình kiến trúc điện toán đám mây
Kiến trúc đám mây gồm: nền tảng đám mây (Cloud Platform), các dịch vụ
đám mây (Cloud Service), cơ sở hạ tầng đám mây (Cloud Infrastructure), lưu trữ
đám mây (Cloud Storage).
Hình 1.4: Kiến trúc điện toán đám mây
Điện toán đám mây có thể coi như một tập hợp dịch vụ, tập hợp này có thể được
trình bày như một kiến trúc phân tầng theo.
SaaS (Software as a Service – phần mềm như là dịch vụ): là tầng đỉnh của
kiến trúc. SaaS cho phép người dùng chạy các ứng dụng từ xa của đám mây.
IaaS (Infrastructure as a Service – hạ tầng cơ sở như là dịchvụ): là tài
nguyên điện toán được cung cấp như là một dịch vụ. Đó là các máy tính được ảo
8
hóa với năng lực xử lý được đảm bảo và băng thông dự trữ đủ để lưu trữ và truy
nhập Internet.
PaaS (Platform as a Service – nền tảng như là dịch vụ) tương tự IaaS, ngoài
ra còn có các hệ điều hành và dịch vụ cần thiết cho một ứng dụng cụ thể. Nói cách
khác, PaaS là IaaS cộng thêm một số phần mềm riêng dành cho một ứng dụng cho
trước.
dSaaS (data Storage as a Service – lưu trữ dữ liệu nh
ư là dịch vụ) cung cấp
không gian lưu trữ mà khách hàng có thể sử dụng, bao gồm cả băng thông lưu
trữ.
2.1. SaaS
Một thực thi đầu tiên trong dịch vụ đám mây là phần mềm như một dịch vụ
(SaaS) – các ứng dụng nghiệp vụ được tổ chức bởi các nhà cung cấp và chuyển
giao như một dịch vụ. SaaS có nguồn gốc từ nhà cung cấp dịch vụ (ASP –
Application Service Providers).
Ban đầu, phần mềm như một dịch vụ (SaaS) không chỉ đơn giản thực hiện
trên Internet, vì lợi ích an ninh và độ tin cậy, các dị
ch vụ này sẽ sử dụng mạng
riêng ảo (VPN – Virtual Private Networks). Một VPN cơ bản có thể tạo một mạng
công cộng từ mạng cục bộ (bằng cách sử dụng một số hình thức mã hóa) thay vì
phải mua kết nối chuyên dụng, việc này cho phép truyền dữ liệu an toàn qua mạng
công cộng như Internet.
Ví dụ về phần mềm như dịch vụ như: Yahoo Mai, Yahoo là nhà cung cấp
dịch vụ email lớn nh
ất với khoảng 260triệu người sử dụng, Facebook, eBay,
Skype, GoogleApps, một số công ty sử dụng trang web xã hội Facebook như là
một mạng nội bộ miễn phí cho nhân viên của mình. Trang bán đấu giá trực tuyến
EBay là cơ sở của hơn 500.000 doanh nghiệp nhỏ, Skype (miễn phí cuộc gọi trực
tuyến và video) được sử dụng bởi các doanh nghiệp nhỏ trên toàn thế giới và
GoogleApps (tin nhắn và các công cụ cộng tác) có hơn một triệu doanh nghiệp s
ử
dụng.
9
2.2. IaaS
Cơ sở hạ tầng như một dịch vụ (IaaS) là việc phân phối phần cứng máy tính
(máy chủ, công nghệ mạng, lưu trữ và không gian dữ liệu) như một dịch vụ, nó
cũng có thể bao gồm việc cung cấp các hệ thống điều hành và các công nghệ ảo
hóa quản lý tài nguyên.
Với IaaS, khách hàng thuê tài nguyên thay vì việc mua và cài đặt dữ liệu
vào trung tâm dữ liệu của họ. Dịch vụ thường
được trả tiền theo sử dụng. Dịch vụ
có thể mở rộng quy mô nếu khách hàng có nhu cầu sử dụng nhiều tài nguyên hơn
so với dự kiến, họ có thể nhận được ngay lập tức khi có yêu cầu (khả năng cung
cấp cũng có một giới hạn). Khả năng mở rộng linh hoạt của cơ sở hạ tầng cho
phép nó mở rộng hoặc thu hẹp tùy theo yêu cầu củ
a ứng dụng. Ngoài ra, tham số
cung cấp liên quan đến cấp độ dịch vụ thỏa thuận, cấp độ của dịch vụ chính là khả
năng sẵn sàng phục vụ của các nhà cung cấp dịch vụ.
2.3. PaaS
Trong nền tảng như một dịch vụ (PaaS – Platform as a Service), nhà cung
cấp sẽ cung cấp nhiều hơn cơ sở hạ tầng, nó có thể coi như một ngăn xếp các giải
pháp – một tập hợp các tài nguyên yêu cầu để nhà phát triển có thể xây dựng ứng
dụng gồm cả phần mềm và thời gian chạy. PaaS có thể coi là phát triển của dịch
vụ Web hosting. Trong các năm gần đây các công ty dịch vụ Web hosting cũ
ng
cung cấp các gói phần mềm khá hoàn chỉnh để xây dựng các trang Web. PaaS có ý
tưởng xa hơn, đó là cung cấp một nền tảng bao gồm toàn bộ các tiến trình trong
vòng đời phát triển của phần mềm: phân tích, thiết kế, xây dựng, kiểm thử, triển
khai và bảo trì. Lợi ích chính của PaaS là phát triển và triển khai phần mềm dựa
hoàn toàn vào dịch vụ đám mây, do đó không có quản lý và bảo trì, quá trình phát
triển từ giai đoạn thiết kế s
ẽ được thực thi trên đám mây. PaaS tạo ra tính năng
động, có thể mở rộng, thu hẹp; cung cấp địa chỉ cụ thể và các dịch vụ tiêu chuẩn
cho truy xuất và bảo mật dữ liệu của khách hàng.
10
Một số ví dụ về các nền tảng như một dịch vụ (PaaS) bao gồm: Google App
Engine, AppJet, Etelos, Qrimp, và Force.com đó là môi trường phát triển chính
thức cho Salesforce.com
3. Lưu trữ dữ liệu trong điện toán đám mây
3.1. Ưu điểm của lưu trữ dữ liệu đám mây
Lưu trữ một lượng rất lớn các thông tin trên mạng cục bộ (LAN) là khá tốn
kém. Năng lực lưu trữ dữ liệu điện tử của các thiết bị như máy chủ tập tin, các
mạng lưu trữ khu vực (SAN) và mạng lưu trữ đính kèm (NAS) cung cấp hiệu suất
cao, tính sẵn sàng cao có thể truy cập thông qua giao diện tiêu hỗ trợ.
Lưu trữ dữ liệu đám mây có nhiều thu
ận lợi là: giá rẻ, không yêu cầu cài
đặt, không cần thay thế, có hệ thống sao lưu và phục hồi, đã không có các yêu cầu
vật lý (không đòi hỏi điều kiện môi trường, không có nhân viên quản lý).
3.2. Nhược điểm của lưu trữ dữ liệu đám mây
Hiệu suất của các đám mây dữ liệu lưu trữ được giới hạn bởi băng thông. Tốc
độ Internet và WAN chậm khoảng 10-100 lần so với tốc độ mạng LAN.
Tính sẵn có của dữ liệu lưu trữ đám mây là một vấn đề nghiêm trọng. Đám
mây cung cấp dữ liệu dựa trên khả năng kết nối mạng giữa mạng LAN, WAN và
nhà cung cấp dịch vụ đ
ám mây. Trong khi đó, kết nối mạng có thể bị ảnh hưởng
khi có sự gián đoạn mạng lưới toàn cầu, năng lượng mặt trời, cắt đứt cáp ngầm và
vệ tinh hư hại khi mạng lưới bị hư hỏng.
Các nhà cung cấp sử dụng các giao thức mạng trong lưu trữ dữ liệu đám mây
có thể gây không tương thích với tập tin bình thường phục vụ trên mạng LAN.
Truy cậ
p vào đám mây dữ liệu lưu trữ thường liên quan đến chương trình được tạo
ra để thu hẹp sự khác biệt trong các giao thức sử dụng.
Lưu trữ dữ liệu đám mây không có một bộ các giao thức tiêu chuẩn phổ biến,
điều này có nghĩa sẽ phức tạp khi lựa chọn các nhà cung cấp vì có thể các giao
thức sử dụng không tương thích.
11
3.3. Lưu trữ dữ liệu đám mây trong điện toán đám mây
Khi thảo luận về lưu trữ đám mây và các tiêu chuẩn liên quan, điều quan
trọng là phân biệt các nguồn lực khác nhau cùng được cung cấp như các dịch vụ:
giao diện chức năng (đường dẫn dữ liệu), giao diện quản lý (kiểm soát đường
dẫn). Một khái niệm quan trọng khác là siêu dữ liệu. Khi quản lý một lượng lớn
dữ liệu với các yêu cầu khác nhau, siêu dữ liệu là một cơ chế phù h
ợp để đảm bảo
các yêu cầu của các nhà cung cấp dịch vụ. Lưu trữ đám mây có một số thuộc tính
để xác định: trả tiền khi theo dữ liệu, tạo ảo giác về khả năng vô hạn (đàn hồi),
đơn giản trong sử dụng, quản lý dữ liệu.
3.3.1. Lưu trữ đám mây
Trong mô tả thuật ngữ điện toán đám mây thường sử dụng một đám mây
như là biểu tượng kết nối mạng, đám mây đại diện cho kết nối mọi điểm bất kỳ
trong một mạng (any to any), các kết nối thực tế và các dịch vụ đang chạy trong
mạng đều được thực hiện ngầm với người sử dụng. Một phầ
n quan trọng trong mô
hình điện toán đám mây chính là nơi lưu trữ tài nguyên và các khái niệm ảo hóa.
Do đó, lưu trữ đám mây chỉ đơn giản là việc cung cấp lưu trữ ảo hóa theo yêu cầu,
lưu trữ dữ liệu như là môt dịch vụ (DaaS), có nghĩa là: "dữ liệu được chuyển giao
trong mạng dựa theo các cấu hình lưu trữ ảo và các dịch vụ dữ liệu liên quan, trên
cơ sở đảm bả
o các yêu cầu về cấp độ dịch vụ”.
3.3.2. Lưu trữ dữ liệu như một dịch vụ (DaaS)
Lưu trữ dữ liệu như một dịch vụ trừu tượng hóa dữ liệu lưu trữ đằng sau
một tập hợp các giao diện dịch vụ cung cấp theo yêu cầu. Một phần quan trọng
của bất kỳ DaaS là sự hỗ trợ của khách hàng. Các giao thức chuẩn hỗ trợ bao gồm:
iSCSI (Internet Small Computer System Interface), CIFS / NFS (Common Internet
File System/ Network File System) hoặc WebDAV (Web-based Distributed
Authoring and Versioning) cho việc lưu trữ tập tin mạng.
12
Hình 1.8: Giao diện lưu trữ dữ liệu tiêu chuẩn
Quản lý lưu trữ thường được thực hiện theo khối của các giao diện lưu trữ
dữ liệu chuẩn, hoặc thông qua một API, hoặc thông qua một giao diện người dùng
dựa trên trình duyệt. Giao diện này có thể được dùng để gọi các dịch vụ dữ liệu
như ảnh chụp hoặc sao chép dữ liệu. Trong mô hình này, chúng ta trừu tượng
không gian lưu trữ cơ bản tiếp xúc với các giao diện này bằng s
ử dụng một hộp
chứa (container), được coi như một nhóm các dữ liệu được lưu giữ và là một điểm
kiểm soát để áp dụng dịch vụ dữ liệu tổng hợp.
DaaS cung cấp là một không gian lưu trữ dạng bảng lưu trữ cho phép mở
rộng quy mô theo chiều ngang, thêm các trường dữ liệu theo yêu cầu lưu trữ, chứ
không phải là ảo hóa các trường cơ sở d
ữ liệu quan hệ.
Một cải tiến của mô hình dữ liệu này là mô hình dữ liệu dạng bảng được
thể hiện như hình sau:
13
Hình 1.9: Giao diện lưu trữ dữ liệu cho cơ sở dữ liệu/ bảng dữ liệu
Một loại thứ ba của giao diện chức năng lưu trữ dữ liệu, là giao diện xử lý
tất cả các đối tượng dữ liệu truy cập thông qua một URI (Uniform Resource
Identifier) duy nhất. Dữ liệu được lấy về thông qua sử dụng giao thức chuẩn
HTTP và một trình duyệt để hiển thị dữ liệu. Mỗi đối tượng dữ liệu được tạo mới,
cập nhật, xóa nh
ư là một nguồn tài nguyên riêng biệt. Trong mô hình giao diện
này, một container là một nhóm các đối tượng dữ liệu đơn giản, container chỉ hỗ
trợ thực thi một bậc gọi chung là container “mềm”. Mô hình này gọi là giao diện
lưu trữ cho lưu trữ đối tượng dữ liệu khách hàng – Storage Interfaces for Object
Storage Client Data.
14
Hình 1.10: Giao diện lưu trữ cho lưu trữ đối tượng dữ liệu khách hàng
3.3.3. Quản lý dữ liệu trong đám mây
Một điều quan trọng được chú ý đầu tiên trong lưu trữ đám mây là hiệu quả
tốt nhất, đó chính là chất lượng lưu trữ, đảm bảo nhu cầu của các nhà cung cấp
ứng dụng, vừa bổ sung thêm các dịch vụ dữ liệu. Tuy nhiên lưu trữ đám mây cũng
khá phức tạp để khách hàng thiết lập lịch trình sao lưu thông qua các giao diện
người dùng chuyên dụng, triển khai các dịch vụ dữ
liệu cá nhân cho các phần dữ
liệu của họ. Bằng cách sử dụng các loại siêu dữ liệu khác nhau trong giao diện lưu
trữ đám mây, có thể tạo ra một giao diện cho phép đáp ứng các yêu cầu dịch vụ
mà quản lý dữ liệu không phức tạp.
15
Hình 1.11: Mô hình sử dụng tài nguyên miền
Bằng cách hỗ trợ siêu dữ liệu, trong một giao diện lưu trữ đám mây chuẩn
quy định cách thức mà hệ thống lưu trữ và hệ thống siêu dữ liệu biên dịch để phù
hợp với các yêu cầu dữ liệu. Mô hình lưu trữ đám mây có thể giữ lại các yêu cầu
đơn giản bằng mô hình lưu trữ và vẫn giải quyết các yêu cầu của ứng dụng doanh
nghiệp. Siêu dữ
liệu người dùng được đám mây giữ lại có thể được sử dụng để tìm
các đối tượng dữ liệu và container thông qua thực hiện truy vấn các giá trị siêu dữ
liệu cụ thể.
3.3.4. Quản lý dữ liệu và hộp chứa
Khi tạo mới một container trong một container hiện tại, các container mới
sẽ kế thừa tương tự các thiết lập siêu dữ liệu của hệ thống dữ liệu cha mẹ. Tất
nhiên, các dữ có thể được ghi đè vào container hoặc lưu trữ theo cấp độ cá nhân.
3.3.5. Mô hình tham chiếu cho giao diện lưu trữ đám mây
Mô hình này cho thấy nhiều loại giao diện lưu trữ điện toán đám mây có
thể hỗ trợ cả các loại ứng dụng khác nhau. Tất cả các giao diện lưu trữ được cung
cấp theo yêu cầu, lấy dữ liệu từ kho tài nguyên và công suất truy xuất dữ liệu tùy
thuộc vào dung lượng mà dịch vụ cung cấp. Dịch vụ dữ liệu áp dụng cho các
thành phần dữ liệu cá nhân được xác định bở
i các hệ thống siêu dữ liệu. Siêu dữ
liệu quy định cụ thể các yêu cầu dữ liệu trên cơ sở dữ liệu cá nhân hoặc nhóm các
dữ liệu (container).
16
Hình 1.12: Mô hình tham chiếu lưu trữ dữ liệu đám mây
3.3.6. Siêu dữ liệu trong lưu trữ đám mây
CDMI sử dụng nhiều loại siêu dữ liệu khác nhau của siêu dữ liệu, bao gồm:
siêu dữ liệu HTTP, siêu dữ liệu hệ thống, siêu dữ liệu người dùng và hệ thống lưu
trữ siêu dữ liệu.
3.3.7. Định danh đối tượng
Mỗi đối tượng được lưu trữ trong một hệ thống CDMI sẽ có một định danh
đối tượng duy nhất trên toàn cầu (Object ID) được giao tại thời điểm tạo. ID đối
tượng CDMI là một chuỗi nhưng có những quy định làm thế nào nó được tạo ra và
làm thế nào nó có tính duy nhất.
17
Định danh của một đối tượng là chuỗi byte chiều dài thay đổi, chiều dài tối
đa là 40 byte. Một ứng dụng nên coi định danh đối tượng là chuỗi byte mờ, tuy
nhiên định dạng như vậy đảm bảo được tính toàn vẹn, độc lập và duy nhất của nó.
Hình 1.13: Định dạng định danh đối tượng (Object ID)
Giải thích mô hình trên:
Các byte bảo lưu được thiết lập là 0.
Enterprise Number: là số do doanh nghiệp cung cấp để tạo định danh cho đối
tượng.
Byte thứ 5 chứa chiều dài của định danh đối tượng tính theo byte.
Trường CRC gồm 2 byte (16 bit): đảm bảo tính toàn vẹn, dữ liệu trường này
được tạo ra khi chạy các thuật toán CRC. CRC chức năng bao gồm các thông
số sau:
o Tên: "CRC-16"
o Chiều rộng: 16
o
Poly: 0x8005
o Init: 0x0000
o RefIn: True
o RefOut: True
o XorOut: 0x0000
o Kiểm tra: 0xBB3D
Chức năng này xác định một CRC 16-bit với đa thức 0x8005, phản ánh đầu
vào và phản ánh sản lượng.
Các dữ liệu mờ (Opaque Data) trong mỗi định danh đối tượng phải là duy
nhất cho mỗi đơn vị nhất định.
Các định dạng của định danh đối tượng là nhị phân, có khi là mã hóa base64.
18
4. Thao tác dữ liệu trong dịch vụ đám mây
4.1. Các thành phần trong dịch vụ đám mây
Về cơ bản, “điện toán đám mây” được chia ra thành 5 lớp riêng biệt, có tác
động qua lại lẫn nhau: lớp khách hàng, lớp ứng dụng, lớp nền tảng, lớp cơ sở hạ
tầng, lớp máy chủ.
4.2. Thao tác dữ liệu trong dịch vụ đám mây
4.2.1. Mô hình đối tượng cho CDMI
Hình 1.15: Mô hình giao diện CDMI
Trong điều khiển lưu trữ dữ liệu, chúng ta sẽ quan tâm đến đối tượng
container và các đối tượng dữ liệu. Trong mô hình khách hàng có thể thực hiện
lệnh PUT để lấy địa chỉ container và tạo ra một container mới với tên được chỉ
định. Một container được tạo ra, khách hàng có thể thực hiện lệnh PUT để tạo ra
một đối tượng dữ liệu URI. Lệnh GET tiếp theo sẽ lấy đố
i tượng dữ liệu thực tế và
giá trị của nó. Với mỗi giá trị khóa (key) của siêu dữ liệu yêu cầu trên đối tượng
dữ liệu PUT là loại nội dung. Với mỗi cặp khóa/giá trị khác có thể được sử dụng
19
để xác định các yêu cầu dữ liệu ở cấp độ đối tượng. CDMI xác định đối tượng
hàng đợi, trong đó các dữ liệu yêu cầu và lấy ra đều tuân theo hàng đợi.
4.2.2. Các lệnh điều khiển
a) Lấy dữ liệu nhà cung cấp dịch vụ
b) Tạo một container mới
c) Tạo một đối tượng trong container
d) Hiển thị danh sách nội dung của container
e) Đọc nội dung của đối tượng
f) Đọc giá trị của một đối tượng dữ liệu
g) Xóa một đối tượng dữ liệu
4.3. Bảo mật trong dịch vụ đám mây
Một trong những vấn đề then chốt khi xây dựng giải pháp tính toán đám mây
là thực hiện các máy ảo (virtual machines - VM), chúng chứa các ứng dụng then
chốt và dữ liệu nhạy cảm trong môi trường đám mây.
Một trong những công nghệ có khả năng hỗ trợ truy nhập đồng thời là các
mạng riêng ảo: VPN-IPsec và VPN-SSL cho phép truy nhập an toàn tin cậy và
hiện nay được sử dụng rất rộng rãi.
Một giải pháp công nghệ bảo mật được s
ử dụng trong điện toán đám mây là
IPN – Identify Private Network. IPN cho phép tạo ra vùng an toàn tin cậy mới
trong vùng không tin cậy hoặc tạo ra truy nhập mới đến vùng an toàn tin cậy, với
điều tiên quyết đối với việc thiết lập vùng tin cậy là khả năng xác thực.
Chương 2: Giới thiệu Điện toán đám mây iDragon
1. Mô hình điện toán đám mây iDragon
Nắm bắt xu hướng và nhu cầu sử dụng máy tính nối mạng ngày càng cao
tại Việt Nam, ngay từ năm 2008, Viện Công nghiệp phần mềm và nội dung số
Việt Nam đã bắt đầu dự án nghiên cứu - phát triển phần mềm ứng dụng cho máy
tính mạng, tích hợp ứng dụng phần mềm với việc cung cấp các dịch vụ nội dung
20
thông tin số và mô hình tính toán mạng mới để cung cấp các dịch vụ lưu trữ, trao
đổi và truy cập thông tin phục vụ các máy tính mạng, thay cho mô hình kết nối
truyền thống client – server các máy trạm mỏng / máy trạm đồ hoạ trước đây. Dự
án còn có tên gọi khác Rồng Thông minh Việt Nam (VietNam iDragon Project).
Viện Công nghiệp Phần mềm và Nội dung số Việt Nam là cơ quan nghiên
cứu phát triển mô hình Điện toán đám mây mang tên iDragon (gọi tắt là iDragon
Cloud). Thương hiệu iDragon đã đượ
c Viện Công nghiệp Phần mềm và Nội dung
số Việt Nam đăng ký tại Cục Sở hữu Trí tuệ - Bộ Khoa học Công nghệ (Giấy
chứng nhận Đăng ký nhãn hiệu số 154989 cấp ngày 23/11/2010). iDragon Cloud
cung cấp mô hình Điện toán Đám mây công cộng và Đám mây riêng cho các cơ
quan, tổ chức và doanh nghiệp sở hữu đám mây hữu hình giải quyết được các vấn
đề của người sử dụng về tính chủ
động, tính riêng tư, quyền sở hữu và tính bảo
mật cao.
Hình 2.1: Mô hình điện toán đám mây iDragon Cloud
Mô hình dịch vụ đám mây iDragon Cloud có các thành phần sau:
Máy tính đám mây CloudPC có các chức năng tự động cấu hình và truy cập
dịch vụ đám mây tương tự điện thoại di động.
Data Center
CloudBox
Cloud
Devices
Cloud
Box
CloudBox
Cloud
Box
Cloud
Box
CloudBox
Cloud
Box
Cloud
Box
CloudBox
Cloud
Devices
Cloud
Devices
Cloud
Devices
Cloud
Devices
Cloud
Devices
Cloud
Devices
Cloud
Devices
Cloud
Devices
21
Thiết bị kết nối mạng Cloud Box kết nối các CloudPC có tính năng tương tự
các trạm BTS kết nối các điện thoại di động.
Phương thức quản lý người dùng và cung cấp dịch vụ đám mây CloudData
tương tự hệ thống quản lý thuê bao di động (người dùng chỉ cần đăng nhập
vào máy tính đám mây CloudPC bằng UserID để truy cập các dịch vụ đ
ám
mây, không phụ thuộc vào địa chỉ IP gán cho CloudPC, tương tự như thuê
bao di động chỉ cần sử dụng số thuê bao khi truy cập các dịch vụ được cung
cấp, không phụ thuộc vào số định danh của điện thoại di động).
2. Cấu trúc kho lưu trữ dữ liệu iDragon Cloud
2.1. Dữ liệu iDragon Cloud
Dữ liệu được lưu trữ trên cloud với khuôn dạng theo chuẩn của iDragon Cloud
thì được gọi là “Dữ liệu iDragon Cloud” (gọi tắt là dữ liệu cloud). Dữ liệu Cloud
có cấu trúc được mô tả như sau:
Dữ liệu Cloud thực chất là một thư mục (hoặc một file nén) có tên được đặt
theo thời gian Unix tại thời điểm phát sinh dữ liệu (Như vậy tên của mỗi thư
mụ
c này là duy nhất và được dùng làm ID của dữ liệu).
Trong thư mục (nêu trên) chứa các file có tên trùng với tên thư mục nhưng có
phần mở rộng khác nhau.
2.2. Cấu trúc kho lưu trữ dữ liệu iDragon Cloud
“Dữ liệu Cloud” được lưu trữ trên iDragon Cloud theo dưới dạng cây thư mục
nhưng theo cấu trúc được định nghĩa trước. Một kho lưu trữ dữ liệu iDragon
Cloud bao gồm các thư mục sau:
“.content” : Là thư mục chứa các “dữ liệu Cloud”.
“.icons”: Là thư mục chứa các file icon (file ảnh icon) phục vụ cho việc
tr.nh diễn dữ liệu.
“.index”: Là thư mục chứa dữ liệu index (các file index) của b
ản thân kho
dữ liệu.
“.template”: chứa các file template phục vụ cho việc tạo lập “dữ liệu
Cloud”.
22
2.2.1. Thư mục “.content”
2.2.2. Thư mục “.icons”
2.2.3. Thư mục “.index”
2.2.4. Thư mục “.template”
3. Các dịch vụ nền tảng iDragon
3.1. Xây dựng hạ tầng mạng LAN và WAN theo công nghệ đám mây
Nền tảng iDragon Cloud cho phép triển khai một hạ tầng mạng LAN nhanh
chóng với chi phí hợp lý với đầy đủ các tính năng và dịch vụ để duy trì hoạt động
của một mạng nội bộ với độ bảo mật và an toàn cao.
3.2. Quản lý người dùng và các tài nguyên
Ngoài việc cung cấp một hạ tầng mạng đầy đủ, nền tảng iDragon Cloud còn cung
cấp khả năng quản lý người dùng và các tài nguyên, bao gồm
Quản lý người dùng tập trung dựa trên công nghệ LDAP: Người dùng chỉ
cần sử dụng một tài khoản duy nhất để sử dụng tất cả các dịch vụ khác như:
CloudPC, e-mail, VoIP
Kiểm soát ra vào mạng LAN và Internet: Cho phép kiểm soát việc truy
cập internet của từng ng
ười dùng như: kiểm soát việc truy cập các trang web
có nội dung xấu hoặc bị cấm, kiểm soát lưu lượng truy cập internet
Quản lý tài nguyên dùng chung: như máy in, máy quét.
4. Lưu trữ và truy xuất dữ liệu trong đám mây iDragon
Với các công ty, tổ chức có trang bị các máy chủ để lưu trữ dữ liệu, nền tảng
iDragon Cloud cung cấp các giải pháp lưu trữ và chia sẻ dữ liệu dựa trên công
nghệ điện toán đám mây, bao gồm: giải pháp quản lý dữ liệu người dùng tập trung
và quản lý dữ liệu và metadata tập trung.
23
4.1. Giải pháp kết nối mạng lưu trữ và trao đổi văn bản
Quản lý dữ liệu người dùng tập trung: trong nền tảng iDragon Cloud, dữ
liệu được tách riêng và độc lập với phần mềm. Toàn bộ dữ liệu của người dùng sẽ
được lưu trữ tập trung trên các máy chủ quản lý dữ liệu. Người dùng có thể thao
tác trực tiếp với dữ liệu trên máy chủ thông qua phần mềm CloudPC được cung
cấp bởi EC-Box.
4.2. Giải pháp quản lý dữ liệu và metadata tập trung
Có ba giải pháp quản lý dữ liệu và chuyển giao văn bản trên mạng với các
mức độ đầu tư và ưu, nhược điểm khác nhau.
4.2.1. Giải pháp quản lý dữ liệu và metadata tập trung
Văn bản điện tử và thông tin quản lý (metadata) sau khi được sao chụp từ các thiết
bị sao chụp được đưa vào lưu trữ tập trung trên máy chủ/trung tâm dữ liệu. Người
dùng được cấp quyền truy cập hệ thống văn bản điện tử qua mạng máy tính (mạng
chuyên dụng truyền dữ liệu dành riêng), từ các máy trạm nối mạng tới máy chủ.
4.2.2. Giải pháp quản lý phân tán dữ liệu, quản lý tập trung metadata
Trong giải pháp này, trong các mạng LAN đều thiết lập các máy chủ lưu trữ
dữ liệu văn bản điện tử (Content Server) được các máy trạm NetScan cung cấp (tài
liệu tại chỗ) và dữ liệu chuyển giao từ các máy chủ Content Server khác (tài liệu
bên ngoài gửi đến).
Các thông tin quản lý (Metadata) được sao lưu và lưu trữ tập trung trên một
máy chủ Master Content Server và có thể chia sẻ trong toàn bộ hệ thống.
4.2.3. Giải pháp quản lý phân tán dữ liệu, quản lý tập trung metadata và sao
lưu dữ liệu trên Data Center
Trong giải pháp này, ngoài các thiết bị Cloud Box, máy chủ Net Server được
triển khai như trong giải pháp quản lý dữ liệu phân tán, thông tin tập trung, còn
sử dụng trung tâm dữ liệu sao lưu và quản lý toàn bộ dữ liệu dự phòng.
24
Chương 3: Ứng dụng Điện toán đám mây iDragon cho thiết bị
di động
1. Các mô hình phát triển phần mềm dựa trên dữ liệu đám mây
1.1. Dịch vụ Web Amazon
1.2. Amazon EC2
1.3. Amazon SimpleDB
1.4. Amazon Simple Storage Service (S3)
1.5. Amazon CloudFront
1.6. Amazon Simple Queue Service
1.7. Amazon Elastic MapReduce
1.8. Google
1.9. SalesForce.com và Force.com
1.10. Microsoft
1.11. Drop Box
2. Môhìnhứngdụngdữliệuđámmâychothiếtbịdiđộng
Điện toán đám mây trên nền tảng thiết bị di động (Mobile Cloud computing -
MCC) đã tạo một làn sóng mới trong sự phát triển vượt bậc của thế giới di động. Điện
toán đám mây cho thiết bị di động là một khái niệm chỉ việc sử dụng kỹ thuật lưu trữ và
thao tác dữ liệu đám mây trên các thiết bị di động.
25
2.1. Cách thức làm việc của MCC
Hình 3.12: Mô hình kiến trúc của điện toán đám mây trên di động
Trong mô hình các dịch vụ thiết yếu trong điện toán đám mây di động máy khách
bao gồm:
- Sync: dịch vụ này đồng bộ hóa tất cả các trạng thái thay đổi trên điện thoại
di động hoặc các ứng dụng trên đám mây Server.
- Push: nó quản lý các trạng thái cập nhật khi bắt đầu gửi một thông báo từ
máy chủ đám mây. Việc cải tiến này không yêu cầu người dùng chủ động
kiể
m tra các thông tin mới.
- OfflineApp: đây là một dịch vụ thể hiện khả năng quản lý, tạo ra sự phối
hợp thông minh giữa các dịch vụ mức thấp như Sync và Push.
- Network:
quản lý các kênh thông tin liên lạc cần thiết để nhận được thông
báo quảng bá từ máy chủ, có khả năng tự động thiết lập kết nối thích hợp.
- Cơ sở dữ liệu: quản lý lưu trữ dữ liệu các ứng dụng của thiết bị di động,
tùy thuộc vào nền tảng sử dụng thiết bị lưu trữ tương ứng.
- InterAppBus: D
ịch vụ này cung cấp phối hợp ở mức độ thấp/thông tin liên
lạc giữa các ứng dụng được cài đặt trên thiết bị.
Trong mô hình các dịch vụ thiết yếu trong điện toán đám mây di động máy chủ
bao gồm: