Tải bản đầy đủ (.doc) (38 trang)

Tìm hiểu về một thuật toán cân bằng tải nhằm giảm thời gian đáp ứng dựa vào ngưỡng thời gian trên điện toán đám mây 1 (2)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.58 MB, 38 trang )

HỌC VIỆN KỸ THUẬT MẬT MÃ
KHOA AN TỒN THƠNG TIN
------

HỌC PHẦN

AN TỒN ĐIỆN TỐN ĐÁM MÂY
Tìm hiểu một thuật tốn cân bằng tải nhằm giảm thời gian đáp
ứng dựa vào ngưỡng thời gian trên điện toán đám mây
Giảng viên: ThS. Nguyễn Thị Thu Thuỷ
Nhóm sinh viên:

Hà Nội, 2021


MỤC LỤC
MỤC LỤC..............................................................................................................2
DANH MỤC HÌNH VẼ.........................................................................................4
LỜI MỞ ĐẦU........................................................................................................5
CHƯƠNG 1. TỔNG QUAN VỀ CÂN BẰNG TẢI TRÊN ĐIỆN TOÁN ĐÁM
MÂY...................................................................................................................................6
1.1

Tổng quan về điện toán đám mây.................................................................7

1.1.1 Lịch sử ra đời của điện toán đám mây.....................................................7
1.1.2 Khái niệm điện toán đám mây.................................................................8
1.1.3 Đặc điểm, tính chất cơ bản của điện tốn đám mây................................9
1.1.4 Các mơ hình triển khai...........................................................................10
1.1.5 Các mơ hình dịch vụ..............................................................................13
1.2



Tổng quan về cân bằng tải trên điện toán đám mây...................................15

1.2.1 Khái niệm cân bằng tải trên điện toán đám mây....................................15
1.2.2 Cân bằng tải trong điện toán đám mây..................................................15
1.2.3 Phân loại cân bằng tải............................................................................16
1.2.4 Đo lường trong cân bằng tải..................................................................18
1.2.5 Lợi ích khi sử dụng cân bằng tải............................................................18
1.2.6 Các thuật tốn cân bằng tải tiêu biểu.....................................................19
CHƯƠNG 2. THUẬT TỐN ĐỀ XUẤT......................................................21
2.1

Mơ hình hồi quy ARIMA.............................................................................21

2.1.1 Khái niệm ARIMA.................................................................................21
2.1.2 Mơ hình ARIMA....................................................................................21
2.2

Chuỗi thời gian...........................................................................................23

2.3

Quy trình dự báo thời gian đáp ứng bằng thuật toán ARIMA....................25

2.4

Lựa chọn tham số ARIMA(p,d,q)................................................................26

2



2.5

Dự báo........................................................................................................28
CHƯƠNG 3. MƠ HÌNH MƠ PHONG THUẬT TỐN ARIMA.................30

3.1

Mơi trường mô phỏng thực nghiệm............................................................30

3.2

Phần mềm SPSS..........................................................................................30

3.3

Thực nghiệm...............................................................................................31

3.3.1 Kiểm định tính dừng..............................................................................31
3.3.2 Xây dựng mơ hình ARIMA...................................................................33
TÀI LIỆU THAM KHẢO....................................................................................38

3


DANH MỤC HÌNH VẼ
Hình 1.1 Mơ hình điện tốn đám mây................................................................9
Hình 1.2 Các mơ hình triển khai.......................................................................11
Hình 1.3 Mơ hình đám mây riêng tư................................................................12
Hình 1.4 Mơ hình đám mây cơng cộng............................................................12

Hình 1.5 Mơ hình đám mây lai.........................................................................13
Hình 1.6 Mơ hình đám mây cơng cộng............................................................13
Hình 1.7 Mơ hình dịch vụ điện tốn đám mây.................................................14
Hình 1.8 Mơ hình dịch vụ cơ sở hạ tầng..........................................................14
Hình 1.9 Mơ hình dịch vụ nền tảng..................................................................15
Hình 1.10 Mơ hình dịch vụ ứng dụng..............................................................15
Hình 1.11 Mơ hình cân bằng tải trên điện tốn đám mây.................................16
Hình 1.12 Sơ đồ phân loại cân bằng tải............................................................17
Hình 1.13 Mơ hình thuật tốn Round Robin....................................................20
Hình 2.1 Tự tương quan ACF...........................................................................28
Hình 2.2 Tự tương quan riêng phần PACF.......................................................29
Hình 2.3 Dự báo...............................................................................................30
Hình 3.1 Phần mềm SPSS................................................................................31
Hình 3.2 Dữ liệu thống kê SPSS......................................................................32
Hình 3.3 Biến động doanh số của cửa hàng A..................................................33
Hình 3.4 Chuỗi dừng sau khi lấy sai phân bằng 1............................................34
Hình 3.5 Biểu đồ ACF......................................................................................35
Hình 3.6 Biểu đồ PACF....................................................................................35
Hình 3.7 Đặt điều kiện mơ hình ARIMA(1,1,1)...............................................36

4


Hình 3.8 Kết quả thống kê tiêu chuẩn mơ hình ARIMA(1,1,1)........................37
Hình 3.9 Đặt điều kiện mơ hình ARIMA(0,1,1)...............................................37
Hình 3.10 Bảng thống kê tiêu chuẩn ARIMA(0,1,1)........................................37
Hình 3.11 Dự báo những năm tiếp theo............................................................38
Hình 3.12 Biểu đồ dự báo................................................................................38

5



LỜI MỞ ĐẦU
Ngày nay, song song với sự bùng nổ mạnh mẽ của công nghệ thông tin và sự
phát triển của Internet tồn cầu là sự phát triển khơng ngừng của cơng nghệ điện tốn
đám mây. Nhằm nâng cao hiệu suất phục vụ của các dịch vụ điện toán đám mây, theo
các chuyên gia thì việc quản lý tài nguyên đối mặt với các vấn đề cơ bản bao gồm
phân bổ tài nguyên, đáp ứng tài nguyên, kết nối tới tài nguyên, khám phám tài nguyên
chưa sử dụng, ánh xạ các tài ngun tương ứng, mơ hình hóa tài ngun, cung cấp tài
nguyên và lập kế hoạch sử dụng các tài nguyên. Trong đó, việc lập kế hoạch cho sử
dụng tài nguyên dựa trên các kết nối theo thời gian, và thời gian đáp ứng của dịch vụ.
Từ đó ta có thể nghiên cứu thời gian đáp ứng để đưa ra giải pháp cho việc phân bố,
cân bằng tải của các tài nguyên. Đây là một trong những hướng nghiên cứu cịn nhiều
triển vọng giúp cho cơng nghệ đám mây ngày một hồn thiện và tiến bộ hơn.
Chính vì những lý do đó bài báo cáo này tập trung nghiên cứu tìm hiểu về một
thuật tốn cân bằng tải nhằm giảm thời gian đáp ứng dựa vào ngưỡng thời gian trên
điện toán đám mây với các nội dung như sau:
Chương 1. Tổng quan về cân bằng tải trên điện toán đám mây: Giới thiệu tổng
quan về điện toán đám mây và cơ chế cân bằng tải, mục tiêu của việc cân bằng tải trên
điện toán đám mây.
Chương 2. Đề xuất thuật toán: giới thiệu về thuật toán đề xuất dựa trên việc
tiếp thu và phát huy ý tưởng dự đoán trong chuỗi thời gian, sử dụng thuật toán
ARIMA để dự báo.
Chương 3. Mơ phỏng và dự báo thuật tốn

6


CHƯƠNG 1. TỔNG QUAN VỀ CÂN BẰNG TẢI TRÊN
ĐIỆN TOÁN ĐÁM MÂY

Trong chương này trình bày tổng quan về điện toán đám mây bao gồm lịch sử
ra đời, khái niệm, các mơ hình dịch vụ và các mơ hình triển khai trên điện tốn đám
mây và tìm hiểu bài tốn cân bằng tải trên điện toán đám mây.

1.1

Tổng quan về điện toán đám mây.

1.1.1 Lịch sử ra đời của điện toán đám mây
Khái niệm điện toán đám mây ra đời từ những năm 1950 khi máy chủ tính tốn
quy mơ lớn (large-scale mainframe computers) được triển khai tại một số cơ sở giáo
dục và tập đồn lớn. Tài ngun tính toán của các hệ thống máy chủ được truy cập từ
các máy khách cuối (thin client, terminal computers), từ đó ra đời khái niệm “chia sẻ
thời gian” (timesharing) đặc tả việc cho phép nhiều người sử dụng cùng chia sẻ đồng
thời một tài ngun tính tốn chung.
Trong những năm 1960-1990 xuất hiện luồng tư tưởng coi máy tính hay tài
nguyên cơng nghệ thơng tin có thể được tổ chức như hạ tầng dịch vụ cơng cộng
(public utility). Điện tốn đám mây hiện tại cung cấp tài ngun tính tốn dưới dạng
dịch vụ và tạo cảm giác cho người dùng về một nguồn cung ứng là vơ tận. Đặc tính
này có thể so sánh tới các đặc tính của ngành cơng nghiệp tiêu dùng dịch vụ công
cộng như điện và nước. Khi sử dụng điện hay nước người dùng không cần quan tâm
tài nguyên đến từ đâu, được xử lý, phân phối như thế nào, họ chỉ việc sử dụng dịch vụ
và trả tiền cho nhà cung cấp theo lượng tiêu dùng của mình.
Những năm 1990, các cơng ty viễn thơng từ chỗ cung ứng kênh truyền dữ liệu
điểm tới điểm (point-to-point data circuits) riêng biệt đã bắt đầu cung ứng các dịch vụ
mạng riêng ảo với giá thấp. Thay đổi này tạo tiền đề để các công ty viễn thông sử
dụng hạ tầng băng thông mạng hiệu quả hơn. Điện tốn đám mây mở rộng khái niệm
chia sẻ băng thơng mạng này qua việc cho phép chia sẻ cả tài nguyên máy chủ vật lý
bằng việc cung cấp các máy chủ ảo.


7


Amazon cung cấp nền tảng Amazon Web Services (AWS) vào năm 2006, đánh
dấu việc thương mại hóa điện tốn đám mây. Từ đầu năm 2008 Eucalyptus được giới
thiệu là nền tảng điện toán đám mây mã nguồn mở đầu tiên tương thích với API của
AWS. Tính tới thời điểm hiện tại đã có rất nhiều sản phẩm điện tốn đám mây ra đời
như Google App Engine, Microsoft Azure, Nimbus,..

1.1.2 Khái niệm điện toán đám mây
Hiện nay điện toán đám mây được rất nhiều tổ chức và cá nhân định nghĩa khác
nhau:
Theo Rajkumar Buyya: “ Điện toán đám mây là một loại hệ thống phân bố và
xử lý song song gồm các máy tính ảo kết nối với nhau và được cung cấp động cho
người dùng như một hoặc nhiều tài nguyên đồng nhất dựa trên sự thỏa thuận dịch vụ
giữa nhà cung cấp và người sử dụng.”
Theo Ian Foster: “ Điện tốn đám mây là một mơ hình điện tốn phân tán có
tính co giãn lớn mà hướng theo co giãn về mặt kinh tế, là nơi chứa các sức mạnh tính
tốn, kho lưu trữ, các nền tảng và các dịch vụ được trực quan, ảo hóa và co giãn linh
động, sẽ được phân phối theo nhu cầu cho các khách hàng bên ngồi thơng qua
Internet.”

Hình 1.1 Mơ hình điện toán đám mây

8


Theo Viện Tiêu chuẩn và Công nghệ (NIST): “ Điện tốn đám mây là một mơ
hình cho phép truy cập mạng thuận tiện, theo nhu cầu đến một kho tài ngun điện
tốn dùng chung, có thể định cấu hình: mạng, máy chủ, lưu trữ, ứng dụng, …có thể

được cung cấp và thu hồi một cách nhanh chóng với yêu cầu tối thiểu về quản lý hoặc
can thiệp của nhà cung cấp dịch vụ”. Mơ hình đám mây thúc đẩy tính sẵn sàng và bao
gồm 5 đặc tính cơ bản, 3 mơ hình dịch vụ và 4 mơ hình triển khai.

1.1.3 Đặc điểm, tính chất cơ bản của điện tốn đám mây
Theo Viện Tiêu chuẩn và Cơng nghệ (NIST) điện tốn đám mây có năm đặc
điểm, tính chất cơ bản sau:
Tự phục vụ theo nhu cầu: Mỗi khi có nhu cầu, người dùng chỉ cần gửi yêu cầu
thông qua trang web cung cấp dịch vụ, hệ thống của nhà cung cấp sẽ đáp ứng yêu cầu
của người dùng. Người dùng có thể tự phục vụ yêu cầu của mình như tăng thời gian
sử dụng server, tăng dung lượng lưu trữ, …mà không cần phải tương tác trực tiếp với
nhà cung cấp dịch vụ, mọi nhu cầu về dịch vụ đều được xử lý trên môi trường web
(Internet).
Truy xuất diện rộng: Điện tốn đám mây cung cấp các dịch vụ thơng qua mơi
trường Internet. Do đó người dùng có kết nối Internet là có thể sử dụng dịch vụ. Hơn
nữa, điện tốn đám mây ở dạng dịch vụ nên khơng địi hỏi khả năng xử lý cao ở phía
client, vì vậy người dùng có thể truy xuất bằng các thiết bị di động như điện thoại,
PDA, laptop… Với điện toán đám mây người dùng khơng cịn bị phụ thuộc vào vị trí
nữa, họ có thể truy xuất dịch vụ từ bất kỳ nơi nào, vào bất kỳ lúc nào miễn là có kết
nối Internet.
Dùng chung tài nguyên: Tài nguyên của nhà cung cấp dịch vụ được dùng
chung, phục vụ cho nhiều người dùng dựa trên mơ hình “multi-tetant”. Trong mơ hình
“multi-tetant” tài nguyên sẽ được phân phát động tùy theo nhu cầu của người dùng.
Khi nhu cầu của một khách hàng giảm xuống, thì phần tài nguyên dư thừa sẽ được tận
dụng để phục vụ cho một khách hàng khác.
Khả năng co giãn: Đây là tính chất đặc biệt nhất, nổi bật nhất và quan trọng
nhất của điện tốn đám mây. Đó là khả năng tự động mở rộng hoặc thu nhỏ hệ thống

9



tùy theo nhu cầu của người dùng. Khi nhu cầu tăng cao, hệ thống sẽ tự mở rộng bằng
cách thêm tài nguyên vào. Khi nhu cầu giảm xuống, hệ thống sẽ giảm bớt tài nguyên.
Khả năng co giãn giúp cho nhà cung cấp sử dụng tài nguyên hiệu quả, tận dụng triệt
để tài nguyên dư thừa, phục vụ được nhiều khách hàng. Đối với người sử dụng dịch,
vụ khả năng co giãn giúp họ giảm chi phí do họ chỉ trả phí cho những tài nguyên thực
sử dụng.
Điều tiết dịch vụ: Hệ thống điện toán đám mây tự động kiểm sốt và tối ưu hóa
việc sử dụng tài ngun (dung lượng lưu trữ, đơn vị xử lý,…). Lượng tài nguyên sử
dụng được theo dõi, kiểm soát và báo cáo một cách minh bạch cho cả hai phía nhà
cung cấp dịch vụ và người sử dụng.

1.1.4 Các mơ hình triển khai
Các mơ hình triển khai điện tốn đám mây được chia thành bốn loại chính:

Hình 1.2 Các mơ hình triển khai
Đám mây riêng tư (Private cloud): là các dịch vụ điện tốn đám mây được
cung cấp trong các cơng ty, doanh nghiệp và được các cơng ty, doanh nghiệp đó trực
tiếp vận hành và quản lý. Đây là xu hướng tất yếu cho các cơng ty, doanh nghiệp
nhằm tối ưu hóa hạ tầng công nghệ thông tin của họ. Đối tượng sử dụng là nội bộ của
cơng ty, doanh nghiệp đó được bảo vệ sau tường lửa.

10


Hình 1.3 Mơ hình đám mây riêng tư
Đám mây cơng cộng (Public cloud): là các dịch vụ điện toán đám mây được
cung cấp bởi các cá nhân, tổ chức, doanh nghiệp cung cấp dịch vụ CNTT, nhằm phục
vụ cho mục đích cơng cộng. Người sử dụng phải đăng ký với nhà cung cấp dịch vụ để
được sử dụng dịch vụ đó (có thể miễn phí hoặc tính phí) theo từng chính sách của nhà

cung cấp. Đám mây cộng đồng đang là mơ hình triển khai phổ biến hiện nay. Khác với
đám mây riêng tư, đối tượng sử dụng là tất cả các cá nhân, tổ chức, doanh nghiệp bên
ngoài kết nối thơng qua Internet.

Hình 1.4 Mơ hình đám mây cơng cộng
Đám mây lai (Hybrid cloud): là sự kết hợp của đám mây riêng tư và đám mây
cơng cộng. Nó liên kết đám mây riêng tư và đám mây công cộng qua một hệ thống mã
hóa để đảm bảo sự linh động cho việc chuyển dữ liệu và sử dụng các ứng dụng. Mơ
hình triển khai đám mây này đối với doanh nghiệp, tổ chức có nhu cầu cần độ bảo mật
ở mức cao nhưng khơng muốn chịu mức phí của việc lưu trữ tất cả dữ liệu trên đám

11


mây riêng tư. Cho phép ta khai thác được điểm mạnh của từng mơ hình cũng như đưa
ra phương thức sử dụng tối ưu cho người sử dụng.

Hình 1.5. Mơ hình đám mây lai
Đám mây cộng đồng (Community cloud): là sự kết hợp của nhiều công ty,
doanh nghiệp với nhau. Các doanh nghiệp sử dụng các dịch vụ ứng dụng của nhau để
phục vụ công việc. Đối tượng sử dụng là các doanh nghiệp tham gia mơ hình triển
khai này đều có thể sử dụng các dịch vụ của mơ hình này cung cấp.

Hình 1.6 Mơ hình đám mây cơng cộng

12


1.1.5 Các mơ hình dịch vụ
Có ba loại mơ hình dịch vụ về điện tốn đám mây:


Hình 1.7 Mơ hình dịch vụ điện toán đám mây
Dịch vụ cơ sở hạ tầng (IaaS): nhà cung cấp sẽ triển khai hạ tầng phần cứng
(máy ảo, network, vùng lưu trữ,...) trên các hệ thống phân tán và cung cấp như một
dịch vụ cho người dùng. Người dùng không thể biết thông tin hạ tầng thực tế bên
trong đám mây nhưng họ có tồn quyền quản lý và sử dụng tài nguyên mà họ được
cung cấp, cũng như yêu cầu mở rộng tài nguyên.Ví dụ: Amazon EC2/S3, Elastra (Beta
2.0 2/2009), Nirvanix, AppNexus

13


Hình 1.8 Mơ hình dịch vụ cơ sở hạ tầng
Dịch vụ nền tảng (PaaS): cung cấp cách thức, các tính năng cần thiết cho việc
xây dựng ứng dụng trên một nền tảng nào đó. Có 2 dạng hạ tầng được xây dựng phổ
biến là hạ tầng trao đổi thông tin ứng dụng (middleware) và nền tảng ứng dụng
(application server) với các cơng cụ ngơn ngữ lập trình nhất định để xây dựng ứng
dụng. Người dùng triển khai ứng dụng mà khơng cần quan tâm đến chi phí hay thơng
số phần cứng và phần mềm bên dưới. Ví dụ: Google App Engine, Openshilt,
Salesforce, Microsoft Azure,…

Hình 1.9 Mơ hình dịch vụ nền tảng
Dịch vụ ứng dụng (SaaS): nhà cung cấp tạo ra nhiều ứng dụng cơ bản, hoàn
chỉnh và triển khai chúng thành dịch vụ để đáp ứng nhu cầu của đại đa số người dùng.
Những nhà cung cấp SaaS có thể lưu trữ ứng dụng trên máy chủ của họ hoặc máy
khách hàng đã có tải ứng dụng xuống thiết bị. Người dùng chỉ việc sử dụng dịch vụ
mà không cần quan tâm gì đến người khác. Ví dụ: Dịch vụ email hay các ứng dụng
Zalo, Google Docs, Google Calendar, Google Translate của Google, SmallPDF,
OneDrive, Evernote, Facebook, Twitter,…


14


Hình 1.10 Mơ hình dịch vụ ứng dụng

1.2

Tổng quan về cân bằng tải trên điện toán đám mây.

1.2.1 Khái niệm cân bằng tải trên điện toán đám mây
Điện toán đám mây giúp chúng ta chia sẻ dữ liệu và cung cấp nhiều nguồn tài
nguyên cho người dùng. Người dùng chỉ cần chi trả cho những gì họ sử dụng, chính vì
thế điện tốn đám mây lưu trữ dữ liệu và phân phối tài nguyên trong một môi trường
mở. Cân bằng tải được xem là quá trình tìm ra các nút mạng bị quá tải và từ đó chuyển
sang các nút khác đang tải ít hoặc khơng tải. Trong mơi trường đám mây, cân bằng tải
đòi hỏi phân bố tại các tải đang hoạt động liên tục giữa tất cả các nút mạng.
Việc dự đoán và ước lượng được tải cần thiết là vô cùng quan trọng, cần
phải so sánh với tất cả các tải, tính ổn định tương đối của các hệ thống khác nhau, hiệu
suất làm việc của các hệ thống mục tiêu, tương tác giữa các nút và các cơng việc cần
làm để truyền đi trong q trình xây dựng một thuật toán cân bằng tải. Vấn đề quan
trọng nữa đó là lựa chọn các nút mà trong đó có nhiều loại khác nhau.

15


Hình 1.11 Mơ hình cân bằng tải trên điện tốn đám mây

1.2.2 Cân bằng tải trong điện toán đám mây
Điện tốn đám mây có thể có một trong hai mơi trường tĩnh hoặc động dựa vào
cách phát triển cấu hình các đám mây bởi các nhà cung cấp điện toán đám mây. Cân

bằng tải trong điện toán đám mây cung cấp một giải pháp hiệu quả cho các vấn đề
khác nhau về thiết lập và sử dụng trong môi trường điện toán đám mây. Cân bằng tải
phải cân nhắc đến hai nhiệm vụ chủ yếu, một là việc cung cấp tài nguyên hoặc phân
bổ nguồn lực, một vấn đề khác là lập lịch cơng việc trong mơi trường phân tán.
Trích lập dự phịng có hiệu quả các nguồn lực và lập kế hoạch các nguồn tài nguyên
cũng như nhiệm vụ để đảm bảo các tính chất sau: sẵn sàng tài nguyên khi có yêu cầu,
các nguồn tài nguyên thực hiện có hiệu quả trong điều kiện tải cao hoặc thấp, tiết
kiệm năng lượng khi điều kiện tải thấp,chi phí sử dụng tài nguyên thấp.

1.2.3 Phân loại cân bằng tải
Trong khi điện tốn đám mây đang phát triển nhanh chóng và khách hàng đang
đòi hỏi nhiều dịch vụ hơn và kết quả tốt hơn, cân bằng tải trên điện toán đám mây đã
trở thành một lĩnh vực nghiên cứu thú vị và quan trọng. Nhiều thuật toán đã được đề
xuất để cung cấp các cơ chế hiệu quả để gán các yêu cầu của khách hàng vào các nút
“đám mây”có sẵn. Thuật toán cân bằng tải được phân thành 2 loại là các thuật toán
tĩnh và các thuật toán động. Các thuật tốn cân bằng tải tĩnh khơng phụ thuộc vào tình
trạng hiện tại của hệ thống. Hệ thống thường được thiết lập sẵn. Mặt khác, các thuật

16


cân bằng tải động xem xét tình trạng trước và hiện tại của hệ thống trong khi xử lý cân
tải.

Hình 1.12 Sơ đồ phân loại cân bằng tải
Trong thuật toán cân bằng tải động lại được chia làm 2 loại: cân bằng tải phân
phối và cân bằng tải không phân phối. Các thuật toán cân bằng tải phân phối thực thi
tại tất cả các nút trong “đám mây” và các tài nguyên được chia sẻ giữa tất cả các nút.
Lợi ích của thuật tốn này là nếu có nhiều nút lỗi, nó sẽ khơng ảnh hưởng nhiều tới hệ
thống. Trong thuật tốn cân bằng tải khơng phân phối, việc thực hiện phân tải sẽ bởi

một nhóm máy ảo (VM). Lợi ích của thuật toán này là giảm chi phí và tài nguyên các
nút trong “đám mây”.


Thuật toán cân bằng tải tĩnh:

Các thuật toán cân bằng tải tĩnh chia lưu lượng thành các phần bằng nhau giữa
các máy chủ, hầu hết phù hợp với các môi trường đồng nhất và ổn định cao và có thể
tạo ra kết quả rất tốt trong các môi trường này. Tuy nhiên, chúng thường không linh
hoạt và không thể khớp với những thay đổi liên tục đối với các thuộc tính trong thời
gian thực hiện. Chúng chỉ định các nhiệm vụ cho các nút “đám mây” dựa trên khả
năng của nút “đám mây” đó để xử lý các yêu cầu mới. Quá trình này chỉ dựa trên kiến
thức về các thuộc tính và khả năng của các nút “đám mây”, bao gồm năng lực xử lý,
bộ nhớ và dung lượng lưu trữ, và hiệu suất đường truyền. Mặc dù chúng có thể nắm
trước thơng tin về hoạt động của đường truyền, các thuật toán tĩnh này thường không
xem xét các thay đổi liên tục của các thuộc tính này trong thời gian chạy cũng như đối
với sự thay đổi tải trong thời gian chạy.

17




Thuật toán cân bằng tải động:

Thuật toán cân bằng tải động linh hoạt hơn và có tính đến các loại thuộc tính
khác nhau về khả năng của nút trong hệ thống và băng thông mạng trước và ngay
trong thời gian chạy. Các thuật tốn này có thể thích ứng với những thay đổi và cung
cấp kết quả tốt hơn trong mơi trường khơng đồng nhất và linh động. Vì hầu hết các
thuật toán này dựa vào sự kết hợp của kiến thức dựa trên thông tin thu thập được trước

đây về các nút trong “đám mây” và các thuộc tính thời gian chạy được thu thập khi
các nút đã chọn xử lý các thành phần của tác vụ. Các thuật tốn này chỉ định các
nhiệm vụ và có thể tự động gán chúng cho các nút dựa trên các thuộc tính được thu
thập và tính tốn. Các thuật tốn như vậy đòi hỏi phải giám sát liên tục các nút và tiến
trình cơng việc và thường khó thực hiện hơn. Tuy nhiên, chúng là chính xác hơn và có
thể dẫn đến cân bằng tải hiệu quả hơn.

1.2.4 Đo lường trong cân bằng tải
Thơng lượng (Throughput): Được sử dụng để tính tốn tất cả các tác vụ mà đã
hồn tất thực thi. Nếu thơng lượng lớn thì hiệu suất làm việc của hệ thống sẽ được cải
thiện.
Dung sai lỗi (Fault Tolerance): Có nghĩa là hồi phục sau sự cố. Cân bằng tải
cần có kỹ thuật tính tốn ra dung sai lỗi tốt nhất.
Thời gian di dời (Migration Time): là tổng thời gian cần thiết để di dời các tác
vụ hay tài nguyên từ nốt này sang nốt khác. Thời gian này cần được tối thiểu hóa để
nâng cao hiệu suất làm việc của hệ thống.
Thời gian đáp ứng (Response Time): Là khoảng thời gian trung bình mà thuật
tốn cân bằng tải trả lời một tác vụ trong hệ thống. Thông số này cần được tối thiểu
hóa để nâng cao hiệu suất hệ thống.
Khả năng mở rộng (Scalability): Là khả năng của thuật tốn cân bằng tải, có
thể xử lý cùng lúc số lượng nốt nhất định trong hệ thống. Thông số này cần được cải
thiện để hệ thống đạt hiệu năng tốt hơn.

18


1.2.5 Lợi ích khi sử dụng cân bằng tải
Hiệu quả chi phí (Cost effectiveness): Cân bằng tải sẽ giúp hệ thống hoạt động
hiệu suất cao với chi phí thấp.
Tính sẵn sàng cao (High-availability): Trong khi hoạt động nhiều cloud server

cùng lúc, cân bằng tải sẽ tăng tính khả dụng tối đa. Ví dụ: nếu một server khơng phản
hồi, tải sẽ được các server back-end xử lý và phản hồi lại, do đó giữ cho các dịch vụ
khơng bị ảnh hưởng.
Bảo mật (Security): Toàn bộ các máy chủ ứng dụng, cơ sở dữ liệu trong một
mạng private cô lập làm tăng khả năng bảo mật của ứng dụng. Cùng với đó cân bằng
tải cung cấp việc quản lý tập trung các cấu hình SSL và hỗ trợ SSL Offload để giảm
tải CPU trên hệ thống máy chủ ứng dụng.
Khả năng mở rộng & tính linh hoạt (Scalability and flexibility): Kích thước
tổng thể của hệ thống có cân bằng tải sẽ thay đổi theo thời gian. Thuật toán sẽ giúp hệ
thống xử lý các vấn đề này. Chính vì vậy, thuật tốn cũng có tính linh hoạt và khả
năng mở rộng.
Tính ưu tiên (Priority): Sắp xếp ưu tiên các tác vụ hoặc các nguồn tài nguyên
cần phải xử lý trước. vì vậy, tác vụ nào có độ ưu tiên cao hơn sẽ có cơ hội được thực
thi trước.

1.2.6 Các thuật tốn cân bằng tải tiêu biểu


Thuật toán Round Robin

Thuật toán Round Robin là một trong những thuật toán đơn giản nhất dựa trên
thuyết lượng tử. Round Robin cố gắng phân phối tải đến các máy ảo (VM) theo thứ tự
vòng tròn luân phiên công bằng. Ý tưởng của Round Robin là tất cả các máy ảo (VM)
trong trung tâm dữ liệu (DC) đều nhận được tải như nhau theo thứ tự vòng trịn mà
khơng cần quan tâm đến năng lực xử lý của chúng khi phân phối tải. Điều này hiệu
quả đối với các trung tâm dữ liệu (DC) có tất cả các máy ảo (VM) có năng lực xử lý
như nhau. Cịn đối với các trung tâm dữ liệu (DC) có các máy ảo (VM) có năng lực xử
lý chênh lệch lớn thì lại khơng hiệu quả.

19



Hình 1.13 Mơ hình thuật tốn Round Robin



Thuật tốn Weighted Round-Robin

Thuật toán Weighted Round-Robin kế thừa ưu điểm phân phối vịng trịn ln
phiên của thuật tốn Round-Robin. Thuật tốn Weight Round-Robin phân bổ tải dựa
vào mức độ ưu tiên thông qua năng lực của mỗi máy ảo,mỗi máy ảo có trọng số ưu
tiên khác nhau. Các yêu cầu xử lý hay ứng dụng dịch vụ được phân phối đến máy ảo
theo thứ tự vịng trịn ln phiên. Ngồi ra nó còn kết hợp khả năng xử lý của từng
máy ảo dựa vào bảng trọng số có sẵn.Vì vậy mà máy ảo nào có năng lực xử lý mạnh
hơn sẽ được phân bổ nhiều tác vụ để xử lý hơn so với những máy ảo cịn lại. Nhờ có
cải tiến này mà thuật toán Weighted đã tốt hơn thuật toán Round- Robin và thực hiện
khá tốt trong trường hợp hệ thống có năng lực xử lý khơng đồng nhất. Nhờ vậy mà có
thể phân bổ máy ảo để xử lý tác vụ một cách tối ưu hơn, giúp cải thiện thời gian đáp
ứng trong hệ thống cân bằng tải.


Thuật toán Throttled

Trong thuật tốn này, trình cân bằng tải duy trì một bảng chỉ mục trạng thái của
các máy ảo (sẵn sàng hoặc bận). Khi có u cầu đến trình cân bằng tải quét bảng chỉ
mục từ trên xuống cho đến khi máy ảo (VM) sẵn sàng đầu tiên được tìm thấy hoặc
bảng chỉ mục được quét hoàn toàn. Máy ảo (VM) được tìm thấy sẽ nhận xử lý yêu

20



cầu đó. Nếu trình cân bằng tải khơng tìm thấy máy ảo (VM) phù hợp. Yêu cầu đó phải
đợi đến khi tìm máy ảo (VM) sẵn sàng kế tiếp.

2

CHƯƠNG 2. THUẬT TỐN ĐỀ XUẤT

Trong chương này trình bày về thuật toán được đề xuất về thuật toán cân bằng
tải dựa vào thời gian đáp ứng trên điện toán đám mây, và cách giải quyết vấn đề cân
bằng tải, cụ thể là sử dụng thuật toán dự báo ARIMA để dự báo thời gian đáp ứng,
từ đó đưa ra cách giải quyết phân phối tài ngun.
2.1

Mơ hình hồi quy ARIMA.
2.1.1 Khái niệm ARIMA

Là phương pháp dự báo yếu tố nghiên cứu một cách độc lập (dự báo theo chuỗi
thời gian). Bằng các thuật toán sử dụng độ trễ sẽ đưa ra mơ hình dự báo thích hợp. Ta
sử dụng kết hội tính tự hồi quy và trung bình trượt.

2.1.2 Mơ hình ARIMA
Dựa trên giả thuyết chuỗi dừng và phương sai sai số khơng đổi. Mơ hình sử
dụng đầu vào chính là những tín hiệu quá khứ của chuỗi được dự báo để dự báo nó.
Các tín hiệu đó bao gồm: chuỗi tự hồi quy AR (auto regression) và chuỗi trung bình
trượt MA (moving average). Hầu hết các chuỗi thời gian sẽ có xu hướng tăng hoặc
giảm theo thời gian, do đó yếu tố chuỗi dừng thường không đạt được. Trong trường
hợp chuỗi khơng dừng thì ta sẽ cần biến đổi sang chuỗi dừng bằng sai phân. Khi đó

21



tham số đặc trưng của mơ hình sẽ có thêm thành phần bậc của sai phân d và mơ hình
được đặc tả bởi 3 tham số ARIMA(p, d, q).
ARIMA model là viết tắt của cụm từ Autoregressive Intergrated Moving
Average. Mô hình sẽ biểu diễn phương trình hồi quy tuyến tính đa biến (multiple
linear regression) của các biến đầu vào (còn gọi là biến phụ thuộc trong thống kê) là 2
thành phần chính:
Auto regression: Kí hiệu là AR. Đây là thành phần tự hồi quy bao gồm tập hợp
các độ trễ của biến hiện tại. Độ trễ bậc p chính là giá trị lùi về quá khứ p bước thời
gian của chuỗi. Độ trễ dài hoặc ngắn trong quá trình AR phụ thuộc vào tham số trễ p.
Cụ thể, quá trình AR(p) của chuỗi xt được biểu diễn như bên dưới:

Moving average: Quá trình trung bình trượt được hiểu là quá trình dịch chuyển
hoặc thay đổi giá trị trung bình của chuổi theo thời gian. Do chuỗi của chúng ta được
giả định là dừng nên quá trình thay đổi trung bình dường như là một chuỗi nhiễu
trắng. Qúa trình moving average sẽ tìm mối liên hệ về mặt tuyến tính giữa các phần tử
ngẫu nhiên €t (stochastic term). Chuỗi này phải là một chuỗi nhiễu trắng thỏa mãn các
tính chất:

Vế (1) có nghĩa rằng kì vọng của chuỗi bằng 0 để đảm bảo chuỗi dừng khơng
có sự thay đổi về trung bình theo thời gian. Vế (2) là phương sai của chuỗi khơng đổi.
Do kì vọng và phương sai khơng đổi nên chúng ta gọi phân phối của nhiễu trắng là
phân phối xác định (identical distribution) và được kí hiệu là €t~WN(0,σ 2). Nhiễu
trắng là một thành phần ngẫu nhiên thể hiện cho yếu tố không thể dự báo của model
và khơng có tính quy luật. Qúa trình trung bình trượt được biểu diễn theo nhiễu trắng
như sau:

22



Qúa trình này có thể được biểu diễn theo dịch chuyển trễ - backshift operator
B như sau:

Intergrated: Là quá trình đồng tích hợp hoặc lấy sai phân. Yêu cầu chung của
các thuật toán trong time series là chuỗi phải đảm bảo tính dừng. Hầu hết các chuỗi
đều tăng hoặc giảm theo thời gian. Do đó yếu tố tương quan giữa chúng chưa chắc là
thực sự mà là do chúng cùng tương quan theo thời gian. Khi biến đổi sang chuỗi dừng,
các nhân tố ảnh hưởng thời gian được loại bỏ và chuỗi sẽ dễ dự báo hơn. Để tạo thành
chuỗi dừng, một phương pháp đơn giản nhất là chúng ta sẽ lấy sai phân. Một số chuỗi
tài chính cịn quy đổi sang logarit hoặc lợi suất. Bậc của sai phân để tạo thành chuỗi
dừng còn gọi là bậc của quá trình đồng tích hợp (order of intergration). Qúa trình sai
phân bậc của chuỗi được thực hiện như sau:
Sai phân bậc 1: I(1) = Δ(xt) = xt – xt-1
Sai phân bậc d: I(d) = Δd(xt) = Δ(Δ(…Δ(xt)))
Thông thường chuỗi sẽ dừng sau q trình đồng tích hợp I(0) hoặc I(1) . Rất ít
chuỗi chúng ta phải lấy tới sai phân bậc 2. Một số trường hợp chúng ta sẽ cần biến đổi
logarit hoặc căn bậc 2 để tạo thành chuỗi dừng. Phương trình hồi qui ARIMA(p, d, q)
có thể được biểu diễn dưới dạng:

Trong đó Δ(xt) là giá trị sai phân bậc d và €t là các chuỗi nhiễu trắng.
ARIMA là mơ hình kết hợp của 2 q trình tự hồi quy và trung bình trượt. Dữ
liệu trong quá khứ sẽ được sử dụng để dự báo dữ liệu trong tương lai. Trước khi huấn
luyện mơ hình, cần chuyển hóa chuỗi sang chuỗi dừng bằng cách lấy sai phân bậc 1

23


hoặc logarit. Ngồi ra mơ hình cũng cần tn thủ điều kiện ngặt về sai số khơng có
hiện tượng tự tương quan và phần dư là nhiễu trắng.

2.2 Chuỗi thời gian
Dự báo chuỗi thời gian là một lớp mơ hình quan trọng trong thống kê, kinh tế
lượng và machine learning. Sở dĩ chúng ta gọi lớp mơ hình này là chuỗi thời gian
(time series) là vì mơ hình được áp dụng trên các chuỗi đặc thù có yếu tố thời gian.
Một mơ hình chuỗi thời gian thường dự báo dựa trên giả định rằng các quy luật trong
quá khứ sẽ lặp lại ở tương lai. Do đó xây dựng mơ hình chuỗi thời gian là chúng ta
đang mơ hình hóa mối quan hệ trong quá khứ giữa biến độc lập (biến đầu vào) và biến
phụ thuộc (biến mục tiêu). Dựa vào mối quan hệ này để dự đoán giá trị trong tương lai
của biến phụ thuộc.
Do là dữ liệu chịu ảnh hưởng bởi tính chất thời gian nên chuỗi thời gian thường
xuất hiện những quy luật đặc trưng như : yếu tố chu kỳ, mùa vụ và yếu tố xu hướng.
Đây là những đặc trưng thường thấy và xuất hiện ở hầu hết các chuỗi thời gian.
Yếu tố chu kỳ, mùa vụ là những đặc tính lặp lại theo chu kỳ. Ví dụ như nhiệt độ
trung bình các tháng trong năm sẽ chịu ảnh hưởng bởi các mùa xuân, hạ, thu, đông.
Hay xuất nhập khẩu của một quốc gia thường có chu kỳ theo các quý.
Yếu tố xu hướng (trend) thể hiện đà tăng hoặc giảm của chuỗi trong tương lai.
Chẳng hạn như lạm phát là xu hướng chung của các nền kinh tế, do đó giá cả trung
bình của giỏ hàng hóa cơ sở hay cịn gọi là chỉ số CPI ln có xu hướng tăng và xu
hướng tăng này đại diện cho sự mất giá của đồng tiền
Các dự báo chuỗi thời gian có tính ứng dụng cao và được sử dụng rất nhiều lĩnh
vực như tài chính ngân hàng, chứng khoán, bảo hiểm, thương mại điện tử, marketing,
quản lý chính sách. Bên dưới là một số ứng dụng của dự báo chuỗi thời gian:
Dự báo nhu cầu thị trường để lập kết hoạch sản xuất kinh doanh cho hãng.
Dự báo lợi suất tài sản tài chính, tỷ giá, giá cả hàng hóa phái sinh để thực hiện
trading hiệu quả trong market risk.

24


Dự báo giá chứng khoán, các chuỗi lợi suất danh mục để quản trị danh mục đầu

tư.
Dự báo giá bitcoin, giá dầu mỏ, giá gas,…
Dự báo nhiệt độ, lượng mưa để lập kế hoạch sản xuất nông, lâm, ngư nghiệp.
Dự báo tác động của các nhân tố vĩ mô như lãi suất, cung tiền, đầu tư trực tiếp
nước ngoài, chi tiêu chính phủ, lạm phát,… tác động lên tăng trưởng GDP để điều
hành nền kinh tế.
Vai trò của chuỗi thời gian rất quan trọng đối với nền kinh tế và hoạt động của
doanh nghiệp nên trong machine learning và thống kê có những ngành học nghiên cứu
chuyên sâu về chuỗi thời gian như kinh tế lượng, định giá tài sản tài chính.
2.3

Quy trình dự báo thời gian đáp ứng bằng thuật toán ARIMA

ARIMA là thuật toán dựa trên thống kê, là thuật tốn tự hồi quy tích hợp trung
bình động (Auto Regression Integrated Moving Average), được phát triển từ mô hình
hồi quy ARMA (Auto Regression Moving Avera). Đây là mơ hình phát triển dựa trên
số liệu chuỗi thời gian đã biết và dự báo số liệu trong tương lai gần. Dữ liệu thời gian
thực hay chuỗi thời gian là một chuỗi các giá trị của một đại lượng nào đó được ghi
nhận là thời gian. Bất cứ dữ liệu chuỗi thời gian nào cũng được tạo ra bằng một quá
trình ngẫu nhiên. Các giá trị của chuỗi thời gian của đại lượng X được kí hiệu là X1,
X2, X3,..,Xt,…, Xn với X là giá trị của X tại thời điểm t.
Việc xác định mơ hình ARMA (hay cịn gọi là phương pháp Box-Jenkin) tức là
xác định p, d, q trong ARIMA(p,d,q), Do mơ hình Box-Jenkins chỉ mơ tả chuỗi dừng
hoặc những chuỗi đã sai phân hóa, nên mơ hình ARIMA(p,d,q) thể hiện những chuỗi
dữ liệu không dừng, đã được sai phân (ở đây, d chỉ mức độ sai phân).
Quy trình dự báo bằng mơ hình Arima:
1.

Xác nhận mơ hình thử nghiệm: Trước tiên, chúng ta cần nhận dạng mơ


hình thử nghiệm. Trong đó: d là bậc tích hợp và p,q sẽ được xác định bằng một hàm
số chuyên dụng, gọi là Correlogram. Mơ hình Arima có thể trình bày theo các dạng
khác nhau. Phương pháp xác định mơ hình thường được các nhà nghiên cứu thực hiện

25


×