Tải bản đầy đủ (.pdf) (93 trang)

Các cơ chế cân bằng giữa chất lượng dịch vụ và tiết kiệm năng lượng trong môi trường tính toán đám mây

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.7 MB, 93 trang )

MỤC LỤC
LỜI CAM ĐOAN ............................................................................................................ 4
DANH MỤC CÁC TỪ VIẾT TẮT VÀ THUẬT NGỮ ................................................. 5
DANH MỤC BẢNG BIỂU ............................................................................................. 7
DANH MỤC HÌNH VẼ .................................................................................................. 7
LỜI NÓI ĐẦU ............................................................................................................... 10
TÓM TẮT LUẬN VĂN ................................................................................................ 12
ABSTRACT .................................................................................................................. 13
GIỚI THIỆU ĐỀ TÀI .................................................................................................... 14
CHƢƠNG 1: LÝ THUYẾT TỔNG QUAN .................................................................. 15
1.1 Tổng quan về trung tâm dữ liệu ................................................................... 15
1.1.1 Mô hình trung tâm dữ liệu............................................................. 15
1.1.2 Mô hình trung tâm dữ liệu xanh .................................................... 18
1.2 Lƣu lƣợng trong mạng trung tâm dữ liệu ..................................................... 22
1.2.1 Đặc điểm chung của lƣu lƣợng trong trung tâm dữ liệu ............... 22
1.3 Chất lƣợng dịch vụ (QoS) trong trung tâm dữ liệu ...................................... 24
1.3.1 Khái niệm chất lƣợng dịch vụ ....................................................... 24
1.3.2 Các tham số chính đặc trƣng cho QoS .......................................... 24
1.4 Kết luận chƣơng ........................................................................................... 24
CHƢƠNG 2: CÔNG NGHỆ OPENFLOW VÀ CÁC CÔNG CỤ THỰC HIỆN ......... 25
2.1 Công nghệ Openflow và các loại OpenFlow Switch ................................... 25
2.1.1 Công nghệ OpenFlow ................................................................... 25
2.1.2 Các ứng dụng của công nghệ Openflow ....................................... 27

1


2.2 NOX- Bộ điều khiển OpenFlow [7] ............................................................. 28
2.3 Mininet - Công cụ giả lập mạng(Network emulator) ................................... 30
2.4 Công cụ phát lƣu lƣợng D-ITG .................................................................... 31
2.5 Kết luận chƣơng ........................................................................................... 32


CHƢƠNG 3: TRIỂN KHAI TRONG MÔI TRƢỜNG THỬ NGHIỆM ...................... 33
3.1 Mô hình hệ thống ......................................................................................... 33
3.2 Môi trƣờng thử nghiệm 1: Mạng trung tâm dữ liệu xây dựng từ các công cụ
giả lập mạng từ bên thứ ba ................................................................................. 35
3.3 Môi trƣờng thử nghiệm 2 : Mạng trung tâm dữ liệu xây dựng từ công cụ tác
giả tự phát triển ................................................................................................... 40
3.4 Bộ phát lƣu lƣợng ......................................................................................... 43
3.5 Bộ Tối ƣu ...................................................................................................... 45
3.6 Kết luận chƣơng ........................................................................................... 47
CHƢƠNG 4: XÂY DỰNG KHỐI TỐI ƢU.................................................................. 48
4.1 Chức năng bộ tối ƣu trong mô hình triển khai ............................................. 48
4.2 Phƣơng pháp thực hiện bộ tối ƣu ................................................................. 49
4.2.1 Các thuật toán tối ƣu trƣớc đây ..................................................... 49
4.2.2 Quản lí thay đổi giá trị đƣờng liên kết .......................................... 59
4.2.3 Thuật toán Link State Adaptive .................................................... 60
4.3 Đánh giá kết quả sau khi thực hiện tối ƣu .................................................... 63
4.4 Kết luận ........................................................................................................ 67
CHƢƠNG 5: ĐÁNH GIÁ KẾT QUẢ VÀ HƢỚNG PHÁT TRIỂN TƢƠNG LAI ..... 68
5.1 Đánh giá kết quả thu đƣợc từ môi trƣờng thử nghiệm thứ nhất ................... 68
5.1.1 Mô hình Fattree k = 4 .................................................................... 69

2


5.1.2 Mô hình Fattree k = 8 .................................................................... 75
5.2 Đánh giá kết quả thu đƣợc từ môi trƣờng thử nghiệm thứ hai ..................... 79
5.3 Định lý so sánh hai thuật toán TAH và RA-TAH ........................................ 82
5.4 Hƣớng phát triển trong tƣơng lai .................................................................. 89
KẾT LUẬN ................................................................................................................... 90
TÀI LIỆU THAM KHẢO ............................................................................................. 91


3


LỜI CAM ĐOAN
Tôi xin cam đoan Luận văn thạc sỹ Kỹ thuật này do tôi nghiên cứu và dƣới sự
hƣớng dẫn khoa học của PGS.TS Phạm Minh Hà và PGS.TS Nguyễn Hữu Thanh. Các
kết quả do tôi nghiên cứu và tham khảo từ các nguồn tài liệu cũng nhƣ các công trình
khoa học khác đƣợc trích dẫn đầy đủ.
Nếu có vấn đề sai phạm về bản quyền tôi xin chịu hoàn toàn trách nhiệm với
nhà trƣờng.

4


DANH MỤC CÁC TỪ VIẾT TẮT VÀ THUẬT NGỮ
Từ viết tắt

Ý nghĩa

Thuật ngữ tiếng anh

Agg

Aggregation

Tích hợp

API


Application Programming Interface

Giao diện lập trình ứng dụng

CDF

Cumulative Distribution Function

Hàm phân phối tích lũy

Core

Lõi

Cooling

Hệ thống làm mát

Distributed Internet Traffic Generator

Bộ phát lƣu lƣợng Internet phân

D-ITG

tán

IETF

LSA


Data center

Trung tâm dữ liệu

Edge

Biên

Fat-Tree

Mô hình cây béo Fat-tree

Formal Model

Tên một thuật toán tối ƣu

Hierarchical Load Balancing

Cân bằng tải phân cấp

Internet Engineering Task Force

Tổ chức chuẩn hóa mở về Intenet

Link

Đƣờng liên kết

Link State Adaptive


Thích ứng trạng thái đƣờng liên
kết

Lognormal

Một dạng phân bố trong mạng
trung tâm dữ liệu

MAC

Điều khiển truy nhập đƣờng

Media Access Control

truyền
OpenFlow

Một công nghệ mạng mở mới, cho
phép triển khai trên các thiết bị
mạng

Optimizer

Bộ tối ƣu

Power control

Điều khiển công suất

5



QoS

Quality of Service

Chất lƣợng dịch vụ

RA-TAH

Rate Adaptive - Topology Aware

Nhận thức đồ hình và thích ứng

Heuristic

động. Là sự kết hợp 2 thuật toán
Topology-Aware Heuristic (TAH)
và thuật toán Link State Adaptive
(LSA)

SSL

Sercure Sockets Layer

Lớp socket bảo mật

TAH

Topology aware Heuristic


Heuristic nhận thức đồ hình

Testbed

Môi trƣờng thử nghiệm

Traffic generator

Bộ phát lƣu lƣợng

Virtual Machines

Máy ảo

VMs

6


DANH MỤC BẢNG BIỂU
Bảng 1.1: Phân bố tiến trình đến trong các loại trung tâm dữ liệu ................................ 23
Bảng 2.1: Đặc trƣng cơ bản của D-ITG ........................................................................ 32
Bảng 3.1: Đặc điểm của các trung tâm dữ liệu vừa và nhỏ ........................................... 43
Bảng 4.1: Công suất tiêu thụ của switch [20]................................................................ 64
Bảng 4.2: Các giả thiết năng lƣợng tiêu thụ .................................................................. 65
Bảng 5.1: cấu hình chạy mô phỏng nhƣ sau .................................................................. 69
Bảng 5.2: Cho thấy PLR trung bình của hệ thống với các mức dự phòng khác nhau đối
với từng mô hình lƣu lƣợng ........................................................................................... 74
Bảng 5.3: Số lƣợng thiết bị trong mạng khi k thay đổi ................................................. 81

Bảng 5.4: Bảng so sánh phần trăm năng lƣợng tiết kiệm đƣợc khi chƣaáp dụng thuật
toán LSA và sau khi đã áp dụng thuật toán LSA. ......................................................... 82

DANH MỤC HÌNH VẼ
Hình 1.1: Kiến trúc 3 tầng điển hình của mạng trung tâm dữ liệu ................................ 16
Hình 1.2: Kiến trúc cây 2N đặc trƣng của mạng trung tâm dữ liệu .............................. 17
Hình 1.3: Lƣợng CO2 từ các thành phần ICT[4] .......................................................... 18
Hình 1.4: Các thành phần tiêu thụ năng lƣợng trong trung tâm dữ liệu[4] ................... 19
Hình 1.5: Kiến trúc Fat-Tree cho mạng trung tâm dữ liệu với toàn bộ link 1G ........... 21
Hình 2.1: OpenFlow switch[6] ...................................................................................... 26
Hình 2.2: Mạng OpenFlow switch với bộ điều khiển mạng NOX [7] .......................... 29
Hình 3.1: Sơ đồ khối mô hình Elastic Tree ................................................................... 33
Hình 3.2: Mô hình xây dựng môi trƣờng thử nghiệm ................................................... 35
Hình 3.3: Kiến trúc vật lý thực tế của môi trƣờng thử nghiệm [1] ............................... 38
Hình 3.4: Kiến trúc mạng trung tâm dữ liệu trong môi trƣờng thử nghiệm.................. 39
Hình 3.5: Modul dùng để thực hiện đo đạc giữa độ sử dụng mạng và mức độ tiết kiệm
năng lƣợng ..................................................................................................................... 41

7


Hình 3.6: Sơ đồ thuật toán xử lí modul tính toán khảo sát mối liên hệ giữa độ sử dụng
mạng và mức độ tiết kiệm năng lƣợng .......................................................................... 42
Hình 3.7: Near Traffic – Lƣu lƣợng chỉ chảy qua các switch biên ............................... 44
Hình 3.8: Middle Traffic- Lƣu lƣợng chỉ chảy trong các pod ....................................... 44
Hình 3.9: Far Traffic- lƣu lƣợng chảy qua giữa các pod với nhau ................................ 45
Hình 3.10: Biểu đồ thể hiện thời gian tính toán tối ƣu đồ hình của các thuật toán [1] . 47
Hình 4.1: Hình vẽ mô tả giải pháp tiết kiệm năng lƣợng trong trung tâm dữ liệu. ....... 49
Hình 4.2: Mô hình lƣu lƣợng trong ví dụ 1 ................................................................... 57
Hình 4.3: Đồ hình tối ƣu với với mô hình lƣu lƣợng ví dụ 1 ........................................ 58

Hình 4.4: Mô hình lƣu lƣợng trong ví dụ 2 ................................................................... 58
Hình 4.5: Đồ hình tối ƣu với với mô hình lƣu lƣợng ví dụ 2 ........................................ 59
Hình 4.6: Sơ đồ mối quan hệ giữa bộ tối ƣu và bộ định tuyến, bộ điều khiển công suất
....................................................................................................................................... 61
Hình 4.7: Sơ đồ khối bộ tối ƣu ...................................................................................... 62
Hình 4.8: Sơ đồ thể hiện thành phần Link State Adaptive ............................................ 63
Hình 5.1: Giao diện hệ thống giả lập trung tâm dữ liệu ................................................ 68
Hình 5.2: Mô hình Fat-tree với hệ số đặc trƣng K = 4 .................................................. 70
Hình 5.3: Mức công suất tiêu thụ khi phát near traffic (k=4) ....................................... 70
Hình 5.4: Mức công suất tiêu thụ khi phát middle traffic (k=4) ................................... 71
Hình 5.5: Mức công suất tiêu thụ khi phát far traffic (k=4) .......................................... 72
Hình 5.6: Mức công suất tiêu thụ khi phát mix traffic (k=4) ........................................ 72
Hình 5.7: Mối quan hệ giữa công suất tiêu thụ của các trƣờng hợp near traffic, middle
traffic, far traffic và mix traffic (k=4) ........................................................................... 73
Hình 5.8: PLR trung bình của hệ thống với các mức dự phòng khác nhau đối với từng
mô hình lƣu lƣợng ( Fat-tree K =4 ) .............................................................................. 74
Hình 5.9: Mô hình Fat-tree với hệ số đặc trƣng k=8 ..................................................... 75
Hình 5.10: Mức công suất tiêu thụ khi phát near traffic (k=8) ..................................... 75
Hình 5.11: Mức công suất tiêu thụ khi phát middle traffic (k=8) ................................. 76
Hình 5.12: Mức công suất tiêu thụ khi phát far traffic (k=8) ........................................ 77

8


Hình 5.13: Mức công suất tiêu thụ khi phát mix traffic (k=8) ...................................... 77
Hình 5.14: Mối quan hệ giữa công suất tiêu thụ của các trƣờng hợp near traffic, middle
traffic, far traffic và mix traffic (k=8) ........................................................................... 78
Hình 5.15: Mô tả mối tƣơng quan giữa phần trăm độ sử dụng mạng và phần trăm tiết
kiệm năng lƣợng với mô hình Fat-tree K = 6 ................................................................ 79
Hình 5.16: Mô tả mối tƣơng quan giữa phần trăm độ sử dụng mạng và phần trăm tiết

kiệm năng lƣợng với mô hình Fat-tree K = 8 ................................................................ 80
Hình 5.17: Mô tả mối tƣơng quan giữa phần trăm độ sử dụng mạng và phần trăm tiết
kiệm năng lƣợng với mô hình Fat-tree K = 60 .............................................................. 80
Hình 5.18: Phần trăm năng lƣợng tiết kiệm dùng thuật toán RA-TAH và TAH trong
trƣờng hợp MST ............................................................................................................ 84
Hình 5.19: Phần trăm năng lƣợng tiết kiệm dùng thuật toán RA-TAH và TAH trong
trƣờng hợpmô hình fully meshed .................................................................................. 88
Hình 5.20: Hình so sánh độ trễ khi dùng RA-TAH và full Fat-Tree topology (mix
traffic) ............................................................................................................................ 89

9


LỜI NÓI ĐẦU
Cùng với sự bùng nổ của các ứng dụng công nghệ thông tin trên nền Internet và
sự ra đời của công nghệ điện toán đám mây, nhu cầu trao đổi thông tin cũng ngày càng
gia tăng. Để đáp ứng đƣợc nhu cầu lƣu lƣợng thông tin khổng lồ đó, các hệ thống
trung tâm dữ liệu đang phải mở rộng, đổi mới cả về quy mô cũng nhƣ kích thƣớc. Có
thể dẫn chứng các tập đoàn lớn nhƣ Google, Microsoft, Facebook…đang phải duy trì
hàng chục trung tâm dữ liệu phân bố khắp thế giới với hàng trăm ngàn server. Nhƣ
một hệ quả tất yếu, lƣợng năng lƣợng tiêu thụ trong các trung tâm dữ liệu gia tăng
chóng mặt.Việc giảm năng lƣợng tiêu thụ trong các trung tâm dữ liệu sẽ mang lại lợi
ích cho cảnhà đầu tƣ lẫn ngƣời dùng với chi phí dịch vụ giảm, không những thế giảm
năng lƣợng tiêu thụ còn mang lợi ích to lớn cho môi trƣờng với tác dụng giảm lƣợng
khí thải CO2. Nhiều giải pháp đã đƣợc đƣa ra để cải thiện hiệu quả hoạt động của các
thiết bị nhằm tiết kiệm năng lƣợng tiêu thụ trên các thiết bị đó. Ý tƣởng thực hiện xuất
phát từ thực tế tất cả thiết bị mạng luôn phải chạy 24/24 để sẵn sàng đáp ứng nhu cầu
lƣu lƣợng mức đỉnh nhƣng lƣu lƣợng trong các trung tâm dữ liệu thay đổi liên tục theo
thời gian và hầu hết các thời điểm lƣu lƣợng thực tế thấp hơn rất nhiều so với mức
đỉnh này, do đó một lƣợng năng lƣợng lớn đã bị lãng phí. Khai thác tính chất này, tác

giả thấy rằng năng lƣợng tiêu thụ trong trung tâm dữ liệu có thể đƣợc tiết kiệm đáng kể
khi linh động điều chỉnh số lƣợng thiết bị mạng và thay đổi các mức tốc độ cho đƣờng
liên kết theo nhu cầu lƣu lƣợng. Tuy nhi n, vấn đề tối ƣu năng lƣợng tiêu thụ của
mạng luôn song hành với việc đảm bảo độ tin cậy chất lƣợng dịch vụ QoS của hệ
thống. Việc điều khiển tắt/bật các Switch phải thích hợp để đảm bảo các thông số
packet loss, delay, jitter của hệ thống không quá mức cho ph p của các dịch vụ.
Sau một thời gian miệt mài nghiên cứu, tác giả đã hoàn thành luận văn với đề
tài: “Các cơ chế cân bằng giữa chất lƣợng dịch vụ và tiết kiệm năng lƣợng trong
môi trƣờng tính toán đám mây”. Nội dung của đề tài là đƣa ra giải pháp để có thể
vừa tối ƣu đƣợc năng lƣợng tiêu thụ trong mạng, vừa đảm bảo đƣợc chất lƣợng dịch
vụ. Từ đó thực hiện triển khai kiểm thử trên mô hình hệ thống trung tâm dữ liệu để
đƣa ra giải pháp tối ƣu để có thể áp dụng vào thực tiễn.
10


Kết quả là năng lƣợng có thể tiết kiệm khoảng hơn 35% với một mô hình trung
tâm dữ liệu nhỏ, 68% với mô hình trung tâm dữ liệu trung bình mà vẫn đảm bảo về
mặt chất lƣợng dịch vụ. Đây là một kết quả đầy hứa hẹn về tiềm năng phát triển của đề
tài. Tác giả hi vọng sẽ phát triển hoàn thiện hơn giải pháp trong đề tài để có thể áp
dụng vào thực tiễn.
Xin cảm ơn tập thể các bạn trong nhóm OpenFlow và lab C9-201 trƣớc kia đã
cùng mình nghiên cứu, chia sẻ, để có thể đem lại những kết quả khả quan này. Trong
quá trình thực hiện đề tài do sự hạn chế về thời gian nghiên cứu nên luận văn không
thể tránh khỏi thiếu sót. Sau khi đƣợc sự nhận xét từ cán bộ hƣớng dẫn và các Thầy Cô
trong hội đồng, tác giả sẽ cố gắng hoàn thiện để có thể đƣa ra một kết quả tốt nhất. Xin
chân thành cảm ơn PGS.TS Phạm Minh Hà và PGS.TS Nguyễn Hữu Thanh đã
hƣớng dẫn em thực hiện luận văn này.
Hà Nội, Tháng 1 năm 2015
Học viên
Trần Ngọc Thuần


11


TÓM TẮT LUẬN VĂN
Ngày nay, do nhu cầu trao đổi thông tin trong mạng ngày càng tăng l n n n các
trung tâm dữ liệu phải mở rộng liên tục cả về quy mô lẫn kích thƣớc, kéo theo việc
tiêu tốn một nguồn năng lƣợng khổng lồ, điều này làm tăng chi phí hoạt động của
trung tâm dữ liệu và ảnh hƣởng đến môi trƣờng do một lƣợng lớn khí carbon thải ra.
Hiện nay các trung tâm dữ liệu luôn trong trạng thái sử dụng tối đa các nguồn tài
nguy n mà không quan tâm đến nhu cầu lƣu lƣợng thật sự luôn thay đổi, điều này dẫn
đến hiệu quả sử dụng tài nguyên kém và có một lƣợng lớn năng lƣợng hao phí khi nhu
cầu lƣu lƣợng trong mạng ở mức thấp. Để khắc phục vấn đề này, các nguồn tài nguyên
mạng cần đƣợc quản lý để sử dụng năng lƣợng một cách hiệu quả hơn hƣớng tới mô
hình trung tâm dữ liệu xanh mà vẫn đảm bảo đƣợc chất lƣợng dịch vụ.
Trong luận văn này, tác giả và nhóm nghiên cứu đã đƣa ra các giải pháp tiết
kiệm năng lƣợng trong môi trƣờng tính toán đám mây. Vấn đề đặt ra là làm thế nào để
đƣa ra đƣợc cơ chế cân bằng giữa tiết kiệm năng lƣợng và chất lƣợng dịch vụ và
chứng minh đƣợc cơ chế đó hoạt động tốt với hệ thống thật. Mục đích chính của đề tài
đó là thực hiện một hệ thống có khả năng điều tiết đƣợc trạng thái hoạt động của
switch và trạng thái đƣờng liên kết để cho mô hình mạng tiêu thụ tiết kiệm năng lƣợng
nhất mà vẫn đảm bảo chất lƣợng dịch vụ ở ngƣỡng cho phép. Hệ thống đề xuất đƣợc
triển khai và đánh giá qua một hệ thống môi trƣờng thử nghiệm (Testbed) xây dựng từ
các Openflow switch tr n môi trƣờng giả lập Mininet. Thông qua việc sử dụng kỹ
thuật lƣu lƣợng kết hợp với tắt bật các thiết bị mạng và thay đổi mức đƣờng liên kết,
kết quả nghiên cứu cho thấy hệ thống đề xuất có khả năng tiết kiệm đƣợc tối đa từ
35,95% - 68,1% năng lƣợng tiêu thụ của mạng trung tâm dữ liệu.

12



ABSTRACT
Nowadays, to adapt to ever increasing traffic demand from customers, data
centers are continuously increasing their size and consume huge amounts of energy,
contributing to high operational costs and carbon footprints to the environment.
Generally, all the resources of a data center are always-on, regardless of the actual
time-varying traffic requirements, and this may result in lower resource utilization and
additional needless power consumption even when the traffic demand is not large
enough. To address this problem, data center resources need to be managed in an
energy-efficient manager to drive Green Data Center while maintainingthe quality
ofservice.
In this thesis ,authority and the subject group proposed a solutions to save
energy in cloud computing environments. The is sueis how to make the balance
mechanism between energy savings and quality of service and demonstrate the
mechanism that works well with the real system. The main purpose of the thesis is to
implemented a system capable of regulating the operation of the switch status and link
status for the network model to save energy consumption while maintaining quality of
services at less than the allowed threshold.We implemented and evaluated proposed
system on a prototype testbed built with programmable OpenFlow switches on
Mininet emulator. By using traffic engineering incorporating with turning ON/OFF
network devices, the results of my thesis shows that savings of 35,95-68,1% of the
network energy in data center is feasible.

13


GIỚI THIỆU ĐỀ TÀI
T n đề tài: “Các cơ chế cân bằng giữa chất lƣợng dịch vụ và tiết kiệm năng
lƣợng trong môi trƣờng tính toán đám mây.”
Mục tiêu:

-

Nghiên cứu tổng quan về trung tâm dữ liệu và đặc điểm lƣu lƣợng trong trung
tâm dữ liệu.

-

Đƣa ra giải pháp và cơ chế tiết kiệm năng lƣợng mà vẫn đảm bảo về mặt chất
lƣợng dịch vụ.
Nội dung chính:
Luận văn đƣợc chia thành 5 chƣơng:

-

Chƣơng 1: Đề cập đến lý thuyết tổng quan về kiến trúc của môi trƣờng tính
toán đám mây, mô hình lƣu lƣợng trong môi trƣờng tính toán đám mây, lý
thuyết về chất lƣợng dịch vụ.

-

Chƣơng 2: Giới thiệu về các công cụ, phần mềm đƣợc dùng để thực hiện luận
văn, chức năng chính và vai trò của chúng. Đặc biệt là giới thiệu về công nghệ
OpenFLow.

-

Chƣơng 3: Trình bày cấu trúc tổng quan của hệ thống giả lập môi trƣờng tính
toán đám mây cũng nhƣ các thành phần chức năng chính trong hệ thống đó, đƣa
ra các thuật toán tối ƣu, cũng nhƣ sơ lƣợc về cách thực hiện từng thành phần.
Đặc biệt hơn nữa, tác giả thực hiện xây dựng thêm một công cụ dùng tƣơng

đƣơng với môi trƣờng giả lập để có thể đánh giá về khả năng tiết kiệm của
mạng trung tâm dữ liệu với các hệ số đặc trƣng lớn.

-

Chƣơng 4: Đƣa ra thuật toán cân bằng giữa chất lƣợng dịch vụ và năng lƣợng
tiết kiệm. Trình bày chi tiết về bộ tối ƣu và cách thực hiện bộ tối ƣu.

-

Chƣơng 5: Kết luận, đánh giá và đƣa ra hƣớng phát triển của đề tài trong tƣơng
lai.

14


CHƢƠNG 1 : LÝ THUYẾT TỔNG QUAN
Chƣơng này trình bày cái nhìn tổng quan về mạng trung tâm dữ liệu, giới thiệu
các kiến trúc phổ biến và một số đặc điểm lƣu lƣợng trong mạng trung tâm dữ liệu.
Cuối chƣơng đề cập đến năng lƣợng tiêu thụ trong mạng trung tâm dữ liệu, mô hình
năng lƣợng tiêu thụ của switch và các thuật toán tiết kiệm năng lƣợng tiêu thụ trong
mạng trung tâm dữ liệu.
1.1 Tổng quan về trung tâm dữ liệu
Ngày nay, các tổ chức chính phủ và các tập đoàn lớn cần duy trì nhiều hệ thống
trung tâm dữ liệu khổng lồ với hàng trăm ngàn server. B n cạnh đó, các trung tâm dữ
liệu cỡ vừa và nhỏ với hàng trăm đến hàng ngàn server cũng ngày càng phổ biến trong
các cơ quan nhƣ trƣờng học, trung tâm nghiên cứu, các công ty… Một số ứng dụng
quan trọng cần thiết thiết sự có mặt của các trung tâm dữ liệu gồm có: phân tích tài
chính, phân tích số liệu khoa học, các dịch vụ mạng xã hội, trò chơi trực tuyến,…Khi
kích thƣớc trung tâm dữ liệu tăng l n, việc đáp ứng đƣợc nhu cầu băng thông trao đổi

giữa các server đặt ra một thách thức lớn đối với các kiến trúc mạng trung tâm dữ liệu
hiện tại, do chúng có tính mở rộng kém.Trong phần này, chúng ta sẽ tìm hiểu về một
số kiến trúc mạng trung tâm dữ liệu hiện đại và lựa chọn kiến trúc phù hợp nhất để
triển khai trong luận văn. Các nội dung của phần 1.1 này chủ yếu đƣợc trích dẫn từ bài
báo [2].
1.1.1 Mô hình trung tâm dữ liệu
Kiến trúc mạng trung tâm dữ liệu thƣờng đƣợc thiết kế dựa tr n phƣơng pháp
phân tầng để tăng khả năng mở rộng, tính linh động, hiệu năng và dễ dàng hơn trong
việc bảo dƣỡng. Ngày nay, các kiến trúc trung tâm dữ liệu đặc trƣng thƣờng có dạng
cây gồm 2 hoặc 3 tầng các switch/router.Hình 1 mô tả một đồ hình mạng trung tâm dữ
liệu 3 tầng điển hình hiện nay.

15


Hình 1.1: Kiến trúc 3 tầng điển hình của mạng trung tâm dữ liệu
Đồ hình mạng trung tâm dữ liệu ở trên gồm có 3 tầng: tầng core ở phần gốc của
cây chứa các core switch, tầng aggregation ở phần giữa chứa các aggreagation switch,
và cuối cùng là tầng edge ở mức lá của cây chứa các edge switch. Kiến trúc cây 2 tầng
thì chỉ có tầng core và tầng edge. Tuy nhiên kiến trúc cây 2 tầng chỉ hỗ trợ các trung
tâm dữ liệu có kích thƣớc tƣơng đối nhỏ và trung bình với khoảng 5000 đến 8000
server, do khả năng hạn chế của công nghệ switch hiện tại, sẽ đƣợc giải thích chi tiết ở
phần sau.
Ta xét một kiến trúc phổ biến nhất tính tới thời điển hiện nay là kiến trúc cây
2N. Đặc trƣng của kiến trúc cây 2N là mỗi phần tử tầng dƣới đều liên kết với 2 phần tử
tầng tr n để chống lỗi, tăng tính tin cậy. Tức là mỗi server sẽ liên kết với 2 edge
switch, mỗi edge switch sẽ liên kết với 2 aggregation switch, mỗi aggregation switch
sẽ liên kết với 2 core switch.

16



Hình 1.2: Kiến trúc cây 2N đặc trƣng của mạng trung tâm dữ liệu
Dễ dàng nhận thấy với đồ hình này, ngay cả khi sử dụng định tuyến đa đƣờng,
băng thông giao tiếp giữa các cặp server sẽ phụ thuộc vào khả năng của core switch do
băng thông tổng cộng của mạng sẽ do khả năng của core switch quyết định. Ví dụ 16
host cần giao tiếp theo cặp với nhau (giả sử các giao tiếp này đều phải đi qua core
switch) ở tốc độ tối đa 1Gbps, khi đó băng thông tổng cộng core switch cần xử lý sẽ là
8 Gbps và lƣợng băng thông tổng cộng này tỷ lệ với số lƣợng server. Do đó việc hỗ trợ
băng thông giao tiếp 1Gbps giữa các cặp server bất kỳ với đồ hình gồm hàng chục
ngàn server là không thể. Khi đó sẽ xảy ra hiện tƣợng thắt cổ chai (bottleneck) tại tầng
core. Ngoài ra, khả năng chống lỗi của kiến trúc cây 2N kém. Ví dụ, khi 1 core switch
lỗi, băng thông tổng cộng toàn mạng sẽ bị giảm đi một nửa, trong không cả hai core lỗi
sẽ làm đứt kết nối của toàn bộ mạng trung tâm dữ liệu. Tƣơng tự lỗi các switch ở tầng
aggregation và tầng edge có thể ảnh hƣởng đến ngắt kết nối của cả một số lƣợng lớn
các server.
Tóm lại khả năng mở rộng, khả năng chống lỗi và hỗ trợ các giao tiếp tốc độ
cao giữa các server đối với kiến trúc mạng trung tâm dữ liệu truyền thống là rất hạn
chế. Do đó, việc tìm ra các kiến trúc mới cho mạng trung tâm dữ liệu là một yêu cầu
cấp thiết.
17


1.1.2 Mô hình trung tâm dữ liệu xanh
Hiện nay, ngành công nghệ thông tin (CNTT) là một trong ngành có vai trò rất
quan trọng trong đời sống con ngƣời, góp phần đáng kể vào sự phát triển của nhân
loại. Tuy nhiên, bên cạnh đó, ngành CNTTcũng là một trong những nguyên nhân làm
tăng lƣợng CO2 trong bầu khí quyển bởi vì ngành này sử dụng hàng triệu máy tính,
hàng trăm ngàn trạm thu phát vô tuyến, các trung tâm dữ liệu với hệ thống làm mát,
các thiết bị mạng, server, cùng với hàng trăm triệu chiếc điện thoại di động đƣợc dùng

trên toàn cầu. Tất cả đều hoạt động 24/24 giờ, tiêu thụ năng lƣợng và toả nhiệt trong
quá trình hoạt động. Hệ quả là lƣợng CO2 thải ra bầu khí quyển từ hoạt động của
ngành ICT chiếm từ 2-2,5% trong tổng lƣợng CO2 trên toàn cầu, tƣơng đƣơng
tấn.

Hình 1.3: Lƣợng CO2 từ các thành phần ICT[4]
Hiệu ứng nhà kính đang làm trái đất nóng lên và gây ra những ảnh hƣởng
tiêu cực đến môi trƣờng toàn cầu, cùng với đó, giá nhi n liệu tăng, việc sử dụng lãng
phí điện năng trong các trung tâm dữ liệu đã đặt ra một yêu cầu cấp thiết đối với các
doanh nghiệp CNTT: tiêu thụ điện năng một cách hiệu quả và tiết kiệm. Theo dự đoán
của các chuy n gia, tƣơng lai sẽ thuộc về các doanh nghiệp nào biết áp dụng các hệ
thống CNTT có mức tiêu thụ năng lƣợng tiết kiệm nhất và thải ra ít khí độc hại môi
trƣờng nhất.

18


Vì vậy một trong những vấn đề nổi bật đang đƣợc nghiên cứu gần đây là tìm ra
giải pháp tiết kiệm nguồn năng lƣợng khổng lồ mà các trung tâm dữ liệu đang ti u thụ.
Đặc biệt thông qua nghiên cứu các kiến trúc đồ hình mới, các thuật toán tối ƣu đồ
hình, các thuật toán định tuyến nhận thức năng lƣợng.Thông thƣờng các trung tâm dữ
liệu đƣợc thiết kế có khả năng chịu tải trong cả những trƣờng hợp xấu nhất (tải tăng
l n đột ngột), và trong các giờ cao điểm có nhiều ngƣời dùng. Trong còn lại phần lớn
thời gian thì mức tải sử dụng thấp hơn mức đỉnh rất nhiều đặc biệt là sự khác biệt rất
lớn về lƣu lƣợng tải sử dụng giữa ngày và đ m. Lƣu lƣợng thƣờng lên mức đỉnh vào
ban ngày và hạ xuông rất thấp vào ban đ m. Khi lƣu lƣợng thấp các thiết bị mạng vẫn
đang ở trạng thái hoạt động, điều này gây ra tiêu tốn nhiều năng lƣợng không cần thiết
để chạy các thiết bị mà không có lƣu lƣợng chảy qua.Theo một nghiên cứu cho thấy
năng lƣợng tiêu thụ bởi các trung tâm dữ liệu ở mỹ năm 2006 khoảng 3 tỷ kWh. Đã có
nhiều nỗ lực chế tạo ra các thiết bị mạng nhận thức năng lƣợng , tức là các thiết bị này

tự chuyển sang trạng thái idle khi không có lƣu lƣợng để tiết kiệm năng lƣợng, nhƣng
năng lƣợng tiêu thụ chƣa giảm đi đáng kể đặc biệt tại thời điểm lƣu lƣợng thấp nhấp
vẫn tiêu thụ tới 90% so với mức đỉnh. Nguyên nhân do vẫn có phần lớn năng lƣợng
phải tiêu thụ cho các thiết bị khác nhƣ hệ thống làm lạnh server, line-cards.

Hình 1.4: Các thành phần tiêu thụ năng lƣợng trong trung tâm dữ liệu[4]

19


Trong hình vẽ trên có thể thấy năng lƣợng tiêu thụ của các thành phần trong
một trung tâm dữ liệu. Ví dụ nhƣ thiết bị làm mát chiếm 33% năng lƣợng tiêu thụ toàn
trung tâm dữ liệu, 18% là của USP, 9% là của máy tính và điều hòa, 5% là của PDU,
1% của máy phat điện và 1% của thành phần chiếu sang. Đặc biệt thành phần chiếm
khá lớn trong trung tâm mạng đó là các thiệt bị IT, chiếm tới 30% tiêu thụ năng lƣợng
toàn trung tâm. Do vậy việc cải thiện hiệu năng thành phần IT này cũng khá đƣợc quan
tâm.
Trung tâm dữ liệu xanh là gì
Trung tâm Dữ liệu Xanh (Green Datacenter) là một Trung tâm Dữ liệu mà trong
đó hệ thống đƣợc thiết kế sao cho hiệu suất hoạt động tối đa với mức tiêu thụ điện
năng thấp và hạn chế thấp nhất tính dƣ thừa gây lãng phí trong sử dụng, thân thiện môi
trƣờng, giảm thiểu chi phí vận hành và bảo trì hệ thống.
Bên cạnh đó, công nghệ xanh còn đem đến cho ngƣời lao động an toàn sức
khỏe trong điều kiện môi trƣờng làm việc tốt nhất; giúp doanh nghiệp nâng cao uy tín
và trách nhiệm với cộng đồng trƣớc áp lực về hịêu ứng nhà kính và bảo vệ môi trƣờng
sống ngày càng cao.
Kiến trúc Fat-Tree
Trong những năm gần đây, các nhà nghi n cứu đã nỗ lực tìm ra các đồ hình
kiến trúc mới cho mạng trung tâm dữ liệu, đáp ứng cả các yêu cầu về tính kinh tế lẫn
hiệu năng, và đã đạt đƣợc một số kết quả nhất định. Nổi bật trong số đó là kiến trúc

Fat-Tree cho mạng trung tâm dữ liệu. Ƣu điểm lớn nhất của kiến trúc này là nó sử
dụng các switch thông thƣờng giá thành rẻ ở tất cả các tầng, ngoài ra nó hỗ trợ giao
tiếp ở tốc độ tùy ý giữa các cặp server bất kỳ.
Đồ hình mạng trung tâm dữ liệu theo kiến trúc Fat-Tree nhƣ sau:

20


Hình 1.5: Kiến trúc Fat-Tree cho mạng trung tâm dữ liệu với toàn bộ link
1G
Hình 1.5 là đồ hình kiến trúc Fat-Tree cho mạng trung tâm dữ liệu với hệ số
k=4, còn gọi là kiến trúc Fat-Tree cấp 4. Nhƣ thấy trên hình vẽ, toàn bộ các switch sử
dụng ở 3 tầng core, aggregation, và tầng edge là giống nhau. Chúng đều là các switch
4-port 1 GigE. Các link sử dụng liên kết các server với switch, và liên kết các switch
với nhau đều là link 1G. Mỗi edge switch liên kết với 2 server và 2 aggregation switch,
mỗi aggregation switch liên kết với 2 edge switch và 2 core switch, mỗi core switch
liên kết với 4 aggregation switch. Đồ hình đƣợc tổ chức thành các nhóm aggregation
switch và edge switch đƣợc gọi là các pod. Cụ thể ở đây ta có 4 pod.
Ƣu điểm của kiến trúc Fat-Tree đó là chúng ta có thể sử dụng tất cả các switch
giống nhau, đều là các switch k-port 1GigE thông thƣờng với giá thành tƣơng đối rẻ.
Ngoài ra, kiến trúc Fat-Tree hỗ trợ các cặp server giao tiếp nhau ở tốc độ tối đa 1 Gbps
với bất kỳ mô hình lƣu lƣợng nào mà không bị hạn chế bởi khả năng của các core
switch hiệu năng cao đắt tiền trong các kiến trúc truyền thống. Thông thƣờng lƣu
lƣợng trao đổi giữa các server thuộc cùng 1 edge switch sẽ dùng kỹ thuật chuyển mạch
tầng 2 thông thƣờng, lƣu lƣợng trao đổi giữa các server thuộc các edge khác nhau sẽ
sử dụng định tuyến tầng 3.
21


Một đặc điểm quan trọng nữa của kiến trúc Fat-Tree đó là khả năng chống lỗi

đặc biệt là khi hệ số k tăng l n, đồ hình kết nối trở thành một hình lƣới ngày càng dày
đặc, tăng độ dƣ thừa, cũng có nghĩa là tính chống lỗi sẽ tăng l n. Lỗi của 1 hoặc 2
switch ở các tầng trên sẽ không thể cắt đứt giao tiếp của tất cả các server có đƣờng liên
kết với switch lỗi đó, tính dƣ thừa và chống lỗi tăng tỷ lệ với hệ số k, đặc biệt trong
thực tế, hệ số k thƣờng lớn.
Ta xét một ví dụ về kiến trúc Fat-Tree ở quy mô lớn xây dựng từ các switch 48port GigE. Khi đó, đồ hình gồm có 48 pod, mỗi pod chứa 48 switch loại này. Mỗi edge
switch liên kết với 24 server n n đồ hình Fat-Tree k=48 có khả năng hỗ trợ 27648
server với 1152 subnets (chính bằng số edge switch, các server trong giới hạn 1 subnet
sẽ giao tiếp qua phƣơng thức chuyển mạch tầng 2 . Chi phí để triển khai 1 mạng trung
tâm dữ liệu hỗ trợ 27648 server nhƣ vậy sẽ khoảng 8.64 triệu $, trong khi nếu dùng các
kiến trúc truyền thống nhƣ mi u tả ở phần trên sẽ tốn 37 triệu $.
Dựa vào các ƣu điểm của kiến trúc Fat-Tree trình bày ở trên kết hợp nhƣ hiệu
quả kinh tế cao, tăng hiệu năng và tính chống lỗi,… ngoài ra các công việc trong luận
văn liên quan rất nhiều đến bài báo [1], trong đó các tác giả cũng sử dụng kiến trúc
Fat-Tree nên nhóm quyết định sử dụng kiến trúc Fat-Tree để thực hiện các thực hiện
và đánh giá các thuật toán tối ƣu năng lƣợng tiêu thụ trong mạng trung tâm dữ liệu.
1.2 Lƣu lƣợng trong mạng trung tâm dữ liệu
1.2.1 Đặc điểm chung của lƣu lƣợng trong trung tâm dữ liệu
Mặc dù trung tâm dữ liệu ngày càng phổ biến và tăng l n về số lƣợng nhƣng có
rất ít các nghiên cứu về mô hình lƣu lƣợng trong trung tâm dữ liệu, các nghiên cứu chủ
yếu dựa trên theo dõi thực tế hoạt động, thống kê các thông số nhƣ hiệu quả sử dụng
link, tắc nghẽn, độ mất gói, kích thƣớc gói, thời gian tồn tại trung bình của luồng, các
thành phần của lƣu lƣợng, mô hình biến đổi lƣu lƣợng ngày đ m.Theo một số nghiên
cứu gần đây về mô hình lƣu lƣợng trong các mạng trung tâm dữ liệu đƣợc thực hiện
trên một loạt các trung tâm dữ liệu điện toán đám mây, doanh nghiệp và trong trƣờng

22


học [13, 14, 15] ta có thể rút ra những đặc điểm chung nhất cho lƣu lƣợng trong mạng

trung tâm dữ liệu nhƣ sau:
-

Khi nghiên cứu về các ứng dụng nhƣ web, lƣu trữ dữ liệu, dịch vụ xác nhận,
dịch vụ tìm kiếm thấy rằng các ứng dụng là không phân bố đều giữa các rack
(chứa các cụm server).

-

Kích thƣớc các flow < 10KB, phần lớn trong số flow đó chỉ kéo dài trong
khoảng vài trăm mili giây,số luồng đang hoạt động trong mỗi giây chảy qua 1
rack là khoảng 10000 luồng.

-

Trong các trung tâm dữ liệu điện toán đám mây, phần lớn lƣu lƣợng tao ra bởi
các server có 80% chỉ chảy trong rack. Đối với các trung tâm dữ liệu của trƣờng
đại học và doanh nghiệp phần lớn lƣu lƣợng (40-90%) rời khỏi rack và đi ra
ngoài.

-

Khả năng sử dụng link ở tầng core đạt hiểu quả cao hơn các tầng dƣới.

-

Có mất mát xảy ra trong trung tâm dữ liệu, nhƣng những mất mát này không
xẩy ra trong các link có hiệu năng sử dụng cao mà xảy ra trong các link có hiệu
năng sử dụng trung bình thấp có nghĩa là sự thay đổi lƣu lƣợng đột ngột dễ gây
ra mất mát. Nghiên cứu cho thấy mất mát xảy ra ở tầng edge switch là cao hơn

so với tầng aggregation và tầng core.
Bảng 1.1: Phân bố tiến trình đến trong các loại trung tâm dữ liệu
Loại trung tâm dữ

Phân phối

Phân phối

Phân phối thời gian

liệu

trong giai

trong giai

giữa hai lần đến

đoạn OFF

đoạn ON

Điện toán đám mây

Lognormal

Lognormal

Lognormal


Doanh nghiệp

Lognormal

Lognormal

Lognormal

Trƣờng học

Lognormal

Weilbull

Weibull

Phân bố của lƣu lƣợng trong các giai đoạn ON/OFF của các loại trung tâm dữ
liệu thể hiện trong bảng 1.1.
23


1.3 Chất lƣợng dịch vụ (QoS) trong trung tâm dữ liệu
1.3.1 Khái niệm chất lƣợng dịch vụ
Chất lƣợng dịch vụ (QoS) là gì? Chất lƣợng dịch vụ ảnh hƣởng bởi những
thông số nào? Chất lƣợng dịch vụ (QoS- Quality of Service) là một khái niệm rộng và
có thể tiếp cận theo nhiều hƣớng khác nhau. Theo khuyến nghị của Hiệp hội viễn
thông quốc tế ITU-T ( International Telecommunication Union) chất lƣợng dịch vụ là
tập hợp các khía cạnh của hiệu năng dịch vụ nhằm xác định cấp độ thỏa mãn của
ngƣời dùng đối với dịch vụ. Theo Tổ chức chuẩn hóa mở về Intenet IETF (Internet
Engineering Task Force) chất lƣợng dịch vụ là khả năng phân biệt luồng lƣu lƣợng để

mạng có các ứng xử phân biệt đối với các kiểu luồng lƣu lƣợng. QoS bao gồm cả việc
phân loại các dịch vụ và hiệu năng tổng thể của mạng cho mỗi loại dịch vụ.
1.3.2 Các tham số chính đặc trƣng cho QoS
Băng thông: là gía trị trung bình số lƣợng gói tin đƣợc truyền qua mạng thành
công trong một giây. Kí hiệu là kbps hoặc Mbps.
Trễ : là khoảng thời gian trung bình mà gói tin đƣợc truyền đi từ nới gửi đến nơi
nhận.
Biến thiên trễ : thời gian thay đổi giữa gói tin nhận đƣợc sớm nhất và muộn
nhất.
Tỷ lệ mất gói : là tỷ lệ phần trăm số gói tin bị mất trên tổng số toàn bộ số gói tin
phía đầu gửi đã chuyển vào mạng cho phía đầu nhận.
1.4 Kết luận chƣơng
Qua chƣơng này, chúng ta đã thu đƣợc các hiểu biết cơ bản về đồ hình và đặc
tính lƣu lƣợng trong trung tâm dữ liệu. Không những thế chúng ta còn phân tích đặc
tính biến đổi công suất tiêu thụ của switch theo các cấu hình khác nhau và dựa vào đó
hiểu đƣợc nguồn gốc và ý nghĩa của các thuật toán tiết kiệm năng lƣợng cơ bản trong
mạng trung tâm dữ liệu. Chƣơng tiếp theo sẽ trình bày về các công cụ, phần mềm đƣợc
sử dụng để thực hiện luận văn.

24


CHƢƠNG 2 : CÔNG NGHỆ OPENFLOW VÀ CÁC CÔNG CỤ THỰC
HIỆN
Chƣơng 2 trình bày về các công cụ đƣợc sử dụng để thực hiện luận văn. Trƣớc
hết là phần giới thiệu về công nghệ OpenFlow dùng để xây dựng các mạng ảo hóa
gồm các switch theo chuẩn OpenFlow và NOX-bộ điều khiển mạng của các OpenFlow
switch. Ngoài ra, chúng ta còn giới thiệu về Mininet-1 công cụ cho phép xây dựng môi
trƣờng giả lập gồm các OpenFlow switch. Cuối cùng là phần mềm D-ITG dùng làm bộ
tạo lƣu lƣợng.

2.1 Công nghệ Openflow và các loại OpenFlow Switch
2.1.1 Công nghệ OpenFlow
Hiện nay hầu nhƣ không có phƣơng pháp nào có tính thực tế để thử nghiệm,
kiểm chứng các giao thức mạng mới trong môi trƣờng thực tế với quy mô lƣu lƣợng
thật.Kết quả là hầu hết các ý tƣởng mới từ cộng đồng nghiên cứu không đƣợc thử
nghiệm và kiểm chứng. OpenFlow [5] là công cụ cho phép các nhà nghiên cứu chạy
các giao thức thử nghiệm trên hệ thống mạng mà ta sử dụng hàng ngày. OpenFlow dựa
trên nguyên tắc Ethernet switch, với một flow-table bên trong, và giao diện chuẩn hóa
để thêm, xóa các flow entries trong flow-table. Mục đích của việc đƣa ra OpenFlow
nhằm khuyến khích các nhà sản xuất thiết bị mạng thêm chức năng OpenFlow vào các
switch của họ để mang triển khai trong thực tế. OpenFlow đang đƣợc sử dụng rộng rãi
bởi nhiều nhà nghiên cứu, các viện nghiên cứu trên thế giới do nó có tính thực tế dựa
tr n các ƣu điểm: cho phép các nhà nghiên cứu chạy các thử nghiệm trên các switch
khác nhau theo cùng một cách nhƣ nhau, không cần cấu hình triển khai theo cấu hình
từng loại switch, hoạt động ở line-rate cùng với mật độ port lớn, hơn nữa các nhà sản
xuất vẫn có thể giữ bí mật về thiết kế các switch của họ. Ngoài việc cho phép các nhà
nghiên cứu đánh giá các ý tƣởng của họ trong môi trƣờng lƣu lƣợng thế giới thực,
OpenFlow còn là một công cụ hữu hiệu cho triển khai các testbed qui mô rộng nhƣ
GENI (Global Environment for Network Innovation, network/testbed gồm các tài
nguyên chung cho các nhà nghiên cứu, chia sẻ tài nguyên bằng phương pháp ảo hóa-

25


×