TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN ĐIỆN TỬ - VIỄN THÔNG
ĐỒ ÁN
TỐT NGHIỆP ĐẠI HỌC
Đề tài:
TỐI ƯU HÓA NĂNG LƯỢNG TRONG TRUNG
TÂM DỮ LIỆU SỬ DỤNG CÔNG NGHỆ
OPENFLOW
Sinh viên thực hiện : NGUYỄN VĂN GIANG
Lớp KSTN – ĐTVT – K52
Giảng viên hướng dẫn : PGS. TS NGUYỄN VĂN KHANG
Cán bộ phản biện :
Hà Nội, 06 – 2012
ĐỒ ÁN TỐT NGHIỆP | 2012 GVHD: PGS. TS. Nguyễn Văn Khang
Nguyễn Văn Giang – KSTN – ĐTVT – K52 2
ĐỒ ÁN TỐT NGHIỆP | 2012 GVHD: PGS. TS. Nguyễn Văn Khang
LỜI NÓI ĐẦU
Ngày nay công nghệ thông tin đang ngày càng phát triển rất mạnh mẽ.Nhu cầu lưu
lượng cũng như khối lượng dữ liệu cần được lưu trữ ngày càng tăng. Để có thể đáp
ứng điều này các trung tâm dữ liệu đang phải mở rộng cả về kích thước với việc
tăng số lượng máy chủ, các thiết bị mạng cũng như quy mô với nhiều trung tâm dữ
liệu phân bố khắp thế giới. Với việc mở rộng này, chi phí danh cho việc duy trì hoạt
động của các hệ thống trung tâm dữ liệu gia tăng chóng mặt bên cạnh đó là sự ảnh
hưởng xấu đến môi trường do lượng khí thải từ sự tiêu thụ năng lượng của các
thành phần trong trung tâm dữ liệu. Việc giảm năng lượng tiêu thụ trong các trung
tâm dữ liệu không chỉ giảm chi phí hoạt động đem lại lợi ích cho cả nhà đầu tư lẫn
người sử dụng mà còn mang lại lợi ích to lớn cho môi trường.
Nhiều giải pháp đã được đưa ra để cải thiện hiệu quả hoạt động của các thiết bị
phần cứng cũng như các giải pháp quản lý tài nguyên hiệu quả. Các hướng nghiên
cứu đáng chú ý gồm có: xây dựng kiến trúc máy chủ thông minh có công suất tiêu
thụ tỷ lệ với tải xử lý, hệ thống làm mát thông minh, tối ưu số lượng máy chủ đáp
ứng với nhu cầu lưu lượng, di chuyển máy ảo… Tuy nhiên hầu hết các nghiên cứu
đã thực hiện chỉ tập trung vào các thành phần làm mát và hệ thống máy chủ việc tối
ưu năng lượng hoạt động của thành phần mạng chưa dành được sự quan tâm đúng
mức. Trong đề tài nghiên cứu này, tác giả xây dựng một hệ thống quản lý các thiết
bị mạng thông minh với mục đích tiết kiệm năng lượng.
Đề tài tác giả thực hiện có tên là “Tối ưu hóa năng lượng trong trung tâm dữ liệu
sử dụng công nghệ Openflow”.Trong đề tài này tác giả phát triển một hệ thống
thông minh linh động duy trì số lượng tối thiểu các thiết bị mạng để đáp ứng với tải
dao động trong trung tâm dữ liệu, đồng thời phát triển thuật toán thích ứng trạng
thái đường liên kết (Link State Adaptation) cho phép thay mức tốc độ của đường
đường liên kết tùy thuộc vào lưu lượng chảy trong mạng. Kết quả thu được cho thấy
hệ thống đưa ra có thể tiết kiệm được khoảng 30% - 50% năng lượng tiêu thụ của
các thiết bị mạng so với việc để tất cả các thiết bị này ở trạng thái hoạt động liên tục
với dung lượng đường liên kết luôn ở mức tối đa. Đây là một kết quả hứa hẹn về
tiềm năng phát triển của đề tài.Tác giả hi vọng sẽ phát triển hoàn thiện hơn các giải
Nguyễn Văn Giang – KSTN – ĐTVT – K52 3
ĐỒ ÁN TỐT NGHIỆP | 2012 GVHD: PGS. TS. Nguyễn Văn Khang
pháp trong đề tài, triển khai trong môi trường Testbed thật từ đó có thể áp dụng
trong việc tư vấn thiết kế các mạng trung tâm dữ liệu xanh.
Trong quá trình thực hiện đề tài do sự hạn chế về nền tảng kiến thức, kinh nghiệm
nghiên cứu, cùng với hạn chế về mặt thời gian nên đồ án không thể tránh khỏi
những thiếu sót. Em rất mong thầy cô tham gia đóng góp phê bình để đồ án của em
được hoàn thiện hơn.
Xin trân trọng cảm ơn trường Đại học Bách khoa Hà Nội, Trung Tâm Đào Tạo Tài
Năng, Viện Điện Tử Viễn Thông trong suốt 5 năm qua đã dạy bảo và cung cấp cho
em những kiến thức nền tảng rất có ích phục vụ cho quá trình thực hiện đồ án cũng
như cuộc sống sau này.
Xin chân thành cảm ơn PGS.TS Nguyễn Văn Khang, người đã trực tiếp hướng
dẫn em thực hiện đồ án này, cùng PGS.TS Nguyễn Hữu Thanh, TS.Trương Thu
Hương đã dìu dắt, giúp đỡ và tận tình chỉ bảo em trong suốt thời gian thực hiện đồ
án.
Xin cảm ơn tập thể các bạn trong nhóm Green Network, phòng nghiên cứu C9 –
201 đã cùng mình nghiên cứu, chia sẻ trong suốt thời gian qua.
Cảm ơn tập thể lớp KSTN – ĐTVT – K52 suốt thời gian học tập cùng các bạn là
quãng thời gian không thể nào quên trong cuộc đời của mình.
Cuối cùng, xin gửi lời cảm ơn tới gia đình, bố mẹ, anh em, đã là nền tảng, là người
luôn theo sát, chăm sóc động viên cho con trong suốt cuộc đời này. Dù bất cứ khi
nào, thành quả của con đạt được không thể thiếu công ơn sinh thành và dạy dỗ của
gia đình.
Hà nội, tháng 06 năm 2012
Sinh viên
Nguyễn Văn Giang
Nguyễn Văn Giang – KSTN – ĐTVT – K52 4
ĐỒ ÁN TỐT NGHIỆP | 2012 GVHD: PGS. TS. Nguyễn Văn Khang
TÓM TẮT ĐỒ ÁN
Các trung tâm dữ liệu đang phát triển một cách nhanh chóng và ngày càng được mở
rộng để đáp ứng nhu cầu về lưu lượng do sự phát triển rộng rãi không ngừng của
mạng Internet. Hệ quả là các trung tâm dữ liệu tiêu thụ một lượng lớn điện năng và
thải ra rất nhiều khí thải nhà kính.Điều này trở thành mối quan tâm lớn đối với
những người chủ, những nhà quản lý các trung tâm dữ liệu và các nhà hoạch định
chính sách.Xu hướng hiện nay là xây dựng các trung tâm dữ liệu xanh với tiêu chí
tăng cường hiệu quả sử dụng năng lượng đồng thời giảm thiểu các tác động xấu tới
môi trường.
Vấn đề này đã thu hút được rất nhiều nghiên cứu bao gồm: thiết kế các hệ thống
làm mát thông minh, di chuyển máy ảo, tối ưu năng lượng tiêu thụ bởi các máy chủ
và thiết bị mạng Đề tài này tập trung nghiên cứu giải pháp tối ưu năng lượng tiêu
thụ bởi các thiết bị mạng bằng việc xây dựng một hệ thống điều khiển thông minh
linh động điều chỉnh số lượng các thiết bị mạng hoạt động tỷ lệ với tổng lưu lượng
đi qua trung tâm dữ liệu. Bằng cách tắt bật các switch khi lưu lượng thay đổi kết
hợp với việc giới hạn mức ngưỡng cho các link theo thuật toán dự đoán trước lưu
lượng thực tế, ta có thể tiết kiệm được đáng kể năng lượng tiêu thụ, đồng thời vẫn
đảm bảo được độ tin cậy của mạng. Kết quả thu được cho thấy hệ thống đưa ra có
thể tiết kiệm được khoảng 30% - 50% năng lượng tiêu thụ của các thiết bị mạng so
với việc để tất cả các thiết bị này ở trạng thái hoạt động liên tục với dung lượng
đường liên kết luôn ở mức tối đa.Hệ thống đề xuất được đánh giá bằng việc giả lập
mạng trung tâm dữ liệu với các kích thước khác nhau trong môi trường Mininet với
các switch hỗ trợ công nghệ Openflow và bộ điều khiển NOX.
Nguyễn Văn Giang – KSTN – ĐTVT – K52 5
ĐỒ ÁN TỐT NGHIỆP | 2012 GVHD: PGS. TS. Nguyễn Văn Khang
ABSTRACT
Global data center is growing rapidly to satisfy the tremendous traffic demand
driven by the exponential development and popularity of the Internet.
Consequently, data centers consume a huge amount of energy and emit a lot of
greenhouse gases. This has been a big concern for data center owners and managers
and for policy-makers. The societal and technological trends have increased focus
on building “green data centers” with the purpose to maximizeenergy efficiency and
to minimize negative environmental effects.
There are many researches that have addressed these issues including designing
smart coolingsystems, migrating VMs across physical machines, optimizing power
consumption of servers, optimizing power consumption of network components…
This project focuses on optimizing power consumption of network components by
designing an intelligent network control system that dynamically adjusts the set of
active network elements corresponding to the total traffic going through the data
center. By turning ON/OFF network devices incorporating with changing link
capacity by using the predictive traffic algorithm. The results of my thesis show that
savings of 30 – 50% of the network energy in data center when considering with all
network equipments that are active with maximum link capacity. We implemented
and evaluated the proposed system on a prototype testbed built with programable
Openflow switches controlled by NOX controller on Mininet emulator.
Nguyễn Văn Giang – KSTN – ĐTVT – K52 6
ĐỒ ÁN TỐT NGHIỆP | 2012 GVHD: PGS. TS. Nguyễn Văn Khang
MỤC LỤC
Nguyễn Văn Giang – KSTN – ĐTVT – K52 7
ĐỒ ÁN TỐT NGHIỆP | 2012 GVHD: PGS. TS. Nguyễn Văn Khang
Nguyễn Văn Giang – KSTN – ĐTVT – K52 8
ĐỒ ÁN TỐT NGHIỆP | 2012 GVHD: PGS. TS. Nguyễn Văn Khang
DANH SÁCH CÁC BẢNG BIỂU
Nguyễn Văn Giang – KSTN – ĐTVT – K52 9
ĐỒ ÁN TỐT NGHIỆP | 2012 GVHD: PGS. TS. Nguyễn Văn Khang
DANH SÁCH CÁC TỪ VIẾT TẮT
Viết tắt Tiếng Anh
Tiếng Việt
VMs Virtual Machines Máy ảo
QoS Quality of Service Chất lượng dịch vụ
Switch Chuyển mạch
Router Bộ định tuyến
Core Lõi
Aggregation Tích hợp
Edge Biên
NAT Network Address Translation Chuyển đổi địa chỉ mạng
IP Internet Protocol Giao thức Internet
SSL Secure Socket Layer
VLAN Virtual Local Arena Network Mạng cục bộ ảo
TLS Transport Layer Security
D-ITG Distributed Internet Traffic Generator Bộ phát lưu lượng
ECMP Equal Cost Multi Path Đa đường cân bằng tải
MAC Media Access Control Giao thức điều khiển truy nhập
PMAC Pseudo Media Address Control Địa chỉ MAC giả
IT Information Technology Công nghệ thông tin
LSA Link State Adaptation Thích ứng trạng thái đườnglink
EWMA
Exponential Weighted Moving Average
DC Data Center Trung tâm dữ liệu
Nguyễn Văn Giang – KSTN – ĐTVT – K52 10
ĐỒ ÁN TỐT NGHIỆP | 2012 GVHD: PGS. TS. Nguyễn Văn Khang
MỞ ĐẦU
Đặt vấn đề
Để đáp ứng nhu cầu lưu lượng đang ngày càng gia tăng một cách nhanh chóng, các
hệ thống trung tâm dữ liệu đang phải mở rộng cả về kích thước cũng như quy mô
với nhiều trung tâm dữ liệu phân bố khắp thế giới. Như một hệ quả tất yếu, chi phí
dành cho năng lượng đang gia tăng chóng mặt và là thành phần tăng nhanh nhất
trong số các chi phí để duy trì hoạt động của các trung tâm dữ liệu.Năng lượng ở
đây gồm các thành phần chính là năng lượng cho các thiết bị làm mát, năng lượng
cho server, và năng lượng cho các thiết bị mạng. Việc giảm năng lượng tiêu thụ của
các trung tâm dữ liệu sẽ dẫn đến giảm chi phí hoạt động giảm các tác động xấu đến
môi trường Nhiều giải pháp đã được đưa ra để cải thiện hiệu quả hoạt động của
các thiết bị phần cứng cũng như các giải pháp quản lý tài nguyên hiệu quả. Các
hướng nghiên cứu đáng chú ý gồm có: xây dựng kiến trúc máy chủ thông minh có
công suất tiêu thụ tỷ lệ với tải xử lý, hệ thống làm mát thông minh, tối ưu số lượng
máy chủ đáp ứng với nhu cầu lưu lượng, di chuyển máy ảo…Trong đề tài nghiên
cứu khoa học này, tác giả tập trung vào nghiên cứu giải pháp tiết kiệm năng lượng
cho các thành phần mạng trong trung tâm dữ liệu.
Mục đích chính nghiên cứu của đề tài là tối ưu hóa năng lượng trong trung tâm dữ
liệu thông qua các thuật toán tối ưu đồ hình mạng, tối ưu hóa băng thông, dung
lượng của đường liên kết, tiến hành bật tắt các switch trong mạng khi không cần
thiết dựa trên nền công nghệ Openflow.
Nguyễn Văn Giang – KSTN – ĐTVT – K52 11
ĐỒ ÁN TỐT NGHIỆP | 2012 GVHD: PGS. TS. Nguyễn Văn Khang
Hướng triển khai đề tài
Để thực hiện đề tài, trước tiên tác giả đi vào tìm hiểu các kiến trúc điển hình của
mạng trung tâm dữ liệu đặc biệt là các kiểu kiến trúc nâng cao như Fattree, Elastic
Tree, các mô hình lưu lượng trong trung tâm dữ liệu, đặc điểm lưu lượng trong các
trung tâm dữ liệu. Bước tiếp theo là nghiên cứu các thuật toán tối ưu phù hợp.Cuối
cùng đưa ra phương pháp thực hiện là: tiến hành tối ưu hóa đồ hình mạng dựa vào
lưu lượng chảy bên trong mạng, sau đó thay đổi dung lượng đường liên kết kết hợp
với chuyển các switch không cần thiết sang trạng thái ngủ hoặc tắt để tiết kiệm năng
lượng.
Hiện tại tác giả đã cùng với nhóm nghiên cứu tiếp tục phát triển hệ thống Testbed
mô phỏng dựa trên các công cụ giả lập mạng (Mininet), công cụ điều khiển các
switch Openflow NOX, bộ phát lưu lượng D-ITG trên nền tảng các switch hỗ trợ
công nghệ Openflow. Đóng góp chính của tác giả trong đề tài này là áp dụng thuật
toán thích ứng trạng thái đường liên kết (Link State Adaptive) thay đổi tốc độ
đường liên kết nhằm tiết kiệm năng lượng.
Cấu trúc của đồ án
Chương 1: Trình bày lý thuyết tổng quan về trung tâm dữ liệu các đặc điểm
của lưu lượng, mô hình lưu lượng trong các trung tâm dữ liệu và mô hinh
năng lượng tiêu thụ của swich. Cuối chương đề cập đến một số phương pháp
tiết kiệm năng lượng trong trung tâm dữ liệu.
Chương 2: Giới thiệu các công cụ, phần mềm được sử dụng để thực hiện đồ
án, chức năng chính và vai trò của chúng.
Chương 3: Trình bày tổng quan về mô hình hệ thống mô phỏng, các thành
phần chính trong hệ thống đó. Trình bày chi tiết về việc thực hiện khối tối
ưu, các thuật toán sử dụng trong khối tối ưu và đưa ra mô hình đánh gia năng
lượng tiêu thụ rong trung tâm dữ liệu.
Chương 4: Trình bày kết quả mô phỏng với các kích thước của trung tâm dữ
liệu khác nhau, đánh giá và so sánh kết quả đạt được với hệ thống trước đó,
cuối cùng đưa ra hướng phát triển của đề tài trong tương lai.
Nguyễn Văn Giang – KSTN – ĐTVT – K52 12
ĐỒ ÁN TỐT NGHIỆP | 2012 GVHD: PGS. TS. Nguyễn Văn Khang
Chương 1. TỔNG QUAN
Chương này trình bày cái nhìn tổng quan về mạng trung tâm dữ liệu, tầm quan
trọng của trung tâm dữ liệu, bên cạnh đó giới thiệu các kiến trúc phổ biến và một số
đặc điểm lưu lượng trong mạng trung tâm dữ liệu.Cuối chương đề cập các giải pháp
tiết kiệm năng lượng trong trung tâm dữ liệu.
1.1 Tầm quan trọng của trung tâm dữ liệu
Trung tâm dữ liệu là nơi đặt các hệ thống máy tính lớn và các thành phần
liên quan như hệ thống truyền dẫn và hệ thống lưu trữ. Trung tâm này được thiết kế
để đảm bảo độ sẵn sàng và an toàn cao nhất cho dữ liệu với các nguồn dự phòng,
kết nối dữ liệu dự phòng, các thiết bị kiểm soát môi trường (điều hòa không khí,
chống cháy) và các thiết bị an ninh bảo mật.
Hình 1.1Trung tâm dữ liệu
Nói một cách chung nhất, trung tâm dữ liệu được xây dựng nhằm đáp ứng nhu cầu
như sau:
Nguyễn Văn Giang – KSTN – ĐTVT – K52 13
ĐỒ ÁN TỐT NGHIỆP | 2012 GVHD: PGS. TS. Nguyễn Văn Khang
Khi doanh nghiệp ngày càng phát triển nhu cầu tập trung dữ liệu để quản lý
và cung cấp cho nhiều chi nhánh của công ty là yêu cầu vô cùng cần thiết.
Các dịch vụ trên Internet cần tập trung để xử lý một lượng thông tin cực lớn
yêu cầu cần có một hệ thống có đủ sức mạnh để xử lý và hệ thống Trung tâm
dữ liệu ra đời nhằm để đáp ứng các nhu cầu cần thiết đó.
Kinh tế cũng là vấn đề được đặt ra khi triển khai hệ thống Trung tâm dữ liệu
với chi phí rất lớn nhưng lại rất tiết kiệm chi phí quản lý và bảo dưỡng hệ
thống, và rẻ hơn rất nhiều khi gộp nhiều hệ thống để có được khả năng xử lý
của hệ thống Trung tâm dữ liệu
Các tính năng của Trung tâm dữ liệu gồm có:
Nơi tích hợp tất cả các công nghệ hàng đầu về mạng, hệ thống và phần mềm
ứng dụng được sử dụng trong hệ thống Trung tâm dữ liệu.
Mạng được thiết kế dành riêng đáp ứng yêu cầu cực cao về tốc độ truyền
giữa các thiết bị, tính ổn định được coi trọng và vấn đề bảo mật cho hệ thống
mạng được đặt lên hàng đầu. Được cấu hình tối ưu và hỗ trợ khi một kết nối
bị hỏng với một thiết bị thì thiết bị vẫn hoạt động bình thường với kết nối
luôn ở tốc độ cao.
Với hệ thống máy chủ có hiệu năng cực cao đáp ứng các ứng dụng chạy trên
nó với độ trễ nhỏ nhất, thời gian đáp ứng nhanh nhất, hỗ trợ nhiều ứng dụng
và cấu hình hoàn hảo giúp hệ thống chạy ổn định 24/7.
Các phần mềm hỗ trợ sử dụng tối đa hiệu năng của phần cứng, giúp liên kết
các máy chủ với Cluster tăng sức mạnh cho máy chủ và khả năng backup dữ
liệu khi có sự cố xảy ra chỉ trong một thời gian ngắn hệ thống có thể đi vào
hoạt động như bình thường và dữ liệu được bảo vệ không bị mất.
Nguyễn Văn Giang – KSTN – ĐTVT – K52 14
ĐỒ ÁN TỐT NGHIỆP | 2012 GVHD: PGS. TS. Nguyễn Văn Khang
Hình 1.2 Mô hình tổng quát của trung tâm dữ liệu
1.2 Kiến trúc mạng trung tâm dữ liệu
Hiện nay có rất nhiều trung tâm dữ liệu có tuổi thọ từ 10- 15 năm, đã trở nên
lỗi thời khó có thể đáp ứng được các nhu cầu hiện nay, hơn nữa các trung tâm này
còn tiêu tốn rất nhiều năng lượng cao hơn gấp 2-3 lần so với các thiết bị IT hiện nay
cần. Nhu cầu mở rộng và thay thế bởi các trung tâm dữ liệu mới là điều tất yếu, đặc
biệt hướng tới việc xây dựng các trung tâm dữ liệu xanh, có khả năng đáp ứng cao,
tiêu thụ ít năng lượng và thân thiện với môi trường.Các trung tâm dữ liệu cũ có kiến
trúc mạng hạn hẹp đang phải đối mặt với các vấn đề như khả năng mở rộng kém,
khó quản lý, khả năng kết nối kém và bị giới hạn trong việc di chuyển các máy
ảo.Các kiểu kiến trúc cũ thường ở dạng Tree (dạng 2N), có từ 2 đến 3 tầng định
tuyến và chuyển mạch. Một kiến trúc 3 tầng bao gồm: tầng core là gốc của cây, tầng
aggregation ở giữa và tầng edge là lá của cây. Kiến trúc 2 tầng sẽ chỉ có corevà
aggregation.Với kiến trúc này thường thì các chuyển mạch tầng dưới chỉ hội tụ vào
một chuyển mạch ở tầng trên và sẽ gây ra mất mát lớn nếu chuyển mạch tầng trên
gặp phải sự cố.
Hình 1.3 bên dưới là một kiểu kiến trúc điển hình của trung tâm dữ liệu hiện
nay.Kiến trúc này được xây dựng với các tủ rack chứa các server, các rack liên kết
Nguyễn Văn Giang – KSTN – ĐTVT – K52 15
ĐỒ ÁN TỐT NGHIỆP | 2012 GVHD: PGS. TS. Nguyễn Văn Khang
trực tiếp với các switch tầng dưới, các switch tầng dưới liên kết với các switch tầng
trên, tầng trên cùng liến kết với các core switch.
Hình 1.3Đồ hình của một trung tâm dữ liệu truyền thống
Để thay thế các kiến trúc cũ các nhà phát triển đã đưa ra rất nhiều các loại kiến trúc
khác nhau như Bcube [5], Dcell [4], VL2 [3], Fat-Tree [2]… đặt biệt là kiến trúc
Fat-Tree với các ưu điểm định tuyến chống lỗi tầng 2.5 sử dụng địa chỉ PMAC (địa
chỉ MAC giả), dạng topo đối xứng và cố định ứng với mỗi cấp nên dễ quản lý, có
khả năng truyền lưu lượng đầy hai chiều ( full bisection bandwith). Kiến trúc này
còn được nhiều nhà phát triển áp dụng để xây dựng nên kiến trúc Elastic Tree [1]
với mục đích tiết kiệm năng lượng tiêu thụ trong mạng trung tâm dữ liệu.
Hình 1.3 là một dạng của kiến trúc Fat-Tree.Kiến trúc này được xây dựng dựa trên
các switch k-port , thường nghiên cứu với kiến trúc 3-Stages Fat-Tree. Trong kiến
trúc có hỗ trợ kết nối giữa /4 host , sử dụng switchs k-port . Fat-Tree được chia ra
làm k pod mỗi pod có chứa host, số core switch là số aggregation switch bằng số
edge switch là /2. Các aggregation switch và edge switch nối với nhau tạo thành đồ
thị hai phía đầy đủ.
Nguyễn Văn Giang – KSTN – ĐTVT – K52 16
ĐỒ ÁN TỐT NGHIỆP | 2012 GVHD: PGS. TS. Nguyễn Văn Khang
Hình 1.4 Kiến trúc Fattree k = 4
Dựa vào các ưu điểm của kiến trúc Fat-Tree trình bày ở trên kết hợp như hiệu quả
kinh tế cao, tăng hiệu năng và tính chống lỗi… ngoài ra công việc trong đề tài liên
quan rất nhiều đến bài báo [1], trong đó các tác giả cũng sử dụng kiến trúc Fat-Tree
nên nhóm quyết định sử dụng kiến trúc Fat-Tree để thực hiện và đánh giá các thuật
toán tối ưu năng lượng tiêu thụ cũng như các thuật toán định tuyến trong mạng
trung tâm dữ liệu.
1.3 Đặc điểm lưu lượng trong trung tâm dữ liệu
Hiện nay đã có một số nghiên cứu về mô hình lưu lượng trong các mạng
trung tâm dữ liệu được thực hiện trên một loạt các trung tâm dữ liệu điện toán đám
mây, doanh nghiệp và trong trường học [6, 7, 8]. Từ các kết quả nghiên cứu này ta
có thể rút ra những đặc điểm chung cho lưu lượng trong mạng trung tâm dữ liệu
như sau:
1.3.1 Đặc điểm ở mức giao tiếp mạng
1.3.1.1 Các luồng lưu lượng
Gần 75% lưu lượng trong các trung tâm dữ liệu đám mây là chảy trong chính
rack mà nó được tạo ra. Điều này có thể lý giải là do trong các trung tâm dữ
liệu dạng đám mây đa phần là các dịch vụ Web phục vụ khách hàng và các
Nguyễn Văn Giang – KSTN – ĐTVT – K52 17
ĐỒ ÁN TỐT NGHIỆP | 2012 GVHD: PGS. TS. Nguyễn Văn Khang
dịch vụ này tạo ra rất nhiều chảy qua nhiều server trong trung tâm dữ liệu.
Để tránh cho việc 1 rack chứa nhiều ứng dụng/dịch vụ, chính các nhà quản
trị đã thực hiện việc đưa các thành phần phụ thuộc vào cùng 1 rack và tạo
nên kết quả này.
Đối với trung tâm dữ liệu trường đại học và trung tâm dữ liệu doanh nghiệp,
ít nhất 50% lưu lượng rời khỏi rack, khác hẳn so với mức 25% của các trung
tâm dữ liệu đám mây. Những trung tâm dữ liệu này chạy các ứng dụng phục
vụ người dùng như dịch vụ Web và server lưu trữ, có nhiều điểm tương tự
với các trung tâm dữ liệu đám mây, nhưng kết quả lại có sự khác biệt. Khả
năng có thể nghĩ đến chỉ đơn giản là do trong các trung tâm dữ liệu này, việc
tối ưu cho các dịch vụ phụ thuộc đã không được tốt như trong trung tâm dữ
liệu đám mây.
1.3.1.2 Hiệu suất sử dụng link
Hiệu suất sử dụng link được đánh giá từ các dữ liệu SNMP:
Hiệu suất sử dụng trong lớp core và aggregation cao hơn lớp edge, nhận xét
này đúng với tất cả các loại trung tâm dữ liệu.
Kết quả này là do số lượng link ở lớp core ít hơn số lượng link ở lớp edge và
dung lượng của link ở lớp core lớn hơn ở lớp aggregation và lớn hơn ở lớp
edge.
1.3.2 Đặc điểm ở mức giao tiếp ứng dụng
1.3.2.1 Mức độ flow
Số lượng active flow trong 1s tại mọi khoảng thời gian là nhỏ hơn 10,000.
2 đến 13% số flow có thời gian giữa hai lần đến nhỏ hơn 10 μs.
Đối với các switch trong trung tâm dữ liệu dạng trường đại học, 80% thời
gian inter-arrival nằm trong dải 4 đến 40ms.
80% flow nhỏ hơn 10KB.
Hầu hết các byte nằm trong 10% các luồng lớn.
Ta rút ra nhận xét về độ dài các flow trong trung tâm dữ liệu từ đồ thị: 80%
các flow có chiều dài ngắn hơn 11s.
Nguyễn Văn Giang – KSTN – ĐTVT – K52 18
ĐỒ ÁN TỐT NGHIỆP | 2012 GVHD: PGS. TS. Nguyễn Văn Khang
1.3.2.2 Mức độ packet
Để đánh giá ở mức độ packet, trước hết ta đánh giá đặc tính phụ thuộc thời
gian của các packet trace. Tiến trình đến của packet trong trung tâm dữ liệu được
biểu hiện theo các mẫu ON/OFF, việc xác định các các chu kì ON/OFF sẽ dựa trên
ngưỡng thời gian inter-arrival của packet. Đặt arrival
95
là giá trị mức 95% trong
phân bố thời gian inter-arrival tại 1 switch thành phần. Chúng ta xác định:
Chu kì ON là chu kì liên tục dài nhất mà trong đó các thời gian inter-arrival
nhỏ hơn arrival
Chu kì OFF là chu kì nằm giữa 2 chu kì ON.
Để xác định đặc tính các mẫu lưu lượng ON/OFF, chúng ta tập trung vào 3 vấn đề:
khoảng thời gian của chu kì ON, khoảng thời gian chu kì OFF và thời gian inter-
arrival giữa các packet trong cùng 1 chu kì ON. Các kết quả trong Bảng 1.1 thể hiện
phân bố cho các tham số của tiến trình tới tại các switch trong các trung tâm dữ liệu
khảo sát.
Bảng 1.1 Phân bố cho các tham số của tiến trình tới tại các switch
Loại trung tâm
dữ liệu
Phân bố chu kì OFF Phân bố chu kì ON Phán bố tỉ lệ
inter-arrival
PRV2
1
Lognormal Lognormal Lognormal
PRV2
2
Lognormal Lognormal Lognormal
PRV2
3
Lognormal Lognormal Lognormal
PRV2
4
Lognormal Lognormal Lognormal
EDU1 Lognormal Weibull Weibull
EDU2 Lognormal Weibull Weibull
EDU3 Lognormal Weibull Weibull
1.3.3 Đặc điểm lưu lượng trong trung tâm dữ liệu vừa và nhỏ
Sau khi thu thập và phân tích dữ liệu của lưu lượng trong các trung tâm dữ
liệu, chúng ta có thể đưa ra một mô hình lưu lượng phù hợp cho trung tâm dữ liệu
Nguyễn Văn Giang – KSTN – ĐTVT – K52 19
ĐỒ ÁN TỐT NGHIỆP | 2012 GVHD: PGS. TS. Nguyễn Văn Khang
vừa và nhỏ. Các đặc điểm của mô hình lưu lượng này được trình bày trong bảng
sau:
Bảng 1.2 Phân bố tiến trình đến trong các loại trung tâm dữ liệu
Loại trung tâm
dữ liệu
Phân phối trong
giai đoạn ON
Phân phối
trong giai đoạn
ON
Phân phối thời gian
giữa hai lần đến
Điện toán đám
mây
Lognormal Lognormal Lognormal
Doanh nghiệp Lognormal Lognormal Lognormal
Trường học Lognormal Weilbull Weibull
Bảng 1.3 Đặc điểm của các trung tâm dữ liệu vừa và nhỏ
Đặc điểm Trung tâm dữ liệu vừa và nhỏ
Hiệu suất sử dụng link Core>Edge>Aggregation
Tỷ lệ link đứt Aggregation>Edge>Core
Số lượng flow trong 1s ở
1 Switch
10 đến 100
Các flow có thể đến trong khoảng thời gian rất ngắn,
chỉ 10μs
Thời gian giữa hai flow
mới đến
[4ms;40ms]
Kích thước flow và chiều
dài flow
80% số flow có kích thước<10KB
80% số flw có chiều dài <11s
1.4 Mô hình năng lượng tiêu thụ của switch
Năng lượng tiêu thụ chủ yếu bởi các thành phần mạng trong trung tâm dữ
liệu là năng lượng tiêu thụ của các switch và router. Hiện tại chúng ta chỉ biết được
giá trị công suất tiêu thụ tối đa của các switch/router qua datasheet của chúng. Năng
lượng tiêu thụ thật sự của các switch/router phụ thuộc vào rất nhiều yếu tố như cấu
hình của thiết bị và lượng tải mà thiết bị cần xử lý, do đó chỉ dựa vào công suất tiêu
thụ tối đa sẽ không thể tính toán chính xác được năng lượng tiêu thụ thật. Trong hai
bài báo [9,10], các tác giả đã mô hình, đo đạc công suất tiêu thụ của nhiều loại thiết
bị mạng và xây dựng mô hình dự đoán công suất tiêu thụ của bất kì switch/router
Nguyễn Văn Giang – KSTN – ĐTVT – K52 20
ĐỒ ÁN TỐT NGHIỆP | 2012 GVHD: PGS. TS. Nguyễn Văn Khang
nào.Kết quả cho thấy cấu hình thiết bị và lưu lượng thông tin đi qua sẽ ảnh hưởng
đến công suất tiêu thụ của các thiết bị mạng. Phần này của đồ án sẽ trình bày một số
nội dung và kết quả thu được từ hai bài báo của cùng nhóm tác giả trên.
Mỗi một switch/router đều chứa nhiều thành phần cấu tạo khác nhau như: chassis,
linecard, TCAM, RAM, processor, quạt,… Một switch/router đặc trưng gồm một
chassis (có thể hiểu là bộ khung của switch) chứa các slot cắm các linecard, mỗi
linecard chứa nhiều port (cổng mạng) chính là các cổng giao tiếp của switch/router
với các switch/router khác hoặc với các máy tính khác. Việc đo thông số năng
lượng tiêu thụ của tất cả các thành phần trong switch một cách toàn diện rất khó để
thực hiện. Dưới đây là các yếu tố quan trọng ảnh hưởng đến công suất tiêu thụ của
switch/router:
• Công suất tiêu thụ của chassis: Các switch hiệu năng cao chứa một chassis
và một số lượng cố định các khe cắm (slot) dùng để cắm các linecard. Đối
với các switch hiệu năng thấp hơn (các switch phổ thông với 24 port trở
xuống), các slot và linecard được gắn cố định, không thể thay đổi. Trong cả
hai trường hợp, công suất tiêu thụ cơ bản của chassis là tổng công suất tiêu
thụ của một số thành phần khác nhau của switch như processor, quạt,
memory…
• Số lượng linecard: số lượng port của một linecard và tổng lưu lượng thông
tin mà nó có thể xử lý là có hạn. Cơ chế cắm và rút các linecard trên các khe
slot của switch cho phép các nhà quản lý mạng linh động cắm số lượng
linecard cần thiết linh động đáp ứng nhu cầu về tải. Hơn nữa, cơ chế đó cũng
đưa ra nhiều lựa chọn cho việc cắm loại linecard phù hợp, ví dụ như cắm một
linecard 24 port 1Gbps để có khả năng xử lý lưu lượng 24Gbps, hay cắm một
linecard 4 port 10Gbps để có khả năng xử lý lưu lượng 40 Gbps.
• Số lượng active port: thuật ngữ này đề cập tới tổng số port trên switch (của
tất cả các linecard) ở trạng thái hoạt động (active). Các port còn lại trên
switch được tắt đi thông qua giao diện câu lệnh hỗ trợ tắt bật đưa ra từ nhà
sản xuất.
Nguyễn Văn Giang – KSTN – ĐTVT – K52 21
ĐỒ ÁN TỐT NGHIỆP | 2012 GVHD: PGS. TS. Nguyễn Văn Khang
• Công suất xử lý tối đa của một port (port capacity) hay tốc độ hoạt động
tối đa của một port: ta có thể thay đổi thông số công suất xử lý tối đa của mỗi
port để giới hạn tốc độ xử lý thông tin của port đó. Ví dụ, công suất xử lý tối
đa của một port full-duplex 1Gbps có thể được cấu hình xuống 100Mbps hay
10Mbps. Việc thay đổi công suất xử lý tối đa này sẽ ảnh hưởng đến năng
lượng tiêu thụ nói chung của switch. Khi giảm công suất xử lý tối đa, năng
lượng tiêu thụ của port sẽ giảm, dẫn đến năng lượng tiêu thụ của cả switch
nói chung giảm theo.
• Hiệu suất sử dụng của port (port utilization): thuật ngữ này mô tả thông
lượng thật chảy qua một port so với công suất xử lý tối đa của port đó. Ví dụ
trong trường hợp công suất xử lý tối đa của một port là 100Mbps, thông
lượng dữ liệu đi qua port đó là 10Mbps, khi đó hiệu suất sử dụng của port đó
(hay port utilization) là 10%. Phụ thuộc vào hiệu suất sử dụng của port mà ta
có thể thiết lập các giá trị công suất xử lý tối đa của port đó một cách phù
hợp. Ví dụ, nếu một port phải xử lý 60 Mbps lưu lượng, khi đó ta sẽ thiết lập
công suất xử lý tối đa của switch là 100 Mbps để có hiệu quả sử dụng năng
lượng một cách tốt nhất.
• TCAM (Ternary Content Addressable Memory): hầu hết các switch thực
hiện việc phân loại packet trên phần cứng và hầu hết các nhà sản xuất sử
dụng TCAM để thực hiện chức năng này do thời gian xử lý tìm kiếm của
TCAM là rất nhanh. Tuy nhiên, TCAM tiêu thụ một lượng công suất lớn.
Ngoài ra, kích thước TCAM trong các switch cũng khác nhau.
• Firmware: các nhà sản xuất cập nhật firmware cho switch/router theo định
kỳ. Các phiên bản firmware khác nhau cũng có thể ảnh hưởng tới công suất
tiêu thụ của switch/router.
Ngoài ra, đặc tính lưu lượng thông tin đi qua mỗi port cũng có thể ảnh hưởng
tới công suất tiêu thụ của port đó. Hai đặc tính quan trọng nhất của lưu lượng của
một flow là kích thước mỗi gói tin và khoảng thời gian giữa hai gói tin liên tiếp.
Nguyễn Văn Giang – KSTN – ĐTVT – K52 22
ĐỒ ÁN TỐT NGHIỆP | 2012 GVHD: PGS. TS. Nguyễn Văn Khang
Dựa vào mô hình năng lượng tiêu thụ của các thiết bị mạng khác nhau, chúng ta có
thể xác định các thời điểm thích hợp để điều chỉnh hiệu quả công suất tiêu thụ của
các thiết bị này. Ví dụ, một port của switch sẽ bị tắt đi khi không có lưu lượng qua
nó hay linh động điều chỉnh công suất tiêu thụ của một port dựa vào tải nó phải xử
lý. Do công suất tiêu thụ của một port phụ thuộc vào tốc độ hoạt động của nó, việc
tiết kiệm năng lượng sẽ phụ thuộc vào lưu lượng port đó phải xử lý. Trong trường
hợp các thiết bị có nhiều linecard, khi không có lưu lượng đi qua các port của một
linecard, toàn bộ linecard đó sẽ được tắt đi để tiết kiệm năng lượng.Cuối cùng, hiệu
quả tiết kiệm năng lượng cao nhất đạt được khi tắt hoàn toàn một switch nếu không
có lưu lượng qua nó.
Bảng sau thể hiện công suất tiêu thụ của switch với các cấu hình khác nhau.
Bảng 1.4 Công suất tiêu thụ của switch
Cấu hình Rack Switch Switch tầng 2
Power
chassis
146 54
Power
linecard
0 39
Power
10Mbps
(của một cổng) 0.12 0.42
Power
100Mbps
(của một cổng) 0.18 0.48
Power
1Gbps
(của một cổng) 0.87 0.9
Tiếp theo ta sẽ đưa ra công thức tính công suất tiêu thụ của một switch. Công
suất tiêu thụ của một switch là hàm của lưu lượng và cấu hình hoạt động của switch
đó. Tuy lưu lượng được kết luận không có ảnh hưởng đến công suất tiêu thụ (chính
xác là ảnh hưởng rất không đáng kể) nhưng thực tế lưu lượng chảy qua switch có
ảnh hưởng gián tiếp đến công suất tiêu thụ do các port của switch và có thể chính cả
switch thay đổi cấu hình theo lưu lượng đi qua.
Tóm lại, mô hình công suất tiêu thụ của một switch được thể hiện theo công
thức tuyến tính như sau:
Trong đó:
Nguyễn Văn Giang – KSTN – ĐTVT – K52 23
ĐỒ ÁN TỐT NGHIỆP | 2012 GVHD: PGS. TS. Nguyễn Văn Khang
• Power
chassis
là công suất tiêu thụ của switch ở trạng thái không có lưu lượng đi
qua, tuy nhiên switch vẫn đang ở trạng thái bật (idle).
• Power
linecard
là công suất tiêu thụ của một linecard khi không có lưu lượng qua
nó. Nói cách khác, các port của line card không phải xử lý bất cứ lượng lưu
lượng nào.
• Num
linecards
là số linecard của switch
• Power
configsi
là công suất tiêu thụ của một port chạy ở tốc độ i.
• Numportsconfigsi là số port chạy ở tốc độ i.
• i: có thể có các giá trị 10Mbps, 100 Mbps hay 1Gbps.
Qua Bảng 1.4 ta thấy đối với Rack switch (các switch thường công suất xử
lý thấp, ít hơn 24 cổng), do các linecard được gắn cố định, không thay đổi được nên
công suất tiêu thụ của chassis chính là công suất tiêu thụ cơ bản và cố định của
switch khi switch được bật mà không xử lý bất cứ một lượng lưu lượng nào, công
suất tiêu thụ của linecard khi đó được bao gồm trong công suất tiêu thụ của chassis.
Mặt khác đối với các chuyển mạch tầng 2 có công suất xử lý cao hơn, số lượng các
linecard có thể thay đổi bằng cách cắm/rút các linecard vào/ra các slot, nên không
thể tính gộp vào công suất tiêu thụ của chassis. Trong trường hợp này, mỗi linecard
được cắm thêm vào, công suất tiêu thụ của switch sẽ tăng thêm 39W. Tuy nhiên,
trong cả hai trường hợp ta có thể thấy công suất tiêu thụ của các port trên switch
phụ thuộc vào cấu hình tốc độ hoạt động của các port đó. Tốc độ hoạt động tăng,
công suất tiêu thụ của port cũng tăng lên.
Ngoài ra, ta có thể quan sát thấy công suất tiêu thụ của chassis chiếm phần lớn công
suất tiêu thụ của switch, nên việc tắt các switch không sử dụng (không có lưu lượng
đi qua) sẽ mang lại lợi ích lớn nhất. Lấy ví dụ 1 switch thường 24 port, khi không
có lưu lượng đi qua sẽ tiêu thụ 146W, trong khi công suất tiêu thụ tối đa khi lượng
lưu lượng tối đa qua (mỗi port đặt ở tốc độ hoạt động 1Gbps), công suất tiêu thụ của
switch sẽ là: 146+0.87*24=167W. Nếu ta không tắt switch khi không có lưu lượng
đi qua, switch sẽ luôn tiêu thụ một lượng công suất nền rất lớn: 146W.
Nguyễn Văn Giang – KSTN – ĐTVT – K52 24
ĐỒ ÁN TỐT NGHIỆP | 2012 GVHD: PGS. TS. Nguyễn Văn Khang
Về lý tưởng, một switch không có tải đi qua sẽ không tiêu thụ năng lượng
(bằng cách tắt switch), và năng lượng sử dụng sẽ tăng lên theo lưu lượng thông tin
đi qua nó. Tiêu thụ năng lượng tỷ lệ với lượng tải cần xử lý là đặc tính được kỳ
vọng ở các switch trong tương lai. Ngoài ra, ta cũng có thể đặt switch vào các trạng
thái tiêu thụ năng lượng thấp như sleep, kết hợp với các kỹ thuật như Wake-on-
LAN (kỹ thuật được sử dụng trong LAN đối với mạng máy tính, dùng đánh thức
các máy tính đang ở trạng thái sleep) để mang lại hiệu quả cao hơn về hiệu năng so
với tắt switch, do thời gian chuyển giao giữa trạng thái sleep và trạng thái hoạt động
là nhỏ hơn so với thời gian chuyển giao giữa trạng thái tắt và trạng thái hoạt động
bình thường. Ở đây ta cần phân biệt hai khái niệm idle và sleep. Idle là trạng thái
switch vẫn hoạt động, tuy nhiên không có lưu lượng đi qua nó. Sleep là trạng thái
switch ngừng hoạt động, tiêu thụ chỉ một phần năng lượng nhỏ, và có thể chuyển
nhanh sang trạng thái hoạt động bằng kỹ thuật như Wake-on-LAN hoặc sử dụng
proxy, tuy nhiên switch ở trạng thái sleep không có khả năng thực hiện các chức
năng giao tiếp mạng. Tuy nhiên, các switch hiện nay không có khả năng tiêu thụ
năng lượng tỷ lệ với lượng tải qua nó, trên thực tế, đặc tính công suất tiêu thụ của
các switch hiện nay rất xa so với tính tỷ lệ thuận kỳ vọng có được trong các switch
trong tương lai.
Hình vẽ sau miêu tả đặc tính tiêu thụ năng lượng của switch so với tải qua
nó:
Nguyễn Văn Giang – KSTN – ĐTVT – K52 25