Khoa Công nghệ Thông tin – Trường Đại học Đà Lạt
1
Đề tài nghiên cứu khoa học sinh viên 2010
Xây Dựng Giải Pháp Giám Sát Mạng Dựa Trên
Mã Nguồn Mở
Vũ Minh Quan 0710328 - Đỗ Văn Quyền 0712392 - Đặng Đình Lành 0712372 - Bùi Long Anh Quân 0712390.
Lớp CTK31, Khoa Công nghệ Thông tin, Trường Đại học Đà Lạt
Giáo viên hướng dẫn: Ths. Trần Thống. Email:
Tóm tắt – Trong bài báo này, chúng tôi tập trung nghiên cứu về
vấn đề giám sát hoạt động của một hệ thống mạng dựa trên phần
mềm mã nguồn mở Nagios chạy trên hệ điều hành mở CentOS.
Đồng thời, chúng tôi cũng tìm hiểu về vai trò và cách thức hoạt
động của các giao thức hỗ trợ giám sát mạng như SNMP. Cuối
cùng, chúng tôi đưa ra một giải pháp hoàn chỉnh nhằm giám sát
hoạt động một hệ thống mạng dựa theo mô hình mạng doanh
nghiệp, hệ thống này có khả năng giám sát hoạt động của hạ tầng
mạng cũng như các dịch vụ mạng bằng cách sử dụng giải pháp
tích hợp dựa trên Nagios, Solarwinds.
Từ khóa – SNMP, Nagios, Monitoring, Configuration,
Solarwinds.
I. GIỚI THIỆU
Cùng với sự phát triển của công nghệ thông tin, sự đầu tư
cho hạ tầng mạng trong mỗi doanh nghiệp ngày càng tăng cao,
dẫn đến việc quản trị sự cố một hệ thống mạng gặp rất nhiều
khó khăn. Đi cùng với những lợi ích khi phát triển hạ tầng
mạng như băng thông cao, khối lượng dữ liệu trong mạng lớn,
đáp ứng được nhu cầu của người dùng, hệ thống mạng phải
đối đầu với rất nhiều thách thức như các cuộc tấn công bên
ngoài, tính sẵn sàng của thiết bị, tài nguyên của hệ thống,…
Một trong những giải pháp hữu hiệu nhất để giải quyết vấn đề
này là thực hiện việc giải pháp giám sát mạng, dựa trên những
thông tin thu thập được thông qua quá trình giám sát, các nhân
viên quản trị mạng có thể phân tích, đưa ra những đánh giá,
dự báo, giải pháp nhằm giải quyết những vấn đề trên.
Để thực hiện giám sát mạng có hiệu quả, một chương trình
giám sát phải đáp ứng được các yêu cầu sau: phải đảm bảo
chương trình luôn hoạt động, tính linh hoạt, chức năng hiệu
quả, đơn giản trong triển khai, chi phí thấp.
Hiện nay, có khá nhiều phần mềm hỗ trợ việc giám sát
mạng có hiệu quả như Nagios, Zabbix, Zenoss, Cacti,…
Trong bài báo này, chúng tôi đề cập đến Nagios, một phần
mềm mã nguồn mở với nhiều chức năng mạnh mẽ cho phép
quản lý các thiết bị, dịch vụ trong hệ thống mạng.
Mục tiêu của chúng tôi trong bài báo này là giúp cho mọi
người có cái nhìn tổng quan về một hệ thống giám sát mạng
hoàn chỉnh, đồng thời đưa ra một giải pháp cụ thể đối với một
hệ thống mạng dành cho doanh nghiệp.
Bài báo này được viết theo cấu trúc như sau:
Giám sát mạng là gì, cần giám sát những gì trong hệ
thống mạng, tầm quan trọng của hoạt động giám sát
mạng.
Cơ chế và cách thức hoạt động của giao thức hỗ trợ
giám sát mạng SNMP.
Giới thiệu, triển khai và đánh giá giải pháp.
Kết luận và hướng phát triển
II. GIÁM SÁT MẠNG
A. Giám sát mạng
Là một thuật ngữ dùng để chỉ việc sử dụng liên tục một hệ
thống (có thể là một chương trình hoặc một thiết bị) để theo
dõi tất cả các hoạt động của các thiết bị, các dịch vụ trong một
hệ thống mạng.
B. Cần giám sát những gì và tại sao?
Đối với hệ thống mạng, điều quan trọng nhất là nắm được
những thông tin chính xác nhất vào mọi thời điểm. Những
thông tin cần nắm bắt khi giám sát một hệ thống mạng bao
gồm:
Tính sẵn sàng của thiết bị (Router, Switch, Server,…):
những thiết bị giữ cho mạng hoạt động
Các dịch vụ trong hệ thống (dns, ftp, http,…): những
dịch vụ này đóng vai trò quan trọng trong một công ty,
tổ chức, nếu các dịch vụ này không được đảm bào hoạt
động bình thường và liên tục, nó sẽ ảnh hưởng nghiêm
trọng đến công ty, tổ chức đó.
Tài nguyên hệ thống: Các ứng dụng đều đòi hỏi tài
nguyên hệ thống, việc giám sát tài nguyên sẽ đảm bảo
cho chúng ta có những can thiệp kịp thời, tránh ảnh
hưởng đến hệ thống.
Lưu lượng trong mạng: nhằm đưa ra những giải pháp,
ngăn ngừa hiện tượng quá tải trong mạng.
Các chức năng về bảo mật: nhằm đảm bảo an ninh
trong hệ thống.
Nhiệt độ, thông tin về máy chủ, máy in: giúp tránh
những hư hỏng xảy ra.
Tạo file log: thu được những thông tin về những thay
đổi trong hệ thống.
C. Tầm quan trọng của hoạt động giám sát mạng
Khoa Công nghệ Thông tin – Trường Đại học Đà Lạt
2
Đề tài nghiên cứu khoa học sinh viên 2010
Hình 1: Ví dụ về số lượng các tham số cần giám sát trong
mô hình mạng
Giả sử một quản trị viên đang quản lý một hệ thống mạng
của công ty bao gồm 10 Server. Trong mỗi Server, quản trị
viên đó phải lần lượt kiểm tra 8 tham số. Như vậy, mỗi ngày,
phải kiểm tra 80 tham số, việc đó tiêu tốn khoảng thời gian
khá lớn. Nếu hệ thống mạng có nhiều thiết bị hơn nữa, việc
kiểm tra từng tham số như vậy là không khả quan, vì vậy, việc
sử dụng một hệ thống giám sát là cần thiết. Sử dụng hệ thống
giám sát, chúng ta có thể tiết kiệm khá nhiều thời gian, thay vì
tốn 10 tiếng để kiểm tra toàn bộ, chúng ta chỉ tốn khoảng 10
phút.
Hơn nữa, khi biết được những sự cố xảy ra trong mạng,
chúng ta có thể khắc phục được những sự cố đó một cách kịp
thời, đồng thời đưa ra được những chính sách hợp lý trong
việc giới hạn truy cập, quản lý băng thông, bảo trì, nâng cấp
hệ thống,… Những hoạt động đó giúp cho việc quản trị mạng
trở nên dễ dàng, có hiệu quả, nâng cao hiệu suất công việc.
III. GIAO THỨC SNMP
Giao thức SNMP[1] (System Network Management
Protocol) là giao thức được sử dụng để hỗ trợ cho việc giám
sát các thiết bị mạng cũng như các thiết bị khác trong trung
tâm dữ liệu (Data Center). Giao thức SNMP là một phần trong
bộ giao thức TCP/IP. Trong môi trường data center, mỗi
Server được cài đặt agent giao tiếp với nhau thông qua giao
thức SNMP để quảng bá trạng thái của mỗi thiết bị. Thiết bị
manager (Monitoring Server) tập trung dữ liệu từ nhiều nút.
Giao thức SNMP gồm 3 thành phần chính:
1) Các thiết bị – là nơi mà agent được cài đặt.
2) Các agent – được cài đặt trên thiết bị.
3) Monitoring Server – Phần mềm nhận dữ liệu giám sát
từ agent.
Dữ liệu có thể được tập hợp bằng cách sử dụng các phương
thức GetRequest, SetRequest,GetNextRequest, Response,
Trap… Có nghĩa là hệ thống giám sát có thể yêu cầu 1 giá trị
từ Server “get” hoặc có thể thiết lập “trap”.
Hình 2: Cấu trúc PDU của giao thức SNMP
Giao thức SNMP hoạt động ở tầng 7 của mô hình OSI (tầng
Application) và sử dụng UDP port 161 để giao tiếp vì giao
thức SNMP không cần hồi báo và chỉ sử dụng cho mục đích
giám sát.
Cấu trúc cơ bảncủa PDU trong giao thức SNMP(Hình 2)
bao gồm IP header, UDP header, version, community
type,requestid, error status, error index, variable bindings.
Có 3 phiên bản chính của giao thức SNMP. Phiên bản 1
[RFC 1065, 1066, 1067, 1156] có vấn đề trong bảo mật và
chứng thực. Lỗi đó được khắc phục ở phiên bản 2 [RFC
1213]. Trong phiên bản 3, giao thức SNMP được cải tiến để
có thể cấu hình từ xa [RFC 3411, 3418].
Hình 3: Sơ đồ hoạt động của giao thức SNMP
IV. NAGIOS
A. Giới thiệu về chương trình Nagios
Là 1 phần mềm mã nguồn mở, là một ứng dụng rất mạnh
cho việc giám sát mạng. Nó phù hợp với các hệ thống mạng
lớn và nhỏ. Ưu điểm lớn nhất của Nagios là tính mở của
chương trình, ta có thể cấu hình Nagios theo nhiều cách, đồng
thời có thể mở rộng theo nhu cầu của người sử dụng. Nagios
giúp cho việc phát hiện và giải quyết vấn đề xảy ra trong hệ
thống được tiến hành một cách hiệu quả nhất.
Nagios[3] hoạt động bằng cách kiểm tra xem một máy chủ
hoặc dịch vụ có hoạt động tốt không và lưu trữ trạng thái của
nó. Trạng thái của một dịch vụ có một trong bốn giá trị OK,
WARNING, CRITICAL, UNKNOWN. Điều quan trọng là nó
thật sự xác định được tình trạng hiện tại.Để tránh phát hiện
tạm thời và ngẫu nhiên vấn đề, Nagios sử dụng trạng thái tạm
thời và cố định mô tả tình trạng hiện tại của một máy chủ lưu
trữ hoặc dịch vụ.
Để xử lý tình huống khi một dịch vụ ngưng hoạt động trong
một thời gian rất ngắn, hoặc các kiểm tra tạm thời khôngthành
công, người ta đưa ra trạng thái tạm thời. Khi trạng thái của
một kiểm tra là UNKNOWN, hoặc khác các trạng thái trước
đó, Nagios sẽ tiến hành kiểm tra lại các máy chủ, dịch vụ
nhiều lần để đảm bảo rằng thay đổi là cố định trong một
khoảng thời gian dài. Số lần kiểm tra được cấu hình trong
phần định nghĩa các dịch vụ. Nagios giả định rằng các kết quả
mới là một trạng tạm thời. Sau khi tiến hành kiểm tra nhiều
lần mà trạng thái không đổi, thì nó được coi là một trạng thái
cố định.
Mỗi Host và Service được định nghĩa số thử kiểm tra sẽ được
thực hiện trước khi nó có thể được giả định rằng thay đổi là
vĩnh viễn. Điều này cho phép linh hoạt trong việc kiểm tra các
sự cố. Thiết lập số lượng kiểm tra một sẽ gây ra các thay đổi
được coi là khó khăn ngay lập tức. Sau đây là một minh họa
cho trạng thái tạm thời và cố định, giả sử số lần kiểm tra là 3
ta sẽ có:
Hình 4: Sơ đồ mô tả cách thức Nagios thông báo các
trạng thái
Khoa Công nghệ Thông tin – Trường Đại học Đà Lạt
3
Đề tài nghiên cứu khoa học sinh viên 2010
Tính năng này cho phép bỏ qua sự cố ngưng hoạt động
trong thời gian ngắn của một dịch vụ.Nó cũng rất hữu ích để
thực hiện các kiểm tra định kỳ ngay cả khi mọi thứ hoạt động
tốt.
Các chức năng chính của Nagios:
Các chức năng của Nagios rất linh hoạt, nó có thể được cấu
hình để theo dõi cơ sở hạ tầng CNTT theo cách ta muốn. Nó
cũng có một cơ chế để tự động phản ứng với các vấn đề, và
một hệ thống cảnh báo mạnh. Tất cả điều này được dựa trên
một hệ thống định nghĩa các đối tượng rõ ràng:
Commands: được định nghĩa về cách Nagios cần
thực hiện các loại kiểm tra, chúng là một lớp trừu
tượng cho phép ta nhóm các hoạt động tương tự lại
với nhau.
Time-periods:là ngày và thời gian kéo dài mà trong
đó một hoạt động nên hay không nên được thực hiện.
Ví dụ: thứ 2 đến thứ 6 9:00-17:00.
Contacts và Contact groups: là những người cần
được cảnh báo, cùng với thông tin về cách thức và
thời gian họ cần được cảnh báo. Contacts có thể được
nhóm lại thành Contact groups.
Host: là những máy vật lý, cùng với thông tin về việc
ai sẽ được liên lạc, làm thế nào kiểm tra phải được
thực hiện, và khi nào. Host có thể được nhóm lại
thành các Host group, mỗi host có thể là một thành
viên của nhiều Host group.
Services: là các chức năng khác nhau hoặc các tài
nguyên cần được giám sát, cùng với thông tin về
những người cần được liên lạc, làm thế nào kiểm tra
phải được thực hiện, và khi nào. Service có thể được
nhóm lại thành các service group, mỗi service có thể
là một thành viên của nhiều service group.
Host và service escalation: định nghĩa khoảng thời
gian được chỉ ra mà sau đó người phụ trách nên được
cảnh báo của các sự kiện nào đó - ví dụ một máy chủ
quan trọng là ngưng hoạt hơn 4 giờ nên cảnh báo cho
quản trị viên để họ bắt đầu theo dõi các vấn đề.
B. Đề xuất giải pháp, triển khai mô hình
Hình 5: Mô hình mạng cần giám sát
Để tiến hành kiểm tra và đánh giá hoạt động của một hệ
thống giám sát, chúng tôi xây dựng một mô hình mạng mô
phỏng hoạt động của hệ thống một mạng doanh nghiệp như
trong Hình 5. Hệ thống này được cài đặt và thử nghiệm tại
phòng thực hành mạng khoa CNTT. Hệ thống bao gồm: 1
Router 2621XM Series, 2 Switch 3560 Catalyst Series, 4
Server: 1 DNS Server, 1 FTP Server, 1 Web Server kết hợp
Mail Server, 1 Server có nhiệm vụ chạy phần mềm giám sát
Nagios.
Những mục tiêu cần giám sát trong mô hình:
Hạ tầng: Theo dõi Router, Switch, End User
o PING: Kiểm tra kết nối từ Server chạy
Nagios đến các thiết bị cần giám sát.
o CPU load: Kiểm tra tải CPU của thiết bị.
o IOS version: Kiểm tra phiên bản hệ điều
hành.
o Interface Table: Kiểm tra trạng thái các port,
gồm 2 trạng thái Up hoặc Down.
o Memory: Kiểm tra tình trạng bộ nhớ đang
được sử dụng của thiết bị.
o Port Bandwidth: Kiểm tra băng thông được
sử dụng của port.
o Port Link Status: Kiểm tra trạng thái liên kết.
o Nhiệt độ: Kiểm tra mức nhiệt độ của thiết bị.
o Uptime: Khoảng thời gian chạy của thiết bị
tính từ lúc bật.
Dịch vụ
o DNS: Kiểm tra dịch vụ phân giải tên miền.
o HTTP: Kiểm tra dịch vụ Web.
o POP3: Kiểm tra dịch vụ WINS.
o FTP: Kiểm tra dịch vụ truyền dữ liệu.
Quá trình triển khai:
Cấu hình IP cho các thiết bị, thiết lập tất cả kết nối
giữa các thiết bị như trong mô hình.
Cài đặt các dịch vụ như DNS, FTP, HTTP,… cho các
Server cần giám sát.
Cài đặt chương trình NSClient trên các thiết bị cần
giám sát.
Hình 6: Thư mục chứa các file cfg để định nghĩa
thiết bị, dịch vụ
Cài đặt chương trình Nagios dựa trên hệ điều hành mã
nguồn mở CentOS trong Nagios Server.
Khoa Công nghệ Thông tin – Trường Đại học Đà Lạt
4
Đề tài nghiên cứu khoa học sinh viên 2010
Cài đặt các plugin cần thiết để hỗ trợ chương trình
Nagios như MRTG, Check Table Interface, Check
Temp,…
Tiến hành cấu hình cho chương trình Nagios.
Định nghĩa các thiết bị, các dịch vụ cần giám sát thông
qua các file config của Nagios như Switch.cfg,
windows.cfg,…(Hình 6).
Định nghĩa các host hoặc thiết bị cần giám sát dựa trên
địa chỉ IP của thiết bị (Hình 7).
Hình 7: Định nghĩa 1 host cần giám sát.
Định nghĩa các dịch vụ cần giám sát trên các thiết
bị(Hình 8).
Hình 8: Định nghĩa 1 dịch vụ cần giám sát.
Sau đó, tiến hành giám sát các thiết bị dựa vào giao diện
web. Các bước tiến hành giám sát bao gồm:
Sử dụng tài khoản admin của Nagios, đăng nhập vào
giao diện web (Hình 9).
Hình 9: Giao diện đăng nhập của Nagios.
Giám sát tổng quan về tình trạng chung của hệ thống
mạng(Hình 10): Giám sát số lượng các host đang up
hoặc down, số lượng các Warning, Problems, Critical,
Pending, OK… Dựa vào các tham số đó, chương trình
Nagios tự động đánh giá và đưa ra cảnh báo về tình
trạng của các thiết bị, các dịch vụ như Host Health,
Service Health.
Hình 10: Tổng quát về tình trạng của hệ thống mạng
Xem danh sách tất cảcác thiết bị đang được giám sát,
tình trạng của thiết bị(Hình 11).
Hình 11: Danh sách tất cả các thiết bị được giám sát
Thông tin giám sát tổng quan tất cả các thiết bị, chi tiết
từng dịch vụ giám sát theo danh sách (Hình 12).
Hình 12: Thông tin chi tiết về thiết bị, dịch vụ.
Phân loại theo nhóm: Phân loại các nhóm dựa vào loại
thiết bị, mô hình này bao gồm 2 nhóm: nhóm các thiết
Khoa Công nghệ Thông tin – Trường Đại học Đà Lạt
5
Đề tài nghiên cứu khoa học sinh viên 2010
bị Router, Switch và nhóm các Server, trong mỗi nhóm,
chương trình Nagios liệt kê chi tiết danh sách từng thiết
bị thuộc mỗi nhóm, trạng thái liên kết, số cảnh
báo(Hình 13).
Hình 13: Danh sách các nhóm và chi tiết thiết bị của
từng nhóm
Chức năng lập lịch cảnh báo: Cho phép chúng ta lập
lịch tiến hành giám sát (Hình 14, 15).
Hình 14: Danh sách các thiết bị và dịch vụ để chúng ta lựa
chọn cho quá trình lập lịch
Hình 15: Quá trình lập lịch
Chức năng Event Log ghi lại tất cả các cảnh báo về thời
gian, dịch vụ, thiết bị xảy ra trong hệ thống(Hình 16).
Đây là thành phần rất quan trọng của chương trình
Nagios, dựa vào đó, người quản trị có thể giải quyết sự
cố trong mạng.
Hình 16: Event Log
C. Khắc phục sự cố mạng
Sau khi triển khai hoàn chỉnh giải pháp, toàn bộ hệ thống
bao gồm hạ tầng và dịch vụ mạng đã được giám sát, theo dõi
thông qua Nagios. Khi có bất kì vấn đề gì xảy ra, chương trình
Nagios sẽ đưa ra những cảnh báo tương ứng để người quản trị
có thể phát hiện sự cố và nhanh chóng khắc phục.
Những sự cố thường xảy ra trong mạng bao gồm: thiết bị
mất kết nối, quá tải đường truyền, thiếu tài nguyên, 1 ứng
dụng nào đó của Server xảy ra lỗi,…
Giả sử, trong mô hình trên, chúng ta nhận được thông báo
về 1 số lỗi xảy ra trong hệ thống. Nếu không triển khai giám
sát mạng, người quản trị phải dựa vào những triệu chứng để
đưa ra những dự đoán về nguyên nhân phát sinh lỗi. Nhưng
sau khi đã triển khai chương trình Nagios, những gì người
quản trị cần làm là đăng nhập vào giao diện web của chương
trình Nagios và xem qua các thông tin về các thiết bị, dịch vụ
được giám sát.
Trong trường hợp này, người quản trị phát hiện được 2 sự
cố xảy ra trong mạng:
Hình 17: Sự cố về dịch vụ DNS
Sự cố đầu tiên xảy ra ở DNS Server, vì 1 lý do gì đó,
dịch vụ DNS không hoạt động, hệ thống sẽ xuất cảnh
báo CRITICAL (Hình 17).
Hình 18: Sự cố về thiết bị Switch Distribution 1
Sự cố thứ 2 là về tình trạng tài nguyên bộ nhớcủa của
Switch bị đầy.
Dựa vào những thông báo này, người quản trị có thể đưa ra
những giải pháp như kiểm tra lại dịch vụ chạy trên Server,
nâng cấp hệ thống,… để giải quyết vấn đề.
Ngoài ra, để tối ưu hóa quá trình giám sát mạng, đồng
thời giảm thiểu những thiệt hại có thể xảy ra khi hệ thống gặp
sự cố, giúp người quản trị có thể nhanh chóng phát hiện ra khi
hệ thống trục trặc, chương trình Nagios có chức năng tự động
gửi những cảnh báo khi sự cố phát sinh đến mail hoặc điện
thoại của người quản trị. Những cảnh báo này có độ chi tiết
Khoa Công nghệ Thông tin – Trường Đại học Đà Lạt
6
Đề tài nghiên cứu khoa học sinh viên 2010
khá cao, nó chỉ rõ trạng thái và vấn đề xảy ra trong hệ thống,
nhờ vậy, người quản trị biết phải làm gì.
Hình 19: Những mail cảnh báo về sự cố mạng
D. Đánh giá chương trình Nagios
Sau khi tiến hành triển khai chương trình Nagios để giám
sát mô hình mạng như trên, chúng tôi đưa ra những đánh giá
tổng quát về chương trình:
Ưu điểm:
o Là phần mã nguồn mở, miễn phí.
o Cung cấp giao diện đồ họa đẹp mắt, thân thiện
đối với người dùng.
o Tính mở rộng cao.
o Có khả năng theo dõi định kì theo thời gian đã
được cấu hình trước.
o Ít tốn tài nguyên hệ thống.
o Có cơ chế tự động cảnh báo cho người quản trị
khi có sự cố xảy ra.
o Tự động tạo các báo cáo theo lịch biểu ấn định.
o Độ ổn định cao khi giám sát hệ thống mạng.
o Đặc biệt Nagios có khả năng giám sát phân tán
nên có thể hỗ trợ tối đa 100 000 node.
Nhược điểm:
o Không có khả năng tự động nhận biết các thiết
bị giám sát trong mạng mà cần phải định nghĩa
trên Nagios Server.
o Cần phải cài đặt từng plugin riêng cho từng
dịch vụ giám sát, chính điều này khiến cho việc
cấu hình Nagios trở nên khá phức tạp.
o Một số thiết bị mới chưa thể giám sát được, ví
dụ như Access Point, …
o Triển khai khó vì phải thực hiện trên CentOS.
E. So sánh với một số công cụ khác để rút ra sự khác biệt
Giới thiệu và triển khai OrionNetwork Performance
Monitor [5] trên thiết bị phần cứng Cisco.
Orion Network Performance Monitor (Orion NPM) cung
cấp khả năng phát hiện lỗi toàn diện và quản lý hiệu suất
mạng mà quy mô với sự tăng trưởng nhanh và mở rộng mạng
lưới với các nhu cầu giám sát mạng của bạn, cho phép bạn thu
thập và xem tính khả dụng theo thời gian thực và số liệu thống
kê lịch sử trực tiếp từ trình duyệt web của bạn. Có khả năng
theo dõi, thu thập và phân tích dữ liệu từ thiết bị định tuyến,
chuyển mạch, tường lửa, máy chủ, và bất cứ thiết bị hỗ trợ
SNMP, là một các giải pháp cho các chuyên gia công nghệ
thông tin để giám sát trên bất kì các hệ thống lớn của mạng
mà không cần lo tới kích thước của mạng.
Orion NPM sẽ theo dõi các thông số quan trọng sau đây:
o Độ sẵn sàng của mạng.
o Công suất sử dụng băng thông.
o Các bộ đệm được sử dụng và các lỗi xảy ra.
o Tình trạng CPU và bộ nhớ đang sử dụng.
o Các interface bị lỗi hoặc từ chối truyền dữ liệu.
o Độ trễ của mạng.
o Giám sát từng node, interface, trạng thái.
o Dung lượng sử dụng.
Hình 20:Kết quả giám sát thử nghiệm trên Router Cisco
Hình 21: Thông tin chi tiết về thiết bị và biểu đồ đánh giá
trạng thái hoạt động của Router
Các
Tiêu
Chí
Các chức
năng
Nagios
SolarWinds
Về
triển
khai
Cài đặt
đơn giản,
nhanh
chóng.
Cài đặt phức
tạp và tốn
nhiều thời
gian.
Cấu hình đơn
giản, cài đặt
nhanh chóng qua
IIS.
Khả năng
mở rộng.
Có khả năng
giám sát cho
những hệ
thống lớn, giới
hạn ở khoảng
100.000 node.
Có khả năng mở
rộng giám sát
cho bất kì kích
thước nào của hệ
thống mạng.
Kĩ
thuật
quản lí
Quản lý
tập trung.
Hỗ trợ theo
dõi toàn bộ hệ
thống một
cách tập trung,
Tương tự như
Nagios.
Khoa Công nghệ Thông tin – Trường Đại học Đà Lạt
7
Đề tài nghiên cứu khoa học sinh viên 2010
trực quan,chi
tiết qua giao
diện web.
Thông tin
hiển thị.
Các thông tin
hiển thị vẫn
còn hạn chế.
Thông tin hiển
thị tương đối rõ
ràng, đầy đủ cho
người quản trị.
Hiệu
quả
giám
sát
Độ ổn
định khi
hoạt động
của công
cụ.
Hoạt động ổn
định khi giám
sát những hệ
thống mạng
lớn.
Hoạt động ổn
định cho các hệ
thống lớn đến rất
lớn, không phụ
thuộc vào kích
cỡ của mạng.
Tính
chính xác.
Cung cấp
thông tin
chính xác cho
người quản trị
biết khi có sự
cố xảy ra.
Tương tự như
Nagios
Khả năng
giám sát
với các
loại thiết
bị và dịch
vụ.
Giám sát hầu
hết các thiết bị
và dịch vụ phổ
biến.
Có khả năng
giám sát nhiều
loại thiết bị mới
hơn như Access
Point… mà
Nagios chưa làm
được.
Khả năng
cảnh báo.
Cung cấp các
cảnh báo cho
người dùng
thông qua
Email, SMS,
syslog.
SNMP, Orion
NPM thu thập
thông tin trong
một cơ sở dữ
liệu SQL và
report lên giao
diện web.
Giao diện
quản lí.
Cung cấp
thông tin giám
sát qua giao
diện web rất
trực quan.
Tương tự như
Nagios.
Bảo trì,
sửa chữa.
Rất phức tạp
vì Nagios
không hỗ trợ
cấu hình qua
giao diện web.
Đơn giản vì nó
hỗ trợ cấu hình
toàn bộ qua giao
diện web.
Chi
phí
đầu tư
Hoàn toàn
miễn phí đối
với phiên bản
mã nguồn mở.
Phải đăng kí và
trả phí để sử
dụng.
Bảng 1.So sánh hai công cụ Nagios core với Orion NPM
V. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
Từ các công cụ được giới thiệu và triển khai ở trên chúng tôi
rút ra một số lợi ích từ việc giám sát hệ thống mạng tự động
bằng các phần mềm giám sát như sau:
Xác định nhanh nguyên nhân cốt lõi của vấn đề một
cách nhanh chóng và dễ dàng. Giảm thiểu công sức
tìm kiếm,di chuyển của nhân viên quản trị mạng.
Tạo ra sự hài lòng của người dùng trong mạng nội bộ.
Tự động gởi cảnh báo qua SMS hoặc email giúp
nhân viên quản trị mạng có thể khắc phục sự cố
nhanh chóng, kịp thời thông qua các kết nối từ xa
bằng internet… Đảm bảo hệ thống mạng của danh
nghiệp hoạt động liên tục và ổn định.
Tự động tạo các báo cáo qua lịch biểu ấn định.
Người sử dụng có thể tạo ra nhiều mẫu báo cáo khác
nhau.
Xác định các xu hướng xảy ra trong tương lai. Tối ưu
hóa và định mức đầu tư đúng mức, đúng chỗ vào hạ
tầng của hệ thống mạng.
Tất cả các yếu tố bên trên dẫn đến việc có thể tiết
kiệm được chi phí, ngân sách đầu tư.
Bên cạnh các phần mềm nhìn chung, khi quản trị hệ thống
mạng, việc giám sát đóng vai trò rất quan trọng. Nó ảnh
hưởng lớn đến hiệu quả kinh doanh của doanh nghiệp hiện
nay. Hiện nay, có rất nhiều phần mềm mạnh hỗ trợ hiệu quả
cho quá trình giám sát mạng như Nagios, CACTI, Zenoss,
Zabbix,…Việc lựa chọn phần mềm phụ thuộc vào quy mô
mạng mà chúng ta quản trị. Và đặc biệt có thể kết hợp một số
phần mềm với nhau để tăng cường hiệu quả của việc giám sát
mạng hiện nay.
Và chúng ta cũng có khá nhiều thiết bị phần cứng hỗ trợ
cho việc giám sát mạng, sự kết hợp giữa phần cứng và phần
mềm sẽ cho hiệu quả cao nhất, mang lại sự tối ưu.
Đề tài có thể phát triển bằng cách mở rộng giải pháp kết
hợp với một số thành phần khác như tường lửa, IPS, IDS
nhằm tăng cường khả năng giám sát và bảo vệ hệ thống mạng.
Bài báo được thực hiện theo đăng kí đề tài nghiên cứu khoa
học sinh viên năm 2010-2011của sinh viên khoa CNTT với sự
hướng dẫn khoa học của giáo viên Ths. Trần Thống.
VI. TÀI LIỆU THAM KHẢO
[1] Use of open source technologies for enterprise
Server monitoring using SNMP, Anshul Kaushik,
2010.
[2] Nagios 3 Enterprise Network Monitoring Including
Plug-Ins and Hardware Devices, Max Schubert
Derick, Derrick Bennett, John Strand, Jonathan
Gines, 2008.
[3] Learning Nagios 3.0, Wojciech Kocjan,2008.
[4] Luận văn tốt nghiệp “Tìm hiểu triển khai giải pháp
giám sát mạng”, Lương Võ Công Khoa, 2010.
[5] SolarWinds, Orion Network Performance Monitor
Quick Start Guide, 2011.