Tải bản đầy đủ (.pdf) (73 trang)

Nghiên cứu xây dựng hệ thống giám sát quản trị mạng và ứng dụng tại tập đoàn VNPT (Luận văn thạc sĩ)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.97 MB, 73 trang )

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
–––––––––––––––––––––––––––––––––––––––

HÀ ĐA SĨ

NGHIÊN CỨU XÂY DỰNG HỆ THỐNG GIÁM SÁT
QUẢN TRỊ MẠNG VÀ ỨNG DỤNG TẠI TẬP ĐOÀN VNPT

LUẬN VĂN THẠC SĨ KỸ THUẬT

HÀ NỘI – 2019


HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
–––––––––––––––––––––––––––––––––––––––

HÀ ĐA SĨ

NGHIÊN CỨU XÂY DỰNG HỆ THỐNG GIÁM SÁT
QUẢN TRỊ MẠNG VÀ ỨNG DỤNG TẠI TẬP ĐOÀN VNPT
CHUYÊN NGÀNH: KỸ THUẬT VIỄN THÔNG
MÃ SỐ: 8.52.02.08

LUẬN VĂN THẠC SĨ KỸ THUẬT
(Theo định hướng ứng dụng)

NGƯỜI HƯỚNG DẪN KHOA HỌC:
TS. VŨ TUẤN LÂM

HÀ NỘI – 2019



i

LỜI CAM ĐOAN

Tôi cam đoan đây là công trình nghiên cứu của riêng tôi.
Các số liệu, kết quả nêu trong luận văn là trung thực và chưa từng được ai
công bố trong bất kỳ công trình nào khác.

Hà Nội, tháng 11 năm 2018
Tác giả luận văn

Hà Đa Sĩ


ii

LỜI CẢM ƠN

Tôi xin bày tỏ sự biết ơn sâu sắc tới TS. Vũ Tuấn Lâm, người thầy đã định
hướng và hướng dẫn tôi thực hiện thành công đề tài nghiên cứu.
Tôi xin chân thành cảm ơn Ban giám đốc, Khoa đào tạo sau đại học - Học
viên Công nghệ Bưu chính Viễn thông cũng như Ban lãnh đạo và các đồng nghiệp
tại Tập đoàn bưu chính viễn thông VNPT, nơi tôi đang công tác, đã tạo mọi điều
kiện thuận lợi cho tôi trong suốt quá trình thực hiện luận văn.
Tôi xin chân thành cảm ơn các thầy cô giáo trong và ngoài trường đã trang bị
cho học viên những kiến thức trong quá trình hoàn thành các học phần cao học.
Tôi xin được cám ơn những người thân, bạn bè đã thường xuyên quan tâm,
giúp đỡ, chia sẻ kinh nghiệm, cung cấp các tài liệu hữu ích trong thời gian học tập,
nghiên cứu cũng như trong suốt quá trình thực hiện luận văn tốt nghiệp.

Cuối cùng, tôi xin chân thành gửi lời cảm ơn tới gia đình đã kiên trì chia sẻ
và động viên tôi trong suốt quá trình thực hiện nội dung luận văn.

Hà Nội, tháng 11 năm 2018
Tác giả luận văn

Hà Đa Sĩ


iii

MỤC LỤC

LỜI CAM ĐOAN ........................................................................................................i
LỜI CẢM ƠN ............................................................................................................ ii
MỤC LỤC ................................................................................................................. iii
DANH MỤC CÁC THUẬT NGỮ VIẾT TẮT ...........................................................v
DANH MỤC CÁC BẢNG BIỂU ..............................................................................vi
DANH MỤC CÁC HÌNH VẼ.................................................................................. vii
MỞ ĐẦU .....................................................................................................................1
Chương 1 – TỔNG QUAN VỀ CÁC HỆ THỐNG GIÁM SÁT MẠNG VÀ ỨNG
DỤNG .........................................................................................................................3
Giới thiệu chương .....................................................................................................3
1.1. Giao thức giám sát mạng SNMP .......................................................................3
1.1.1. Giám sát thiết bị mạng ..................................................................................3
1.1.2. Hai phương thức giám sát Poll và Alert .......................................................5
1.1.3. Giới thiệu giao thức SNMP ..........................................................................7
1.1.4. Các khái niệm nền tảng của SNMP ..............................................................9
1.1.5. Các phương thức của SNMP ........................................................................9
1.1.6. Các cơ chế bảo mật cho SNMP ..................................................................10

1.1.7. Cấu trúc bản tin SNMP ...............................................................................10
1.2. Giới thiệu một số phần mềm giám sát phổ biến ..............................................10
1.2.1. PRTG ..........................................................................................................10
1.2.2. Nagios ......................................................................................................... 11
1.2.3. Cacti ............................................................................................................12
1.3 Ưu nhược điểm của các phần mềm giám sát phổ biến .....................................13
1.4. Kết luận chương 1 ............................................................................................14
Chương 2 – PHÂN TÍCH, ĐÁNH GIÁ HIỆN TRẠNG HỆ THỐNG GIÁM SÁT
QUẢN TRỊ MẠNG VÀ ỨNG DỤNG TẠI TẬP ĐOÀN VNPT .............................15


iv

Giới thiệu chương ...................................................................................................15
2.1. Hiện trạng hệ thống giám sát quản trị mạng và ứng dụng tại Tập đoàn VNPT
.................................................................................................................................15
2.1.1. Mô hình hệ thống ........................................................................................15
2.1.2. Các hệ thống giám sát đang được sử dụng .................................................17
2.2. Phân tích ưu, nhược điểm và các vấn đề cần cải thiện ....................................27
2.2.1. Ưu điểm ......................................................................................................27
2.2.2. Nhược điểm ................................................................................................27
2.2.3. Các phương án cải thiện .............................................................................27
2.3. Kết luận chương 2 ............................................................................................28
Chương 3 – XÂY DỰNG HỆ THỐNG GIÁM SÁT QUẢN TRỊ MẠNG VÀ ỨNG
DỤNG TẠI TẬP ĐOÀN VNPT ...............................................................................29
Giới thiệu chương ...................................................................................................29
3.1. Giới thiệu .........................................................................................................29
3.1.1. Kiến thức chung về hệ quản trị cơ sở dữ liệu .............................................29
3.1.2. Một số hệ quản trị cơ sở dữ liệu đang được sử dụng tại Tập đoàn VNPT .30
3.2. Xây dựng hệ thống giám sát ứng dụng cơ sở dữ liệu bằng Oracle Cloud

Control ....................................................................................................................32
3.2.1. Giới thiệu về Oracle Cloud Control 12c .....................................................32
3.2.2. Các thành phần của Oracle Cloud Control .................................................33
3.2.3. Quản trị hệ thống cơ sở dữ liệu sử dụng Oracle Cloud Control .................35
3.3. Thực nghiệm và đánh giá kết quả ....................................................................40
3.3.1. Cài đặt hệ quản trị CSDL và agent để theo dõi ..........................................40
3.3.2. Kết quả thực hiện tại Tập đoàn VNPT .......................................................50
3.4. Kết luận chương 3 ............................................................................................57
KẾT LUẬN ...............................................................................................................60
TÀI LIỆU THAM KHẢO .........................................................................................63


v

DANH MỤC CÁC THUẬT NGỮ VIẾT TẮT
Viết tắt

Nghĩa tiếng Anh

Nghĩa tiếng Việt

ACL

Access Control List

Danh Sách Điều Khiển Truy Cập

DB

Database


Cơ Sở Dữ Liệu

DC

Data center

Trung tâm dữ liệu xử lý chính

DMZ

Demilitarized Zone

Vùng phi quân sự

DR

Data Center Disaster Recovery

Trung tâm dữ liệu dự phòng

IDC

Internet Data Center

Trung tâm Dữ liệu Internet

LAN

Local Area Network


Mạng Cục Bộ

PRTG

Paessler Router Traffic Grapher

Trình vẽ Lưu lượng Bộ điều
hướng của Paessler

RDBMS

Relational Database Management

Hệ Quản Trị Cơ Sở Dữ Liệu

System

Quan Hệ

Simple Network Management

Giao Thức Quản Lý Mạng Đơn

Protocol

Giản

SQL


Structured Query Language

Ngôn Ngữ Truy Vấn Cấu Trúc

TCP/IP

Transmission Control Protocol /

Giao Thức Điều Khiển Truyền

Internet Protocol

Vận / Giao Thức Internet

UDP

User Datagram Protocol

Giao Thức Dữ Liệu Người Dùng

VNPT

Vietnam Posts and

Tập đoàn Bưu chính Viễn thông

Telecommunications Group

Việt Nam


VPN

Virtual Private Network

Mạng Riêng Ảo

WAN

Wide Area Network

Mạng Diện Rộng

WLAN

Wireless LAN

Mạng LAN Không Dây

SNMP


vi

DANH MỤC CÁC BẢNG BIỂU

Bảng 1.1: So sánh Poll và Alert ..................................................................................6
Bảng 1.2: Các loại bản tin SNMP ...............................................................................9
Bảng 3.1: So sánh Oracle Cloud Control và PRTG ..................................................54
Bảng 3.2: So sánh Oracle Enterprise Manager 11g và Oracle Cloud Control 12c ...55
Bảng 3.3: So sánh Oracle Enterprise Manager 11g và Oracle Cloud Control 12c ...56



vii

DANH MỤC CÁC HÌNH VẼ
Hình 1.1: Bài toán giám sát tài nguyên máy chủ ........................................................4
Hình 1.2: Giám sát lưu lượng trên các port của switch, router ...................................4
Hình 1.3: Hệ thống tự động cảnh báo sự cố tức thời ..................................................5
Hình 2.1: Mô hình hệ thống tại IDC Tòa nhà Internet ..............................................15
Hình 2.2: Mô hình hệ thống tại IDC Nam Thăng Long ............................................16
Hình 2.3: Hệ thống giám sát lưu lượng bằng Cacti áp dụng cho hệ thống mạng tại
IDC Tòa nhà Internet.................................................................................................17
Hình 2.4: Hệ thống giám sát lưu lượng bằng Cacti tại IDC Nam Thăng Long ........18
Hình 2.5: Biểu đồ lưu lượng thời gian thực của hệ thống được vẽ bằng Cacti ........18
Hình 2.6: Hệ thống giám sát sử dụng PRTG tại Tòa nhà Internet ............................19
Hình 2.7: Cảnh báo thời gian thực của PRTG...........................................................19
Hình 2.8: Kiểm tra thành phần gặp sự cố của hệ thống ............................................19
Hình 2.9: Khoanh vùng sự cố ...................................................................................20
Hình 2.10: Kiểm tra hiện trạng hệ thống bằng lệnh Check Now ..............................20
Hình 2.11: Kiểm tra nhật ký (log) cảnh báo với PRTG ............................................21
Hình 2.12: Xuất báo cáo (report) với PRTG .............................................................21
Hình 2.13: Xuất báo cáo (report) dưới dạng PDF với PRTG ...................................22
Hình 2.14: Hệ thống giám sát Nagios tại Tòa nhà Internet .......................................22
Hình 2.15: Hệ thống giám sát Nagios tại IDC Nam Thăng Long .............................23
Hình 2.16: Theo dõi tình trạng các host trong hệ thống ...........................................23
Hình 2.17: Hiện trạng các dịch vụ (service) được Nagios liệt kê .............................24
Hình 2.18: Hệ thống theo dõi DB bằng Oracle Enterprise Manager 11g .................24
Hình 2.19: Theo dõi các câu lênh SQL .....................................................................25
Hình 2.20: Theo dõi thời lượng của các câu lệnh .....................................................25
Hình 2.21: Thời điểm bắt đầu / kết thúc câu lệnh .....................................................26

Hình 3.1: Theo dõi hiệu năng của hệ quản trị cơ sở dữ liệu trong thời gian thực ....30
Hình 3.2: Theo dõi các câu lệnh SQL đang chạy ......................................................31
Hình 3.3: Các thành phần của hệ cơ sở dữ liệu Microsoft SQL Server ....................31
Hình 3.4: Theo dõi các câu lệnh chạy trên cơ sở dữ liệu Microsoft SQL Server .....32


viii

Hình 3.5: Hình ảnh tổng quan về Oracle Cloud Control ..........................................33
Hình 3.6: Các thành phần của Oracle Cloud Control ...............................................34
Hình 3.7: Tải về Oracle Database 12c ......................................................................40
Hình 3.8: Các file đã tải về........................................................................................41
Hình 3.9: Cài đặt trên Windows ................................................................................41
Hình 3.10: Cài đặt và tạo database Oracle ................................................................41
Hình 3.11: Các bước cài Oracle Database 12c ..........................................................42
Hình 3.12: Tạo mới một Windows user ....................................................................42
Hình 3.13: Cài đặt plugin ..........................................................................................43
Hình 3.14: Thiết lập bộ nhớ ......................................................................................43
Hình 3.15: Thiết lập bộ mã hóa .................................................................................44
Hình 3.16: Thiết lập mật khẩu cho user ....................................................................44
Hình 3.17: Deploy từ EM12C ...................................................................................45
Hình 3.18: Add Host Targets -> Add Host ................................................................45
Hình 3.19: Điền hostname/IP, chọn platform ...........................................................46
Hình 3.20: Tạo mới Named Credential .....................................................................46
Hình 3.21: Mở port giữa 2 hệ thống..........................................................................47
Hình 3.22: Deploy Agent ..........................................................................................47
Hình 3.23: Quá trình deploy......................................................................................47
Hình 3.24: Chạy script root.sh ..................................................................................48
Hình 3.25: Add Targets Using Guided Process .........................................................48
Hình 3.26: Nhập tên server vừa deploy agent ...........................................................48

Hình 3.27: EM12 tìm ra các đối tượng đang chạy trên server ..................................49
Hình 3.28: Review lại thông tin và add vào hệ thống EM12c ..................................49
Hình 3.29: Kết quả deploy agent...............................................................................50
Hình 3.30: Giao diện giám sát các sự cố (Incident Manager)...................................50
Hình 3.31: Danh sách các cơ sở dữ liệu được giám sát ............................................51
Hình 3.32: Giám sát một cơ sở dữ liệu cụ thể...........................................................52
Hình 3.33: Giám sát hiệu năng (Performance) trong thời gian thực .........................53


1

MỞ ĐẦU
Đối với các hệ thống Công nghệ Thông tin nói chung, đặc biệt là các hệ
thống dịch vụ phần mềm nói riêng, không có gì quan trọng hơn là tính ổn định. Để
đảm bảo sự ổn định của hệ thống dịch vụ phần mềm, bên cạnh việc xây dựng hệ
thống phần cứng, phần mềm thỏa mãn các yêu cầu kỹ thuật, thì việc quản lý, bao
gồm giám sát, điều khiển, và báo cáo tình trạng của hệ thống là một chức năng,
nhiệm vụ không thể thiếu.
Việc giám sát cho phép người quản lý phát hiện kịp thời các bất thường trong
thời gian thực của hệ thống. Việc điều khiển giúp người quản lý xử lý kịp thời các
vấn đề phát sinh, tránh để lan rộng ra hệ thống. Việc báo cáo không chỉ để người
quản lý và những người liên quan nắm được tình trạng hệ thống theo ngày, tuần,
tháng, quý, năm, mà còn giúp họ có thể dự kiến, phòng ngừa, cải tiến, nâng cấp hệ
thống nhằm đáp ứng nhu cầu thực tế.
Dựa vào kiến thức cá nhân cũng như đặc thù công việc, học viên sẽ nêu ra
các ưu, nhược điểm, cũng như đề ra phương án cải tiến, nâng cao chất lượng hoạt
động quản lý và giám sát các hệ thống đang đảm nhận. Cụ thể, học viên sẽ nghiên
cứu các phần mềm: PRTG giám sát hệ thống máy chủ, Nagios giám sát log dịch vụ,
Cacti theo dõi lưu lượng mạng. Bên cạnh đó, học viên sẽ tập trung vào việc nghiên
cứu, xây dựng hệ thống giám sát ứng dụng cơ sở dữ liệu bằng phần mềm Oracle

Cloud Control tại Tập đoàn VNPT, phục vụ trực tiếp cho tiến trình công tác.
Hiện nay, tại Việt Nam, việc nghiên cứu ứng dụng phần mềm Oracle Cloud
Control còn rất hạn chế. Trong khi đó, các phần mềm PRTG, Nagios và Cacti được
sử dụng phổ biến hơn. Còn lại, trên thế giới, việc nghiên cứu ứng dụng phần mềm
Oracle Cloud Control đã và đang được thực hiện rộng rãi, với nhiều tài liệu, sách
báo có chất lượng chuyên môn và hàm lượng kiến thức cao, phục vụ thiết thực cho
việc học tập, nghiên cứu và áp dụng vào công việc của học viên.


2

Vì những lẽ đó, học viên xin chọn đề tài “Nghiên Cứu Xây Dựng Hệ Thống
Giám Sát Quản Trị Mạng Và Ứng Dụng Tại Tập Đoàn VNPT” làm đề tài luận
văn thạc sĩ của mình.
Việc thực hiện đề tài này, về mặt lý luận, sẽ giúp học viên hiểu rõ về cơ chế
hoạt động, cách thức cấu hình và các vấn đề liên quan đến việc quản lý, giám sát,
điều khiển và báo cáo tình trạng của các hệ thống; hiểu rõ về cơ sở dữ liệu, các
thành phần của một hệ quản trị cơ sở dữ liệu, bao gồm cả phần cứng và phần mềm.
Về mặt thực tiễn, học viên có thể nghiên cứu, xây dựng thành công các hệ thống
giám sát bằng PRTG, Nagios và Cacti, đồng thời có phương án cải tiến, nâng cao
chất lượng hoạt động giám sát hệ thống dịch vụ của Tập đoàn VNPT. Quan trọng
hơn, học viên có thể nghiên cứu, xây dựng thành công hệ thống giám sát ứng dụng
cơ sở dữ liệu bằng phần mềm Oracle Cloud Control.
Đề tài nghiên cứu của học viên được thực hiện tại Tập đoàn VNPT, nơi học
viên đang công tác. Về mặt lý luận, học viên sẽ tận dụng các tài liệu hướng dẫn sử
dụng phần mềm do công ty sản xuất phần mềm cung cấp; vận dụng các kiến thức về
hệ thống Công nghệ Thông tin đã học và tích lũy qua tiến trình làm việc; kết hợp
với việc trao đổi, thảo luận với giảng viên hướng dẫn, chúng ta học, đồng nghiệp và
những người có kiến thức về các vấn đề liên quan. Về mặt thực tiễn, học viên sẽ
tiến hành cài đặt phần mềm trên các hệ thống máy tính trong môi trường thử

nghiệm dưới dạng các bài lab, máy ảo; cài đặt các phần mềm trong môi trường thực
tế; sẵn sàng đưa vào sử dụng khi đáp ứng được yêu cầu và nhiệm vụ; tiến hành quản
trị, theo dõi, giám sát, điều khiển, báo cáo trên các hệ thống đã cài đặt và đào tạo,
chuyển giao công nghệ.
Đây là một đề tài mới, có tính ứng dụng cao, đòi hỏi sự tập trung nghiên cứu
cao độ và nền tảng kiến thức vững chắc, cũng như phương pháp nghiên cứu thích hợp.
Dù đã rất cố gắng, song chắc chắn đề tài này vẫn cần nhận được những lời góp ý của
thầy cô và chúng ta. Học viên chân thành tiếp thu các ý kiến và trân trọng cảm ơn!


3

Chương 1 – TỔNG QUAN VỀ CÁC HỆ THỐNG GIÁM SÁT
MẠNG VÀ ỨNG DỤNG
Giới thiệu chương
Trong chương 1, học viên sẽ:
– Trình bày kết quả nghiên cứu của học viên về giao thức quản lý mạng
SNMP;
– Giới thiệu về các phần mềm quản lý và giám sát hệ thống thông dụng,
đang được áp dụng tại nơi học viên đang công tác.

1.1. Giao thức giám sát mạng SNMP
1.1.1. Giám sát thiết bị mạng
Đầu tiên, chúng ta sẽ đề cập đến 3 bài toán thuộc hàng phổ biến nhất trong
các ứng dụng của SNMP.
– Bài toán thứ nhất: Giám sát tài nguyên máy chủ
+ Giả sử chúng ta có hàng ngàn máy chủ chạy các hệ điều hành (HĐH) khác
nhau. Làm thế nào có thể giám sát tài nguyên của tất cả máy chủ hàng ngày, hàng
giờ để kịp thời phát hiện các máy chủ sắp bị quá tải? Giám sát tài nguyên máy chủ
nghĩa là theo dõi tỷ lệ chiếm dụng CPU, dung lượng còn lại của ổ cứng, tỷ lệ sử

dụng bộ nhớ RAM.
+ Chúng ta không thể kết nối vào từng máy để xem vì số lượng máy nhiều và
vì các HĐH khác nhau có cách thức kiểm tra khác nhau.
+ Để giải quyết vấn đề này chúng ta có thể dùng một ứng dụng SNMP giám
sát được máy chủ, nó sẽ lấy được thông tin từ nhiều HĐH khác nhau.
Ứng dụng này có thể trông giống như hình dưới đây:


4

Hình 1.1: Bài toán giám sát tài nguyên máy chủ

– Bài toán thứ hai: Giám sát lưu lượng trên các port của switch, router
+ Chúng ta có hàng ngàn thiết bị mạng (network devices) của nhiều hãng
khác nhau, mỗi thiết bị có nhiều port. Làm thế nào để giám sát lưu lượng đang
truyền qua tất cả các port của các thiết bị suốt 24/24, kịp thời phát hiện các port sắp
quá tải?
+ Chúng ta cũng không thể kết nối vào từng thiết bị để gõ lệnh lấy thông tin
vì thiết bị của các hãng khác nhau có lệnh khác nhau.
+ Để giải quyết vấn đề này chúng ta có thể dùng một ứng dụng SNMP giám
sát lưu lượng, nó sẽ lấy được thông tin lưu lượng đang truyền qua các thiết bị của
nhiều hãng khác nhau.
Ứng dụng này có thể trông giống như hình dưới đây:

Hình 1.2: Giám sát lưu lượng trên các port của switch, router

– Bài toán thứ ba: Hệ thống tự động cảnh báo sự cố tức thời


5


+ Chúng ta có hàng ngàn thiết bị mạng và chúng có thể gặp nhiều vấn đề
trong quá trình hoạt động như: một port nào đó bị mất tín hiệu (port down), có ai đó
đã cố kết nối (login) vào thiết bị nhưng nhập sai username và password, thiết bị vừa
mới bị khởi động lại (restart). Làm thế nào để người quản trị biết được sự kiện khi
nó vừa mới xảy ra?
+ Vấn đề này khác với hai vấn đề ở trên. Ở trên là làm thế nào cập nhật liên
tục một số thông tin nào đó (biết trước sẽ lấy cái gì), còn ở đây là làm thế nào biết
được cái gì xảy ra (chưa biết cái gì sẽ đến).
+ Để giải quyết bài toán này chúng ta có thể dùng ứng dụng thu thập sự kiện
(event) và cảnh báo (warning) bằng SNMP, nó sẽ nhận cảnh báo từ tất cả các thiết
bị và hiện nó lên màn hình hoặc gửi email cho người quản trị.
Ứng dụng này có thể trông giống như hình dưới đây:

Hình 1.3: Hệ thống tự động cảnh báo sự cố tức thời

1.1.2. Hai phương thức giám sát Poll và Alert
Trước khi tìm hiểu SNMP, chúng ta cần hiểu về hai phương thức giám sát
“Poll” và “Alert”. Đây là 2 phương thức cơ bản của các kỹ thuật giám sát hệ thống,
nhiều phần mềm và giao thức được xây dựng dựa trên 2 phương thức này, trong đó
có SNMP. [2]
Việc hiểu rõ hoạt động của Poll & Alert và ưu nhược điểm của chúng sẽ giúp
chúng ta dễ dàng tìm hiểu nguyên tắc hoạt động của các giao thức hay phần mềm giám
sát khác. Hoặc nếu chúng ta muốn tự phát triển một cơ chế giám sát của riêng chúng ta
thì nó cũng là cơ sở để chúng ta xây dựng một nguyên tắc hoạt động đúng đắn.
– Phương thức Poll
Nguyên tắc hoạt động: Trung tâm giám sát (manager) sẽ thường xuyên hỏi
thông tin của thiết bị cần giám sát (device). Nếu Manager không hỏi thì Device



6

không trả lời, nếu Manager hỏi thì Device phải trả lời. Bằng cách hỏi thường xuyên,
Manager sẽ luôn cập nhật được thông tin mới nhất từ Device.
– Phương thức Alert:
Nguyên tắc hoạt động: Mỗi khi trong Device xảy ra một sự kiện (event) nào
đó thì Device sẽ tự động gửi thông báo cho Manager, gọi là Alert. Manager không
hỏi thông tin định kỳ từ Device.
Device chỉ gửi những thông báo mang tính sự kiện chứ không gửi những
thông tin thường xuyên thay đổi, nó cũng sẽ không gửi Alert nếu chẳng có sự kiện
gì xảy ra. Chẳng hạn khi một port down/up thì Device sẽ gửi cảnh báo, còn tổng số
byte truyền qua port đó sẽ không được Device gửi đi vì đó là thông tin thường
xuyên thay đổi. Muốn lấy những thông tin thường xuyên thay đổi thì Manager phải
chủ động đi hỏi Device, tức là phải thực hiện phương thức Poll.
– So sánh phương thức Poll và Alert
Hai phương thức Poll và Alert là hoàn toàn khác nhau về cơ chế. Một ứng
dụng giám sát có thể sử dụng Poll hoặc Alert, hoặc cả hai, tùy vào yêu cầu cụ thể
trong thực tế. Bảng sau so sánh những điểm khác biệt của 2 phương thức. Ký hiệu
so sánh: (+) Ưu điểm, (–) Nhược điểm.
Bảng 1.1: So sánh Poll và Alert

POLL
(+) Có thể chủ động lấy những thông
tin cần thiết từ các đối tượng mình
quan tâm, không cần lấy những thông
tin không cần thiết từ những nguồn
không quan tâm.
(+) Có thể lập bảng trạng thái tất cả các
thông tin của Device sau khi poll qua
một lượt các thông tin đó. VD Device

có một port down và Manager được
khởi động sau đó, thì Manager sẽ biết
được port đang down sau khi poll qua
một lượt tất cả các port.

ALERT
(–) Tất cả những event xảy ra đều được
gửi về Manager. Manager phải có cơ
chế lọc những event cần thiết, hoặc
Device phải thiết lập được cơ chế chỉ
gửi những event cần thiết.
(–) Nếu không có event gì xảy ra thì
Manager không biết được trạng thái
của Device. VD Device có một port
down và Manager được khởi động sau
đó, thì Manager sẽ không thể biết được
port đang down.


7

(+) Trong trường hợp đường truyền
giữa Manager và Device xảy ra gián
đoạn và Device có sự thay đổi, thì
Manager sẽ không thể cập nhật. Tuy
nhiên khi đường truyền thông suốt trở
lại thì Manager sẽ cập nhật được thông
tin mới nhất do nó luôn luôn poll định
kỳ.
(+) Chỉ cần cài đặt tại Manager để trỏ

đến tất cả các Device. Có thể dễ dàng
thay đổi một Manager khác.
(–) Nếu tần suất poll thấp, thời gian chờ
giữa 2 chu kỳ poll (polling interval) dài
sẽ làm Manager chậm cập nhật các thay
đổi của Device. Nghĩa là nếu thông tin
Device đã thay đổi nhưng vẫn chưa đến
lượt poll kế tiếp thì Manager vẫn giữ
những thông tin cũ.
(–) Có thể bỏ sót các sự kiện : khi
Device có thay đổi, sau đó thay đổi trở
lại như ban đầu trước khi đến lượt poll
kế tiếp thì Manager sẽ không phát hiện
được.

(–) Khi đường truyền gián đoạn và
Device có sự thay đổi thì nó vẫn gửi
Alert cho Manager, nhưng Alert này sẽ
không thể đến được Manager. Sau đó
mặc dù đường truyền có thông suốt trở
lại thì Manager vẫn không thể biết
được những gì đã xảy ra.
(–) Phải cài đặt tại từng Device để trỏ
đến Manager. Khi thay đổi Manager thì
phải cài đặt lại trên tất cả Device để trỏ
về Manager mới.
(+) Ngay khi có sự kiện xảy ra thì
Device sẽ gửi Alert đến Manager, do đó
Manager luôn luôn có thông tin mới
nhất tức thời.


(+) Manager sẽ được thông báo mỗi khi
có sự kiện xảy ra ở Device, do đó
Manager không bỏ sót bất kỳ sự kiện
nào.

1.1.3. Giới thiệu giao thức SNMP
Giao thức là một tập hợp các thủ tục mà các bên tham gia cần tuân theo để có
thể giao tiếp được với nhau. Trong lĩnh vực thông tin, một giao thức quy định cấu
trúc, định dạng (format) của dòng dữ liệu trao đổi với nhau và quy định trình tự, thủ
tục để trao đổi dòng dữ liệu đó. Nếu một bên tham gia gửi dữ liệu không đúng định
dạng hoặc không theo trình tự thì các bên khác sẽ không hiểu hoặc từ chối trao đổi
thông tin.
SNMP là một giao thức, do đó nó có những quy định riêng mà các thành
phần trong mạng phải tuân theo. Một thiết bị hiểu được và hoạt động tuân theo giao


8

thức SNMP được gọi là “hỗ trợ SNMP” (SNMP supported) hoặc “tương thích
SNMP” (SNMP compatible).
SNMP dùng để quản lý, nghĩa là có thể theo dõi, có thể lấy thông tin, có thể
được thông báo, và có thể tác động để hệ thống hoạt động như ý muốn. Một số khả
năng của phần mềm SNMP:
+ Theo dõi tốc độ đường truyền của một router, biết được tổng số byte đã
truyền/nhận.
+ Lấy thông tin máy chủ đang có bao nhiêu ổ cứng, mỗi ổ cứng còn trống
bao nhiêu.
+ Tự động nhận cảnh báo khi switch có một port bị down.
+ Điều khiển tắt (shutdown) các port trên switch.

SNMP dùng để quản lý mạng, nghĩa là nó được thiết kế để chạy trên nền
TCP/IP và quản lý các thiết bị có nối mạng TCP/IP. Các thiết bị mạng không nhất
thiết phải là máy tính mà có thể là switch, router, firewall, adsl gateway, và cả một
số phần mềm cho phép quản trị bằng SNMP.
SNMP là giao thức đơn giản, do nó được thiết kế đơn giản trong cấu trúc bản
tin và thủ tục hoạt động, và còn đơn giản trong bảo mật (ngoại trừ SNMP version
3). Sử dụng phần mềm SNMP, người quản trị mạng có thể quản lý, giám sát tập
trung từ xa toàn mạng của mình.
SNMP được thiết kế để đơn giản hóa quá trình quản lý các thành phần trong
mạng. Nhờ đó các phần mềm SNMP có thể được phát triển nhanh và tốn ít chi phí.
SNMP được thiết kế để có thể mở rộng các chức năng quản lý, giám sát.
Không có giới hạn rằng SNMP có thể quản lý được cái gì. Khi có một thiết bị mới
với các thuộc tính, tính năng mới thì người chúng ta có thể thiết kế “custom” SNMP
để phục vụ cho riêng mình.
SNMP được thiết kế để có thể hoạt động độc lập với các kiến trúc và cơ chế
của các thiết bị hỗ trợ SNMP. Các thiết bị khác nhau có hoạt động khác nhau nhưng
đáp ứng SNMP là giống nhau. VD chúng ta có thể dùng 1 phần mềm để theo dõi
dung lượng ổ cứng còn trống của các máy chủ chạy HĐH Windows và Linux; trong


9

khi nếu không dùng SNMP mà làm trực tiếp trên các HĐH này thì chúng ta phải
thực hiện theo các cách khác nhau.
SNMP có 4 phiên bản: SNMPv1, SNMPv2c, SNMPv2u và SNMPv3. Các
phiên bản này khác nhau ở định dạng bản tin và phương thức hoạt động. Hiện tại
SNMPv2 là phổ biến nhất do có nhiều thiết bị tương thích nhất và có nhiều phần
mềm hỗ trợ nhất. Trong khi đó chỉ có một số thiết bị và phần mềm hỗ trợ SNMPv3.

1.1.4. Các khái niệm nền tảng của SNMP

Theo RFC1157 2, kiến trúc của SNMP bao gồm 2 thành phần: các trạm quản
lý mạng và các thành phần mạng. Thành phần mạng là các thiết bị, máy tính, hoặc
phần mềm tương thích SNMP và được quản lý bởi Trạm Quản lý.
Ngoài ra còn có khái niệm SNMP agent. SNMP agent là một tiến trình
(process) chạy trên thành phần mạng, có nhiệm vụ cung cấp thông tin của thành
phần cho trạm, nhờ đó trạm có thể quản lý được thành phần. Chính xác hơn là ứng
dụng chạy trên trạm và agent chạy trên thành phần mới là 2 tiến trình SNMP trực
tiếp liên hệ với nhau.

1.1.5. Các phương thức của SNMP
Giao thức SNMPv1 có 5 phương thức hoạt động, tương ứng với 5 loại bản
tin như sau:
Bảng 1.2: Các loại bản tin SNMP

Bản tin/phương thức
GetRequest
GetNextRequest
SetRequest
GetResponse
Trap

Mô tả tác dụng
Manager gửi GetRequest cho agent để yêu cầu agent
cung cấp thông tin nào đó dựa vào ObjectID (trong
GetRequest có chứa OID)
Manager gửi GetNextRequest có chứa một ObjectID
cho agent để yêu cầu cung cấp thông tin nằm kế tiếp
ObjectID đó trong MIB.
Manager gửi SetRequest cho agent để đặt giá trị cho
đối tượng của agent dựa vào ObjectID.

Agent gửi GetResponse cho Manager để trả lời khi
nhận được GetRequest/GetNextRequest
Agent tự động gửi Trap cho Manager khi có một sự
kiện xảy ra đối với một object nào đó trong agent.


10

Mỗi bản tin đều có chứa OID để cho biết object mang trong nó là gì. OID
trong GetRequest cho biết nó muốn lấy thông tin của object nào. OID trong
GetResponse cho biết nó mang giá trị của object nào. OID trong SetRequest chỉ ra
nó muốn thiết lập giá trị cho object nào. OID trong Trap chỉ ra nó thông báo sự kiện
xảy ra đối với object nào. Đối với các phương thức Get/Set/Response thì SNMP
Agent lắng nghe ở port UDP 161, còn phương thức trap thì SNMP Trap Receiver
lắng nghe ở port UDP 162.

1.1.6. Các cơ chế bảo mật cho SNMP
Một Trạm Quản lý SNMP có thể quản lý/giám sát nhiều thành phần SNMP,
thông qua hoạt động gửi request và nhận trap. Tuy nhiên một thành phần SNMP có
thể được cấu hình để chỉ cho phép các Trạm Quản lý SNMP nào đó được phép quản
lý/giám sát mình. Các cơ chế bảo mật này gồm có: community string, view và
SNMP access control list.

1.1.7. Cấu trúc bản tin SNMP
SNMP chạy trên nền UDP. Cấu trúc của một bản tin SNMP bao gồm:
version, community và data. Phần Data trong bản tin SNMP gọi là PDU (Protocol
Data Unit). SNMPv1 có 5 phương thức hoạt động tương ứng 5 loại PDU. Tuy nhiên
chỉ có 2 loại định dạng bản tin là PDU và Trap–PDU; trong đó các bản tin Get,
GetNext, Set, GetResponse có cùng định dạng là PDU, còn bản tin Trap có định
dạng là Trap–PDU.


1.2. Giới thiệu một số phần mềm giám sát phổ biến
1.2.1. PRTG
PRTG Network Monitor là một ứng dụng giám sát mạng mạnh mẽ cho các
hệ thống dựa trên Windows. Nó phù hợp cho các mạng nhỏ, vừa và lớn và có khả
năng giám sát mạng LAN, WAN, WLAN và VPN. Chúng ta cũng có thể giám sát
các máy chủ web, thư và tệp thực, ảo, hệ thống Linux, máy khách Windows, bộ
định tuyến và nhiều tính năng khác. [6]


11

PRTG giám sát việc sử dụng băng thông và tính khả dụng của mạng, cũng
như các thông số mạng khác như chất lượng dịch vụ, tải bộ nhớ và việc sử dụng
CPU, ngay cả trên các máy từ xa. PRTG cung cấp cho người quản trị hệ thống các
bản báo cáo trực tiếp và xu hướng sử dụng định kỳ để tối ưu hóa hiệu quả, bố cục,
thiết lập các đường dây thuê, bộ định tuyến, tường lửa, máy chủ và các thành phần
mạng khác.
Phần mềm này rất dễ cài đặt và sử dụng và giám sát mạng bằng Giao thức
Quản lý Mạng Đơn giản (Simple Network Management Protocol – SNMP), Công
cụ Quản lý Windows (Windows Management Instrumentation – WMI), Cisco
NetFlow (cũng như IPFIX, sFlow và jFlow) và nhiều giao thức chuẩn công nghiệp
khác. Nó chạy trên máy Windows trong mạng của chúng ta 24 giờ mỗi ngày. PRTG
Network Monitor liên tục ghi lại các thông số sử dụng mạng và tính khả dụng của
các hệ thống mạng. Dữ liệu được ghi lại sẽ được lưu trữ trong cơ sở dữ liệu nội bộ
để phân tích sau này.
PRTG Network Monitor cung cấp hai tùy chọn để giám sát mạng của chúng
ta: PRTG tự lưu trữ và PRTG được Paessler lưu trữ. Với PRTG tự lưu trữ, máy chủ
lõi và đầu dò cục bộ chạy trong mạng của chúng ta. PRTG được Paessler lưu trữ là
giải pháp đám mây PRTG, nơi Paessler chạy máy chủ lõi và đầu dò được lưu trữ sẵn

cho chúng ta. Giao diện web PRTG để theo dõi cấu hình và xem xét dữ liệu giám
sát là giống nhau cho cả PRTG được Paessler lưu trữ và PRTG tự lưu trữ.

1.2.2. Nagios
Nagios Core, phiên bản mã nguồn mở của nền tảng giám sát Nagios, là một
tiêu chuẩn công nghiệp để giám sát mạng được lưu trữ trên các hệ thống kiểu Unix,
chẳng hạn như GNU / Linux hoặc BSD. Nó thường được sử dụng bởi các quản trị
viên mạng và hệ thống để kiểm tra kết nối giữa các máy chủ và đảm bảo rằng các
dịch vụ mạng đang chạy như mong đợi. [6]
Việc giám sát hệ thống trong Nagios được chia thành hai loại đối tượng: máy
chủ (host) và dịch vụ (service). Máy chủ đại diện cho thiết bị thực hoặc ảo trên
mạng của chúng ta (máy chủ, bộ định tuyến, máy trạm, máy in, v.v.). Các dịch vụ là


12

các chức năng cụ thể, ví dụ, một máy chủ Secure Shell (SSH) (tiến trình sshd trên
máy) có thể được coi là một dịch vụ được giám sát. Mỗi dịch vụ được kết hợp với
một máy chủ mà nó đang chạy. Ngoài ra, máy có thể được nhóm lại thành các nhóm
lưu trữ. [10]
Nagios đi kèm với một bộ plugin tiêu chuẩn cho phép kiểm tra hiệu suất cho
hầu như tất cả các dịch vụ mà công ty của chúng ta có thể cung cấp. Hơn nữa, nếu
chúng ta cần thực hiện một kiểm tra đặc biệt (ví dụ, kết nối với một dịch vụ Web và
gọi các phương thức), rất dễ dàng để viết các plugin của riêng chúng ta. Và đó
không phải là tất cả – chúng có thể được viết bằng bất kỳ ngôn ngữ nào và mất
không đến 15 phút để viết một lệnh kiểm tra hoàn chỉnh.

1.2.3. Cacti
Cacti là một ứng dụng đo đạc và vẽ biểu đồ nguồn mở. Phiên bản đầu tiên
của Cacti được phát hành vào ngày 23 tháng 9 năm 2001, và cung cấp một giao diện

hoàn chỉnh dựa trên web cho công cụ RRD, hệ thống ghi dữ liệu và vẽ biểu đồ hiệu
năng cao được tạo ra bởi Tobias Oetker, hai năm trước đó. [4]
Cacti lưu trữ tất cả các thông tin cần thiết để thu thập dữ liệu này và tạo ra
các đồ thị trong cơ sở dữ liệu MySQL, tất cả đều hoàn toàn có thể hiểu được thông
qua giao diện web của nó. Để thu thập dữ liệu, Cacti sử dụng các tập lệnh và lệnh
bên ngoài, cũng như tất cả 3 phiên bản SNMP.
Cacti sử dụng cron / phép thử cấp cơ sở để thu thập dữ liệu từ nhiều nguồn
khác nhau, Cơ sở Dữ liệu Luân Chuyển (Round Robin Database – RRD) lưu trữ dữ
liệu được thăm dò và cơ sở dữ liệu MySQL để lưu trữ hệ thống. [11]
Giao diện người dùng chính của Cacti là một ứng dụng web PHP cho phép
quản lý dễ dàng tất cả các khía cạnh của hệ thống, cũng như các cơ chế hiển thị tự
động để xem biểu đồ.
Cacti có sẵn cho các hệ điều hành khác nhau như Windows, Linux và Solaris.
Ngay cả trong bản phát hành đầu tiên của nó, Cacti đã bao gồm nhiều chức
năng cần thiết cho một công cụ đo lường hiệu năng cấp doanh nghiệp:
– Quản lý RRD và RRA dựa trên web hoàn chỉnh


13

– Cấu hình và vẽ biểu đồ RRD hoàn chỉnh
– Các Kịch bản / Lệnh bên ngoài và hỗ trợ SNMP
– Dễ dàng cấu hình cho việc xây dựng đồ thị dữ liệu giao diện SNMP
– Quản lý quyền người dùng chi tiết
Mặc dù lĩnh vực chính mà Cacti được sử dụng là đo lường hiệu suất, nó có
thể được mở rộng cho nhiều chức năng hơn, bao gồm các tác vụ như:
– Cảnh báo ngưỡng
– Theo dõi thời gian thực các nguồn dữ liệu cụ thể
– Tạo và gửi các báo cáo được lập biểu
– Đăng nhập và phân tích Hệ thống

– Thực hiện sao lưu cấu hình mạng
– Tích hợp các phần mềm quản lý mạng khác
– Theo dõi phần cứng mạng
Nhiều phần mở rộng hoặc bổ sung được duy trì và được hỗ trợ bởi chính
nhóm Cacti, trong khi những phần khác được duy trì bởi cộng đồng Cacti và nhà
phát triển của từng phần mở rộng. [11]

1.3 Ưu nhược điểm của các phần mềm giám sát phổ biến
Phần mềm PRTG: Là phần mềm giám sát mạng chuyên nghiệp, với tính năng
giám sát mạnh mẽ. Tuy nhiên, PRTG là phần mềm trả phí, các chức năng đối với
bản thử nghiệm giới hạn. Ngoài ra, client chỉ hỗ trợ trên hệ điều hành windows,
không linh hoạt như các phần mềm nguồn mở khác.
Phần mềm Nagios: Chức năng chính của Nagios là giám sát tình trạng hoạt
động của các máy chủ, sau đó được phát triển thêm các plugin để giám sát mạng
lưới. Bởi vậy ưu điểm của Nagios là làm việc tốt với các cảnh báo không đồng bộ từ
hệ thống, SNMP trap. Tuy nhiên các tính năng về thống kê lưu lượng mạng lưới
không thực sự tốt, cần phải cài thêm các gói từ bên thứ 3.
Phần mềm Cacti: Cacti được phát triển từ phần mềm MRTG dùng để đo
lường lưu lượng qua các interface của thiết bị mạng, và sau đó được mở rộng để đo
lường, thống kê, vẽ biểu đồ các tham số nhận về từ giao thức SNMP. Bởi vậy, ưu


14

điểm của Cacti là hỗ trợ việc tạo các biểu đồ, báo cáo một cách dễ dàng. Tuy nhiên,
nhược điểm là không hỗ trợ nhiều các tính năng phát hiện sự cố mạng, nhận các báo
cáo không đồng bộ từ SNMP trap và không có các công cụ để tự vẽ bản đồ mạng
lưới.

1.4. Kết luận chương 1

Đối với các hệ thống Công nghệ Thông tin nói chung, đặc biệt là các hệ
thống dịch vụ phần mềm nói riêng, không có gì quan trọng hơn là tính ổn định. Để
đảm bảo sự ổn định của hệ thống dịch vụ phần mềm, bên cạnh việc xây dựng hệ
thống phần cứng, phần mềm thỏa mãn các yêu cầu kỹ thuật, thì việc quản lý, bao
gồm giám sát, điều khiển, và báo cáo tình trạng của hệ thống là một chức năng,
nhiệm vụ không thể thiếu.
Trong công tác giám sát công nghệ thông tin, có 2 phương pháp giám sát là
Hỏi/Trả lời (Poll) và tự động thông báo khi xảy ra sự kiện (Alert). Để giám sát tốt
chúng ta cần kết hợp cả 2 kỹ thuật này. SNMP là giao thức quản lý mạng TCP/IP,
được thiết kế để có thể mở rộng thêm các chức năng và độc lập kiến trúc của các
thiết bị.
Các phần mềm giám sát PRTG Network Monitor, Nagios Core, Cacti là
những ứng dụng giám sát mạng mạnh mẽ cho các hệ thống dựa trên Windows/
Linux. Nó phù hợp cho các mạng nhỏ, vừa và lớn và có khả năng giám sát mạng
LAN, WAN, WLAN và VPN. Chúng ta cũng có thể giám sát các máy chủ web, thư
và tệp thực, ảo, hệ thống máy chủ Windows/Linux, máy khách, bộ định tuyến và
nhiều tính năng khác.
Hiểu được cơ chế hoạt động và cách quản lý chúng thành công là một nhiệm
vụ quan trọng cho quản trị viên hệ thống.
Từ các kết quả được nghiên cứu ở chương 1 về các hệ thống giám sát quản
trị mạng và ứng dụng, học viên sẽ phân tích đánh giá hiện trạng hệ thống giám sát
quản trị mạng và ứng dụng của Tập đoàn VNPT trong chương 2.


15

Chương 2 – PHÂN TÍCH, ĐÁNH GIÁ HIỆN TRẠNG HỆ
THỐNG GIÁM SÁT QUẢN TRỊ MẠNG VÀ ỨNG DỤNG TẠI
TẬP ĐOÀN VNPT
Giới thiệu chương

Trong chương này, học viên sẽ trình bày hiện trạng hệ thống tại Tập đoàn
VNPT, giới thiệu về các hệ thống đang được áp dụng tại đây, cũng như phân tích
ưu, nhược điểm và các vấn đề cần cải thiện.

2.1. Hiện trạng hệ thống giám sát quản trị mạng và ứng dụng tại
Tập đoàn VNPT
2.1.1. Mô hình hệ thống
– Mô hình hệ thống tại IDC Tòa nhà Internet:
VN2

SRX1400

SRX1400
Connect
Internet via
VDC0

4x1GE

4x1GE

LB Citrix

LB Citrix

EX 3300
VC
APP

DMZ


SRX650

SRX650
4x1GE

LB Citrix

L3VPN for
Synchronization

4x1GE

POP
(T11)
Cable
EX 3300
VC

HA Interface
1GE Copper

10GE Fiber SR
10GE Fiber LR
10GE DAC Cable

DATABASE

Hình 2.1: Mô hình hệ thống tại IDC Tòa nhà Internet


Với mô hình hệ thống tại IDC tòa nhà Internet, thiết bị firewall SRX1400
cluster làm nhiệm vụ kiểm soát traffic từ vùng Internet vào vùng DMZ. Thiết bị


×