MỤC LỤC
Trang
DANH MỤC CÁC HÌNH VẼ V
DANH MỤC CÁC BẢNG VI
LỜI MỞ ĐẦU 1
CHƯƠNG 1: TỔNG QUAN VỀ INTERNET VÀ LƯU LƯỢNG IP 3
1.1. Mạng Internet 3
1.1.1. Lịch sử phát triển của Internet 3
1.1.2. Tổ chức của mạng Internet 4
1.2. Tổng quan về lưu lượng IP 6
1.2.1. Các loại lưu lượng trên Internet 6
1.2.1.1. Lưu lượng thoại 6
1.2.1.2. Lưu lượng dữ liệu 7
1.2.2. Các gói tin, luồng lưu lượng IP 9
1.2.2.1. Khái niệm luồng lưu lượng IP 9
1.2.2.2. Cơ chế kết thúc luồng 11
1.2.3. Các thuộc tính của luồng lưu lượng IP 11
1.2.4. Sự cần thiết phải phân loại lưu lượng IP 16
1.3. Mô hình lưu lượng IP 17
1.4. Kết luận chương 17
CHƯƠNG 2: CÁC PHƯƠNG PHÁP BẮT GIỮ VÀ PHÂN TÍCH LUỒNG
LƯU LƯỢNG IP 18
2.1. Các phương pháp bắt giữ lưu lượng IP trên Internet 18
2.1.1 Đo lường thụ động 21
2.1.1.1 Tiến trình bắt giữ gói lưu lượng 22
2.1.1.2 Tiến trình phân tích thô dữ liệu gói bắt được 23
2.1.1.3 Đo lường mạng đường trục 26
2.1.1.4 Đo lường mạng nội bộ 27
2.1.1.5 Đo lường mạng quay số (Dial- up và ADSL) 28
2.1.2 Phương pháp nén dữ liệu đo và kỹ thuật lấy mẫu lưu lượng IP 29
2.1.2.1 Thuật toán lấy mẫu 32
2.1.2.2 Tần số lấy mẫu và khoảng lấy mẫu 34
2.2 Phân tích luồng lưu lượng IP trên Internet 37
2.2.1 Lý thuyết lưu lượng và Internet 39
2.2.2. Sắp xếp mức thông trong tiến trình Semi-Markov và chuổi Markov 42
2.2.2.1. Sơ bộ 43
2.2.2.2 Chuỗi Markov rời rạc thời gian 44
2.2.2.3. Các tiến trình Semi-Markov 45
2.2.2.4. Chuỗi thời gian liên tục Markov 47
2.2.3. Phương pháp dự đoán phân bố phù hợp với dữ liệu đo thực nghiệm 50
2.5. Kết luận chương 55
I
CHƯƠNG 3 : MÔ HÌNH TỰ ĐỘNG NHẬN DẠNG, PHÂN LOẠI LƯU
LƯỢNG IP TRÊN INTERNET VÀ ĐỀ XUẤT ỨNG DỤNG 56
3.1. Cơ sở lý thuyết 56
3.1.1. Tổng quan về học tự động 56
3.1.2. Lựa chọn thuộc tính 57
3.1.3. Thuật toán phân loại 57
3.2. Xây dựng mô hình tự động nhận dạng và phân loại lưu lượng IP 62
3.2.1. Mô hình đề xuất 62
3.2.2. Chú thích mô hình 63
3.3. Đề xuất ứng dụng: 64
3.4 Kết luận chương 66
KẾT LUẬN 68
II
THUẬT NGỮ, CHỮ VIẾT TẮT
Viết tắt Nghĩa tiếng Anh Nghĩa tiếng Việt
∀
For all Với mọi
∋
Such that Thỏa mãn
∃
there exists Tồn tại
⇒
implies Nghĩa là, hàm ý
⇔
implies and is implied by Bao hàm và kéo theo bởi
{ }
i
x
the set whose elements are
i
x
Tập gồm các phần tử là
i
x
∈
belonging to Thuộc
¥
the set of all natural integers Tập các số tự nhiên nguyên
¢
the set of all integer numbers Tập các số nguyên
¡
the set of all real numbers Tập các số thực
( )f t
The value of
(.)f
at t Giá trị của
(.)f
tại thời điểm t
ADU/PDU Application/Protocol Data Unit Đơn vị dữ liệu ứng dụng/ giao thức
CDF/CCDF Complement/Cummulative
Density Function
Hàm mật độ xác suất lũy tích/ lũy
tích bù
DoS Denial of Service Tấn công từ chối dịch vụ
I.A.T Inter-arrival time Khỏang thời gian giữa các thời
điểm đến
ICMP Internet Control Message
Protocol
Giao thức điều khiển Internet
IG Information Gain Lượng thông tin (của một thuộc
tính)
IPFIX IP Flow Import Export Kiến trúc đo lường luồng lưu lượng
IP
HTTPS Hyper Text Transfer Protocol
Secured
Giao thức Web bảo mật
KS Kolmogorov - Smirnov Chỉ số kiểm tra mức độ phù hợp
kNN k Nearest Neighbor Tên thuật toán học tự động
LCO Level Crossing Ordering Sắp xếp mức thông
LAN
Local Area Network Mạng nội hạt
MAC Media Access Control Giao thức điều khiển truy nhập
NBD Naive Bayes Discretization Tên thuật toán học tự động
POP3 Post Office Protocol V3 Giao thức nhận thư điện tử
III
QoS Quality of Services Chất lượng dịch vụ
SSE Sum of Square due to Error Chỉ số kiểm tra mức độ phù hợp
SMTP Simple Mail Transfer Protocol Giao thức gửi thư điện tử
RTT Round Trip Time Trễ từ phía phát -> phía thu-> phát
TTL Time To Live Thời gian sống của gói tin trên
mạng
IV
DANH MỤC CÁC HÌNH VẼ
Hình 1-1. Ví dụ về một mạng ISP 5
Hình 1-2: Cấu trúc gói tin UDP (UDP packet) 9
Hình 1-3: Cấu trúc gói tin TCP 10
Hình 2.1: Đồ thị log-log CCDF của các phân bố vệt dài 42
Hình 2-2: thuật toán mô phỏng 2 LCO DTMCS thoả mãn điều kiện (2.10) và
(2.11) 45
Với điều kiện (2.10) và (2.11), thuật toán được nêu ở hình 2.2 mô phỏng 2 LCO
DTMCS X và Y, để có X ≤lc Y. Điều kiện (2.11) bảo đảm trước khi Y đạt giá
trị lớn nhất, tình trạng X mà dựa trên đó X chuyển tiếp. Vì vậy, khi X và Y bắt
đầu từ 1 mức chung, thủ tục này dẫn đến, Xn ≤ Yn n ≤ inf {m € : Ym = sup I}
và cũng dẫn đến kết quả X ≤lc Y. 45
Hình 2-3: thuật toán mô phỏng LCO SMPS với vector xác suất sinh p thoả
mãn điều kiện (2.12) và (2.13) 46
Hình 2-4: Thuật toán mô phỏng 2 LCO CTMCS với vector sinh xác suất p
thoả mãn điều kiện (2.14) và (2.15) 49
Hình 3-1: Sơ đồ mô hình đề xuất 62
Hình 3-2: Đầu dữ liệu vàolà các thiết bị như switch, router, network card, 63
Hình 3-3: Các gói tin được bắt giữ và lấy mẫu dựa theo IP Header trước khi
đưa vào phần phân loại và phân tích luồng theo cơ chế học tự động. 63
Hình 3-4: Các ứng dụng có thể lấy dữ liệu trực tiếp từ các gói được bắt giữ,
hoặc lấy dữ liệu từ các luồng thu thập, hoặc lấy kết quả từ khâu phân loại
luông và học tự động. 64
V
DANH MỤC CÁC BẢNG
Bảng 1-1: Các thuộc tính chung của các luồng 12
Bảng 1-2: Các thuộc tính trên mỗi hướng của luồng 13
Bảng 2-1: Một số phép đo điển hình trên mạng Internet 18
Bảng 2-2: Một số công cụ thu thập và đo lường lưu lượng IP hiện có 35
36
VI
LỜI MỞ ĐẦU
Quá trình hội tụ công nghệ trong lĩnh vực viễn thông đã làm cho mạng
Internet trở thành hạ tầng truyền thông chủ yếu của tất cả các ứng dụng thông tin
liên lạc như: duyệt Web, thư điện tử, truyền file thậm chí cả các ứng dụng thời
gian thực như: VoIP, truyền hình trực tuyến. Một thách thức lớn được đặt ra đối với
mạng Internet hiện nay là vấn đề cung cấp chất lượng dịch vụ (QoS) và giám sát
mức chất lượng dịch vụ do mạng cung cấp. Để xây dựng kiến trúc cung cấp QoS và
mô hình giám sát mức chất lượng dịch vụ do mạng cung cấp thì việc xác định được
các biểu hiện hoạt động và biến thiên của lưu lượng của các ứng dụng trên Internet
là rất quan trọng. Tuy nhiên, lưu lượng Internet luôn luôn thay đổi và không đồng
nhất, và do đó, rất khó để dự đoán. Hơn nữa, cũng rất khó để giám sát lưu lượng
trên một mạng diện rộng, lưu lượng rất lớn, có cơ chế quản lý phân tán và phương
tiện không đồng nhất. Việc hiểu được khuôn mẫu lưu lượng và các phương pháp đo
đạc chỉ là bước đầu, xa hơn nữa việc nghiên cứu để giám sát lưu lượng IP trở nên
rất quan trọng và cấp thiết khi mà lưu lượng mạng phát triển theo hàm số mũ.
Các vấn đề có thể giải quyết khi nhận dạng và phân tích được các luồng lưu
lượng của các nhóm ứng dụng khác nhau từ lưu lượng tổng hợp trên mạng là:
• Cung cấp chất lượng dịch vụ (QoS): khi phân biệt được các luồng lưu
lượng IP của từng nhóm dịch vụ sẽ giúp mạng cấp mức ưu tiên xử lý
tương ứng cho các gói thuộc nhóm đó.
• Phát hiện tấn công trên mạng: khi phân biệt được các luồng lưu lượng
IP sẽ giúp phát hiện các luồng lưu lượng lạ vốn có thể là do các cuộc tấn
công mạng gây ra.
• Phân tích xu hướng phát triển lưu lượng và tỉ lệ chiếm dụng tài
nguyên mạng.
• Điều khiển truy nhập: giúp giải quyết tình trạng tắt nghẽn mạng cũng
như đảm bảo việc phân bố tài nguyên mạng dễ dàng, hợp lý.
Đề tài tập trung nghiên cứu, tìm hiểu các phương pháp xây dựng mô hình bắt
giữ, phân tích và nhận dạng các luồng lưu lượng trên Internet để từ đó làm cơ sở
1
cho việc xây dựng mô hình tự động nhận dạng và phân chia lưu lượng theo các
nhóm ứng dụng khác nhau.
Về bố cục, luận văn gồm có 3 chương chính với các nội dung như sau:
Chương 1: Tổng quan về Internet và lưu lượng IP.
Chương 2: Các phương pháp bắt giữ và phân tích luồng lưu lượng IP.
Chương 3: Mô hình tự động nhận dạng, phân loại lưu lượng IP trên Internet
và đề xuất ứng dụng.
Để hoàn thành bản luận văn này, tôi đã nhận được sự hướng dẫn tận tâm và
sự giúp đỡ tận tình của TS Nguyễn Gia Thái. Tôi cũng đã nhận được sự giúp đỡ quý
báu của Khoa Quốc tế và Đào tạo sau Đại học Học viện Công nghệ Bưu chính-Viễn
thông, của các đồng nghiệp của tôi ở Viễn thông Thừa Thiên-Huế.
Tôi xin bày tỏ lời cảm ơn sâu sắc tới TS Nguyễn Gia Thái, người thầy trực tiếp
hướng dẫn tôi viết bản luận văn này, đã dành cho tôi nhiều thời gian và những chỉ
dẫn vô cùng quý báu bằng cả một tấm lòng của một người thầy. Tôi xin gửi lời cảm
ơn sâu sắc đến thầy giáo chủ nhiệm khoa, các thầy cô giáo trong khoa Khoa Quốc tế
và Đào tạo sau Đại học, Học viện Công nghệ Bưu chính-Viễn thông đã quan tâm
truyền đạt giảng dạy kiến thức và các kỹ năng cơ bản, đến đồng chí Giám đốc và
các đồng nghiệp trong Viễn thông Thừa Thiên-Huế đã tạo điều kiện cho tôi được
học tập và hoàn thành luận văn.
Tôi cũng xin trân trọng gửi tới gia đình tôi, bạn bè thân thiết đã dành cho tôi
nhiều tình thương, sự ưu ái và nâng đỡ tôi trong những khó khăn để tôi hoàn thành
luận văn.
Với mục đích tìm hiểu và triển khai trong thực tế những kết quả nghiên cứu
được, tuy nhiên do hạn chế về thời gian cũng như khả năng của bản thân nên những
kiến thức trình bày trong luận văn không tránh khỏi thiếu sót, tôi mong nhận được
sự đóng góp ý kiến của các thầy cô và các bạn học viên. Tôi xin chân thành cảm ơn!
Hà nội, ngày 01 tháng 09 năm 2008
Nguyễn Xuân Nam
2
CHƯƠNG 1: TỔNG QUAN VỀ INTERNET VÀ LƯU LƯỢNG IP
1.1. Mạng Internet.
Năm 1995, Hội đồng mạng liên bang (FNC - Federal Network Council) nhất
trí thông qua một nghị quyết định nghĩa thuật ngữ Internet. Định nghĩa này ra đời
với sự tham gia tư vấn của ban lãnh đạo Internet và hiệp hội hiệp hội quyền sở hữu
trí tuệ (IPR). FNC nhất trí rằng những định nghĩa sau được coi là chuẩn của thuật
ngữ "Internet" [7]. Internet là hệ thống thông tin toàn cầu mà:
• Được nối với nhau hợp lý bằng một không gian địa chỉ độc đáo dựa
trên giao thức mạng (IP).
• Có thể tạo điều kiện cho các máy tính giao tiếp với nhau thông qua bộ
giao thức TCP/IP.
• Công khai hay bí mật cung cấp, cho phép sử dụng, truy cập các dịch
vụ cao cấp được xếp trên các mục giao tiếp và cơ sở liên quan.
Nói cách khác, mạng Internet là mạng của các mạng máy tính, hoạt động
truyền thông tuân theo bộ các giao thức TCP/IP.
Không thể có được sơ đồ cụ thể của mạng Internet vì các máy tính và các
mạng máy tính liên tục đăng ký thêm vào mạng Internet cũng như các thông tin trên
mạng liên tục thay đổi, cập nhật.
1.1.1. Lịch sử phát triển của Internet
Internet được phát minh từ cục “Nghiên cứu các dự án quốc phòng hiện đại
(ARPA)”[3], một cơ quan của Bộ quốc phòng Mỹ DOD (Department of Defence).
Năm 1969, ARPA triển khai một mạng chuyển mạch gói gồm 4 nút gọi là
ARPANET (Advanced Research Project Agency Network). Trong quân sự, trường
hợp có chiến tranh hạt nhân, DOD muốn bảo đảm truyền số liệu tin cậy ngay cả khi
các phần của mạng đã bị phá huỷ.
Năm 1986, Internet mới bắt đầu phát triển đột biến. Vào thời gian đó NSF
(National Science Foundation) đã tạo ra mạng NSFNET, kết nối 5 trung tâm siêu
máy tính khu vực với nhau để cung cấp một mạng xương sống tốc độ cao toàn quốc
trên khắp Hoa Kỳ. Các máy tính nhanh và mạnh nhất thế giới được đưa vào sử dụng
3
cho cộng đồng các giáo sư đại học và các nhà khoa học. Mạng NSFNET đã dựa trên
kiến trúc TCP/IP của ARPANET. Lúc này, một người dùng ngồi tại đầu cuối ở
trường đại học Standford ở California có thể nối máy tới các máy tính chủ kết nối
vào Internet và truy cập tới bộ sưu tập đa dạng của các kho lưu trữ tại MIT
(Massachusets Institute of Technology). Các máy chủ trên NSFNET còn cung cấp
các Gateway tới các mạng khu vực và nội hạt khác.
Tập hợp các mạng được kết nối với nhau này được gọi một cách đơn giản là
“Internet”. Các máy tính chủ của mạng đã dùng (và cho tới nay vẫn dùng) bộ giao
thức TCP/IP. Trong khoảng thời gian đó, công việc nghiên cứu về Internet đã thay
thế vai trò của mạng ARPANET và vào năm 1990, ARPANET chính thức ngừng
hoạt động.
Nói một cách tổng quát [7], Internet là mạng diện rộng (WAN), bao gồm
hàng nghìn các mạng máy tính trải rộng khắp thế giới, giúp cho hàng triệu người sử
dụng trên trái đất có thể thông tin, trao đổi với nhau. Các học viện đào tạo, các thư
viện, các cơ quan chính phủ, các trung tâm nghiên cứu, các dịch vụ trực tuyến và
các doanh nghiệp đại diện cho các loại mạng khác nhau đã được kết nối với nhau
trên khắp hành tinh để hình thành nên Internet. Sự phát triển nhanh như vũ bão của
Internet mà hiện tại cứ tháng này lại tăng gấp đôi so với tháng trước, đã dẫn đến cái
gọi là “Xa lộ thông tin” (Information Super Highway). Ngoài ra, nó còn là những
nguồn tài nguyên vô giá cho các nhà nghiên cứu, các nhà giáo dục, các quan chức
chính phủ, các thủ thư, Internet đã trở thành một công cụ thiết yếu cho mọi cá thể
đang sử dụng thư điện tử, đang nghiên cứu và thực tế là mọi hoạt động liên quan
đến việc thu thập thông tin.
1.1.2. Tổ chức của mạng Internet
Mạng Internet bao gồm các mạng LAN (Local Area Networks) và mạng
MAN (Metropolitan Area Networks) được liên kết với nhau bởi một mạng đường
trục tốc độ cao [3]. Các mạng LANs và MANs ở đây có thể mạng của các trường
đại học, các công ty, tổ chức, hoặc các nhà cung cấp dịch vụ khu vực, quốc gia,
vv Mạng Internet đường trục bao gồm một số mạng của các nhà cung cấp dịch vụ
4
Internet (ISPs) quốc gia và quốc tế như AT&T WorldNet, Global Crossing, Sprint,
UUNET (Mỹ), SingTel (Singapore), Dustch Telecom (Đức), VDC (Việt nam). Các
mạng này thường chống lấn nhau về mặt địa lý. Các mạng ISPs được liên kết với
nhau qua các điểm chuyển mạch công cộng gọi là NAPs (Network Access Points).
Để tránh tắc nghẽn xảy ra ở các NAPs, các mạng ISP cũng thường được kết nối
bằng các kết nối thuê riêng khác. Một mạng ISP bao gồm nhiều điểm cung cấp dịch
vụ POPs (Point of Presence) và các kết nối liên kết các POP với nhau. Hình 1-1
trình bày ví dụ về một mạng ISP điển hình. Nói một cách đơn giản, một POP bao
gồm sự kết hợp của một hay nhiều bộ định tuyến truy nhập ARs (Access Router)
kết nối tới các khách hàng ở xa, các bộ định tuyến biên BRs (Border Router) kết nối
tới mạng của các ISP khác, các bộ định tuyến chủ HRs (Hosting Router) kết nối tới
các máy chủ phục vụ Web của các ICP (Internet Content Provider) như Yahoo,
Vnn, Fpt, và các bộ định tuyến chính CRs (Core Router) kết nối tới các POP khác.
Lưu lượng từ các ARs, BRs và HRs trước hết phải được gửi tới CR. CR sau đó sẽ
chuyển tiếp lưu lượng tới các CR khác, cho đến khi tới POP cuối cùng (điểm đích).
Kiến trúc của các POP thường là đối xứng (như trong hình 1-1). Các POP
khác nhau thường được kết nối theo cấu hình vòng để tăng độ tin cậy. Một mạng
ISP lớn có thể có trên 50 POPs .
Hình 1-1. Ví dụ về một mạng ISP
5
1.2. Tổng quan về lưu lượng IP
1.2.1. Các loại lưu lượng trên Internet
1.2.1.1. Lưu lượng thoại
Mô hình lưu lượng đối với dịch vụ thoại dựa trên lý thuyết Erlang gồm hai
tham số chính là tốc độ xuất hiện cuộc gọi (số cuộc gọi / một đơn vị thời gian) và
thời gian chiếm giữ trung bình (thời gian / một cuộc gọi). Tải lưu lượng đưa ra
trong Erlang tương ứng với thời gian sử dụng tài nguyên trên một khoảng thời gian.
Phân bố thống kê đối với các xuất hiện cuộc gọi được coi là phân bố Poisson với
thời gian giữa các lần xuất hiện tuân theo phân bố mũ. Giả sử hệ thống có số lượng
kênh hạn chế, do lưu lượng được hỗ trợ lớn nhất có thể nhỏ hơn lưu lượng dự kiến
nên có thể hệ thống sẽ không gán kênh khi một khách hàng muốn thực hiện cuộc
gọi. Xác xuất của nó gọi là xác xuất khóa cuộc gọi hoặc mức dịch vụ. Đối với lưu
lượng dự kiến là A erlang, số các kênh đồng thời cần thiết cho hệ thống là N phụ
thuộc vào mức dịch vụ đưa ra. Có hai cách để tính xác xuất khóa cuộc gọi phụ
thuộc vào đáp ứng hệ thống khi nhận được yêu cầu thực hiện cuộc gọi khi tất cả các
kênh đều bận. Trường hợp thứ nhất là từ chối ngay yêu cầu và người sử dụng nhận
được chỉ thị không thành công và có thể thử lại nếu muốn. Nó được mô hình hóa
bởi công thức Erlang B thu được từ hệ thống hàng đợi M/M/c/c như là xác suất tất
cả các server đều bận. trường hợp thứ hai là hệ thống yêu cầu đưa vào hàng đợi và
cho phếp đợi một thời gian (trễ). Nếu thời gian đợi vượt quá một ngưỡng, yêu cầu
sẽ bị loại bỏ và người sử dụng nhận được chỉ thị không thành công và có thể thử lại
nếu muốn. Cơ chế này được gọi là trễ cuộc gọi khóa và mức dịch vụ đo kiểm được
định nghĩa như là xác suất thời gian đợi vượt quá độ trễ cho phép. Nó được mô hình
hóa bởi công thức Erlang C thu được từ hệ thống hàng đợi M/M/c. Các công thức
này cho phép tính toán trực tiếp tham số GoS và lưu lượng dự kiến A là những biến
độc lập và phải tính toán số các kênh yêu cầu N để phục vụ hệ thống. Đây là vấn đề
của định cỡ.
6
Mô hình Erlang B: Xác suất không có server (hệ thống bận)[2]:
0
!
!
N
k
N
k
A
N
GOS
A
k
=
=
∑
(1.1)
Mô hình Erlang C: Xác suất độ trễ >T:
( )
N
1
N
0
A
S=
A ! 1
!
N A T
k
N
k
GO e
A A
N
N k
τ
−
−
=
+ −
÷
∑
(1.2)
Trong đó:
T = Độ trễ lớn nhất cho phép trước khi cuộc gọi mới bị khóa.
τ = Thời gian giữ cuộc gọi trung bình.
A = Tổng lưu lượng mà hệ thống có thể hỗ trợ.
N = Tổng số kênh.
GOS = Xác xuất cuộc gọi mới bị khóa.
1.2.1.2. Lưu lượng dữ liệu
Đối với liên kết lưu lượng, một số các tham số điển hình được sử dụng để
đặc tính hóa nguồn lưu lượng như tốc độ dữ liệu đỉnh, tốc độ dữ liệu trung bình, lưu
lượng bùng nổ [1]. Các biến được định nghĩa như sau:
- Tốc độ dữ liệu đỉnh: tốc độ dữ liệu lớn nhất được tạo ra bởi một nguồn
lưu lượng trong khoảng thời gian điển hình.
- Tốc độ dữ liệu trung bình: số dữ liệu tạo ra từ nguồn trong một khoảng
thời gian nhất định, thường là bps hoặc packet per second. Việc tính toán
thường được diễn ra trong khoảng thời gian dài.
- Burstiness: Mô tả nguồn gửi lưu lượng không thường xuyên. Công thức
đơn giản tính toán như sau:
PeakDataRate
Burstiness=
AverageDataRace
(1.3)
7
Nếu một nguồn gửi lưu lượng với tốc độ không đổi thì nguồn đó không đột
biến (burstiness = 1), trong khi nó được coi là biến đổi rất lớn nếu nó cho phép các
khoảng thời gian lớn không gửi lưu lượng xen kẽ với những khoảng thời gian gửi
với tốc độ gần bằng tốc độ đỉnh (burstiness >> 1).
Tính đa dạng của các dịch vụ băng rộng dẫn tới sự phân tán lớn của
burstiness, thời gian chiếm giữ và tốc độ đỉnh.
Trong dịch vụ đa phương tiện, các ứng dụng cung cấp có thể nhóm thành
bốn loại chính của các lớp dịch vụ như sau:
- Lớp thoại (Conversitional Class): Bao gồm các dịch vụ thoại, hội nghị
video, video-game… Yêu cầu quan trọng nhất đối với lớp dịch vụ này
liên quan đến thời gian, bao gồm độ trễ thấp, biến đổi trễ thấp và duy trì
tốc độ dữ liệu nguồn. Tỷ lệ tổn thất không phải là quá quan trọng.
- Lớp luồng lưu lượng (Streaming Class): Bao gồm các luồng lưu lượng
audio, video. Nó yêu cầu duy trì tương quan với thời gian để yêu cầu
biến đổi trễ thấp nhưng không yêu cầu quan trọng như đối với lớp thoại
với yêu cầu độ trễ thấp. Tỷ lệ tổn thất là không quan trọng.
- Lớp tương tác (Interactive Class): Bao gồm Web-browser, truy nhập cơ
sở dữ liệu, truy nhập LAN từ xa. Một tham số quan trọng đó là độ trễ
toàn trình (round-trip delay), nó mô tả thời gian yêu cầu và đáp ứng. Tỷ
lệ tổn thất là rất quan trọng đối với các loại ứng dụng này.
- Lớp nền (Background Class): Các ứng dụng phi thời gian thực như
email, truyền file… không có hạn chế nào về thời gian hay độ trễ nhưng
tỷ lệ tổn thất là rất quan trọng.
Các loại ứng dụng được đề cập ở trên được nhóm vào hai tập chính: lưu
lượng thời gian thực bao gồm các lớp trong đó thời gian và các đặc tính biến đổi tốc
độ phải được duy trì (lớp thoại và lớp luồng lưu lượng) và lưu lượng phi thời gian
thực là các lớp mà vấn đề thời gian ít quan trọng nhưng tính nguyên vẹn dữ liệu lại
rất quan trọng (lớp tương tác và lớp nền).
8
1.2.2. Các gói tin, luồng lưu lượng IP
1.2.2.1. Khái niệm luồng lưu lượng IP
Một trong những định nghĩa sơ khởi nhất về luồng lưu lượng Internet đó là:
"chuỗi các gói liên tục truyền bởi một ứng dụng hoặc dịch vụ nào đó trên Internet".
Cụm từ "liên tục" ở đây phản ánh mong muốn xử lý các luồng lưu lượng một cách
đồng nhất về thời gian nhằm đáp ứng hai mục đích quan trọng: thứ nhất (i) người ta
muốn làm cho khái niệm luồng lưu lượng có càng nhiều ý nghĩa vật lý càng tốt theo
đó chúng có thể đại diện cho việc truyền tải một tài liệu hay một đối tượng TCP
hoặc các pha hoạt động của các kết nối âm thanh/ hình ảnh của UDP và thứ hai (ii)
là các luồng lưu lượng được định nghĩa phải cung cấp đủ thông số đầu vào cho các
mô hình hiệu suất.
0 16 31
Source Port(Cổng nguồn) Destination Port(Cổng đích)
Length(độ dài) Checksum
User Data(dữ liệu người dùng)
User Data(dữ liệu người dùng)
….
Hình 1-2: Cấu trúc gói tin UDP (UDP packet)
Khi nghiên cứu về hoạt động của các ứng dụng chạy trên giao thức TCP, người
ta thường định nghĩa luồng lưu lượng là tập hợp các gói truyền giữa hai ứng dụng
trên mạng Internet và nằm trong khoảng giữa hai cờ SYN/RESET và FIN, thể hiện
thời điểm bắt đầu và kết thúc một kết nối TCP. Hay khi nghiên cứu về các đặc tính
lưu lượng của một ứng dụng cụ thể trên Internet, như http hay ftp, người ta lại sử
dụng định nghĩa luồng lưu lượng là tập hợp các gói thuộc một phiên làm việc cụ thể
của giao thức ứng dụng tương ứng.
9
0 16 31
Source port Destination port
Sequence number
Acknowledgment number
Offse
t
Reser
ved
U A P R S F Window
Checksum Urgent pointer
Options Padding
TCP data
…
Hình 1-3: Cấu trúc gói tin TCP
Nhóm làm việc RTFM [9] của IETF khi nghiên cứu xây dựng kiến trúc quản lý
lưu lượng cho các ứng dụng thời gian thực trên Internet đã đưa ra khái niệm luồng
lưu lượng là tập hợp các gói có chung một số giá trị các trường trong phần tiêu đề
của gói IP. Các trường này thường được sử dụng cho mục đích tổng hợp lưu lượng
theo các mức khác nhau, ví dụ nếu muốn biết toàn bộ các gói lưu lượng truyền trên
mạng giữa 2 nút bất kỳ thì chỉ cần sử dụng trường địa chỉ IP nguồn và đích của gói,
hoặc giữa hai ứng dụng cụ thể thì sẽ phải sử dụng số hiệu cổng ứng dụng nguồn và
đích và chỉ số giao thức của gói, vv…
Nói cách khác hiện không tồn tại một định nghĩa thống nhất và/ hoặc đã được
chuẩn hoá nào đối với khái niệm luồng lưu lượng Internet, mà tuỳ vào mục đích
nghiên cứu, các tác giả có thể định nghĩa luồng lưu lượng theo nhiều cách khác
nhau. Mục tiêu của chúng ta là nhằm xây dựng được một mô hình nhận dạng lưu
lượng của các ứng dụng trên mạng Internet trên cơ sở các kết quả phân tích đặc tính
và biểu hiện hoạt động của luồng lưu lượng, do đó ta sẽ tìm kiếm một định nghĩa
sao cho đảm bảo được hai yếu tố: thứ nhất (i) cung cấp được càng nhiều thông số
thống kê luồng lưu lượng càng tốt và thứ hai (ii) đồng nhất theo thời gian.
Với hai tiêu chí này, chúng ta sử dụng phương pháp định nghĩa luồng lưu
lượng gần giống với phương pháp của RTFM, trong đó thuật ngữ "khoá" được sử
dụng để chỉ tập các thuộc tính địa chỉ trên các lớp khác nhau của mô hình TCP/IP.
10
Việc đưa ra khái niệm khoá này giúp cho việc định nghĩa luồng lưu lượng rất mềm
dẻo, theo đó có thể xác định luồng lưu lượng là tập hợp các gói trao đổi trên các
mức khác nhau. Ngoài ra nó cũng giúp giải quyết các vấn đề gặp phải khi định
nghĩa luồng lưu lượng theo giao thức truyền dẫn (TCP) hay theo phiên làm việc của
ứng dụng, như vấn đề các gói thuộc một luồng nhưng lại đi theo các tuyến đường
khác nhau hay vấn đề mất gói vv…
Luồng lưu lượng IP đề cập trong luận văn này có khoá bao gồm các thông số:
địa chỉ IP nguồn, địa chỉ IP đích, cổng ứng dụng nguồn, cổng ứng dụng đích và chỉ
số nhận dạng giao thức TCP. Ngoài ra hai gói liên tiếp được xem là thuộc cùng một
luồng nếu chúng không cách nhau quá một khoảng thời gian cho trước gọi là thời
gian time-out. Nếu không một luồng mới sẽ được tạo ra.
1.2.2.2. Cơ chế kết thúc luồng
Trong quá trình phân tích luồng, ngoài việc định nghĩa khoá, cũng cần phải xác
định các cơ chế bắt đầu và kết thúc của một luồng lưu lượng. Thực tế hiện nay các
nhà nghiên cứu hay sử dụng ba phương pháp cơ bản để xác định sự kết thúc của
một luồng lưu lượng, bao gồm: phương pháp dựa trên cơ chế hoạt động của giao
thức, phương pháp thời gian Time-out cố định và phương pháp thời gian Time-out
thích ứng.[5] Với phương pháp dựa trên hoạt động của giao thức, người ta xác định
trạng thái của một luồng lưu lượng bằng cách quan sát một số bản tin đặc biệt của
giao thức (ví dụ các cờ SYN, FIN hoặc RST trong giao thức TCP). Còn trong
phương pháp thời gian Time-out cố định, luồng lưu lượng được xem là kết thúc khi
thời gian từ lúc nhận được gói cuối cùng vượt quá một giá trị ngưỡng cho trước là
thời gian time-out. Trong phương pháp thời gian time-out thích ứng thì việc xác
định giá trị time-out của luồng là một cơ chế phức tạp hơn nhiều, theo đó thời gian
time-out thay đổi theo từng luồng và được tính dựa trên tốc độ gói quan sát được
của luồng tương ứng.
1.2.3. Các thuộc tính của luồng lưu lượng IP
11
Để mô tả nguồn lưu lượng, chúng ta sử dụng các thuộc tính đặc trưng của nó.
Ngoài mục đích đặc tính hoá các luồng lưu lượng, việc định nghĩa tập thuộc tính
của nó còn cho phép đưa ra phương pháp đo lường phù hợp.
Một cách tổng quát nhất, thuộc tính luồng có thể là các trường trong phần tiêu
đề của gói như địa chỉ IP nguồn/ đích, cổng ứng dụng nguồn/ đích, v.v… hoặc là
các bộ đếm số lượng byte, số lượng gói chứa trong luồng hoặc là các giá trị thống
kê của các thông số trên như trị trung bình, trị trung tâm, hay độ lệch tiêu chuẩn. Để
phản ánh đúng bản chất biến thiên và các biểu hiện hoạt động của luồng lưu lượng
Internet, thì ngoài các thuộc tính trên, chúng ta sẽ khảo sát và tính toán thêm nhiều
thuộc tính quan trọng là các thông số của các phân bố rời rạc liên quan, như: phân
bố thời điểm đến của các luồng, phân bố kích thước luồng, phân bố thời điểm đến
của các gói thuộc luồng, phân bố kích thước các gói thuộc luồng, v.v… vào tập các
thuộc tính mô tả luồng.
Trên thực tế, số lượng thuộc tính có thể có của luồng lưu lượng IP là rất lớn.
Tuy nhiên để có thể sử dụng cho việc nhận dạng và phân loại luồng lưu lượng ta có
thể chỉ ra một số các đặc tính của luồng lưu lượng [5] như sau:
Bảng 1-1: Các thuộc tính chung của các luồng
STT Thuộc tính Mô tả Kiểu giá trị
1.
Khoá
Tập 5 tham số định nghĩa luồng: địa chỉ IP
nguồn và đích, cổng ứng dụng nguồn và đích,
số nhận dạng giao thức
Xâu
2.
Bắt đầu Thời điểm đến của gói đầu tiên của luồng Xâu
3.
Kết thúc Thời điểm đến của gói cuối cùng của luồng Xâu
4.
Thời lượng Độ dài luồng lưu lượng đo bằng μs Liên tục
5. Kích thước
gói đầu
Độ dài phần tải tin của gói đầy đủ đầu tiên
(gói có phần tải tin #0)
Liên tục
6. Hướng một
số gói đầu
Xác định hướng truyền của một số gói đầu
tiên của luồng (≤10)
Chuỗi 10 giá
trị rời rạc lấy
12
1: hướng từ nút khởi tạo luồng đến nút đáp
ứng
-1: theo hướng ngược lại
giá trị -1
hoặc1
7. Tỷ lệ dữ
liệu
Tỷ lệ giữa tổng số byte dữ liệu (chỉ tính phần
tải tin) truyền bởi phía khởi tạo luồng và bởi
phía đáp ứng luồng
Liên tục
8. Phân bố
I.A.T gói
Phân bố rời rạc khoảng thời gian giữa các thời
điểm đến (I.A.T) của các gói thuộc luồng, thể
hiện bởi một chuỗi 9 bin giá trị liên tục. Giá
trị của mỗi bin nằm giữa 0 và 1 thể hiện tỉ lệ
tương đối các gói có I.A.T nằm trong bin đó
chuỗi 9 giá
trị liên tục
9. Phân bố
I.A.T luồng
Độ dài phần đuôi của biểu đồ phân bố thời
điểm đến (I.A.T) của các luồng lưu lượng
quan sát trong một cửa sổ thời gian cho trước
Liên tục
10. Phân bố số
luồng
Tỷ lệ % số lượng luồng quan sát được trong
một cửa sổ thời gian cho trước (2 phút)
Liên tục
11.
Các thuộc tính thể hiện phiên làm việc kiểu đối thoại
αdt
Tỷ lệ giữa số lượng gói đầy đủ thuộc đoạn đối
thoại trên tổng số gói đầy đủ của luồng
Liên tục
βdt
Tỷ lệ giữa số lượng gói đầy đủ thuộc đoạn đối
thoại trung bình trên tổng số gói đầy đủ của
luồng
Liên tục
γdt
Tỷ lệ các gói đối thoại truyền bởi phía khởi
tạo phiên làm việc
Liên tục
15.
Các thuộc tính thể hiện phiên làm việc kiểu giao dịch
αgd
Dấu hiệu cho biết mức độ thường xuyên của
các trao đổi gói kiểu ping-pong quan sát được
trong luồng lưu lượng
Liên tục
Bảng 1-2: Các thuộc tính trên mỗi hướng của luồng
ST
T
Thuộc tính Mô tả Kiểu giá trị
1 Phân bố Phân bố rời rạc thể hiện bằng chuỗi 9 giá trị Chuỗi 9 giá trị
13
I.A.T gói
liên tục, là các khoảng giá trị của các khoảng
thời gian giữa các thời điểm đến của các gói
trên hướng đang xét. Giá trị trong mỗi bin
nằm trong khoảng 0 và 1 thể hiện tỉ lệ tương
đối các gói nằm trong bin đó
liên tục
2
Phân bố tải
tin
Phân bố rời rạc chiều dài phần tải tin của các
gói, thể hiện bởi một chuỗi 23 giá trị liên
tục. Các giá trị liên tục này thực ra là các bin
giá trị của chiều dài phần tải tin của mỗi gói.
Giá trị trong mỗi bin nằm trong khoảng 0 và
1
Chuỗi 23 giá trị
liên tục
3 Số byte
Tổng số byte truyền (bao gồm cả các byte
phần tiêu đề lớp mạng và lớp vận chuyển)
trên hướng xét
Liên tục
4
Số byte dữ
liệu
Tổng số byte dữ liệu truyền trên hướng xét Liên tục
5 Số gói Tổng số gói truyền trên hướng xét Liên tục
6
Số gói dữ
liệu
Tổng số gói đầy đủ (có phần tải tin #0)
truyền trên hướng xét
Liên tục
7
Các thuộc tính thể hiện phiên làm việc kiểu tương tác từ bàn phím
αp
Dấu hiệu thể hiện sự thay đổi về thời lượng
giữa các lần phát gói tương tác (nhận từ bàn
phím)
Liên tục
βp Dấu hiệu tương tác dựa trên tỷ lệ các gói nhỏ Liên tục
γp
Dấu hiệu về sự xuất hiện liên tục của các gói
nhỏ
Liên tục
δp Dấu hiệu về kiểu truyền kết hợp Liên tục
εp
Dấu hiệu về sự không bình thường (đồng bộ)
của thời lượng giữa các gói của các gói nhỏ
liên tiếp
Liên tục
13 Các thuộc tính thể hiện phiên làm việc kiểu tương tác dòng lệnh
αdl Dấu hiệu thể hiện sự thay đổi về thời lượng
giữa các lần phát gói (đối với các gói dòng
Liên tục
14
lệnh)
βdl Dấu hiệu tương tác dựa trên tỷ lệ các gói nhỏ Liên tục
γdl
Dấu hiệu về sự xuất hiện liên tục của các gói
nhỏ
Liên tục
δdl Dấu hiệu về kiểu truyền kết hợp Liên tục
εdl
Dấu hiệu về sự không bình thường (đồng bộ)
của thời lượng giữa các gói của các gói nhỏ
liên tiếp
Liên tục
19
Các thuộc tính thể hiện phiên làm việc kiểu truyền file
αdl
Dấu hiệu thể hiện sự thay đổi về thời lượng
giữa các lần phát gói trong quá trình truyền
file
Liên tục
βdl
Dấu hiệu về kiểu truyền dữ liệu dựa trên tỷ
lệ gói lớn
Liên tục
γdl
Dấu hiệu về sự xuất hiện liên tục của các gói
truyền kết hợp
Liên tục
23
Tốc độ bit
trung bình
Là tốc độ bit trung bình đo trong những
khoảng 5s
Liên tục
24 αbtb
Dấu hiệu thể hiện mức độ gần với trị trung
bình của các tốc độ bit đo trong những
khoảng 5s (thể hiện tính không đổi của tốc
độ bit)
Liên tục
25
Tốc độ gói
trung bình
Là tốc độ gói trung bình đo trong những
khoảng 5s
Liên tục
26 αgtb
Dấu hiệu thể hiện mức độ gần với trị trung
bình của các tốc độ gói đo trong những
khoảng 5s (thể hiện tính không đổi của tốc
độ gói)
Liên tục
27
Trị trung
tâm tải tin
Vị trí trung tâm của phân bố chiều dài phần
tỉa tin của các gói
Liên tục
28 αptb
Dấu hiệu thể hiện mức độ gần với trị trung
tâm của độ dài phần tải tin của các gói (thể
hiện tính không đổi của độ dài phần tải tin)
Liên tục
15
1.2.4. Sự cần thiết phải phân loại lưu lượng IP
Lưu lượng Internet tăng không ngừng do sự phát triển của các ứng dụng và
các thuê bao mới. Những nguyên nhân dẫn đến yêu cầu phải hiểu và đo được các
mẫu và đặc tính lưu lượng:
- Để hiểu được tầm vĩ mô cấu trúc của toàn bộ mạng, phục vụ cho việc quy
hoạch mạng và tối ưu mạng:
+ Thiết kế, vận hành và quản lý lưu lượng mạng, nghĩa là cân bằng tải
lưu lượng và hiệu suất sử dụng tài nguyên mạng để tương thích tốt nhất với cấu
hình mạng hiện có, loại bỏ các vấn đề như sự xung đột và các vấn đề tương tự.
+ Phát hiện và loại bỏ các giao thức không cần thiết, làm tăng hiệu
quả mạng IP.
+ Phát hiện các định tuyến không tối ưu.
+ Định giá và tính cước.
- Để cung cấp QoS phù hợp cho các ứng dụng (từ tầm vĩ mô tới các luồng
lưu lượng, các phiên truyền và các kết nối):
Cấu hình mạng có thể rất linh động và tự thích ứng tốt; các tài nguyên mạng
có thể phân chia lại để cung cấp QoS phù hợp cho các ứng dụng trong các trường
hợp như: tốc độ truyền dẫn, độ trễ, jitter, mất gói và các nguyên nhân tương tự. Việc
đo đạc và điều khiển thời gian thực rất cần thiết để đáp ứng QoS theo yêu cầu.
- Phát hiện những yếu tố bất thường ảnh hưởng đến an ninh mạng:
Nhiệm vụ này bao gồm việc phát hiện những nguy hiểm tiềm năng ảnh
hưởng đến lưu lượng mạng, chỉ ra vị trí, nguyên nhân của sự cố, thực hiện các thao
tác để khắc phục những bất thường này, do đó hạn chế mở rộng sự cố ra toàn mạng.
Tuỳ thuộc các mục đích khác nhau, việc đo đạc có thể thực hiện theo thời
gian dài hoặc theo thời gian thực, với các tỷ lệ thời gian khác nhau như tháng, tuần,
tới giây và miligiây.
Tuy nhiên, lưu lượng Internet luôn luôn thay đổi và không đồng nhất và do
đó, rất khó để dự đoán. Hơn nữa, cũng rất khó để giám sát lưu lượng trên một mạng
diện rộng, lưu lượng rất lớn, có cơ chế quản lý phân tán và phương tiện không đồng
16
nhất. Việc hiểu được khuôn mẫu lưu lượng và các phương pháp đo đạc chỉ là bước
đầu, xa hơn nữa việc nghiên cứu để giám sát lưu lượng IP trở nên rất quan trọng và
cấp thiết khi mà lưu lượng mạng phát triển theo hàm số mũ.
1.3. Mô hình lưu lượng IP
Trong hệ thống đảm bảo chất lượng dịch vụ các lớp ứng dụng thời gian thực
và phi thời gian thực được triển khai với một số cơ chế đăng nhập để cho các mạng
quyết định liệu một yêu cầu gửi lưu lượng mới được chấp nhận hay loại bỏ sau khi
tính toán ảnh hưởng tới hoạt động đối với các luồng lưu lượng đang hoạt động.
Có nhiều phương pháp để mô hình hóa các quá trình xuất hiện luồng lưu
lượng và kích thước luồng lưu lượng trong các ứng dụng đa phương tiện băng rộng,
trong đó có hai nhóm tiếp cận mô hình chính. Nhóm đầu tiên [9 ] tiếp cận mô tả lưu
lượng dữ liệu sử dụng mô hình Markov trong đó liên quan chính đến tiến trình
Poisson, là phần quan trọng trong lý thuyết hàng đợi hiện tại. Các mô hình khác
trong nhóm này để mô hình hóa xác suất xuất hiện gói như là Poisson –batch hoặc
Markov Modulate Poisson Process. Nhóm thứ hai dựa trên bản chất tương tự nhau
của các nguồn dữ liệu đa phương tiện. Nhóm này tập hợp các mô hình dựa trên việc
quan sát các mẫu lưu lượng đột biến được tạo ra bởi các nguồn dữ liệu và các ứng
dụng bit thay đổi, với xu hướng mô tả mức độ tương quan giữa các luồng lưu lượng
đến và chỉ ra những phụ thuộc theo thời gian (lưu lượng tự đồng dạng).
1.4. Kết luận chương
Với sự phát triển của kỹ thuật lưu lượng, việc giám sát lưu lượng mạng IP có
thể có tác động rất lớn đến hiệu năng của mạng. Cấu trúc và phương pháp đo kiểm
hiện tại không thể đáp ứng được những yêu cầu và đòi hỏi cho việc giám sát chính
xác QoS của các ứng dụng IP. Do đó, luận văn nêu bật yêu cầu cần phải phát triển
những phương thức và mô hình giám sát lưu lượng mạng IP mới.
17
CHƯƠNG 2: CÁC PHƯƠNG PHÁP BẮT GIỮ VÀ PHÂN TÍCH LUỒNG
LƯU LƯỢNG IP
2.1. Các phương pháp bắt giữ lưu lượng IP trên Internet
Có rất nhiều lý do phải thực hiện thu thập lưu lượng Internet và đo lường các
thông số liên quan của nó. Tuy nhiên, có thể tóm tắt theo 3 mục tiêu chính là:
- Phục vụ việc nghiên cứu đặc tính và sự biến thiên của lưu lượng.
- Giám sát hiệu suất hoạt động và chất lượng dịch vụ của mạng.
- Điều khiển truy nhập tài nguyên và cung cấp chất lượng dịch vụ (QoS)
mạng.
Hai mục tiêu sau liên quan chặt chẽ với nhau và chỉ khi khác nhau trên
phương diện thang thời gian của phép đo. Bảng 2-1 dưới đây trình bày các phép đo
điển hình trong mạng Internet và ứng dụng tương ứng của chúng.
Bảng 2-1: Một số phép đo điển hình trên mạng Internet
Ứng dụng
đối với:
Phép đo Mục đích
Nhà cung
cấp dịch
vụ
(ISP/IXP)
• Hệ số sử dụng băng thông
• Số lượng gói /giây
• RTT(round trip time)
• Biến thiên RTT
• Tỉ lệ mất gói
• Khả năng kết nối
• Hiệu suất kết nối
• Giám sát định tuyến
• Phân bố kích thước gói,
luồng, phiên làm việc
• Phân bố thời điểm đến của
các gói, luồng lưu lượng
• Quy hoạch dung lượng
• Tối ưu hoá mạng
• Khai thác mạng
• Cung cấp chất lượng
dịch vụ
• Cung cấp các dịch vụ
giá trị gia tăng
• Dự đoán xu hướng phát
triển của lưu lượng
• Điều khiển truy nhập
mạng
• Tính cước
Người
dùng
• Băng thông sẵn sàng
• Thời gian đáp ứng
• Giám sát hiệu suất
• Kế hoạch cung cấp
18
• Tỉ lệ mất gói
• Khả năng kết nối
• Tốc độ kết nối
• Chất lượng dịch vụ
• Hiệu suất ứng dụng
(ứng dụng)
• Thoả thuận mức dịch
vụ
• Thiết lập mức chất
lượng
• Tối ưu hoá việc phân
phát nội dung
• Lập kế hoạch sử dụng
Nhà sản
xuất thiết
bị mạng
• Lấy mẫu lưu lượng
• Phân tích log file
• Phân bố kích thước gói,
cụm, luồng, lưu lượng và
phiên làm việc
• Phân ATI gói, luồng và
phiên làm việc
• Cải thiện thiết kế và
cấu hình thiết bị
• Cho phép giải quyết sự
cố thiết bị thời gian
thực
Một cách tóm tắt, có thể phân loại các thông số cần đo của mạng Internet thành
4 nhóm như sau:
- Các thông số đo lường hệ số sử dụng mạng, bao gồm: số lượng gói, số lượng
byte, lưu lượng đỉnh, phân bố lưu lượng giữa các ứng dụng và giao thức.
- Các thông số đo lường hiệu suất, như: RTT (trên các khớp khác nhau), tỉ lệ
huỷ gói, hay tỉ lệ gói va chạm trong các mạng cấu hình bus.
- Các thông số về hệ sẵn sàng, bao gồm độ sẵn sàng đường đi, độ sẵn sàng của
liên kết và độ sẵn sàng ứng dụng.
- Và cuối cùng là các thông số đo lường độ ổn định, bao gồm: tốc độ thay đổi
trạng thái đường truyền, bảng định tuyến, v.v
Để thực hiện đo các thông số này người ta đã đưa ra nhiều phương pháp và
kĩ thuật đo khác nhau, nhưng nhìn chung có thể chia thành hai phương pháp chính
là: Đo lường chủ động và đo lường thụ động.
19