Tải bản đầy đủ (.doc) (46 trang)

Đề tài nghiên cứu, xây dựng tài liệu hướng dẫn kiểm tra và khắc phục lỗi của thiết bị router

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (451.18 KB, 46 trang )

THUẬT NGỮ VIẾT TẮT 3
1. Nghiên cứu, xây dựng đề cương nghiên cứu chi tiết 4
1.1 Tên nhiệm vụ : 4
1.2. Mục đích của việc nghiên cứu, xây dựng: 4
2 Nghiên cứu và xác định các yêu cầu vật lý đảm bảo an toàn cho hoạt động
của router 4
2.1 Xác định các sự cố vật lý có thể xảy ra 4
2.2 Thực hiện các yêu cầu vất lý để đảm bảo Router hoạt động an toàn 5
3. Nghiên cứu, xây dựng hướng dẫn kiểm tra và khắc phục lỗi vật lý của thiết
bị Router 7
3.1. Khảo sát và phân tích các lỗi vật lý thường gặp của thiết bị Router 7
3.2. Nghiên cứu, xây dựng hướng dẫn kiểm tra và khắc phục sự cố vật lý của Router 7
3.2.1. Kiểm tra thông tin cơ bản về Router 7
3.2.2. Kiểm tra và xác định sự cố của Router về các vấn đề như:Cổng Serial, cổng ISDN, bộ nhớ,
Router bị treo 8
Kiểm tra và khắc phục lỗi trên cổng Serial 8
Các vấn đề xử lý sự cố trên cổng Serial 9
Xử lý sự cố trên cổng ISDN 11
Xử lý sự cố với các vấn đề về bộ nhớ: 11
3.2.3. Kiểm tra và khắc phục lỗi khi Router Reboots/Reloads 11
Cấu hình thanh ghi để vào chế độ ROMMON 12
3.2.4. Kiểm tra và khắc phục lỗi khi Router bị Boot liên tục 13
3.2.5. Kiểm tra và khắc phục lỗi Router không boot được 14
3.2.6. Kiểm tra và khắc phục lỗi khi Router làm mất gói tin 16
Mã phát hiện lỗi (CRC) và các lỗi khung hình. 16
Cổng giao tiếp Ethernet 16
Bỏ qua gói tin: 17
3.3. Nghiên cứu, xây dựng hướng dẫn khắc phục lỗi Crashes trên Router 18
3.3.1. Khảo sát và phân tích các kiểu lỗi Crash trên thiết bị định tuyến 18
Router bị Crashes 18
Bus Error Crashes 19


Lỗi địa chỉ 19
Lỗi xử lý ngoại lệ số học 19
Lỗi xử lý ngoại lệ của bộ nhớ (Cache) 20
Lỗi do ngắt mạch: Error Interrupt 20
1
Lỗi định đạng 20
Hướng dẫn không hợp lệ (illegal instruction) 20
Ngoại lệ Opcode không hợp lệ 20
Lỗi nhảy vể 0 (Jump to Zero Error) 20
Lỗi bẫy Emulator 21
Không xác định đuợc bẫy lỗi (Undefined Trap) 21
Phần cứng ngắt không mong muốn (Unexpected Hardware Interrupt) 21
Lỗi không rõ ràng (Unknown Failure) 21
Không rõ nguyên nhân Reload (Unknown Reload Cause) 21
Lỗi ngắt thanh ghi Bus (Write Bus Error Interrupt) 21
3.2.2 Kiểm tra và nhận biết thông tin về lỗi Crash 22
3.3.3. Khắc phục sự cố trên các Module của Router 25
Xử lý sự cố khi module VIP (versatile interface processor) bị crash 25
Kiến trúc VIP 25
Làm thể nào để xác định VIP: 27
4. Nghiên cứu, xây dựng hướng dẫn kiểm tra và khắc phục lỗi logic của thiết
bị Router 30
4.1. Kiểm tra và khắc phục lỗi sự cố của Router tại tầng 2 Data Link 30
4.2. Kiểm tra và khắc phục lỗi sự cố của Router tại tầng 3 Network 32
4.3. Nghiên cứu xây dựng hướng dẫn một số điểm cần chú ý để khắc phục lỗi bảo mật cho
Router, bao gồm: 35
4.3.1. Kiểm tra những thông tin bảo mật cơ bản của Router 35
4.3.2 Hướng dẫn khắc phục một số lỗi bảo mật cơ bản của Router 36
2
THUẬT NGỮ VIẾT TẮT

Router Thiết bị định tuyến
Switch Thiết bị chuyển mạch
line Đường
Access list Danh sách truy cập
Interface Giao diện điều khiển hoặc cổng giao tiếp
Password Mật khẩu
Lan Mạng nội bộ
Wan Mạng diện rộng
IOS Hệ điều hành
Mode Chế độ
Port Cổng
FireWall Thiết bị tường lửa
Configuration Cấu hình
Protocol Giao thức
Telnet Truy cập từ xa
3
1. Nghiên cứu, xây dựng đề cương nghiên cứu chi tiết.
1.1 Tên nhiệm vụ :
Nghiên cứu, xây dựng tài liệu hướng dẫn kiểm tra và khắc phục lỗi của thiết bị
Router
1.2. Mục đích của việc nghiên cứu, xây dựng:
Xây dựng tài liệu hướng dẫn kiểm tra và khắc phục lỗi của thiết bị định tuyến
(Router)
2 Nghiên cứu và xác định các yêu cầu vật lý đảm bảo an toàn cho hoạt động
của router.
2.1 Xác định các sự cố vật lý có thể xảy ra
o Hardware threats: Là các mối đe dọa thiệt hại vật chất phần cứng của
router hoặc switch.
o Environmental threats: Là các mối đe dọa do nhiệt độ (quá nóng hay quá
lạnh) hoặc do độ ẩm (quá ướt hay quá khô).

o Electrical threats: Là các mối đe dọa như tăng giảm điện áp, điện áp cung
cấp không đầy đủ và tổng số tổn thất điện năng.
o Mainternance threats: Là các mối đe dọa do việc xử lý kém của các thành
phần điện tử chính (gây rò rỉ điện), thiếu phụ tùng quan trọng, dây cáp
kém, lắp đặt kém
4
2.2 Thực hiện các yêu cầu vất lý để đảm bảo Router hoạt động an toàn
Giảm thiểu những mối đe dọa do phần cứng
Nhiệm vụ quan trọng của các thiết bị router và switch nên được đặt trong hệ
thống điện tử hoặc máy tính hoặc phòng viễn thông đáp ứng những yêu cầu tối
thiểu sau đây:
o Nhân viên được ủy quyền phải khóa phòng và chỉ có người có phận sự
mới được vào.
o Không nên để người khác có thể đột nhập vào phòng thông qua trần nhà,
sàn nhà, cửa sổ, đường ống, hoặc bất kì địa điểm nào khác.
o Nếu có thể, việc kiểm soát truy cập điện tử nên được khai thác tối đa khả
năng chống truy cập trái phép của hệ thống an ninh và được giám sát bởi
các nhân viên an ninh.
o Nếu có thể, nhân viên an ninh nên giám sát qua camera an ninh và tự động
ghi âm
Giảm thiểu những mối đe dọa do môi trường
Các quy tắc sau nên được áp dụng để hạn chế những mối đe dọa do môi trường
tới router và switch:
o Phòng phải được cung cấp hệ thống kiểm soát nhiệt độ và độ ẩm tốt. Luôn
luôn kiểm tra các thông số nhiệt độ môi trường trong phòng phù hợp theo
yêu cầu tài liệu sản phẩm được cung cấp.
o Nếu có thể, các thông số nhiệt độ môi trường này nên được theo dõi từ xa
và có chế độ báo động kịp thời.
o Phòng phải được đảm bảo sự nhiễu điện và từ trường
Giảm thiểu những mối đe dọa do điện năng

Những vấn đề liên quan đến điện năng có thể được hạn chế bằng cách tuân thủ
các quy tắc sau đây:
o Cài đặt các hệ thống điện năng hỗ trợ không bị gián đoạn (uninterrupted
power supply -UPS) cho những thiết bị router và switch quan trọng.
5
o Cài đặt các hệ thống máy phát điện dự phòng cho nguồn cung cấp quan
trọng.
o Lên kế hoạch và khởi tạo UPS, thường xuyên kiểm tra máy phát điện và
thực hiện lịch trình bảo trì phòng ngừa dựa vào các yêu cầu của nhà sản
xuất.
o Sử dụng nguồn lọc.
o Cài đặt các nguồn điện dự phòng trên các thiết bị quan trọng.
o Theo dõi và cảnh báo liên quan đến các thông số mức độ yêu cầu của thiết
bị.
Giảm thiểu những mối đe dọa liên quan đến bảo trì
Các mối đe dọa liên quan đến bảo trì là một hạng mục rộng lớn bao gồm nhiều
quy tắc. Các quy tắc chung sau đây cần được tuân thủ để ngăn chặn các mối đe
dọa:
o Tất cả các loại cáp nên được dán nhãn rõ ràng và trang bị các thiết bị giá
đỡ để ngăn chặn thiệt hại ngẫu nhiên hoặc bị ngắt kết nối đột ngột.
o Chạy dây cáp, ống bảo vệ dây cáp hoặc cả hai cùng được sử dụng để đi
qua kết nối rack-to-ceiling hoặc rack-to-rack.
o Luôn luôn tuân theo quy trình xả điện (electrostatic discharge -ESD) khi
thay thế hoặc làm việc với các thiết bị router và switch.
o Duy trì một kho chứa các phụ kiện thay thế quan trọng để sử dụng trong
trường hợp khẩn cấp.
o Không để một kết nối điều khiển và đăng nhập vào bất kỳ cổng console
nào. Luôn log off giao diện quản trị chính khi ra ngoài.
o Luôn luôn nhớ rằng, không có phòng nào là hoàn toàn an toàn và không
nên chỉ dựa vào lực lượng bảo vệ để đảm bảo an ninh cho thiết bị truy cập.

Một khi kẻ xâm nhập vào được bên trong phòng, sẽ không có biện pháp
nào để ngăn chặn kết nối vào terminal thông qua cổng console của router
hoặc switch.
6
3. Nghiên cứu, xây dựng hướng dẫn kiểm tra và khắc phục lỗi vật lý của
thiết bị Router
3.1. Khảo sát và phân tích các lỗi vật lý thường gặp của thiết bị Router
Router trong quá trình hoạt động đường gặp những lỗi vật lý sau:
o Router bị Reboots/Reloads
o Router bị boot liên tục
o Router không boot được
o Router làm mất gói tin
Về cấu hình Logic Router thường cấu hình chưa đảm bảo tính bảo mật như
o Bật các dịch vụ không an toàn trên thiết bị Router
o Không hạn chế việc truy cập tới Router từ các máy client
o Quản lý được việc kết nối tới Router
o Không kiểm soát được kết nối từ bên trong mạng đi ra bên ngoài
thông qua Router
o Không kiểm soát được kết nối từ bên ngoài mạng đi vào bên trong
mạng thông qua Router
o Các giao thức định tuyến chưa cấu hình bảo mật
3.2. Nghiên cứu, xây dựng hướng dẫn kiểm tra và khắc phục sự cố vật lý của
Router
3.2.1. Kiểm tra thông tin cơ bản về Router
Thông thin cơ bản cần thiết về các Router
Tích hợp phần cứng-phần mềm và yêu cầu bộ nhớ:
Bất cứ khi nào cài đặt 1 card/module mới, hoặc phần mềm IOS của Router, phải
kiểm tra lại Router có đủ bộ nhớ không, phần cứng và phần mềm tích hợp với
các tính năng cần sử dụng.
Để kiểm tra xem phần cứng-mềm có tương thích và các yêu cầu về bộ nhớ cần

hoàn thành các bước sau:
1. Sử dụng Software Advisor Tool cho việc chọn phần mềm cho các thiết bị
mạng
7
Hỗ trợ phần mềm cho phần cứng: kiểm tra lại xem các moduls và các cạc được
cài đặt trên Router có được hỗ trợ bởi phiên bản phần mềm IOS của router hay
không.
Hỗ trợ phần mềm cho các tính năng: xác định các tính năng và Router hỗ trợ, có
thể chọn các kiểu đặc tính muốn thực thi.
2. Sử dụng nâng cấp IOS Panner để kiểm tra khối lượng nhỏ nhất của bộ nhớ
(Ram và Flash) được yêu cầu bởi phần mềm trên Router IOS, và/hoặc tải phần
mềm IOS của Router để phát hiện ra khối lượng của bộ nhớ (RAM và Flash)
được cài đặt trên Router.
3. Ví dụ những lỗi thường gặp khi thực hiện nâng cấp
Fixed and Modular Access Routers
Thông báo lỗi
Thông báo lỗi xuất hiện trên cổng Console của Router, thông thường trên form:
%XXX-n-YYYY : [text]
Đây là 1 ví dụ thông báo lỗi
Router# %SYS-2-MALLOCFAIL: Memory allocation of [dec] bytes failed from
[hex],
pool [chars], alignment [dec]
Một vài thông báo lỗi chỉ đưa ra duy nhất thông tin, trong khi những thông báo
khác đưa ra chỉ dẫn lỗi phần cứng hay phần mềm và yêu cầu hành động. Vấn đề
về nhận dạng
+ Các nhật ký của bảng điều khiển: (Console Logs )
+ Thông tin log hệ thống (Syslog). Nếu Router cài đặt để gửi các Log tới Log hệ
thống trên máy chủ, ta có thể nhận biết được điều gì đang xảy ra.
+ Câu lệnh xuất thông tin: Show technical-support: Đây là một câu lệnh biên
dịch gộp của nhiều lệnh Show khác nhau như là: Show version, show running-

config và show stacks.
3.2.2. Kiểm tra và xác định sự cố của Router về các vấn đề như:Cổng Serial,
cổng ISDN, bộ nhớ, Router bị treo.
Kiểm tra và khắc phục lỗi trên cổng Serial
Sơ đồ khắc phục sự cố:
8
Các vấn đề xử lý sự cố trên cổng Serial
Phần này đưa ra các thông tin khắc phục sự cố cơ bản và thảo luận về các
công cụ và công nghệ sử dụng cho việc khắc phục sự cố về kết nối trên cổng
Serial. Bao gồm các phần sau:
+ Khắc phục sự cố khi sử dụng lệnh Show interfaces serial
+ Sử dụng lệnh show controllers
+ Sử dụng lệnh debug
+ Sử dụng kiểm tra Ping
+ Khắc phục sự cố với các vấn đề về Clocking
+ Điều chỉnh Buffers
+ Kiểm tra với các dòng Serial đặc biệt
9
+ Thông tin chi tiết với câu lệnh: show interfaces serial
+ Các vấn đề khắc phục sự cố với cổng T1
+ Các vấn đề khắc phục sự cố với cổng E1
- Yêu cầu:
Phải nắm được các khái niệm sau:
• DTE = data terminal equipment
• CD = Carrier Detect
• CSU = channel service unit
• DSU = digital service unit
• SCTE = serial clock transmit external
• DCE = data circuit-terminating equipment
• CTS = clear-to-send

• DSR = data-set ready
• SAP = Service Advertising Protocol
• IPX = Internetwork Packet Exchange
• FDDI = Fiber Distributed Data Interface
• ESF = Extended Superframe Format
• B8ZS = binary eight-zero substitution
• LBO = Line Build Out
Thành phần sử dụng:
Phần mềm này không bị giới hạn bởi phần mềm cụ thể và các phiên bản phần
cứng
Thông tin đưa ra trong tài liệu này được tạo ra từ các thiết bị trong môi trường
Lab cụ thể. Hiển thị đầu ra của lệnh Show interfaces serial cho một High-Level
Data Link (HDLC) cổng Serial.
* Xử lý sự cố các dòng Serial
* Các kiểm tra Lookback cho dòng T1/56K
10
Xử lý sự cố trên cổng ISDN
Sử dụng các tham chiếu để khắc phục sự cố trên cổng Serial
- Xử lý sự cố ISDN trên Layer 1
- Xử lý sự cố ISDN trên Layer 2
- Xử lý sự cố ISDN trên Layer 3
Xử lý sự cố với các vấn đề về bộ nhớ:
Nếu một Router không có đủ bộ nhớ nó có thể đưa ra lỗi khi khởi động như sau:
SYSTEM INIT: INSUFFICIENT MEMORY TO BOOT THE IMAGE!
Hoặc đưa ra một lỗi khác về việc cấp phát bộ nhớ: %SYS-2-MALLOCFAIL theo
thông báo sau:
00:00:07: %SYS-2-MALLOCFAIL: Memory allocation of 4000 bytes failed
from 0x32D05
C0, alignment 0
Pool: Processor Free: 0 Cause: Not enough free memory

Alternate Pool: I/O Free: 0 Cause: Not enough free memory
- Đảm bảo rằng Router của bạn có dung lượng bộ nhớ tối thiểu cần thiết được chỉ
định trong Cisco IOS
+ Có kế hoạch nâng cấp
+ Xem nâng cấp Boot Image với Thẻ nhớ Flash cho Router và phần thông tin
thêm
3.2.3. Kiểm tra và khắc phục lỗi khi Router Reboots/Reloads
Khi Router khởi động lại, nó sẽ trở về trạng thái bình thường. Một trạng thái
“normal state” nghĩa là Router thực hiện các chức năng thông thường, lưu lượng
được chuyển qua Router và bạn có thể truy cập vào Router. Kiểm tra xem tại sao
Router bị khởi động lại sử dụng lệnh Show verion xem các thông tin đầu ra (xem
ví dụ dưới đây):
Router# show version
Router uptime is 20 weeks, 5 days, 33 minutes
System returned to ROM by power-on
11
Cấu hình thanh ghi để vào chế độ ROMMON
Cấu hình thanh ghi chuẩn có giá trị là 0x2102 nơi mà bít thứ 8 có giá trị là
0x2102 được thiết lập và vô hiệu hóa quá trình gián đoạn. Thiết lập bít thứ 8
bằng 0 có giá trị là (0x2002) để cho phép bít này bị gián đoạn. Khi quá trình gián
đoạn diễn ra, Router không nhận ra các chuỗi để có thể nhập vào và làm cho
Router bị Crash, Nếu bạn nạp lại một giao diện điều khiển của PC để kết nối tới
giao diện điều khiển của Router. Xem cấu hình bít thanh ghi phần mềm cho biết
thông tin chi tiết về cấu hình giá trị thanh ghi khác nhau.
Một modem được gắn vào cổng giao diện điều khiển có thể gây ra tiếng ồn đó
không phải là một định dạng được công nhận. Nếu điều này xảy ra hãy tháo dây
cắm từ Router đến modem ra và chuyển sang cổng kết nối phụ. Router được nạp
lại và quá trình nạp lại được diễn ra. Bạn có thể kiểm tra cấu hình thanh ghi cuối
cùng bằng lệnh Show version.
Router#show version

IOS (tm) 2500 Software (C2500-DS40-L), Version 11.2(9),
RELEASE SOFTWARE (fc1)
Copyright (c) 1986-1997 by cisco Systems, Inc.
Compiled Tue 23-Sep-97 08:20 by ckralik
Image text-base: 0x03038474, data-base: 0x00001000
ROM: System Bootstrap, Version 11.0(5), SOFTWARE
BOOTFLASH: 3000 Bootstrap Software (IGS-BOOT-R), Version 11.0(5),
RELEASE SOFTWARE (fc1) doduo uptime is 18 hours, 37 minutes
System restarted by unknown reload cause - ptr to non-ascii bytes 0x4
System image file is "flash:c2500-ds40-l.112-9", booted via flash
cisco 2524 (68030) processor (revision B) with 8192K/2048K bytes of memory.
Processor board ID 02781822, with hardware revision 00000000
Bridging software.
X.25 software, Version 2.0, NET2, BFE and GOSIP compliant.
1 Ethernet/IEEE 802.3 interface(s)
2 Serial network interface(s)
5-in-1 module for Serial Interface 0
12
5-in-1 module for Serial Interface 1
32K bytes of non-volatile configuration memory.
8192K bytes of processor board System flash (Read ONLY)
Configuration register is 0x2
3.2.4. Kiểm tra và khắc phục lỗi khi Router bị Boot liên tục
Router thường có một bộ vi xử lý có tính giờ mà bảo vệ chống lại một số kiểu hệ
thống bị treo cứng. Theo định kì CPU sẽ khởi động lại bộ đếm thời gian. Các bộ
đếm thời gian thông thường sẽ kiểm soát thời gian của các quá trình. Nếu bộ đếm
thời gian không khởi động lại thì có một bẫy lỗi xảy ra. Nếu một quá trình dài
hơn bình thường nên được bộ đếm thời gian sử dụng để thoát khỏi quá trình này.
Có hai kiểu bộ đếm thời gian timeouts chính. Loại thứ nhất thường được gây ra
bởi vấn đề về phần mềm và được báo cáo trong một hoặc hai cách sau:

Hiển thị đầu ra của lệnh Show version
Hệ thống trả lại ROM một địa chỉ bus lỗi trên máy PC 0x602DADE0, địa chỉ
0x480811
hoặc hệ thống trả loại ROM một lỗi mà do phần mềm gây ra trên máy PC tại địa
chỉ 0x60435894
Hiển thị nhật ký
%SYS-2-WATCHDOG: Process aborted on watchdog timeout
Kiểu thứ hai bộ đếm thời gian timeouts thường do vấn đề phần cứng và được báo
cáo trong một hoặc 2 cách sau:
Hiển thị đầu ra bằng lệnh show version
Router uptime is 17 minutes
System returned to ROM by watchdog timer expired
System image file is "flash:c3640-is-mz.122-3.bin"
Hiển thị các Log
System returned to ROM by watchdog timer expired
*** Watch Dog Timeout ***
PC = 0x800001b4, SP = 0x61e19590
Cả hai vấn đề do phần mềm mềm gây ra cần tiếp tục được theo dõi, điều tra dự
trên hệ thống. Xem thêm phần xử lý sự cố khi Bus bị lỗi Craches và xử lý sự cố
13
khi phần mềm bị lỗi Crashes điều này phụ thuộc rất nhiều khi ta sử dụng lệnh
show version. Lệnh này cũng cho chúng thêm thông tin khi bộ đếm thời gian
timeouts bị crashes.
3.2.5. Kiểm tra và khắc phục lỗi Router không boot được
Xử lý sự cố khi Router không boot được chúng ta phải bắt thông tin từ cổng
console của Router
Đầu ra của giao diện nên được đăng nhập trong một tập tin để phân tích sau hoặc
cho trung tâm giúp đỡ kỹ thuật (TAC), nếu dịch vụ giúp đỡ kỹ thuật được mở.
Bảng sau đây sẽ liệt kê các triệu chứng và các hành động kiến nghị(đề xuất) để
thực hiện nếu bạn gặp vấn đề về khởi động:

Triệu trứng Hành động đề nghị
Đèn LED không sáng khi bạn đã
bật nguồn của Router
Kiểm tra xem dây diện được cắm chắc chắn
chưa và nguồn điện có đủ mạnh không. Nếu
không giải quyết được vấn đề thì bạn phải
thay dây điện. Nếu làm như trên mà vấn đề
chưa được xử lý thì nên thay thế Router
Đèn LED sáng khi bạn bật
Router nhưng không nhìn thây gì
trên giao diện điều khiển
Kiểm tra lại xem tốc độ đường truyền được
thiết lập có phải là tốc độ 9600 bps không.
Nếu điều đó không giúp được xác minh xem
thiết bị mà bạn sử dụng để kết nối tới giao
diện điều khiển vận hành đúng. Để làm như
vậy, kết nối tới Router phải tốt để kiểm tra
thiết giao diện điều khiển của bạn. Nếu thiết
bị được kiểm tra thành công, nhưng vấn đề
vẫn không được giải quyết thì bạn nên thay
thế Router
Router bị kẹt trong chế độ
ROMMON lệnh
rommon#prompt, không có
thông báo lỗi trên giao diện điều
khiển
Thiết lập cấu hình:
rommon 1 > confreg 0x2102
rommon 2 > reset
Đối với thông tin về việc làm thế nào để khôi

phục lại một Router bị kẹt trong chế độ
rommon, tìm hiểu thêm phần khôi phục
rommon cho Router
14
Router khởi động vào chế độ
rommon với thông báo trên bàn
giao diện điều khiển
device does not contain a valid
magic number
boot: cannot open "flash:"
boot: cannot determine first file
name on device "flash:"
Flash trống hoặc hệ thống tập tin bị hỏng. Sao
chép một image hợp lệ trên Flash, và trong
khi sao chép, ta sẽ được nhắc phải xóa Flash
cũ (nếu có). Sau đó tải lại Router. Xem cài đặt
phần mềm và thủ tục nâng cấp để được hướng
dẫn làm thế nào để sao chép một image hợp lệ
vào Flash
Nạp lại do một lỗi chẵn lẻ Ở lần đầu tiên xảy ra, theo dõi các bộ định
tuyến. Ở lần thứ hai xảy ra, thay thế phần
cứng tương ứng như miêu tả bên trong tài liệu
xử lý sự cố với lỗi chẵn lẻ
Nạp lại do phần mềm bị crash Nâng cấp phiên bản phần mềm IOS mới nhất
trên Router của bạn
Nạp lại do một lỗi SegV Lỗi SegV thường xuyên liên quan đến vấn đề
về phần mềm. Nâng cấp phiên bản phần mềm
IOS mới nhất trên Router, hoặc sử dụng công
cụ Ouput interpreter (chỉ được đăng ký bởi
khách hàng) để hiện thị các vấn đề và các bản

sửa lỗi.
Router bị mất cấu hình trong quá
trình khởi động lại?
Trong hầu hết các trường hợp, đây là kết quả
của việc thiết lập cấu hình không đúng với
đăng ký. Cấu hình đăng ký thường thay đổi
trong suốt quá trình khôi phục password để bỏ
qua cấu hình đã mất khi động lại, nhiều lần
thì cấu hình đăng ký không trả lại chế độ thiết
lập thông thường.
15
3.2.6. Kiểm tra và khắc phục lỗi khi Router làm mất gói tin
Mất gói tin là nguyên nhân gây ra các vấn đề về phần cứng và dễ dàng phát hiện
ra. Trong phần này sử dụng đầu ra của lệnh show interfaces để xác định gói tin bị
mất.
Mã phát hiện lỗi (CRC) và các lỗi khung hình.
Nếu các CRC lỗi hoặc các lỗi khung hình liên tục gia tăng trên giao diện, điều
này thường chỉ do vấn đề về phần cứng
router#show interfaces ethernet 0
Ethernet0/0 is up, line protocol is up

121 input errors, 102 CRC, 19 frame, 0 overrun, 0 ignored
Một ngoại lệ này là khi lỗi CRC và khung hình được tìm thấy trên kênh giao
diện; điều này cũng có thể chỉ do vần đề về clocking. Những sai lầm gây ra các
lỗi có thể ở bất cứ đâu có thể do sự kết nối giữa cổng giao tiếp và cáp, thiết bị
trung gian, bản thân cổng giao tiếp. Xử lý sự cố kỹ thuật khác biệt đôi chút đối
với các kiểu cổng giao tiếp.
Cổng giao tiếp Ethernet
Đối với cổng giao tiếp Ethernet, xử lý sự cố khác nhau giữa một môi trường chia
sẻ( thiết bị kết nối thông qua một hub hoặc cáp xoắn đồng trục) và một môi

trường chuyển mạch ( các thiết bị kết nối tới Switch). Trong một môi trường
chuyển mạch, chỉ có năm thành phần có thể gây ra lỗi:
+ Dây cáp (cable)
+ Cổng giao tiếp nội bộ (Local Interfaces)
+ Cổng giao tiếp điều khiển tử xa (remote interface)
+ Tốc độ (speed)
+ Song công không phù hợp (duplex mismatch)
Do đó, các bước để khắc phục xử lý sự cố đơn giản. Ví dụ, nếu một Router kết
nối tới một switch thì các bước xử lý sự cố như sau:
1. Thay thế dây cáp
2. Nếu điều này không giải quyết được vấn đề, cố gắng thử một cổng trên Switch
16
3. Nếu vấn đề vẫn còn, thay thế cổng giao tiếp Ethernet
Trong một môi trường chia sẻ muốn tìm hiểu nguồn gốc của vấn đề là điều hết
sức khó khăn. Mỗi thành phần của phần cứng mà tạo nên phân đoạn chia sẻ có
thể là nguyên ngân. Tất cả các thành phần(dây cáp, bộ phận kết nối, …) được
kiểm tra từng phần một.
Bỏ qua gói tin:
Các gói tin bị bỏ qua nếu bộ đệm không rảnh để chấp nhận các gói tin mới. Điều
này có thể xảy ra nếu Router bị quá tải với lưu lượng truy cập, nhưng điều này
cũng có thể xảy nếu giao diện kết nối bị lỗi.
router#
show interfaces ethernet 0
Ethernet0/0 is up, line protocol is up
21 input errors, 0 CRC, 0 frame, 0 overrun, 21 ignored
Nếu “bỏ qua” các vấn đề hiện tại trên tất cả cổng giao diện kết nối, Router có thể
quá tải với lưu lượng hoặc không có đủ bộ đệm trống bên trong vùng nhớ mà phù
hợp với đơn vị truyền dẫn tối đa. Trong trường hợp sau, để chống lại sự bỏ qua
gia tăng theo sau phải chống việc không có vùng nhớ đệm gia tăng.
router#

show interfaces serial 0

1567 packets input, 0 bytes, 22 no buffer
22 input errors, 0 CRC, 0 frame, 0 overrun, 22 ignored, 0 abort
Có thể sự gia tăng chống lại các bộ đệm bị lỗi bên trong vùng nhớ mà phù hợp
với kích thước của MTU:
router#
show buffers

Big buffers, 1524 bytes (total 50, permanent 50):
50 in free list (5 min, 150 max allowed)
3066 hits, 189 misses, 0 trims, 24 created
17
12 failures (0 no memory)
Số lượng của các cấu hình có sẵn thường xuyên và tối đa được cho phép trong bộ
đệm có thể không hoàn toàn phù hợp với mọi môi trường. Ta có thể đọc thêm
điều này và làm thế nào để tránh sự không phù hợp này khi điều chỉnh bộ đệm.
Nếu “bỏ qua” chỉ tăng trên một giao diện xử lý và không kèm theo sự gia tăng
của sự chống lại do “không có bộ nhớ đệm” và cổng giao diện xử lý không tải
quá nặng, sau đó cổng giao diện xử lý có thể bị lỗi. Trong trường hợp này hãy bắt
thông tin đầu ra bằng lệnh show technical-support hoặc liên lạc với TAC. Tải
trên giao cổng giao diện xử lý có thể xem được thông tin đầu ra bằng lệnh show
interfaces
router#show interfaces serial 0

reliability 255/255, txload 100/255, rxload 122/255
Đầu vào và đầu ra của hàng đợi bị Drop
Đầu vào trên hàng đợi bị drop không bao giờ do nguyên nhân bởi phần cứng gây
ra. Đầu ra trên hàng đợi bị drop có thể là nguyên nhân do vấn đề phần cứng gây
ra, chỉ khi đầu ra trên hàng đợi liên tục đầy và không có gói tin nào được gửi ra

cổng giao diện xử lý. Ta có thể đọc thêm về các loại drop trong việc xử lý sự cố
với đầu vào trên hàng đợi và đầu ra trên hàng đợi.
3.3. Nghiên cứu, xây dựng hướng dẫn khắc phục lỗi Crashes trên Router
3.3.1. Khảo sát và phân tích các kiểu lỗi Crash trên thiết bị định tuyến
Router bị Crashes
Một hệ thống bị Crash là đề cập tới tình huống mà một hệ thống phát hiện
một lỗi không thể khôi phục lại được mặc dù đã được khởi động lại. Một lỗi
crash có thể bị nguyên nhân bởi các vấn đề phần mềm, các vấn đề phần cứng
hoặc cả hai. Trong phần này chúng ta sẽ giải quyết vấn đề bị Crashes mà nguyên
nhân là do phần cứng gây ra, và các crashes có liên quan đến phần mềm, nhưng
có thể bị nhầm lẫn với các vấn đề của phần cứng.
Quan trọng: Nếu bạn nạp lại giá trị của Router sau khi bị crash (ví dụ thông qua
lệnh power-cycle hoặc reload) thông tin quan trọng về lỗi Crash sẽ bị mất. Thử
tập hợp lại các thông tin bằng lệnh đưa thông tin đầu ra Show technical-support
và show log trước khi bạn khởi động lại Router
18
Xem xử lý sự cố khi Router bị Crashes cho thêm 1 vài thông tin:
Bus Error Crashes
Hệ thống bắt gặp một lỗi với Bus khi các bộ vi xử lý cố gắng truy cập vào một
vùng bộ nhớ không tồn tại (do phần mềm lỗi), hoặc không trả lời đúng (một vấn
đề về phần cứng). Để xác định một lỗi Bus hãy nhìn đầu ra của lệnh Show
version được cung cấp bởi các Router (nếu không phải dùng lệnh Power-cycled
hoặc reloaded)
Đây là hai ví dụ về lỗi bus error crashes:
Router uptime is 2 days, 21 hours, 30 minutes
System restarted by bus error at PC 0x30EE546, address 0xBB4C4
System image file is "flash:igs-j-l.111-24.bin", booted via flash
Trên giao diện Console bạn có thể nhìn thấy thông báo lỗi trên một bus như sau:
*** System received a Bus Error exception ***
signal= 0xa, code= 0x8, context= 0x608c3a50

PC = 0x60368518, Cause = 0x20, Status Reg = 0x34008002
Hệ thống bị khởi động lại do không biết nguyên nhân nạp lại
Hệ thống bị khởi động lại bởi không biết lý do nạp lại nguyên nhân chính tạo ra
do không thể nhận ra chuỗi thông qua giao diện điều khiển. Nhiều khả năng một
modem tương tự kết nối tới cổng giao diện điều khiển đã gửi đi một luồng dữ
liệu không yêu cầu tới Router mà đây là trường hợp hiếm thấy sẽ làm Router nạp
lại hoặc thường xuyên xuất hiện một sự kiện nhưng do một vài nguyên nhân
thông thường gây ra.
Lỗi địa chỉ
Các lỗi liên quan đến vấn đề địa chỉ xảy ra khi phần mềm cố gắng truy cập dữ
liệu trên ranh giới không có liên kết chính xác; hai byte hoặc 4 byte truy cập
được cho phép trên địa chỉ. Một lỗi địa chỉ thường là do lỗi phần mềm nhưng nó
cũng có thể do lỗi phần cứng gây ra (xem thêm phần xử lý sự cố để biết thêm chi
tiết)
Lỗi xử lý ngoại lệ số học
Một phần mềm thường là nguyên nhân gây ra lỗi này (xem thêm phần xử lý sự
cố để biết thêm chi tiết)
19
Lỗi xử lý ngoại lệ của bộ nhớ (Cache)
Đây là kiểu crash gây ra khi Router phát hiện bít chẵn lẻ bị bad. Vấn đề này là
một vấn đề lỗi tạm thời hoặc do lỗi phần cứng. Để biết thêm thông tin để xử lý sự
cố này hãy tham khảo thêm các lỗi chẵn lẻ của bộ vi xử lý.
Lỗi – Lever <x>
X là một số từ 1 – 7
Đây là một kiểu Crash thường liên quan đến phần cứng. Hầu hết thường do lỗi
của CPU trên bo mạch gây ra kiểu lỗi này.
Lỗi do ngắt mạch: Error Interrupt
Một lỗi Crash do ngắt là do sự khác hơn so với việc bộ vi xử lý xác định được
một lỗi nghiêm trọng. Ta cần biết thêm thông tin để phát hiện ra nguyên nhân của
vấn đề. Một tệp tin Crashinfo hoặc lệnh đầu ra show tech-support để yêu cầu xử

lý sự cố. Tham khảo xử lý sự cố Crashes trên Router. Sau khi bạn tập hợp được
thông tin này liên hệ với đội ngũ hỗ trợ kỹ thuật.
Lỗi định đạng
Trừ khi các trường hợp rõ ràng chỉ ra một vấn đề phần cứng. (xem chi tiết phần
xử lý sự cố), liên hệ với đội hỗ trợ kỹ thuật khi gặp vấn đề này.
Hướng dẫn không hợp lệ (illegal instruction)
Lỗi này thường liên quan đến phần mềm. Tuy nhiên phần cững cũng có thể gây
ra lỗi này (thường là bộ nhớ hoặc RAM bị lỗi). Vấn đề này cũng có thể do phần
mềm IOS (xem phần xử lý sự cố để biết chi tiết).
Ngoại lệ Opcode không hợp lệ
Một lỗi phần cứng là nguyên nhân gây ra lỗi này (ví dụ, bộ vi xử lý trên bo mạch
chủ bị lỗi). Trong một vài trường hợp, khi một phần mềm có vấn đề cũng có thể
gây ra lỗi này. (xem phần xử lý sự cố để biết thêm chi tiết).
Lỗi nhảy vể 0 (Jump to Zero Error)
Đây là kiểu lỗi thường liên quan đến phần mềm IOS cố gắng để thay thế dữ liệu
vào mã (code). Hầu hết một phần mềm lỗi gây ra vấn đề này, nhưng nếu các triệu
trứng rõ ràng chỉ ra rằng do phần cứng gây ra, hãy xem xét khả năng do CPU bị
lỗi (xem xử lý sự cố để biết chi tiết)
20
Lỗi bẫy Emulator
Một đường 1010/1111 thường xảy ra lỗi Emulator khi bộ vi xử lý cố gắng thực
thi chỉ dẫn không hợp lệ. Các mã 1010/1111 thực sự không liên quan (mã phụ
thuộc vào các chỉ dẫn không hợp lệ nếu bạn cố gắng thực hiện)
Các nguyên có thể gây lỗi Line Emulator trap là:
- Image bị lỗi (Khi các bản sửa lỗi nâng cấp phần mềm IOS)
- Phát hiện lỗi bộ nhớ Flash hoặc DRAM
- Lỗi do phần mềm (xem xử lý sự cố để biêt chi tiết)
Không xác định đuợc bẫy lỗi (Undefined Trap)
Trừ khi trường hợp rõ ràng cho thấy vấn đề do phần cứng gây ra (xem phần xử lý
sự cố).

Phần cứng ngắt không mong muốn (Unexpected Hardware Interrupt)
Một vấn đề phần cứng thường là nguyên nhân gây ra kiểu crash này (xem phần
xử lý sự cố)
Lỗi không rõ ràng (Unknown Failure)
Trừ khi xác định rõ ràng vấn đề liên quan đến phần cứng (xem phần xử lý sự cố).
Không rõ nguyên nhân Reload (Unknown Reload Cause)
Ở đây, phát hiện ra nguyên nhân Crash không cho phép Router ghi lại các lý do
bị reload. Vấn đề này có thể liên quan đến phần cứng hoặc phần mềm. Trừ khi
xác định rõ rằng vấn đề do phần cứng gây ra (xem phần xử lý sự cố).
Kiểm tra xem bạn có thể giải quyết vấn đề liên quan đến việc nâng cấp phiên bản
phần mềm IOS cuối cùng hay không. Nếu không hãy thu thập thông tin về file
Crash hoặc từ bản ghi log ở giao diện điều khiển (tham khảo thêm phần xử lý sự
cố khi Router bị Crash).
Lỗi ngắt thanh ghi Bus (Write Bus Error Interrupt)
Một vấn đề phần cứng thường là nguyên nhân gây ra kiểu crash này (xem phần
xử lý sự cố).
21
3.2.2 Kiểm tra và nhận biết thông tin về lỗi Crash
Khi router bị Crash, điều quan trọng là thu thập thông tin nhiều nhất có thể về
crash trước khi bạn reload hoặc power-cycle Router. Tất cả thông tin về Crash,
trừ trường hợp đã được lưu trữ trong tập tin crashinfo, bị mất sau khi reload hoặc
power-cycle. Đầu ra dưới đây đưa ra một số thông tin về crash.
Nếu bạn có các lệnh đầu ra: show version, show stacks, show context, show tech
support trên Router. Bạn có thể sử dụng thông dịch đầu ra để hiển thị các vấn đề
và khắc phục sự cố. Để sử dụng thông dịch đầu ra bạn phải là một khách hàng đã
được đăng ký, đăng nhập và đã kích hoạt Java Script.
Lệnh Miêu tả
Show version Đây là đầu tiên xuất hiện trên phần mềm IOS. Thực thi lệnh
Show version hiển thị cáu hình của hệ thống phần cứng,
phiên bản phần mềm, tên và nguồn của tệp tin cấu hình và

image của phần mềm, thời gian hoạt động của Router, và
thông tin trên hệ thống được khởi động lại như thế nào.
Quan trọng: Nếu Router bị được nạp lải sau khi bị crash.
Thông tin sẽ bị mất vì vậy cố gắng thu thập thông tin trước
khi nạp lại
Show stacks Đây là lệnh xuất hiện bên trong phần mềm IOS. Thực thi
lệnh show stacks sử dụng để theo dõi quá trình sử dụng của
stack và việc ngắt trên Router. Lệnh show stacks là một trong
những nguồn không thể thiếu để tập hợp thông tin khi Router
bị crash.
Quan trọng: Nếu Router bị được nạp lải sau khi bị crash.
Thông tin sẽ bị mất vì vậy cố gắng thu thập thông tin trước
khi nạp lại
Show context Là một lênh xuất hiện đầu tiên trong phần mềm IOS. Thực
thi lệnh show context để hiển thị thông tin chứa trong
NVRAM khi ngoại lệ xảy ra. Thông tin ngữ cảnh trong một
kiến trúc và quá trình xử lý cụ thể, trong khi thông tin về
phiên bản phần mềm và thời gian hoạt động của Router
không có. Các thông tin ngữ cảnh trên các loại Router khác
nhau là khác nhau. Lệnh hiển thị đầu ra show context hiển
thị các thông tin sau:
22
- Lý do hệ thống bị khởi động lại
- Kiểm tra dấu vết stack
- Phiên bản phần mềm
- Tín hiệu số, mã, thời gian hoạt động của Router
- Tất cả nội dung đăng ký tại thời điểm Router bị crash
Show tech-
support
Đây là một lệnh xuất hiện đầu tiên trong phần mềm IOS.

Lệnh này rất hữu ích trong việc thu thập thông tin chung về
Router khi báo cáo một vấn đề. Nó bao gồm:
• show version
• show running-config
• show stacks
• show interface
• show controller
• show process cpu
• show process memory
• show buffers
Console logs Giữ thông tin này và các log trước đây. Khi Router được bật
trở lại, không quên xem thông tin đầu ra show stacks:
*** System received a Software forced crash ***
signal= 0x17, code= 0x24, context= 0x619978a0
PC = 0x602e59dc, Cause = 0x4020, Status Reg =
0x34008002
DCL Masked Interrupt Register = 0x000000f7
DCL Interrupt Value Register = 0x00000010
MEMD Int 6 Status Register = 0x00000000
23
Syslog Nếu cài đặt Router gửi các log thời một máy chủ syslog, ta sẽ
xem một vài thông tin xảy ra trước khi Router bị crash trên
máy chủ syslog. Tuy nhiên khi Router bị crash, nó có thể
không gửi hầu hết các thông tin có ích trên máy chủ syslog
này.
Crashinfo Tập tin crashinfo là tập hợp thông tin có ích liên quan đến
crash tạm thời, lưu trữ trong vùng bootflash hoặc bộ nhớ
flash. Khi Router bị crash do sự sai lệnh dự liệu hoặc ngăn
xếp, Nạp lại thông thông tin là cần thiết để gỡ lỗi cho kiểu
crash này. Dùng lệnh show stacks.

Core dump Một core dump là bản sao đầy đủ hình ảnh bộ nhớ của
Router. Đây là thông tin không cần thiết cho việc xử lý sự cố
của hầu hết các kiểu crash, nhưng nó đưa ra một khuyến nghị
cao khi dò ra một lỗi mới. Bạn có thể cần enable một số bug
lỗi để nhận thêm thông tin vào core cũng như phải tỉnh táo để
gỡ lỗi, lập lịch cho quá trình xử lý heapcheck và kiểm tra bộ
nhớ.
ROM monitor Router có thể quá trình theo dõi trong ROM sau một crash
khi quá trình thiết lập cấu hình kết thúc. Nếu bộ vi xử lý là
68k, dấu nhắc sẽ là “>”. Ta có thể nhận về stack với lệnh k.
Nếu bộ vi xử lý làm giảm quá trình thiết lập tính toán RISC.
Dấu nhắc sẽ là: “rommon 1>”. Nhận thông tin đầu ra của của
stack hoặc show context
24
3.3.3. Khắc phục sự cố trên các Module của Router
Xử lý sự cố khi module VIP (versatile interface processor) bị crash
Thành phần sử dụng:
• VIP1
• VIP2-10
• VIP2-15
• VIP2-20
• VIP2-40
• VIP2-50
• FEIP2
• GEIP
• GEIP+
• VIP4-50
• VIP4-80
• VIP6-80
Kiến trúc VIP

Để ngắt một crash VIP, điều quan trọng đầu tiên là hiểu được kiến trúc cơ bản
của VIP. Hình vẽ bên dưới hiển thị sơ đồ chức năng của VIP2, bao gồm các
thành phần:
Orion làm giảm chỉ dẫn thiết lập tính toán RISC liên quan đến vi mạch và bộ vi
xử lý bao gồm: DRAM, bộ đệm L2, ứng dụng RENO trong bản mạch tích hợp và
Boot ROM.
25

×