路由器故障处理及分析
一、 故障现象及处理
单位以Cisco7513路由器作为广域网骨干路由器,采用标准配置,IOS的版本为11.1。一日发现该路由器的2M主干出口线路协议处于down状态,从而使与之相联的网络中断,用“show running-config”命令检查所有运行参数,没有发现错误;又用“show interfaces serial”命令检查串口,发现某些端口状态up,而线路协议是 down,并且出现这种情况的串口均在同一个串口板(A板)上,其它各模块工作正常。经查所有物理线路也都正常,从而排除了线路故障的可能性。然而在一般情况下同一个串口板上的串口同时出现线路故障的可能性也并不大。至此可以初步确定可能A板出了问题。当进入全局配置模式后,再想进入A板上串口的端口配置模式时却发现无法实现,每次键入“interface serial串口号”时,总是报错,但是同样的命令却可以进入其它串口的.端口配置模式。这时,可以初步判断IOS本身出现了某种软件故障,用reload 命令重启路由器后系统进入ROMmonitor模式,提示符为“rommon>”,键入命令“boot”可启动路由器但故障依然存在,而且所有A板串口的配置语句全都报错。
再将路由器关电然后加电时观察到:路由器的交流(或直流)OK LED灯为绿色,这说明系统的供电子系统工作正常,风扇旋转正常且输出错误LED灯未亮,这说明冷却子系统工作正常,路由交换处理器(RSP)的LED灯为绿色,这也表示系统工作正常。各接口的Enable LED灯为绿色,表示RSP已完成了接口处理器的初始化。但A板的LED灯全闪了一下就灭了,执行“reset”命令再用“boot”引导系统后所有A板串口的配置语句全部消失了。
进一步检查A板时发现其型号为VIP2,其上的两个子模块中只安装了一个四串口子模块,因此A板上只有四个串(可扩充至8个),其中三个串口已使用,一个空闲。正常时三个使用的串口的LED灯应亮,而未使用的串口的LED灯应为黄色,但目前却是四个串口的LED都不亮。系统启动后,用命令“show version”可以发现系统已找到了A板并识别出该板的型号为VIP2,只是没有详细信息。为进一步压缩故障,将A板调换插槽安装,故障依然存在;将A 板安装在另一台无故障的机器上时,则一切正常。
通过以上的步骤,将故障压缩到路由器配置参数上了。再用“show version”命令,在显示信息的最后一行,发现路由器配置寄存器数值为0x0,将其修改为0x2102后,重新引导路由器,将备份配置从 tftpserver上拷入running-config后,路由器工作恢复正常,至此排除了这一貌似硬件接口损坏而实为软件参数设置错误的故障。
二、故障原因分析
72、75等系列高档路由器寄存器值由四个16进制数组成,其中低4位决定系统的启动方式:
当最低4位为0-0-0-0,路由器不装载系统镜像,而是进入监控状态(ROM monitor mode)或维护状态(Maintenance mode),需要手工引导。
当最低4位为0-0-0-1,路由器装载从ROMs里找到的系统镜像。
当最低4位为0-0-1-0至于1-1-1-1之间,路由器按启动配置中BOOT SYSTEM命令的设置装载操作系统镜像,如果没有设置该命令则从一个默认的网络服务器上的系统镜像中装载操作系统镜像。
当第6位为1时,路由器启动时忽略NVRAM中的配置。例如:
0x0 :不自动装载操作系统镜像而是进入ROM monitor模式等待用户键入命令(如上例故障,仅能用“boot”引导系统不能加载接口模块IOS);
0xf :按启动配置中的命令或从一个默认的网络服务器上的系统镜像中装载操作系统镜像(Cisco 72系列、Cisco75系列等,不能从ROM引导)。
0x101:禁止break健,直接从ROM中引导。
0x2102:一般为引值。
0x2142:启动时忽略startup-config。
现在举一个自动从flash memory引导的例子:
Router # configure terminal
Router (config) # boot system flash gsnew-image
Router (config) # config-register 0x010f
^Z
Router # copy running-config startup-config
[ok]
Router # reload
[confirm]