• 产品与解决方案
  • 行业解决方案
  • 服务
  • 支持
  • 合作伙伴
  • 关于我们

H3C SR8800-F路由器 维护宝典-R838x-6W101

05-快速维护指南

本章节下载 05-快速维护指南  (443.73 KB)

05-快速维护指南


1 本书约定

本文档为快速维护高端路由器提供指导。

本文档不严格与具体软、硬件版本对应,如果使用过程中与产品实际情况有差异,请以设备实际情况为准。

由于设备型号不同、配置不同、版本升级等原因,可能造成本手册中的内容与用户使用的设备显示信息不一致。实际使用中请以设备显示的内容为准。

2 维护前的准备

本章介绍维护高端路由器之前需完成的准备工作,包含以下内容:

(1)     获取整个网络的拓扑结构图和数据规划表(接口、VLAN、IP地址等信息),打印之后张贴在机房的醒目位置,便于随时查询和对照。

(2)     准备好维护设备时可能会用到的工具和线缆。

表2-1 维护设备常用工具和线缆

序号

项目

说明

1

线缆

·     一根标准RS232串口线:用于通过Console口登录设备。

·     串口转USB转接头:用于使用维护终端的USB接口连接设备的串口,请提前安装好串口驱动程序并验证功能可用。

·     两根直连网线:用来调测管理网口或其它业务。

·     网线延长线接头:网线长度不够时可延长网线。

·     若干条光纤、若干XFP/QSPF+/QSFP28/SFP28/CFP/CFP2/SFP+/SFP等光模块:用于连接对接设备。

2

维护终端

一般为便携计算机,并安装串口通信软件,用于登录设备。使用前请做好自检,避免串口通信终端license过期。

3

辅助仪器、仪表、工具等

·     光功率计:用于光接口测试(光功率、接收灵敏度等)。

·     温湿度计:用于测量设备周围的环境温度和湿度、风扇出口处温度和湿度。

·     镊子:用于辅助拔出光纤或光模块。

·     光纤端面清洁盒

·     接口清洁棒

·     扎带(线扣)

·     螺丝刀:十字螺丝刀、一字螺丝刀等。

·     斜口钳

 

(3)     获取H3C技术服务支持人员常用联系方式。

(4)     访问H3C官网,按需申请用户账号,可浏览或下载全部产品文档。

3 快速维护设备流程

说明

检查告警、健康状态、单板状态以及记录故障信息等步骤,均需要通过Console口、Telnet或SSH登录到设备来进行操作(登录设备的操作请参考对应设备的基础配置指导)。如果无法登录到设备,请直接查看“无法登录设备的处理措施”。

 

图3-1 快速维护设备流程图

 

3.1  检查设备指示灯状态是否正常

设备提供种类丰富的指示灯,通过查看指示灯的状态,可以判断该指示灯所指示对象的运行状态,如果发现指示灯状态异常,请及时记录故障信息,并参考对应设备的安装指导进行处理,如果仍无法排除故障,请及时联系代理商或当地用服工程师。

本节仅列出各设备主要指示灯的正常状态。关于指示灯状态的详细介绍,请参见对应设备的安装指导。

说明

不同单板上相同类型指示灯的个数和状态不尽相同,本节中各设备指示灯正常状态汇总表,列举的是各类指示灯正常状态的合集。例如表3-1中的“风扇状态指示灯(FAN)”列举的是各类主控板上该类指示灯正常状态的合集,其中,“OK/FAIL”表示主控板上有1个OK、FAIL合一的风扇框指示灯。

 

3.1.1  SR8800-X/CR16000-F指示灯

SR8800-X/CR16000-F主要指示灯的正常状态,如表3-1所示。

表3-1 SR8800-X/CR16000-F主要指示灯正常状态汇总表

类别

指示灯类型

指示灯状态

说明

主控板

CF卡状态指示灯(CFS)

常亮

表示CF卡在位,CF卡处于操作空闲状态,此时,CF卡严禁热插拔

闪烁

表示CF卡在位,CF卡正在读写操作,此时,CF卡严禁热插拔

风扇状态指示灯(FAN)

OK:常亮

FAIL:灯灭

表示所有风扇框正常工作

OK/FAIL:绿灯亮

表示所有风扇框正常工作

电源状态指示灯(PWR)

OK:常亮

FAIL:灯灭

表示所有在位的电源模块正常工作

OK/FAIL:绿灯亮

表示所有在位的电源模块正常工作

单板状态指示灯(SLOT)

RUN:闪烁(1次/2秒)

ALM:灯灭

表示对应槽位单板正常工作

RUN:快闪(4次/秒)

ALM:常亮

表示对应槽位的业务板正在加载软件

RUN:常亮

ALM:常亮

表示对应槽位单板可能正在启动

RUN/ALM:绿灯闪烁

表示对应槽位单板正常工作

RUN/ALM:绿灯快闪(4次/秒)

表示对应槽位的业务板正在加载软件

RUN/ALM:红灯常亮

表示对应槽位单板可能正在启动

主控板状态指示灯(ACT)

常亮

表示主控板处于主用状态

灯灭

表示主控板可能处于备用状态

网板

网板状态指示灯

RUN:闪烁(1次/2秒)

表示网板正常工作

RUN:快闪(8次/秒)

表示网板正在启动

RUN:闪烁(1次/2秒)

ALM:灯灭

表示网板正常工作

RUN:常亮

ALM:灯灭

表示网板正在启动

业务板

业务板状态指示灯

RUN:绿灯慢闪(1次/秒)

表示单板正常工作

RUN:绿灯快闪(8次/秒)

表示单板处于启动过程中,一直快闪表示单板注册不成功

OAA单板状态指示灯

ALM:常灭

表示系统运行正常,无任何告警

RUN:绿灯闪烁(1次/秒)

表示系统已按配置启动,进入正常运行状态

电源模块

电源状态指示灯

均为绿灯常亮

表示电源模块正常工作

风扇框模块

风扇框状态指示灯

OK/FAIL:绿灯常亮

表示风扇框正常工作

OK:常亮

FAIL:灯灭

表示风扇框正常工作

 

3.1.2  SR8800-X-S/SR8800-F指示灯

SR8800-X-S/SR8800-F主要指示灯的正常状态,如表3-2所示。

表3-2 SR8800-X-S/SR8800-F主要指示灯正常状态汇总表

类别

指示灯类型

指示灯状态

说明

主控板

CF卡状态指示灯(CFS

常亮

表示CF卡在位,CF卡处于操作空闲状态,此时,CF严禁热插拔

闪烁

表示CF卡在位,CF卡正在读写操作,此时,CF卡严禁热插拔

单板状态指示灯(SLOT)

RUN:闪烁(1次/2秒)

ALM:灯灭

表示对应槽位单板正常工作

RUN:快闪(4次/秒)

ALM:常亮

表示对应槽位的业务板正在加载软件

RUN:常亮

ALM:常亮

表示对应槽位单板可能正在启动

RUN/ALM:绿灯闪烁

表示对应槽位单板正常工作

RUN/ALM:绿灯快闪(4次/秒)

表示对应槽位的业务板正在加载软件

RUN/ALM:红灯常亮

表示对应槽位单板可能正在启动

主控板状态指示灯(ACT)

常亮

表示主控板处于主用状态

灯灭

表示主控板可能处于备用状态

风扇状态指示灯(FAN)

OK:常亮

FAIL:灯灭

表示所有风扇框正常工作

OK/FAIL:绿灯亮

表示所有风扇框正常工作

电源状态指示灯(PWR)

OK:常亮

FAIL:灯灭

表示所有在位的电源模块正常工作

OK/FAIL:绿灯亮

表示所有在位的电源模块正常工作

业务板

业务板状态指示灯

RUN:绿灯慢闪(1次/秒)

表示单板正常工作

RUN:绿灯快闪(8次/秒)

表示单板处于启动过程中,一直快闪表示单板注册不成功

OAA单板指示灯

ALM:常灭

表示系统运行正常,无任何告警

RUN:绿灯闪烁(1次/秒)

表示系统已按配置启动,进入正常运行状态

电源模块

电源状态指示灯

均为绿灯常亮

表示电源模块正常工作

 

3.1.3  RX8800指示灯

RX8800主要指示灯的正常状态,如表3-3所示。

表3-3 RX8800主要指示灯正常状态汇总表

类别

指示灯类型

指示灯状态

说明

主控板

CF卡状态指示灯(CFS

常亮

表示CF卡在位,CF卡处于操作空闲状态,此时,CF严禁热插拔

闪烁

表示CF卡在位,CF卡正在读写操作,此时,CF卡严禁热插拔

单板状态指示灯(SLOT)

RUN:闪烁(1次/2秒)

ALM:灯灭

表示对应槽位单板正常工作

RUN:快闪(4次/秒)

ALM:常亮

表示对应槽位的业务板正在加载软件

RUN:常亮

ALM:常亮

表示对应槽位单板可能正在启动

主控板状态指示灯(ACT)

常亮

表示主控板处于主用状态

灯灭

表示主控板可能处于备用状态

风扇状态指示灯(FAN)

OK:常亮

FAIL:灯灭

表示所有风扇框正常工作

电源状态指示灯(PWR)

OK:常亮

FAIL:灯灭

表示所有在位的电源模块正常工作

业务板

业务板状态指示灯

RUN:绿灯闪烁(1次/秒)

表示单板正常工作

RUN:绿灯快闪(8次/秒)

表示单板处于启动过程中,一直快闪表示单板注册不成功

网板

网板状态指示灯

RUN:闪烁(1次/2秒)

表示网板正常工作

RUN:快闪(8次/秒)

表示网板正在启动

电源模块

电源状态指示灯

均为绿灯常亮

表示电源模块正常工作

风扇框模块

风扇框状态指示灯

OK/FAIL:绿灯常亮

表示风扇框正常工作

 

3.1.4  CR16000-M/SR6600-G指示灯

表3-4 CR16000-M/SR6600-G主要指示灯正常状态汇总表

类别

指示灯类型

指示灯状态

说明

主控板

主控板运行状态指示灯(RUN)

闪烁(1次/2秒)

表示主控板正常工作

快闪(4次/秒)

表示主控板正在启动

主控板状态指示灯(ACT)

常亮

表示主控板处于主用状态

灯灭

表示主控板可能处于备用状态

主控板告警状态指示灯(ALM)

灯灭

表示主控板正常工作

风扇状态指示灯(FAN)

绿色常亮

表示所有风扇框正常工作

电源状态指示灯(PWR)

绿色常亮

表示所有在位的电源模块正常工作

接口板

接口板状态指示灯(RUN)

闪烁(1次/2秒)

表示接口板正常工作

快闪(4次/秒)

表示接口板正在加载软件中,一直快闪表示加载软件不成功

交换网板

交换网板状态指示灯(RUN)

闪烁(1次/2秒)

表示交换网板正常工作

快闪(4次/秒)

表示交换网板正在启动,加载软件过程中

风扇框模块

风扇框状态指示灯(RUN)

绿色常亮

表示风扇框正常工作

电源模块

电源状态指示灯

均为绿灯常亮

表示电源模块正常工作

 

3.2  检查设备是否存在紧急或重要告警

说明

如果部署有网管系统,也可以通过网管系统来检查设备是否存在告警,详细操作请参考具体系统的使用说明。

 

登录设备后,执行display alarm active命令查看设备是否存在级别为ERROR的告警信息。

在日常维护中,对于ERROR级别的告警需要及时处理。对于无法处理的告警,请及时联系技术支持。

<Sysname> display alarm active

Seq         Level   Time                Info

191         WARNING 2022-03-14 10:45:04 Temperature is greater than the high-tem

perature warning threshold on slot 3 sensor hotspot 1.

1           ERROR   2022-03-10 17:58:14 Power 2 is absent.

表3-5 display alarm active命令显示信息描述表

字段

描述

Seq

告警序列号,告警发生时分配。

Level

告警的级别,级别由高到低依次为ERROR、WARNING、NOTICE、INFO

Time

告警产生的时间

Info

告警的详细信息,涉及风扇、电源、设备温度等硬件故障,主要取值包括:

·     Board state changed to Fault on slot xx:slot xx变成Fault状态(该slot可能正在启动,或者处于故障状态)

·     Slot xx fan xx is absent:Slot xx上风扇xx未插入

·     Slot xx fan xx is failed:Slot xx上风扇xx处于异常状态

·     Slot xx power xx is absent:Slot xx上电源xx未插入

·     Slot xx power xx failed:Slot xx上电源xx处于异常状态

·     Temperature is higher than the high-temperature alarming threshold on slot xx sensor inflow xx:slot xx上的传感器xx的温度高于高温门限

·     Memory minor threshold has been exceeded on slot xx:slot xx的空闲内存高于minor门限

·     CPU usage is in minor alarm state on slot xx:slot xx的CPU使用率高于minor门限

·     Interface-name: RX power is high!:接口Interface-name光功率过高

·     Interface-name:The bit error ratio exceeds the upper threshold:接口Interface-name误码率超过了上限

 

3.3  检查设备的健康状态是否正常

登录设备后,可通过以下命令查看设备的健康状态:

·     display health

·     display memory

·     display fan

·     display power

·     display environment

# 检查CPU和内存的使用情况,查看各单板的CPU使用率是否均低于80%,内存使用率是否均低于60%

<Sysname> display health

Slot CPU Role         CPU Usage(%) Memory Usage(%) Used/Total(MB)

1    0   MPU(Master)  7            23              1902504/8130012

2    0   LPU          9            48              963064/1991292

3    0   LPU          7            47              1913916/4052524

5    0   LPU          4            18              1538196/8158684

6    0   SFU          3            36              361296/984332

7    0   SFU          6            36              361348/984332

表3-6 display health命令显示信息描述表

字段

描述

Role

设备的角色,取值为:

·     MPU(Master)表示主用主控板(独立运行模式)

·     MPU(Standby)表示备用主控板(独立运行模式)

·     MPU(Master)表示全局主用主控板(IRF模式)

·     MPU(Standby)表示全局备用主控板(IRF模式)

·     LPU表示接口板

CPU Usage(%)

CPU利用率信息,表示系统在过去5秒内CPU利用率的平均值

Memory Usage(%)

单板上当前的内存利用率

Used/Total(MB)

单板上当前已使用的内存大小/单板上内存总大小,单位为MB

如果发现CPU使用率或内存使用率过高,请观察一段时间(5~10分钟),如果一直处于高使用率状态,请及时联系技术支持。

# 检查风扇的工作状态,查看在位的风扇的状态(State)是否均为Normal。

<Sysname> display fan

Fan Frame 0  State: Normal

表3-7 display fan命令显示信息描述表

字段

描述

Fan Frame         n State

风扇状态:

·     Absent:风扇不在位

·     Normal:风扇正常工作

·     Fault:风扇故障

 

如果发现异常,请检查风扇模块是否插牢、风扇叶是否被卡住或灰尘较多。如果是上述原因,可通过热拔插风扇模块,清理风扇叶中的异物或灰尘等方式进行解决。如果不是上述原因,可尝试通过更换风扇模块的方式进行解决。如果无法解决,请及时记录故障信息,并联系技术支持。

# 检查设备电源的信息,查看在位的电源模块的状态(State)是否均为Normal。

<Sysname> display power

 Power        0 State: Normal

 Power        1 State: Absent

 Power        2 State: Absent

 Power        3 State: Absent

表3-8 display power命令显示信息描述表

字段

描述

Power         n State

电源模块的状态:

·     Normal:表示该槽位电源模块处于正常工作状态

·     Absent:表示该槽位没有插入电源模块

·     Error:表示该槽位电源模块出错,不能正常运行

如果发现异常,请检查电源模块的开关是否闭合、电源线缆是否松动,最后可尝试通过更换电源模块解决故障。如果无法解决,请及时记录故障信息,并联系技术支持。

# 检查设备上温度传感器的温度信息,查看在位的各单板当前温度(Temperature)是否低于低温告警门限(Lower)。

<Sysname> display environment

System temperature information (degree centigrade):

 ----------------------------------------------------------------------

 Slot  Sensor    Temperature  Lower  Warning  Alarm  Shutdown

 0     inflow  1 25           0      48       60     NA

 0     hotspot 1 31           0      80       95     NA

 2     inflow  1 29           0      80       97     NA

 2     outflow 1 26           0      80       97     NA

 2     hotspot 1 31           0      80       97     NA

 2     hotspot 2 42           0      80       97     NA

 3     inflow  1 31           0      80       97     NA

 3     outflow 1 32           0      80       97     NA

 3     hotspot 1 47           0      80       97     NA

 3     hotspot 2 38           0      80       97     NA

 4     hotspot 1 30           0      75       90     NA

 6     hotspot 1 41           0      88       100    110

表3-9 display environment命令显示信息描述表

字段

描述

System Temperature information (degree centigrade)

系统温度信息,单位为摄氏度

sensor

温度传感器

·     hotspot:表示热点温度传感器

·     inflow:表示入风口温度传感器

·     outflow:表示出风口温度传感器

Slot

当显示数字时表示指定slot上温度传感器的温度信息;当显示Vent时表示位于机框、风扇框上的温度传感器的温度信息

Temperature

当前温度

Lower

低温告警门限

Warning

一般级(Warning)高温告警门限

Alarm

严重级(Alarm)高温告警门限

Shutdown

关断级(Shutdown)高温告警门限

当温度传感器的温度大于该门限时,单板会自动下电

 

如果发现异常,请检查机房温度是否正常、设备散热通道是否堵塞、设备的风扇模块是否工作正常,并采取相应的处理措施。如果无法解决,请及时记录故障信息,,并联系技术支持。

3.4  检查各单板及子卡状态是否正常

登录设备后,执行display device命令检查单板及子卡的状态,查看在位的各单板或子卡状态(Brd Status)是否均为Normal。

<Sysname> display device

Slot No. Brd Type           Brd Status   Software Version

 0       SR05SRP1L1         Master       SR8800-CMW710-E8305

 1       NONE               Absent       NONE

 2       NONE               Absent       NONE

 3       CSPEX-1504X-A      Normal       SR8800-CMW710-E8305

   Sub1  MIC-CLP2L          Normal

   Sub2  MIC-GP4L           Normal

   Sub3  MIC-XP5L_A         Normal

   Sub4  MIC-ET16L          Normal

 4       NONE               Absent       NONE

 5       IM-OAPX            Normal       SR8800-CMW710-E8305

 6       NONE               Absent       NONE

 7       NONE               Absent       NONE

 8       NONE               Absent       NONE

 9       NONE               Absent       NONE

表3-10 display device命令显示信息描述表

字段

描述

Slot No.

单板或子卡的槽位号

Brd Type

单板的硬件类型

Brd Status

单板或子卡状态:

·     Standby表示该板是备用主控板

·     Master表示该板是主用主控板

·     Absent表示该槽位没有插入单板或子卡

·     Fault表示该槽位单板或子卡出错,不能正常启动

·     Normal表示该槽位的接口板或子卡处于正常工作状态

·     Off:表示该槽位的单板或子卡没有上电

·     Illegal:表示当前软件版本不支持该单板或子卡,无法正常使用

·     Offline:表示该槽位单板处于被隔离状态

Software version

软件版本信息

 

执行display system stable state命令检查单板的运行状态,查看单板的运行状态state)是否均为Stable。

<Sysname> display system stable state

System state     : Stable

Redundancy state : No redundance

  Slot    CPU    Role       State

  1       0      Active     Stable

  2       0      Other      Stable

  13      0      Other      Stable

表3-11 display system stable state命令显示信息描述表

字段

描述

System state

所有CPU的运行状态的汇总,取值为:

·     Stable:稳定运行

·     Not ready:未稳定

所有CPU的运行状态为Stable时,该字段将显示为Stable;只要有一个CPU的运行状态不是Stable,该字段将显示为Not ready

Redundancy state

主备状态:

·     Stable:主备状态稳定,可以倒换

·     No redundance:系统无冗余,不能倒换

·     Not ready:未稳定,不可以倒换

NSR state

各业务模块NSR状态的汇总,取值为:

·     Stable:稳定状态

·     Not ready:未稳定状态,此时不能进行进程倒换或者主备倒换

Role

Slot在系统中的身份:

·     Active:主用主控板

·     Standby:备用主控板,提供冗余备份

·     Other:业务板

State

单板的运行状态:

·     Stable:单板稳定运行

·     Board inserted:单板插入

·     Kernel initiating:单板内核初始化

·     Service starting:单板上的服务正在启动

·     Service stopping:单板上的服务正在关闭

·     HA Batch backup:HA批量备份中

·     Interface data batch backup:正在进行接口管理数据批量备份

·     Service module data batch backup:正在进行业务模块数据批量备份

*

当前对象处于未稳定状态

如果检查结果发现异常,请及时记录故障信息,并联系技术支持。

4 收集与反馈故障信息

当检查中发现设备存在状态异常时,请及时收集故障信息,再采取后续的处理措施。

故障信息的收集主要包括如下几个方面:

·     故障基本信息:故障发生时间、故障具体现象、故障严重程度和影响的业务范围、故障点网络拓扑结构、故障后已采取措施和结果等信息。

·     日志信息:系统产生的日志信息。

·     诊断信息:发生故障的设备的名称、版本、当前配置、接口信息等。

收集的信息请完整的反馈给代理商或H3C技术支持工程师。

4.1  故障基本信息收集

设备出现故障时,首先需要采集故障的基础信息。

表4-1 故障基本信息收集表

序号

项目

收集方法

1

故障时间

记录发生故障的时间,精确到分钟

2

故障现象

收集故障现象并详细记录

3

故障影响

记录故障的严重程度和影响的业务范围

4

组网信息

画出组网图。主要包括上下行设备、对接接口等

5

已采取的措施

记录发生故障后已采取的措施和结果(包括完整的命令执行过程和输出信息)

 

4.2  日志信息收集

日志信息主要记录日常信息、用户操作、系统故障、系统安全和系统跟踪调试等信息,包括诊断监控日志、诊断日志、系统日志和调试跟踪日志等。

由于诊断日志、系统日志和调试跟踪日志在保存到文件前,先保存在文件缓冲区,为了获取最新日志信息,请先将收集到的日志信息保存到文件。

您可以通过如下方式获取日志信息:

·     将收集到的日志信息保存到文件。

¡     系统自动实时将收集到的诊断监控日志信息保存到文件。

缺省情况下,诊断监控日志文件路径为存储设备根目录下的drvmon文件夹。

¡     系统自动实时将收集到的可维护信息保存到文件。

缺省情况下,可维护信息文件路径为存储设备根目录下info文件夹。

¡     将收集到的诊断日志信息保存到文件。

diagnostic-logfile save

缺省情况下,诊断日志文件路径为存储设备根目录下的diagfile文件夹。

¡     将收集到的系统日志信息保存到文件。

logfile save

缺省情况下,系统日志文件路径为存储设备根目录下的logfile文件夹。

¡     将收集到的调试跟踪日志信息保存到文件。

trace-logfile save

缺省情况下,调试跟踪日志文件路径为存储设备根目录下的tracefile文件夹。

执行完上述命令后,您可以在用户视图下使用dir命令确认日志文件是否正确生成,通过FTP/TFTP/SFTP等方式将日志文件传输到您的工作电脑,方便后续的查看和反馈,详细操作方法请参见对应设备的配置指导。

4.3  诊断信息收集

登录到设备后请执行display diagnostic-information命令,收集设备全部诊断信息包括启动配置、当前配置、接口信息、时间、系统版本等。

当设备配置较多或者运行时间较长时,可能会产生较多的诊断信息,为了缩短诊断信息的收集时间,也可以执行display diagnostic-information key-info命令,收集设备关键诊断信息。

您可以通过如下方式获取诊断信息:

·     显示设备诊断信息。

¡     # 显示设备全部诊断信息。

<Sysname> display diagnostic-information

Save or display diagnostic information (Y=save, N=display)? [Y/N]:n

===============================================

  ===============display clock===============

14:03:55 UTC Thu 01/05/2021

=================================================

  ===============display version===============

其他显示信息略……。

¡     # 显示设备关键诊断信息。

<Sysname> display diagnostic-information key-info

Save or display diagnostic information (Y=save, N=display)? [Y/N]:n

===============================================

  ===============display clock===============

15:03:55 UTC Thu 01/05/2021

=================================================

  ===============display version===============

其他显示信息略……。

·     将收集到的诊断信息保存到文件。

¡     # 将收集到的全部诊断信息保存到文件。

<Sysname> display diagnostic-information

Save or display diagnostic information (Y=save, N=display)? [Y/N]:y

Please input the file name(*.tar.gz)[flash:/diag_Sysname_20211020-194410.tar.gz]:

Diagnostic information is outputting to flash:/diag_Sysname_20211020-194410.tar.gz.

Please wait...

Save successfully.

¡     # 将收集到的关键诊断信息保存到文件。

<Sysname> display diagnostic-information key-info

Save or display diagnostic information (Y=save, N=display)? [Y/N]:y

Please input the file name(*.tar.gz)[flash:/diag_Sysname_20211020-194412.tar.gz]:

Diagnostic information is outputting to flash:/diag_Sysname_20211020-194412.tar.gz.

Please wait...

Save successfully.

缺省情况下,诊断文件路径为存储设备的根目录下。

诊断文件生成之后,您可以在用户视图下使用dir命令确认诊断文件是否正确生成,通过FTP/TFTP/SFTP等方式将诊断文件传输到您的工作电脑,方便后续的查看和反馈,详细操作方法请参见对应设备的配置指导。

5 无法登录设备的处理措施

如果发现无法通过Telnet或SSH远程登录到设备进行操作,可以先尝试通过Console口登录到设备,检查并修改与Telnet或SSH有关的配置。

注意

以下所有处理步骤都基于一个前提,即用户的业务已经中断,因此不会造成进一步的影响。如果用户业务并未中断,请不要进行以下的任何操作。您只需将故障信息收集后,及时联系代理商或H3C技术支持热线。

 

如果通过Console口也无法登录设备,则无法进行任何与命令行有关的操作,需要进行应急处理,具体处理步骤如下:

5.1  检查修复供电系统

如果发现所有单板的指示灯都不亮,并且所有单板的风扇都不转(可通过听声音辨别),有可能是供电系统出现故障。

(1)     检查电源模块的开关是否已打开。如果有多个电源模块,请保证使设备运行的电源模块开关均已打开。

(2)     参考3.1  检查设备指示灯状态是否正常章节,检查表示电源模块正常工作的指示灯是否点亮,初步判断电源模块是否存在输出短路、输出过流、输出过压、输入欠压、温度过热等问题。

(3)     如果电源模块输入异常,可通知电工检修机房/机架/机柜的供电线路,恢复供电;如果电源模块有异常,可尝试通过更换电源模块解决。

(4)     如果以上检查都未发现问题,但单板仍无法正常加电,请及时联系代理商或H3C技术支持热线。

5.2  检查修改串口终端通信参数

请检查串口终端的通信参数是否与设备Console口的通信参数一致,如果不一致,请修改串口终端的通信参数。缺省情况下,设备的Console口通信参数为9600bps8位数据位、1位停止位、无校验和无流控(如有修改,以修改后的参数为准)。

5.3  检查主控板

排除了供电系统和串口通信方面的原因后,则很有可能是主控板发生了故障。

当主控板发生故障时,请参考下列步骤进行故障处理:

(1)     检查主控板是否安装到位。可以重新拉出主控板,并将其重新插入,拧紧安装螺钉,保证主控板安装到位。

(2)     通过短按主控板的系统复位键(RESET)进行主控板复位,待主控板启动完成后,再次查看指示灯RUN是否亮起。

(3)     如果设备上有空闲的主控板槽位,可以尝试将主控板插入空闲的槽位,查看工作状态是否正常。

(4)     使用备件更换主控板。

5.4  复位设备

拔插复位/更换主控板也无效后,可尝试复位设备来解决问题。复位设备可通过关闭设备开关、三分钟后再打开设备开关的方法来实施。

5.5  寻求技术支持

上述方法均无效后,请及时联系代理商或H3C技术支持热线,寻求技术支持。

6 高危操作警示

本章介绍H3C高端路由器产品在使用和维护过程中,所涉及到的可能会导致人身安全、设备故障、业务中断或异常的操作,包括硬件高危操作和命令行高危操作。要求运维人员在对设备进行操作前,请先了解可能带来的风险再进行操作,以降低事故发生率。

6.1  硬件高危操作

高危险的操作只能由有资质且经过培训的维护人员执行。

表6-1 硬件高危操作

操作大类

操作小类

设备及模块操作

严禁在不戴防静电腕带的情况下操作设备及模块

单板类操作

严禁随意在设备运行时拔出主用主控板

严禁随意按下主控板面板上的RESET按钮

光模块操作

严禁在工作状态操作光纤时,用眼睛直视光模块的光发射口和与其相连的光纤连接器的光纤出口

线缆类操作

严禁随意拔插机柜内部的网线

电源类操作

严禁在设备运行时随意拔出电源

严禁随意操作机柜配电框内的电源开关

对于双开关冗余控制的设备,如需下电维护,必须将两个开关同时置于OFF状态

 

6.2  软件高危操作

高危险的命令只能由有资质、且经过培训的维护人员执行。更多详细高危命令请参考对应产品的高危操作手册。

表6-2 软件高危操作

模块

命令行

描述

高危提示

文件系统管理

delete [ /unreserved ] file

删除设备上的文件

delete /unreserved file命令用来永久删除文件,系统会将该文件从设备上彻底删除。被删除的文件不再存在,不能恢复。当缺省MDC的管理员执行delete file命令删除非缺省MDC文件系统中的文件时,系统将永久删除对应文件

文件系统管理

format

格式化文件系统

格式化操作将导致文件系统中的所有文件丢失,并且不可恢复;尤其需要注意的是,如果文件系统中有启动配置文件,格式化该文件系统,将丢失启动配置文件

设备管理

reboot

重启设备

重新启动可能会导致业务中断,请谨慎使用。使用force参数时,系统在重启时不会做任何保护性措施。重启后,可能导致文件系统损坏,请谨慎使用该参数。建议在系统故障或无法正常重启时,才使用该参数

接口公共配置

shutdown

关闭接口

执行本命令会导致使用该接口建立的链路中断,不能通信,请谨慎使用

 

不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!

新华三官网
联系我们