• 产品与解决方案
  • 行业解决方案
  • 服务
  • 支持
  • 合作伙伴
  • 关于我们

12-可靠性

目录

03-VRRP故障处理

本章节下载 03-VRRP故障处理  (173.15 KB)

03-VRRP故障处理

1 可靠性故障处理

1.1  VRRP故障处理

1.1.1  VRRP主备变化

1. 故障描述

设备的VRRP主备状态发生变化。分别登录VRRP备份组中的两台设备并执行display vrrp命令:

·     如果其中一台设备的显示信息中State字段的取值为Master,另一台设备显示信息中State字段的取值为Backup,则说明VRRP备份组能正常运行,无需处理。

·     其它情况,请参照本文进行相应处理。

<Sysname> display vrrp

IPv4 Virtual Router Information:

 Running Mode      : Standard

 Enhanced sending of gratuitous ARP packets : Disabled

 Total number of virtual routers : 1

 Interface          VRID  State        Running Adver   Auth     Virtual

                                       Pri     Timer   Type        IP

 ---------------------------------------------------------------------

 GE0/0/1            1     Master       150     100     Simple   1.1.1.1

2. 常见原因

本类故障的常见原因主要包括:

(1)     收到接口事件,配置VRRP备份组的接口状态发生了变化。

(2)     VRRP备份组的虚拟IP地址被删除。

(3)     VRRP备份组关联的Track项状态发生了变化。

(4)     Master设备收到VRRP优先级高的报文。

(5)     当前设备成为地址拥有者。

(6)     定时器超时,Backup设备仍未收到Master设备的VRRP协议报文。

(7)     Backup设备收到优先级为0的报文。

(8)     发生了抢占。

(9)     VRRP备份组关联了VRRP管理备份组。VRRP管理备份组状态变化,导致VRRP备份组状态跟着改变。

3. 故障分析

本类故障的诊断流程如图1-1所示。

图1-1 VRRP主备变化故障诊断流程图

 

4. 处理步骤

(1)     分别登录VRRP备份组中的两台设备并执行display logbuffer | include VRRP_STATUS_CHANGE命令,查找摘要为VRRP_STATUS_CHANGE的日志。该日志会携带设备的VRRP备份组中的状态以及状态发生变化的原因。

¡     设备在VRRP备份组中的状态取值包括:

-     Master:表示设备为VRRP备份组中的Master。

-     Backup:表示设备为VRRP备份组中的Backup。

-     Initialize:表示设备上VRRP备份组处于关闭状态。

-     Inactive:表示VRRP备份组处于无效状态,原因可能为:未配置虚拟IP地址,或者关联了管理备份组,但是关联的管理备份组不存在。

¡     设备的VRRP备份组状态发生变化的原因取值包括:

-     Interface event received:表示收到接口事件,配置VRRP备份组的接口状态发生了变化(原因一)。

-     IP address deleted:VRRP备份组的虚拟IP地址被删除(原因二)。

-     The status of the tracked object changed:VRRP备份组关联的Track项状态发生了变化(原因三)。

-     VRRP packet received:Master设备收到VRRP优先级高的报文(原因四)。

-     Current device has changed to IP address owner:当前设备成为地址拥有者(原因五)。

-     Master-down-timer expired:定时器超时,Backup设备仍未收到Master设备的VRRP协议报文(原因六)。

-     Zero priority packet received:Backup设备收到优先级为0的报文(原因七)。

-     Preempt:发生了抢占(原因八)。

例如:如下日志表示接口GigabitEthernet0/0/1的VRRP备份组状态从Master变成了Initialize,原因是接口GigabitEthernet0/0/1的状态发生了变化。

<Sysname> display logbuffer | include VRRP_STATUS_CHANGE

%Mar 12 14:10:32:110 2023 Sysname VRRP4/6/VRRP_STATUS_CHANGE: The status of IPv4 virtual router 1 (configured on GigabitEthernet0/0/1) changed from Master to Initialize: Interface event received.

(2)     根据日志中携带的VRRP状态以及VRRP状态发生变化的原因,进行相应处理:

¡     针对原因一(收到接口事件,配置VRRP备份组的接口状态发生了变化):

请在本机和对端分别执行display interface命令查看备份组连接接口的状态。如果接口状态显示为Down,请根据显示信息定位并处理接口故障。

¡     针对原因二(VRRP备份组的虚拟IP地址被删除),请在接口视图下,执行vrrp [ ipv6 ] vrid命令为VRRP备份组配置虚拟IP地址。

¡     针对原因三(VRRP备份组关联的Track项状态发生了变化),先执行display vrrp [ ipv6 ]命令找到关联的Track项的编号,再使用display track命令定位Track项故障,并解决Track项故障。

¡     针对原因四(Master设备收到VRRP优先级高的报文),无需处理。

¡     针对原因五(当前设备成为地址拥有者),处理建议如下:

确认是否需要将本机配置为VRRP备份组的IP地址拥有者:在本机执行不带参数的display vrrp [ ipv6 ]命令,查看VRRP组的虚拟IP地址;在本机执行display interface brief命令,查看设备接口的IP地址,找到与VRRP备份组IP地址相同的接口。接口IP地址与虚拟IP地址相同的设备被称为IP地址拥有者。当备份组内存在IP地址拥有者时,只要其工作正常,则为Master。

-     如果确认需要将设备配置为IP地址拥有者,则无需处理。

-     如果确认无需将设备配置为IP地址拥有者,请在接口视图下,使用vrrp [ ipv6 ] vrid命令修改VRRP备份组的虚拟IP地址。

¡     针对原因六(定时器超时,Backup设备仍未收到Master设备的VRRP协议报文)处理建议如下:

-     确认是否为对端设备故障。在对端设备上执行display vrrp [ ipv6 ]命令,如果State字段取值为Initialize,则说明该设备的VRRP功能不工作。请检查故障原因,恢复对端设备。

-     确认是否为备份组连接接口故障。在本端和对端分别执行display interface命令查看备份组连接接口的状态。如果接口状态显示为Down,请根据显示信息定位并处理接口故障。

-     确认是否为VRRP配置错误,在本机和对端分别执行display current-configuration | inculde vrrp命令,过滤VRRP配置。本机和对端的VRRP配置有如下要求:

-     本机和对端的VRRP备份组编号以及虚拟IP地址必须相同,如果不同,请使用vrrp [ ipv6 ] vrid命令重新配置。

-     对于VRRPv4,要求版本号一致,如果不一致,请在接口视图下使用vrrp version命令修改。VRRPv6仅支持VRRPv3版本,不支持修改。

-     对于VRRPv4,要求认证方式一致,如果配置了认证字,还要求认证字一致。如果不一致,请在接口视图下使用vrrp vrid authentication-mode命令修改。VRRPv6不支持认证。

¡     针对原因七(Backup设备收到优先级为0的报文),处理建议如下:

-     在本机和对端分别执行display vrrp [ ipv6 ] verbose命令,查看配置的VRRP优先级(Config pri字段):

-     如果确认配置正确,则无需处理。

-     如果确认配置错误,请在接口视图下,使用vrrp [ ipv6 ] vrid priority命令修改。

-     在本机和对端分别执行display vrrp [ ipv6 ] verbose命令,查看配置的VRRP优先级(Config pri字段)和实际生效的VRRP优先级(Running pri字段)。如果两个取值不同,则进一步查看关联的Track项的编号,使用display track命令定位Track项故障,并解决Track项故障。

¡     针对原因八(发生了抢占):

-     如果是管理员手工触发的抢占,则无需处理。

-     如果不是管理员手工触发的抢占,而是VRRP自动触发的抢占,则说明监控对象故障,需要进一步确认自动抢占的原因。

(3)     确认是否因为VRRP备份组关联了VRRP管理备份组,VRRP管理备份组状态变化,导致VRRP备份组状态跟着改变。

(4)     请在本机执行display vrrp [ ipv6 ] verbose命令,根据Follow Name字段的取值找到关联的管理备份组名称。

¡     如果管理备份组不存在,请执行vrrp [ ipv6 ] vrid命令创建管理备份组。

¡     如果管理备份组已经存在,请根据管理备份组日志中提示的原因字段取值进一步定位管理备份组VRRP状态发生变化的原因。

(5)     如果问题仍未解决,请收集设备的配置文件、日志信息、告警信息,并联系技术支持人员。

5. 告警与日志

相关告警

模块名:VRRP-MIB

·     vrrpTrapNewMaster(1.3.6.1.2.1.68.0.1)

模块名:HH3C-VRRP-EXT-MIB(仅V7B75支持)

·     hh3cVrrpExtStateChange(1.3.6.1.4.1.25506.2.24.2.0.1)

相关日志

·     VRRP4/6/VRRP_STATUS_CHANGE

·     VRRP6/6/VRRP_STATUS_CHANGE

不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!

新华三官网
联系我们