06-VPLS故障处理手册
本章节下载: 06-VPLS故障处理手册 (248.64 KB)
PW两端的PE设备中只有一个PE上的VSI处于Up状态。
VSI up的条件为:
· VSI下至少有一个PW Up和一个AC up。
· VSI下至少有两个AC Up。
因此本类故障的常见原因为:Up的VSI上虽然PW down,但是存在两个Up的AC;Down的VSI上PW down,且无两个Up的AC。
本类故障的诊断思路为:检查状态为Down的VSI下的AC和PW的状态。
(1) 执行display l2vpn vsi命令,查看VSI下AC和PW的状态。
<Sysname> display l2vpn vsi verbose
VSI Name: vpls1
VSI Index : 0
VSI Description : vsi for vpls1
VSI State : Down
MTU : 1500
Bandwidth : -
Broadcast Restrain : -
Multicast Restrain : -
Unknown Unicast Restrain: -
MAC Learning : Enabled
MAC Table Limit : -
MAC Learning rate : -
Drop Unknown : -
PW Redundancy : Master
Flooding : Enabled
Statistics : Disabled
VXLAN ID : -
LDP PWs:
Peer PW ID Link ID State
192.3.3.3 1 8 Down
ACs:
AC Link ID State Type
GE0/0/3 srv1 1 Up Manual
(2) 执行display l2vpn pw verbose命令,查看PW状态变为Down的原因。
<Sysname> display l2vpn pw verbose
VSI Name: aaa
Peer: 2.2.2.9 Remote Site: 2
Signaling Protocol : BGP
Link ID : 9 PW State : Down
In Label : 1420 Out Label: 1419
MTU : 1500
PW Attributes : Main
VCCV CC : -
VCCV BFD : -
Flow Label : Send
Control Word : Disabled
Tunnel Group ID : 0x800000960000000
Tunnel NHLFE IDs : 1038
Admin PW : -
E-Tree Mode : -
E-Tree Role : root
Root VLAN : -
Leaf VLAN : -
Down Reasons : Control word not match
常见的故障原因及处理方法如下:
¡ BFD session for PW down:用来检测PW的BFD会话状态为down,此类故障的处理方式为,通过display bfd session命令查看BFD状态为down的原因,检查并修改BFD配置或检查物理链路是否存在链路故障、链路质量问题。
¡ BGP RD was deleted:BGP的RD被删除,此类故障的处理方式为,在交叉连接组自动发现视图下配置route-distinguisher route-distinguisher命令。
¡ BGP RD was empty:未配置BGP的RD,此类故障的处理方式为,在交叉连接组自动发现视图下配置route-distinguisher route-distinguisher命令。
¡ Control word not match:PW两端控制字功能配置不一致,此类故障的处理方式为,将PW两端引用的PW模板下的控制字功能(通过control-word enable命令开启)配置一致。
¡ Encapsulation not match:PW两端封装类型不一致,此类故障的处理方式为,将PW两端引用的PW模板下的PW数据封装类型(通过pw-type命令配置)配置一致。
¡ LDP interface parameter not match:PW两端接口LDP协商参数不一致,此类故障的处理方式为,将PW两端引用的PW模板下的VCCV控制通道类型(通过vccv cc命令配置)配置一致或将PW两端关联的电路仿真接口下引用的电路仿真类中的配置保持一致。
¡ Non-existent remote LDP PW:对端设备已删除LDP PW,此类故障的处理方式为,在对端设备上重新配置PW。
¡ Local AC Down:本地AC状态为down,此类故障的处理方式为,检查并修改AC接口上的配置或排除AC所在的接口的故障,保障接口为Up状态。
¡ Local AC was non-existent:未配置本地AC,此类故障的处理方式为,配置本地的AC并关联VSI。
¡ MTU not match:PW两端MTU不一致,此类故障的处理方式为,将PW两端的MTU配置一致或者通过mtu-negotiate disable命令关闭PW MTU协商功能。
¡ Remote AC Down:对端AC状态down,此类故障的处理方式为,检查并修改对端AC接口上的配置或排除AC所在的接口的故障,保障接口为Up状态。
(3) 如果故障仍然未能排除,请收集如下信息,并联系技术支持人员。
¡ 上述步骤的执行结果。
¡ 设备的配置文件、日志信息、告警信息。
¡ 使用display diagnostic-information命令收集诊断信息。
无
· L2VPN/2/L2VPN_PWSTATE_CHANGE
· L2VPN/4/L2VPN_BGPVC_CONFLICT_LOCAL
· L2VPN/4/L2VPN_BGPVC_CONFLICT_REMOTE
· L2VPN/4/L2VPN_HARD_RESOURCE_NOENOUGH
· L2VPN/2/L2VPN_HARD_RESOURCE_RESTORE
· L2VPN/4/L2VPN_LABEL_DUPLICATE
VPLS业务流量转发不通。
本类故障的常见原因主要包括:
· AC没有Up
· PW没有Up。
· PW没有生成转发信息。
· PW没有可迭代的公网隧道。
· PW迭代的公网隧道异常。
本类故障的诊断思路如下:
(1) 查看VSI详细信息,确认VSI下至少关联了一个AC和一个PW。
(2) 检查AC状态是否Up。
(3) 检查PW状态是否Up。
(4) 检查PW转发信息。
(5) 检查PW迭代的公网隧道信息。
本类故障的诊断流程如图1-1所示。
图1-1 VPLS业务不通的故障诊断流程图
(1) 执行display l2vpn vsi命令,查看VSI关联的AC、PW的状态和数量。
<Sysname> display l2vpn vsi verbose
VSI Name: vpls1
VSI Index : 0
VSI Description : vsi for vpls1
VSI State : Up
MTU : 1500
Bandwidth : -
Broadcast Restrain : -
Multicast Restrain : -
Unknown Unicast Restrain: -
MAC Learning : Enabled
MAC Table Limit : -
MAC Learning rate : -
Drop Unknown : -
PW Redundancy : Master
Flooding : Enabled
Statistics : Disabled
VXLAN ID : -
LDP PWs:
Peer PW ID Link ID State
192.3.3.3 1 8 Down
ACs:
AC Link ID State Type
GE0/0/3 srv1 1 Up Manual
(2) 若AC的状态为Down,则检查AC配置是否正确和并检查AC所在的接口是否Up。如果AC配置不正确或AC所在的接口为Down状态,请修改AC配置或排查接口故障。
(3) 若PW的状态为Down,请通过display l2vpn pw verbose命令查看PW状态变为Down的原因。
<Sysname> display l2vpn pw verbose
VSI Name: aaa
Peer: 2.2.2.9 Remote Site: 2
Signaling Protocol : BGP
Link ID : 9 PW State : Down
In Label : 1420 Out Label: 1419
MTU : 1500
PW Attributes : Main
VCCV CC : -
VCCV BFD : -
Flow Label : Send
Control Word : Disabled
Tunnel Group ID : 0x800000960000000
Tunnel NHLFE IDs : 1038
Admin PW : -
E-Tree Mode : -
E-Tree Role : root
Root VLAN : -
Leaf VLAN : -
Down Reasons : Control word not match
常见的故障原因及处理方法如下:
¡ BFD session for PW down:用来检测PW的BFD会话状态为down,此类故障的处理方式为,通过display bfd session命令查看BFD状态为down的原因,检查并修改BFD配置或检查物理链路是否存在链路故障、链路质量问题。
¡ BGP RD was deleted:BGP的RD被删除,此类故障的处理方式为,在交叉连接组自动发现视图下配置route-distinguisher route-distinguisher命令。
¡ BGP RD was empty:未配置BGP的RD,此类故障的处理方式为,在交叉连接组自动发现视图下配置route-distinguisher route-distinguisher命令。
¡ Control word not match:PW两端控制字功能配置不一致,此类故障的处理方式为,将PW两端引用的PW模板下的控制字功能(通过control-word enable命令开启)配置一致。
¡ Encapsulation not match:PW两端封装类型不一致,此类故障的处理方式为,将PW两端引用的PW模板下的PW数据封装类型(通过pw-type命令配置)配置一致。
¡ LDP interface parameter not match:PW两端接口LDP协商参数不一致,此类故障的处理方式为,将PW两端引用的PW模板下的VCCV控制通道类型(通过vccv cc命令配置)配置一致或将PW两端关联的电路仿真接口下引用的电路仿真类中的配置保持一致。
¡ Non-existent remote LDP PW:对端设备已删除LDP PW,此类故障的处理方式为,在对端设备上重新配置PW。
¡ Local AC Down:本地AC状态为down,此类故障的处理方式为,检查并修改AC接口上的配置或排除AC所在的接口的故障,保障接口为Up状态。
¡ Local AC was non-existent:未配置本地AC,此类故障的处理方式为,配置本地的AC并关联VSI。
¡ Remote AC Down:对端AC状态down,此类故障的处理方式为,检查并修改对端AC接口上的配置或排除AC所在的接口的故障,保障接口为Up状态。
(4) 若AC和PW均处于Up状态,请通过display l2vpn forwarding pw verbose命令查看PW是否存在转发信息,即承载PW的隧道对应的NHLFE表项索引列表(Tunnel NHLFE IDs)。
¡ 如果存在转发信息,请执行步骤(6)。
¡ 如果不存在转发信息,请执行步骤(5)。
<Sysname> display l2vpn forwarding pw verbose
VSI Name: aaa
Link ID: 8
PW Type : VLAN PW State : Up
In Label : 1272 Out Label: 1275
MTU : 1500
PW Attributes : Main
VCCV CC : Router-Alert
VCCV BFD : Fault Detection with BFD
Flow Label : Send
Tunnel Group ID : 0x960000000
Tunnel NHLFE IDs: 1034
MAC limit : maximum=2000 alarm=enabled action=discard
(5) 执行display mpls lsp命令,查看是否存在承载PW的隧道,即是否存在FEC为PW对端IP地址的LSP,若不存在,则需要先完成承载PW的隧道的建立。
<Sysname> display mpls lsp
FEC Proto In/Out Label Out Inter/NHLFE/LSINDEX
100.100.100.100/24 LDP -/1049 GE0/0/1
(6) 如果故障仍然未能排除,请收集如下信息,并联系技术支持人员。
¡ 上述步骤的执行结果。
¡ 设备的配置文件、日志信息、告警信息。
¡ 使用display diagnostic-information命令收集诊断信息。
无
· L2VPN/2/L2VPN_PWSTATE_CHANGE
· L2VPN/4/L2VPN_BGPVC_CONFLICT_LOCAL
· L2VPN/4/L2VPN_BGPVC_CONFLICT_REMOTE
· L2VPN/4/L2VPN_HARD_RESOURCE_NOENOUGH
· L2VPN/2/L2VPN_HARD_RESOURCE_RESTORE
· L2VPN/4/L2VPN_LABEL_DUPLICATE
PW处于Up状态时两个PE间报文转发失败。
本类故障的常见原因主要包括:
· MAC地址表达到允许VSI学习到的最大MAC地址数,并且配置当VSI学习到的MAC地址数达到最大值后,禁止转发源MAC地址不在MAC地址表里的报文,即丢弃该报文。
· PW信息没有下发到转发模块。
本类故障的诊断流程如图1-2所示。
图1-2 PW处于Up状态时两个PE间报文转发失败故障诊断流程图
(1) 执行display l2vpn mac-address命令,查看是否存在相应的MAC地址表项和学习的MAC地址表项总数。可以通过指定具体的AC接口和PW信息,来显示从指定AC和PW上学习的MAC地址表项总数。
¡ 查看所有L2VPN MAC地址表项信息。
<Sysname> display l2vpn mac-address
* - The output interface is issued to another VSI
MAC Address State VSI Name Link ID/Name Aging
0000-0000-000a Dynamic vpn1 GE0/0/1 Aging
0000-0000-0009 Dynamic vpn1 GE0/0/1 Aging
--- 2 mac address(es) found ---
¡ # 显示L2VPN MAC地址表项总数。
<Sysname> display l2vpn mac-address count
2 mac address(es) found
(2) 查看是否配置了允许学习到的最大MAC地址数,及达到最大MAC地址数后的转发。
¡ 在VSI视图下执行display this命令,查看当前VSI下是否配置了mac-table limit命令和mac-table limit drop-unknown命令,如果配置了上述命令且当前已经学习到的MAC地址已经达到最大值,则需要将允许VSI学习到的最大MAC地址数调大或删除mac-table limit drop-unknown命令。
¡ 在AC和PW视图下执行display this命令,查看当前视图下是否配置了mac-limit命令,如果配置了该述命令且当前已经学习到的MAC地址已经达到最大值,则需要将允许学习到的最大MAC地址数调大或删除action discard参数。
(3) 执行display l2vpn forwarding pw verbose命令,查看PW是否存在转发信息,即承载PW的隧道对应的NHLFE表项索引列表(Tunnel NHLFE IDs)。
¡ 如果存在转发信息,请执行步骤(5)。
¡ 如果不存在转发信息,请执行步骤(4)。
<Sysname> display l2vpn forwarding pw verbose
VSI Name: aaa
Link ID: 8
PW Type : VLAN PW State : Up
In Label : 1272 Out Label: 1275
MTU : 1500
PW Attributes : Main
VCCV CC : Router-Alert
VCCV BFD : Fault Detection with BFD
Flow Label : Send
Tunnel Group ID : 0x960000000
Tunnel NHLFE IDs: 1034
MAC limit : maximum=2000 alarm=enabled action=discard
(4) 执行display mpls lsp命令,查看是否存在承载PW的隧道,即是否存在FEC为PW对端IP地址的LSP,若不存在,则需要先完成承载PW的隧道的建立。
<Sysname> display mpls lsp
FEC Proto In/Out Label Out Inter/NHLFE/LSINDEX
100.100.100.100/24 LDP -/1049 GE0/0/1
(5) 如果故障仍然未能排除,请收集如下信息,并联系技术支持人员。
¡ 上述步骤的执行结果。
¡ 设备的配置文件、日志信息、告警信息。
¡ 使用display diagnostic-information命令收集诊断信息。
无
· L2VPN/4/L2VPN_MACLIMIT_MAX_AC
· L2VPN/4/L2VPN_MACLIMIT_MAX_PW
· L2VPN/4/L2VPN_MACLIMIT_MAX_VSI
在VPLS网络中,LDP PW不能Up。
本类故障的常见原因主要包括:
· PW两端封装类型不一致。
· PW两端MTU值不一致。
· LDP session状态没有Up。
· PW没有可用的公网隧道。
· AC接口没有Up。
本类故障的诊断思路为:执行display l2vpn pw verbose命令查看PW状态变为Down的原因,根据具体原因对故障进行排查。
(1) 通过display l2vpn pw verbose命令查看PW对端的IP地址(Peer)和PW状态变为Down的原因(Down Reasons)。
<Sysname> display l2vpn pw verbose
VSI Name: aaa
Peer: 2.2.2.9 VPLS ID: 100:100
Signaling Protocol : LDP
Link ID : 8 PW State : Down
In Label : 1553 Out Label: 1553
MTU : 1500
PW Attributes : Main
VCCV CC : -
VCCV BFD : -
Flow Label : -
Tunnel Group ID : 0x800000960000000
Tunnel NHLFE IDs : 1038
Admin PW : -
E-Tree Mode : -
E-Tree Role : root
Root VLAN : -
Leaf VLAN : -
Down Reasons : Control word not match
(2) 如表1-1所示,常见的故障原因及处理方法如下。
Down Reasons |
故障描述 |
故障处理方法 |
BFD session for PW down |
用来检测PW的BFD会话状态为down |
通过display bfd session命令查看BFD状态为down的原因,检查并修改BFD配置或检查物理链路是否存在链路故障、链路质量问题 |
Control word not match |
PW两端控制字功能配置不一致 |
将PW两端引用的PW模板下的控制字功能(通过control-word enable命令开启)配置一致 |
Encapsulation not match |
PW两端封装类型不一致 |
将PW两端引用的PW模板下的PW数据封装类型(通过pw-type命令配置)配置一致 |
LDP interface parameter not match |
PW两端接口LDP协商参数不一致 |
将PW两端引用的PW模板下的VCCV控制通道类型(通过vccv cc命令配置)配置一致或将PW两端关联的电路仿真接口下引用的电路仿真类配置一致 |
Non-existent remote LDP PW |
对端设备已删除LDP PW |
在对端设备上重新配置PW |
Local AC Down |
本地AC状态为down |
检查并修改AC接口上的配置或排除AC所在的接口的故障,保证口为Up状态 |
Local AC was non-existent |
未配置本地AC |
配置本地的AC并关联VSI |
Remote AC Down |
对端AC状态down |
检查并修改对端AC接口上的配置或排除AC所在的接口的故障,保证接口为Up状态 |
Label not allocated |
标签未分配 |
请联系技术支持人员处理 |
Local VSI Down |
本地VSI状态为down |
请参见VPLS故障处理中的“PW两端的PE设备中只有一个PE上的VSI处于Up状态” |
Local and remote LDP PWs have different AII |
本端携带的SAII与对端携带的TAII不同 |
请参见LDP故障处理中的“LDP会话无法Up” |
Local LDP PW was not sent mapping message |
本端未发送LDP mapping消息 |
请参见LDP故障处理中的“LDP会话无法Up” |
Local LDP PW Virtual Nexthop defect |
本地LDP PW存在虚拟下一跳缺陷 |
|
Remote LDP PW Virtual Nexthop defect |
远端LDP PW存在虚拟下一跳缺陷 |
|
Tunnel Down |
承载PW的隧道down |
此类故障处理方法请参见步骤(4) |
(3) 请通过display l2vpn forwarding pw verbose命令查看PW是否存在转发信息,即承载PW的隧道对应的NHLFE表项索引列表(Tunnel NHLFE IDs)。
¡ 如果存在转发信息,请执行步骤(5)。
¡ 如果不存在转发信息,请执行步骤(4)。
<Sysname> display l2vpn forwarding pw verbose
VSI Name: aaa
Link ID: 8
PW Type : VLAN PW State : Up
In Label : 1272 Out Label: 1275
MTU : 1500
PW Attributes : Main
VCCV CC : Router-Alert
VCCV BFD : Fault Detection with BFD
Flow Label : Send
Tunnel Group ID : 0x960000000
Tunnel NHLFE IDs: 1034
MAC limit : maximum=2000 alarm=enabled action=discard
(4) 执行display mpls lsp命令,查看是否存在承载PW的隧道,即是否存在FEC为步骤(1)中Peer地址的LSP,若不存在,则需要先完成承载PW的隧道的建立。目前支持的公网隧道类型有LSP、MPLS TE、GRE隧道等,LSP类型的公网隧道创建,请参见“MPLS”中的“静态LSP”和“LDP”;MPLS TE类型的公网隧道创建,请参见“MPLS TE”;GRE类型的公网隧道创建,请参见“三层技术-IP业务”中的“GRE”。
<Sysname> display mpls lsp
FEC Proto In/Out Label Out Inter/NHLFE/LSINDEX
100.100.100.100/24 LDP -/1049 GE0/0/1
(5) 如果故障仍然未能排除,请收集如下信息,并联系技术支持人员。
¡ 上述步骤的执行结果。
¡ 设备的配置文件、日志信息、告警信息。
¡ 使用display diagnostic-information命令收集诊断信息。
无
无
VPLS使用LDP信令协议,VSI不能Up。
满足如下任一条件,VSI即为Up状态:
· VSI下至少有一个PW Up和一个AC Up。
· VSI下至少有两个AC Up。
· VSI下至少有两个PW Up(多段PW组网)。
因此本类故障的常见原因为:
· VSI下Up的AC和PW的总数小于2。
· VSI下执行了shutdown命令。
本类故障的诊断思路为:
(1) 检查VSI下是否执行了shutdown命令
(2) 查看VSI下的AC、PW的状态和数量。
(1) 在VSI视图下执行display this命令,查看当前视图是否配置了shutdown命令。
¡ 如果配置shutdown命令,请执行undo shutdown命令。
¡ 如果未配置shutdown命令,请执行步骤(2)。
(2) 执行display l2vpn vsi命令,查看VSI关联的AC、PW的状态和数量。
<Sysname> display l2vpn vsi verbose
VSI Name: vpls1
VSI Index : 0
VSI Description : vsi for vpls1
VSI State : Up
MTU : 1500
Bandwidth : -
Broadcast Restrain : -
Multicast Restrain : -
Unknown Unicast Restrain: -
MAC Learning : Enabled
MAC Table Limit : -
MAC Learning rate : -
Drop Unknown : -
PW Redundancy : Master
Flooding : Enabled
Statistics : Disabled
VXLAN ID : -
LDP PWs:
Peer PW ID Link ID State
192.3.3.3 1 8 Down
ACs:
AC Link ID State Type
GE0/0/3 srv1 1 Up Manual
¡ 若VSI下关联的AC和PW的数量小于2,请先创建AC和PW。
¡ 若AC的状态为Down,则检查AC配置是否正确,并检查AC所在的接口是否Up。如果AC配置不正确或AC所在的接口为Down状态,请修改AC配置或排查接口故障。
¡ 若PW的状态为Down,请参见1.1.4 LDP PW不能Up对故障进行处理。
(3) 如果故障仍然未能排除,请收集如下信息,并联系技术支持人员。
¡ 上述步骤的执行结果。
¡ 设备的配置文件、日志信息、告警信息。
¡ 使用display diagnostic-information命令收集诊断信息。
无
无
不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!