01-LDP故障处理手册
本章节下载: 01-LDP故障处理手册 (237.58 KB)
LDP会话无法Up。
本类故障的常见原因主要包括:
· 建立会话的接口处于Down状态
· LSR ID配置错误
· 不存在LDP会话的相关配置
· 传输地址配置错误
· LDP Hello-hold定时器超时
· LDP Keepalive-hold定时器超时
· 安全认证配置错误
本类故障的诊断流程如图1-1所示。
图1-1 LDP会话Down的故障诊断流程图
(1) 检查建立LDP会话的接口是否处于Up状态。
执行display interface命令查看接口是否处于UP状态:
¡ 如果没有UP,则排除接口物理链路故障,使接口处于UP状态。
¡ 如果接口处于UP状态,则执行步骤(2)。
(2) 检查LSR ID配置是否正确。
LSR ID包括Local LSR ID、LDP LSR ID和MPLS LSR ID。LSR ID优先级从高到底依次为Local LSR ID、LDP LSR ID、MPLS LSR ID。设备上至少配置其中的一种LSR ID,且该LSR ID必须路由可达。
执行display mpls ldp peer verbose命令检查是否配置了LSR ID:
<Sysname> display mpls ldp peer verbose
VPN instance: public instance
Peer LDP ID : 100.100.100.20:0
Local LDP ID : 100.100.100.17:0
TCP Connection : 100.100.100.20:47515 -> 100.100.100.17:646
…
如果执行display mpls ldp peer verbose命令时无显示,则通过以下方法配置LSR ID:
¡ 在系统视图下配置MPLS LSR ID。
请在系统视图下执行mpls lsr-id命令。
¡ 在LDP视图下配置LDP LSR ID。
请在LDP视图下执行lsr-id命令。
¡ 如果是直连会话,在接口视图下配置Local LSR ID。
请在接口视图下执行mpls ldp local-lsr-id命令。
¡ 如果是远程会话,在LDP对等体视图下配置Local LSR ID。
请在LDP对等体下执行mpls ldp local-lsr-id interface命令。
如果至少配置了一种LSR ID,则执行步骤(3)。
(3) 检查是否存在LDP会话的相关配置。
如果是直连会话,则在接口视图下执行display this命令,查看是否存在LDP会话的相关配置。
a. 如果配置信息中没有包含mpls enable命令、mpls ldp enable命令、mpls ldp ipv6 enable命令或mpls ldp transport-address命令,则部署对应的配置。
b. 如果存在LDP会话的相关配置,则执行步骤(4)。
如果是LDP远程会话,则在LDP视图下执行display this命令,查看是否存在LDP会话的相关配置。
c. 如果配置信息中没有包含targeted-peer或mpls ldp transport-address命令,则部署对应的配置。
d. 如果存在LDP会话的相关配置,则执行步骤(4)。
(4) 检查传输地址配置是否正确。
如果是LDP IPv4会话,请执行display mpls ldp discovery verbose命令检查传输地址配置是否正确:
<Sysname> display mpls ldp discovery verbose
VPN instance: public instance
Link Hellos:
Interface Ten-GigabitEthernet0/0/7
Local LDP ID : 100.100.100.17:0
Hello Interval : 5000 ms Hello Sent/Rcvd : 83/160
Transport Address: 100.100.100.17
Peer LDP ID : 100.100.100.18:0
Source Address : 202.118.224.18 Transport Address: 100.100.100.18
Hello Hold Time: 15 sec (Local: 15 sec, Peer: 15 sec)
Peer LDP ID : 100.100.100.20:0
Source Address : 202.118.224.20 Transport Address: 100.100.100.20
Hello Hold Time: 15 sec (Local: 15 sec, Peer: 15 sec)
Targeted Hellos:
100.100.100.17 -> 100.100.100.18 (Active, Passive)
Local LDP ID : 100.100.100.17:0
Hello Interval : 15000 ms Hello Sent/Rcvd : 23/20
Transport Address: 100.100.100.17
Session Setup : Config/Tunnel
Peer LDP ID : 100.100.100.18:0
Source Address : 100.100.100.18 Transport Address: 100.100.100.18
Hello Hold Time: 45 sec (Local: 45 sec, Peer: 45 sec)
如果是LDP IPv6会话,请执行display mpls ldp discovery ipv6 verbose命令检查传输地址配置是否正确:
<Sysname> display mpls ldp discovery ipv6 verbose
VPN instance: public instance
Link Hellos:
Interface Ten-GigabitEthernet0/0/7
Hello Interval : 5000 ms Hello Sent/Rcvd : 83/160
Transport Address: 2001::2
Peer LDP ID : 100.100.100.18:0
Source Address : FE80:130F:20C0:29FF:FEED:9E60:876A:130B
Transport Address: 2001::1
Hello Hold Time: 15 sec (Local: 15 sec, Peer: 15 sec)
Targeted Hellos:
2001:0000:130F::09C0:876A:130B ->
2005:130F::09C0:876A:130B(Active, Passive)
Hello Interval : 15000 ms Hello Sent/Rcvd : 23/22
Transport Address: 2001:0000:130F::09C0:876A:130B
Peer LDP ID : 100.100.100.18:0
Source Address : 2005:130F::09C0:876A:130B
Destination Address : 2001:0000:130F::09C0:876A:130B
Transport Address : 2005:130F::09C0:876A:130B
Hello Hold Time: 45 sec (Local: 45 sec, Peer: 45 sec)
如果传输地址配置不正确,则可以在接口视图或LDP对等体视图下执行mpls ldp transport-address命令配置传输地址。缺省情况下,传输地址为本LSR的LSR ID。
如果传输地址配置正确,则需要确认路由是否发布。执行display ip routing-table命令,查看是否存在到达会话对端的路由。
e. 如果不存在到达会话对端的路由,则请将传输地址配置成本机存在的IP地址,确保路由正确发布。
f. 如果存在到达会话对端的路由,则执行步骤(5)。
(5) 检查LDP Hello-hold定时器是否超时。
建议每隔5秒执行一次display mpls ldp discovery命令,查看Hello消息的发送和接收计数,检查会话两端的Hello消息是否正常发送。如果连续几次执行该命令后,发现发送或接收Hello消息的计数保持不变,则表明Hello消息的发送或接收存在异常。
¡ 如果Hello-hold定时器超时,请排除链路问题,并检查设备CPU利用率。如果CPU利用率过高,请关闭一些不必要功能;如果CPU利用率正常,则执行步骤(6)。
¡ 如果Hello-hold定时器没有超时,则执行步骤(6)。
(6) 检查LDP Keepalive-hold定时器是否超时。
建议每隔15秒执行一次display mpls ldp peer命令,查看Keepalive消息的发送和接收计数,检查会话两端的Keepalive消息是否正常发送。如果连续几次执行该命令后,发现发送或接收Keepalive消息的计数保持不变,则表明Keepalive消息的发送或接收存在异常。
¡ 如果Keepalive-hold定时器超时,则排除报文转发问题。
¡ 如果Keepalive-hold定时器没有超时,则执行步骤(7)。
(7) 安全认证配置是否正确。
请执行display mpls ldp peer命令LDP会话之间的安全认证是否配置,以及配置的安全认证类型是否一致:
<Sysname> display mpls ldp peer
VPN instance: public instance
Total number of peers: 1
Peer LDP ID State Role GR Auth KA Sent/Rcvd
2.2.2.9:0 Operational Passive Off Keychain 39/39
¡ 如果LDP会话两端Auth字段显示不一致,则将LDP会话两端的安全认证修改为一致。
¡ 如果LDP会话两端Auth字段显示一致,则执行步骤(8)。
(8) 如果故障仍然未能排除,请收集如下信息,并联系技术支持人员。
¡ 上述步骤的执行结果。
¡ 设备的配置文件、日志信息、告警信息。
模块名:MPLS-LDP-STD-MIB
· mplsLdpSessionDown (1.3.6.1.2.1.10.166.4.0.4)
· LDP/4/LDP_SESSION_CHG
LDP会话状态频繁震荡。
本类故障的常见原因主要包括:
· 接口震荡
· 路由震荡
· CPU利用率过高
本类故障的诊断流程如图1-2所示。
图1-2 LDP会话震荡的故障诊断流程图
(1) 检查接口是否震荡。
执行display interface brief命令,查看Physical和Protocol字段。Physical和Protocol字段均显示Up,则表示接口状态为Up,否则表示接口状态为Down。若接口一直在Up和Down两种状态间切换,则表示接口震荡。
¡ 如果接口震荡,则排除接口问题。
¡ 如果接口没有震荡,请执行步骤(2)。
(2) 检查路由是否震荡。
执行display ip routing-table命令,查看路由信息。如果路由信息一直在显示和不显示两种情况切换,则表示路由震荡。
¡ 如果路由震荡,或者路由一直不存在,则排除链路问题和排除IGP路由问题。
¡ 如果路由没有震荡,则执行步骤(3)。
(3) TCP报文是否过大。
执行display tcp statistics命令,查看TCP连接的流量统计信息。通过Sent packets信息中data packets retransmitted(重发的数据报文数)字段的值,判断TCP报文是否过大:
¡ 如果重发的数据报文数不断增加,则表示TCP报文过大,请在报文出接口下执行tcp mss命令调整TCP MSS值。
¡ 如果重发的数据报文数未增加,则表示TCP报文大小正常,请执行步骤(4)。
(4) 检查CPU利用率是否过高。
执行display cpu-usage命令,查看CPU利用率的统计信息。
¡ 如果CPU利用率过高,则关闭一些不必要的功能,降低设备CPU利用率。
¡ 如果CPU利用率正常,则执行步骤(5)。
(5) 如果故障仍然未能排除,请收集如下信息,并联系技术支持人员。
¡ 上述步骤的执行结果。
¡ 设备的配置文件、日志信息、告警信息。
模块名:MPLS-LDP-STD-MIB
· mplsLdpSessionDown (1.3.6.1.2.1.10.166.4.0.4)
· LDP/4/LDP_SESSION_CHG
LDP网络中LDP LSP无法Up。
本类故障的常见原因主要包括:
· 路由问题
· LDP会话Down
· 资源不足,如Label达到上限,内存不足等
· 配置了LSP触发策略、标签接受控制策略、标签通告控制策略或Label Mapping消息的发送策略
· 路由的出接口与LDP建立会话的接口不一致
本类故障的诊断思路如下:
(1) 检查路由是否存在。
(2) 检查LDP会话是否正常建立。
(3) 检查是否存在资源不足,入Label达到上限,内存不足的问题。
(4) 检查是否配置了LSP建立策略。
(5) 检查路由的出接口与LDP建立会话的接口是否一致。
本类故障的诊断流程如图1-3所示。
图1-3 LDP LSP Down的故障诊断流程图
(1) 检查路由是否存在。
执行display ip routing-table ip-address mask verbose命令,查看是否存在到达指定LSP目的地址的路由,并检查该路由是否处于激活状态(路由信息中的State字段为Active Adv,表示路由处于激活状态)。对于公网BGP路由,还需要检查路由是否带标签。如果Label字段非NULL,则表示BGP路由携带标签。
<Sysname> display ip routing-table 1.1.1.1 32 verbose
Summary count : 1
Destination: 1.1.1.1/32
Protocol: O_INTRA
Process ID: 1
SubProtID: 0x1 Age: 00h00m16s
FlushedAge: 00h00m16s
Cost: 1 Preference: 10
IpPre: N/A QosLocalID: N/A
Tag: 0 State: Active Adv
OrigTblID: 0x0 OrigVrf: default-vrf
…
¡ 如果路由不存在、路由存在但未处于激活状态或者BGP路由未携带标签,则请排除路由故障。
¡ 如果路由存在且处于激活状态,对于BGP路由也带标签,则执行步骤(2)。
(2) 检查LDP会话是否正常建立。
执行display mpls ldp peer verbose命令,查看LDP会话是否成功建立:
<Sysname> display mpls ldp peer verbose
VPN instance: public instance
Peer LDP ID : 1.1.1.1:0
Local LDP ID : 2.2.2.2:0
TCP Connection : 2.2.2.2:14080 -> 1.1.1.1:646
Session State : Operational Session Role : Active
Session Up Time : 0000:00:14 (DD:HH:MM)
…
¡ 如果Session State字段的取值不是Operational,则表示LDP会话没有正常建立,请参见“1.1.1 LDP会话无法Up”故障进行定位。
¡ 如果Session State字段的取值为Operational,则表示LDP会话正常建立,且该会话处于Up状态,请执行步骤(3)。
(3) 检查是否配置了LSP策略。
¡ 在LDP视图下执行display this命令,如果存在以下命令,则需要检查IP前缀列表是否过滤了指定的LSP:
- lsp-trigger prefix-list
- accept-label peer prefix-list
- advertise-label prefix-list
- propagate mapping prefix-list
如果IP前缀列表过滤了指定的LSP,则请修改IP前缀列表,使其允许指定LSP目的地址通过;如果IP前缀列表没有过滤指定的LSP,则执行步骤(4)。
¡ 如果LDP视图下没有配置以上命令,则执行步骤(4)。
(4) 检查路由的出接口与LDP建立会话的接口是否一致。
执行display ip routing-table ip-address mask命令,查看指定路由的出接口信息:
<Sysname> display ip routing-table 1.1.1.1 32
Summary count : 1
Destination/Mask Proto Pre Cost NextHop Interface
1.1.1.1/32 O_INTRA 10 1 10.1.1.1 XGE0/0/6
执行display mpls ldp peer peer-lsr-id verbose命令,查看指定LDP对等体的Discovery Sources信息:
<Sysname> display mpls ldp peer 1.1.1.1 verbose
VPN instance: public instance
Peer LDP ID : 1.1.1.1:0
Local LDP ID : 2.2.2.2:0
TCP Connection : 2.2.2.2:14080 -> 1.1.1.1:646
Session State : Operational Session Role : Active
Session Up Time : 0000:00:55 (DD:HH:MM)
Max PDU Length : 4096 bytes (Local: 4096 bytes, Peer: 4096 bytes)
Keepalive Time : 45 sec (Local: 45 sec, Peer: 45 sec)
Keepalive Interval : 15 sec
Msgs Sent/Rcvd : 229/228
KA Sent/Rcvd : 223/223
Label Adv Mode : DU Graceful Restart : Off
Reconnect Time : 0 sec Recovery Time : 0 sec
Loop Detection : Off Path Vector Limit: 0
mLDP P2MP : Off
Discovery Sources:
Ten-GigabitEthernet0/0/6
Hello Hold Time: 15 sec Hello Interval : 5000 ms
Addresses received from peer:
10.1.1.1 1.1.1.1
¡ 如果Discovery Sources信息的接口信息不包含指定路由的出接口,则检查指定路由的出接口上对应的LDP配置是否正确,及下游设备对应接口的LDP配置是否正确。如果不正确,则修改相应配置;如果正确,则执行步骤(5)
¡ 如果Discovery Sources信息的接口信息包含指定路由的出接口,则执行步骤(5)。
(5) 检查是否资源不足,如内存不足,LSP数量达到上限的问题。
¡ 检查系统内存是否不足
执行display memory-threshold命令,查看系统内存是否不足。如果存在内存不足,则删除不必要的LSP。
¡ 检查标签数量是否超出上限。
执行display mpls summary命令,查看LDP的标签段剩余标签数量是否为0,即Idle字段显示为0。如果LDP标签段剩余标签数量为0,则表示LDP的标签资源全部使用完,需要删除不必要的LSP。
<Sysname> display mpls summary
MPLS LSR ID : 2.2.2.2
Egress Label Type: Implicit-null
Entropy Label : Off
Labels:
Range Used/Idle/Total Owner
16-2047 0/2032/2032 StaticPW
Static
StaticCR
Static SR Adj
BSID
2048-599999 9129/588823/597952 LDP
RSVP
BGP
BGP SR EPE
OSPF SR Adj
ISIS SR Adj
¡ 如果不存在资源不足问题,请执行步骤(6)。
(6) 如果故障仍然未能排除,请收集如下信息,并联系技术支持人员。
¡ 上述步骤的执行结果。
¡ 设备的配置文件、日志信息、告警信息。
模块名:MPLS-LSR-STD-MIB
· 节点名称 (OID) mplsXCDown (1.3.6.1.2.1.10.166.2.0.2)
无
LDP网络中LDP LSP频繁震荡。
本类故障的常见原因主要包括:
· 路由震荡。
· LDP会话震荡。
本类故障的诊断思路如下:
(1) 检查路由是否震荡。
(2) 检查LDP会话是否震荡。
本类故障的诊断流程如图1-4所示。
图1-4 LDP LSP震荡的故障诊断流程图
(1) 检查路由是否震荡。
建议每1秒执行一次display ip routing-table命令,连续执行5~10次,查看到达LSP目的地址的路由信息。如果相关路由信息一直在显示和不显示两种情况切换,则表示路由震荡。
查看路由信息后,请执行display mpls ldp fec命令查看LSP下游信息,即Downstream Info中的State字段,确保与下游对等体建立的LSP处于激活状态(Established)。
<Sysname> display mpls ldp fec
VPN instance: public instance
FEC: 1.1.1.1/32
Flags: 0x112
In Label: 2175
Upstream Info:
Peer: 1.1.1.1:0 State: Established
Downstream Info:
Peer: 1.1.1.1:0
Out Label: 3 State: Established
Next Hops: 10.1.1.1 XGE0/0/6
RIB Info:
Protocol : OSPF BGP As Num : 0
Label Proto ID : 1 NextHopCount : 1
VN ID : 0x313000003
Tunnel ID : -
¡ 如果路由震荡,或者路由一直都不存在,则请排除路由问题。
¡ 如果路由没有震荡,则执行步骤(2)。
(2) 检查LDP会话是否震荡。
建议每隔1秒执行一次display mpls ldp peer命令,连续执行5~10次,查看显示信息的State字段。如果该字段的取值在Operational和其他状态之间切换,则表明LDP会话出现震荡。
<Sysname> display mpls ldp peer
VPN instance: public instance
Total number of peers: 1
Peer LDP ID State Role GR AUT KA Sent/Rcvd
1.1.1.1:0 Operational Active Off None 298/298
¡ 如果LDP会话震荡,则请参见“1.1.2 LDP会话震荡”故障进行定位。
¡ 如果LDP会话没有震荡,则执行步骤(3)。
(3) 如果故障仍然未能排除,请收集如下信息,并联系技术支持人员。
¡ 上述步骤的执行结果。
¡ 设备的配置文件、日志信息、告警信息。
模块名:MPLS-LSR-STD-MIB
· 节点名称 (OID) mplsXCDown (1.3.6.1.2.1.10.166.2.0.2)
无
不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!