• 产品与解决方案
  • 行业解决方案
  • 服务
  • 支持
  • 合作伙伴
  • 关于我们

08-MPLS

目录

01-LDP故障处理手册

本章节下载 01-LDP故障处理手册  (237.58 KB)

01-LDP故障处理手册

1 MPLS类故障处理

1.1  LDP故障处理

1.1.1  LDP会话无法Up

1. 故障描述

LDP会话无法Up。

2. 常见原因

本类故障的常见原因主要包括:

·     建立会话的接口处于Down状态

·     LSR ID配置错误

·     不存在LDP会话的相关配置

·     传输地址配置错误

·     LDP Hello-hold定时器超时

·     LDP Keepalive-hold定时器超时

·     安全认证配置错误

3. 故障分析

本类故障的诊断流程如图1-1所示。

图1-1 LDP会话Down的故障诊断流程图

 

4. 处理步骤

(1)     检查建立LDP会话的接口是否处于Up状态。

执行display interface命令查看接口是否处于UP状态:

¡     如果没有UP,则排除接口物理链路故障,使接口处于UP状态。

¡     如果接口处于UP状态,则执行步骤(2)。

(2)     检查LSR ID配置是否正确。

LSR ID包括Local LSR ID、LDP LSR ID和MPLS LSR ID。LSR ID优先级从高到底依次为Local LSR ID、LDP LSR ID、MPLS LSR ID。设备上至少配置其中的一种LSR ID,且该LSR ID必须路由可达。

执行display mpls ldp peer verbose命令检查是否配置了LSR ID:

<Sysname> display mpls ldp peer verbose

VPN instance: public instance

 Peer LDP ID      : 100.100.100.20:0

 Local LDP ID     : 100.100.100.17:0

 TCP Connection   : 100.100.100.20:47515 -> 100.100.100.17:646

如果执行display mpls ldp peer verbose命令时无显示,则通过以下方法配置LSR ID:

¡     在系统视图下配置MPLS LSR ID。

请在系统视图下执行mpls lsr-id命令。

¡     在LDP视图下配置LDP LSR ID。

请在LDP视图下执行lsr-id命令。

¡     如果是直连会话,在接口视图下配置Local LSR ID。

请在接口视图下执行mpls ldp local-lsr-id命令。

¡     如果是远程会话,在LDP对等体视图下配置Local LSR ID。

请在LDP对等体下执行mpls ldp local-lsr-id interface命令。

如果至少配置了一种LSR ID,则执行步骤(3)。

(3)     检查是否存在LDP会话的相关配置。

如果是直连会话,则在接口视图下执行display this命令,查看是否存在LDP会话的相关配置。

a.     如果配置信息中没有包含mpls enable命令、mpls ldp enable命令、mpls ldp ipv6 enable命令或mpls ldp transport-address命令,则部署对应的配置。

b.     如果存在LDP会话的相关配置,则执行步骤(4)。

如果是LDP远程会话,则在LDP视图下执行display this命令,查看是否存在LDP会话的相关配置。

c.     如果配置信息中没有包含targeted-peermpls ldp transport-address命令,则部署对应的配置。

d.     如果存在LDP会话的相关配置,则执行步骤(4)。

(4)     检查传输地址配置是否正确。

如果是LDP IPv4会话,请执行display mpls ldp discovery verbose命令检查传输地址配置是否正确:

<Sysname> display mpls ldp discovery verbose

VPN instance: public instance

Link Hellos:

  Interface Ten-GigabitEthernet0/0/7

    Local LDP ID     : 100.100.100.17:0

    Hello Interval   : 5000 ms            Hello Sent/Rcvd  : 83/160

    Transport Address: 100.100.100.17

    Peer LDP ID      : 100.100.100.18:0

      Source Address : 202.118.224.18     Transport Address: 100.100.100.18

      Hello Hold Time: 15 sec (Local: 15 sec, Peer: 15 sec)

    Peer LDP ID      : 100.100.100.20:0

      Source Address : 202.118.224.20     Transport Address: 100.100.100.20

      Hello Hold Time: 15 sec (Local: 15 sec, Peer: 15 sec)

 

Targeted Hellos:

  100.100.100.17 -> 100.100.100.18 (Active, Passive)

    Local LDP ID     : 100.100.100.17:0

    Hello Interval   : 15000 ms           Hello Sent/Rcvd  : 23/20

    Transport Address: 100.100.100.17

    Session Setup    : Config/Tunnel

    Peer LDP ID      : 100.100.100.18:0

      Source Address : 100.100.100.18     Transport Address: 100.100.100.18

      Hello Hold Time: 45 sec (Local: 45 sec, Peer: 45 sec)

如果是LDP IPv6会话,请执行display mpls ldp discovery ipv6 verbose命令检查传输地址配置是否正确:

<Sysname> display mpls ldp discovery ipv6 verbose

VPN instance: public instance

Link Hellos:

  Interface Ten-GigabitEthernet0/0/7

    Hello Interval   : 5000 ms            Hello Sent/Rcvd  : 83/160

    Transport Address: 2001::2

    Peer LDP ID      : 100.100.100.18:0

      Source Address : FE80:130F:20C0:29FF:FEED:9E60:876A:130B

      Transport Address: 2001::1

      Hello Hold Time: 15 sec (Local: 15 sec, Peer: 15 sec)

 

Targeted Hellos:

  2001:0000:130F::09C0:876A:130B ->

        2005:130F::09C0:876A:130B(Active, Passive)

    Hello Interval   : 15000 ms           Hello Sent/Rcvd  : 23/22

    Transport Address: 2001:0000:130F::09C0:876A:130B

    Peer LDP ID      : 100.100.100.18:0

      Source Address : 2005:130F::09C0:876A:130B

      Destination Address : 2001:0000:130F::09C0:876A:130B

      Transport Address   : 2005:130F::09C0:876A:130B

      Hello Hold Time: 45 sec (Local: 45 sec, Peer: 45 sec)

如果传输地址配置不正确,则可以在接口视图或LDP对等体视图下执行mpls ldp transport-address命令配置传输地址。缺省情况下,传输地址为本LSR的LSR ID。

如果传输地址配置正确,则需要确认路由是否发布。执行display ip routing-table命令,查看是否存在到达会话对端的路由。

e.     如果不存在到达会话对端的路由,则请将传输地址配置成本机存在的IP地址,确保路由正确发布。

f.     如果存在到达会话对端的路由,则执行步骤(5)。

(5)     检查LDP Hello-hold定时器是否超时。

建议每隔5秒执行一次display mpls ldp discovery命令,查看Hello消息的发送和接收计数,检查会话两端的Hello消息是否正常发送。如果连续几次执行该命令后,发现发送或接收Hello消息的计数保持不变,则表明Hello消息的发送或接收存在异常。

¡     如果Hello-hold定时器超时,请排除链路问题,并检查设备CPU利用率。如果CPU利用率过高,请关闭一些不必要功能;如果CPU利用率正常,则执行步骤(6)。

¡     如果Hello-hold定时器没有超时,则执行步骤(6)。

(6)     检查LDP Keepalive-hold定时器是否超时。

建议每隔15秒执行一次display mpls ldp peer命令,查看Keepalive消息的发送和接收计数,检查会话两端的Keepalive消息是否正常发送。如果连续几次执行该命令后,发现发送或接收Keepalive消息的计数保持不变,则表明Keepalive消息的发送或接收存在异常。

¡     如果Keepalive-hold定时器超时,则排除报文转发问题。

¡     如果Keepalive-hold定时器没有超时,则执行步骤(7)。

(7)     安全认证配置是否正确。

请执行display mpls ldp peer命令LDP会话之间的安全认证是否配置,以及配置的安全认证类型是否一致:

<Sysname> display mpls ldp peer

VPN instance: public instance

Total number of peers: 1

Peer LDP ID             State         Role     GR   Auth      KA Sent/Rcvd

2.2.2.9:0               Operational   Passive  Off  Keychain  39/39

¡     如果LDP会话两端Auth字段显示不一致,则将LDP会话两端的安全认证修改为一致。

¡     如果LDP会话两端Auth字段显示一致,则执行步骤(8)。

(8)     如果故障仍然未能排除,请收集如下信息,并联系技术支持人员。

¡     上述步骤的执行结果。

¡     设备的配置文件、日志信息、告警信息。

5. 告警与日志

相关告警

模块名:MPLS-LDP-STD-MIB

·     mplsLdpSessionDown (1.3.6.1.2.1.10.166.4.0.4)

相关日志

·     LDP/4/LDP_SESSION_CHG

1.1.2  LDP会话震荡

1. 故障描述

LDP会话状态频繁震荡。

2. 常见原因

本类故障的常见原因主要包括:

·     接口震荡

·     路由震荡

·     CPU利用率过高

3. 故障分析

本类故障的诊断流程如图1-2所示。

图1-2 LDP会话震荡的故障诊断流程图

 

4. 处理步骤

(1)     检查接口是否震荡。

执行display interface brief命令,查看Physical和Protocol字段。Physical和Protocol字段均显示Up,则表示接口状态为Up,否则表示接口状态为Down。若接口一直在Up和Down两种状态间切换,则表示接口震荡。

¡     如果接口震荡,则排除接口问题。

¡     如果接口没有震荡,请执行步骤(2)。

(2)     检查路由是否震荡。

执行display ip routing-table命令,查看路由信息。如果路由信息一直在显示和不显示两种情况切换,则表示路由震荡。

¡     如果路由震荡,或者路由一直不存在,则排除链路问题和排除IGP路由问题。

¡     如果路由没有震荡,则执行步骤(3)。

(3)     TCP报文是否过大。

执行display tcp statistics命令,查看TCP连接的流量统计信息。通过Sent packets信息中data packets retransmitted(重发的数据报文数)字段的值,判断TCP报文是否过大:

¡     如果重发的数据报文数不断增加,则表示TCP报文过大,请在报文出接口下执行tcp mss命令调整TCP MSS值。

¡     如果重发的数据报文数未增加,则表示TCP报文大小正常,请执行步骤(4)。

(4)     检查CPU利用率是否过高。

执行display cpu-usage命令,查看CPU利用率的统计信息。

¡     如果CPU利用率过高,则关闭一些不必要的功能,降低设备CPU利用率。

¡     如果CPU利用率正常,则执行步骤(5)。

(5)     如果故障仍然未能排除,请收集如下信息,并联系技术支持人员。

¡     上述步骤的执行结果。

¡     设备的配置文件、日志信息、告警信息。

5. 告警与日志

相关告警

模块名:MPLS-LDP-STD-MIB

·     mplsLdpSessionDown (1.3.6.1.2.1.10.166.4.0.4)

相关日志

·     LDP/4/LDP_SESSION_CHG

1.1.3  LDP LSP无法Up

1. 故障描述

LDP网络中LDP LSP无法Up。

2. 常见原因

本类故障的常见原因主要包括:

·     路由问题

·     LDP会话Down

·     资源不足,如Label达到上限,内存不足等

·     配置了LSP触发策略、标签接受控制策略、标签通告控制策略或Label Mapping消息的发送策略

·     路由的出接口与LDP建立会话的接口不一致

3. 故障分析

本类故障的诊断思路如下:

(1)     检查路由是否存在。

(2)     检查LDP会话是否正常建立。

(3)     检查是否存在资源不足,入Label达到上限,内存不足的问题。

(4)     检查是否配置了LSP建立策略。

(5)     检查路由的出接口与LDP建立会话的接口是否一致。

本类故障的诊断流程如图1-3所示。

图1-3 LDP LSP Down的故障诊断流程图

 

4. 处理步骤

(1)     检查路由是否存在。

执行display ip routing-table ip-address mask verbose命令,查看是否存在到达指定LSP目的地址的路由,并检查该路由是否处于激活状态(路由信息中的State字段为Active Adv,表示路由处于激活状态)。对于公网BGP路由,还需要检查路由是否带标签。如果Label字段非NULL,则表示BGP路由携带标签。

<Sysname> display ip routing-table 1.1.1.1 32 verbose

 

Summary count : 1

 

 Destination: 1.1.1.1/32

    Protocol: O_INTRA

  Process ID: 1

   SubProtID: 0x1                       Age: 00h00m16s

  FlushedAge: 00h00m16s

        Cost: 1                  Preference: 10

       IpPre: N/A                QosLocalID: N/A

         Tag: 0                       State: Active Adv

   OrigTblID: 0x0                   OrigVrf: default-vrf

¡     如果路由不存在、路由存在但未处于激活状态或者BGP路由未携带标签,则请排除路由故障。

¡     如果路由存在且处于激活状态,对于BGP路由也带标签,则执行步骤(2)。

(2)     检查LDP会话是否正常建立。

执行display mpls ldp peer verbose命令,查看LDP会话是否成功建立:

<Sysname> display mpls ldp peer verbose

VPN instance: public instance

 Peer LDP ID      : 1.1.1.1:0

 Local LDP ID     : 2.2.2.2:0

 TCP Connection   : 2.2.2.2:14080 -> 1.1.1.1:646

 Session State    : Operational        Session Role     : Active

 Session Up Time  : 0000:00:14 (DD:HH:MM)

¡     如果Session State字段的取值不是Operational,则表示LDP会话没有正常建立,请参见“1.1.1  LDP会话无法Up”故障进行定位。

¡     如果Session State字段的取值为Operational,则表示LDP会话正常建立,且该会话处于Up状态,请执行步骤(3)。

(3)     检查是否配置了LSP策略。

¡     在LDP视图下执行display this命令,如果存在以下命令,则需要检查IP前缀列表是否过滤了指定的LSP:

-     lsp-trigger prefix-list

-     accept-label peer prefix-list

-     advertise-label prefix-list

-     propagate mapping prefix-list

如果IP前缀列表过滤了指定的LSP,则请修改IP前缀列表,使其允许指定LSP目的地址通过;如果IP前缀列表没有过滤指定的LSP,则执行步骤(4)。

¡     如果LDP视图下没有配置以上命令,则执行步骤(4)。

(4)     检查路由的出接口与LDP建立会话的接口是否一致。

执行display ip routing-table ip-address mask命令,查看指定路由的出接口信息:

<Sysname> display ip routing-table 1.1.1.1 32

 

Summary count : 1

 

Destination/Mask   Proto   Pre Cost        NextHop         Interface

1.1.1.1/32         O_INTRA 10  1           10.1.1.1        XGE0/0/6

执行display mpls ldp peer peer-lsr-id verbose命令,查看指定LDP对等体的Discovery Sources信息:

<Sysname> display mpls ldp peer 1.1.1.1 verbose

VPN instance: public instance

 Peer LDP ID      : 1.1.1.1:0

 Local LDP ID     : 2.2.2.2:0

 TCP Connection   : 2.2.2.2:14080 -> 1.1.1.1:646

 Session State    : Operational        Session Role     : Active

 Session Up Time  : 0000:00:55 (DD:HH:MM)

 Max PDU Length   : 4096 bytes (Local: 4096 bytes, Peer: 4096 bytes)

 Keepalive Time     : 45 sec (Local: 45 sec, Peer: 45 sec)

 Keepalive Interval : 15 sec

 Msgs Sent/Rcvd   : 229/228

 KA Sent/Rcvd     : 223/223

 Label Adv Mode   : DU                 Graceful Restart : Off

 Reconnect Time   : 0 sec              Recovery Time    : 0 sec

 Loop Detection   : Off                Path Vector Limit: 0

 mLDP P2MP        : Off

 Discovery Sources:

   Ten-GigabitEthernet0/0/6

     Hello Hold Time: 15 sec           Hello Interval   : 5000 ms

 Addresses received from peer:

   10.1.1.1           1.1.1.1

¡     如果Discovery Sources信息的接口信息不包含指定路由的出接口,则检查指定路由的出接口上对应的LDP配置是否正确,及下游设备对应接口的LDP配置是否正确。如果不正确,则修改相应配置;如果正确,则执行步骤(5)

¡     如果Discovery Sources信息的接口信息包含指定路由的出接口,则执行步骤(5)。

(5)     检查是否资源不足,如内存不足,LSP数量达到上限的问题。

¡     检查系统内存是否不足

执行display memory-threshold命令,查看系统内存是否不足。如果存在内存不足,则删除不必要的LSP。

¡     检查标签数量是否超出上限。

执行display mpls summary命令,查看LDP的标签段剩余标签数量是否为0,即Idle字段显示为0。如果LDP标签段剩余标签数量为0,则表示LDP的标签资源全部使用完,需要删除不必要的LSP。

<Sysname> display mpls summary

MPLS LSR ID      : 2.2.2.2

Egress Label Type: Implicit-null

Entropy Label    : Off

Labels:

  Range                               Used/Idle/Total         Owner

  16-2047                             0/2032/2032             StaticPW

                                                              Static

                                                              StaticCR

                                                              Static SR Adj

                                                              BSID

  2048-599999                         9129/588823/597952      LDP

                                                              RSVP

                                                              BGP

                                                              BGP SR EPE

                                                              OSPF SR Adj

                                                              ISIS SR Adj

¡     如果不存在资源不足问题,请执行步骤(6)。

(6)     如果故障仍然未能排除,请收集如下信息,并联系技术支持人员。

¡     上述步骤的执行结果。

¡     设备的配置文件、日志信息、告警信息。

5. 告警与日志

相关告警

模块名:MPLS-LSR-STD-MIB

·     节点名称 (OID) mplsXCDown (1.3.6.1.2.1.10.166.2.0.2)

相关日志

1.1.4  LDP LSP震荡

1. 故障描述

LDP网络中LDP LSP频繁震荡。

2. 常见原因

本类故障的常见原因主要包括:

·     路由震荡。

·     LDP会话震荡。

3. 故障分析

本类故障的诊断思路如下:

(1)     检查路由是否震荡。

(2)     检查LDP会话是否震荡。

本类故障的诊断流程如图1-4所示。

图1-4 LDP LSP震荡的故障诊断流程图

 

4. 处理步骤

(1)     检查路由是否震荡。

建议每1秒执行一次display ip routing-table命令,连续执行5~10次,查看到达LSP目的地址的路由信息。如果相关路由信息一直在显示和不显示两种情况切换,则表示路由震荡。

查看路由信息后,请执行display mpls ldp fec命令查看LSP下游信息,即Downstream Info中的State字段,确保与下游对等体建立的LSP处于激活状态(Established)。

<Sysname> display mpls ldp fec

VPN instance: public instance

 FEC: 1.1.1.1/32

   Flags: 0x112

   In Label: 2175

   Upstream Info:

     Peer: 1.1.1.1:0               State: Established

   Downstream Info:

     Peer: 1.1.1.1:0

       Out Label: 3                State: Established

       Next Hops: 10.1.1.1                XGE0/0/6

   RIB Info:

     Protocol        : OSPF        BGP As Num   : 0

     Label Proto ID  : 1           NextHopCount : 1

     VN ID           : 0x313000003

     Tunnel ID       : -

¡     如果路由震荡,或者路由一直都不存在,则请排除路由问题。

¡     如果路由没有震荡,则执行步骤(2)。

(2)     检查LDP会话是否震荡。

建议每隔1秒执行一次display mpls ldp peer命令,连续执行5~10次,查看显示信息的State字段。如果该字段的取值在Operational和其他状态之间切换,则表明LDP会话出现震荡。

<Sysname> display mpls ldp peer

VPN instance: public instance

Total number of peers: 1

Peer LDP ID             State         Role     GR   AUT       KA Sent/Rcvd

1.1.1.1:0               Operational   Active   Off  None      298/298

¡     如果LDP会话震荡,则请参见“1.1.2  LDP会话震荡”故障进行定位。

¡     如果LDP会话没有震荡,则执行步骤(3)。

(3)     如果故障仍然未能排除,请收集如下信息,并联系技术支持人员。

¡     上述步骤的执行结果。

¡     设备的配置文件、日志信息、告警信息。

5. 告警与日志

相关告警

模块名:MPLS-LSR-STD-MIB

·     节点名称 (OID) mplsXCDown (1.3.6.1.2.1.10.166.2.0.2)

相关日志

不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!

新华三官网
联系我们