• 产品与解决方案
  • 行业解决方案
  • 服务
  • 支持
  • 合作伙伴
  • 新华三人才研学中心
  • 关于我们

11-可靠性配置指导

目录

01-以太网OAM配置

本章节下载 01-以太网OAM配置  (283.78 KB)

01-以太网OAM配置


1 以太网OAM

1.1  以太网OAM简介

以太网OAM(Operation, Administration, and Maintenance,操作、管理和维护)是一种监控网络故障的工具,主要用于解决以太网接入“最后一公里”中常见的链路问题,能够有效提高以太网的管理和维护能力,保障网络的稳定运行。用户通过在两个点到点连接的设备上启用以太网OAM功能,可以监控这两台设备之间的链路状态。

1.1.1  以太网OAM主要功能

以太网OAM的主要功能包括:

·     链路性能监测:对链路的各种性能进行监测,包括对丢包、时延和抖动等数据的衡量,以及对各类流量的统计。

·     故障侦测和告警:通过发送检测报文来探测链路的连通性,当链路出现故障时及时通知网络管理员。

·     环路测试:通过监测所发出报文的返回情况来检测链路质量和定位链路故障。

1.1.2  以太网OAM协议报文

以太网OAM工作在数据链路层,其协议报文被称为OAMPDU(OAM Protocol Data Unit,OAM协议数据单元)。以太网OAM就是通过设备之间定时交互OAMPDU来报告链路状态,使网络管理员能够对网络进行有效的管理。几种常见的OAMPDU及其作用如表1-1所示。

表1-1 常见的OAMPDU及其作用

报文类型

中文含义

作用

Information OAMPDU

信息OAMPDU

用于将OAM实体的状态信息(包括本地信息、远端信息和自定义信息)发给远端OAM实体,以保持以太网OAM连接

Event Notification OAMPDU

事件通知OAMPDU

一般用于链路监控,对连接本端和远端OAM实体的链路上所发生的故障进行告警

Loopback Control OAMPDU

环回控制OAMPDU

主要用于远端环回控制,用来控制远端设备的OAM环回状态,该报文中带有开启或关闭环回功能的信息,根据该信息开启或关闭远端环回功能

 

说明

我们将开启了以太网OAM功能的接口称为“以太网OAM实体”,简称“OAM实体”。

 

1.1.3  以太网OAM工作流程

1. 建立以太网OAM连接

以太网OAM连接的建立过程也称为Discovery阶段,即本端OAM实体发现远端OAM实体、并与之建立稳定对话的过程。

在这个过程中,相连的OAM实体通过交互Information OAMPDU通报各自的以太网OAM配置信息和本端支持的以太网OAM能力信息。当OAM实体收到远端的配置参数后,决定是否建立OAM连接。当两端OAM实体对远端环回功能、单向链路检测及链路事件等配置信息的检查都通过之后,以太网OAM协议开始正常工作。

以太网OAM的连接模式有两种:主动模式和被动模式。以太网OAM连接只能由主动模式的OAM实体发起,而被动模式的OAM实体只能等待远端OAM实体的连接请求;同处于被动模式下的两个OAM实体之间无法建立以太网OAM连接。在这两种模式下设备的处理能力如表1-2所示。

表1-2 主动模式与被动模式的处理能力比较

处理能力

主动模式

被动模式

初始化以太网OAM Discovery过程

可以

不可以

对以太网OAM Discovery初始化过程的响应

可以

可以

发送Information OAMPDU

可以

可以

发送Event Notification OAMPDU

可以

可以

发送不携带TLV的Information OAMPDU

可以

可以

发送Loopback Control OAMPDU

可以

不可以

对Loopback Control OAMPDU的响应

可以

可以

 

以太网OAM连接建立后,两端的OAM实体会以一定的时间间隔为周期发送Information OAMPDU来检测连接是否正常,该间隔被称为握手报文发送间隔。如果一端OAM实体在连接超时时间内未收到远端OAM实体发来的Information OAMPDU,则认为OAM连接中断。

2. 链路监控

以太网的故障检测非常困难,特别是在网络物理通信没有中断而网络性能缓慢下降的情况下。链路监控用于在各种环境下检测和发现链路层故障,以太网OAM通过交互Event Notification OAMPDU来监控链路:当一端OAM实体监控到一般链路事件(其所含类型如表1-3所示)时,将向其远端发送Event Notification OAMPDU以进行通报,管理员可以通过观察日志信息动态地掌握网络的状况。

表1-3 一般链路事件

事件类型

描述

错误信号事件(Errored Symbol Event)

以收到设定数量的信号为检测窗口,在窗口期内检测到的错误信号数量如果达到或超过了检测阈值,就产生一次错误信号事件

错误帧事件(Errored Frame Event)

以设定的时间为检测窗口,在窗口期内检测到的错误帧数量如果达到或超过了检测阈值,就产生一次错误帧事件

错误帧周期事件(Errored Frame Period Event)

以收到设定数量的帧为检测窗口,在窗口期内检测到的错误帧数量如果达到或超过了检测阈值,就产生一次错误帧周期事件

错误帧秒事件(Errored Frame Seconds Event)

以设定的时间为检测窗口,在窗口期内检测到的错误帧秒(在某一秒内检测到至少一个错误帧,就称该秒为错误帧秒)数量如果达到或超过了检测阈值,就产生一次错误帧秒事件

 

3. 远端故障检测

在以太网OAM连接已建立的情况下,两端的OAM实体会不断交互Information OAMPDU。当设备故障或不可用导致流量中断时,故障端OAM实体会通过Information OAMPDU中的Flag域将故障信息(即紧急链路事件类型)通知给远端OAM实体。这样,管理员可以通过观察日志信息动态地了解链路状态,对相应的错误及时进行处理。紧急链路事件的类型及其对应的Information OAMPDU发送频率如表1-4所示。

表1-4 紧急链路事件

事件类型

描述

OAMPDU发送频率

链路故障(Link Fault)

远端链路信号丢失

每秒发送一次

致命故障(Dying Gasp)

不可预知的状态发生,比如电源中断

不间断发送

紧急事件(Critical Event)

不能确定的紧急事件发生

不间断发送

 

1.1.4  协议规范

与以太网OAM相关的协议规范有:

·     IEEE 802.3ah:Carrier Sense Multiple Access with Collision Detection (CSMA/CD) Access Method and Physical Layer Specifications

1.2  以太网OAM配置限制和指导

设备对收、发携带有紧急链路事件的Information OAMPDU的支持情况如下:

·     支持接收携带所有类型紧急链路事件的Information OAMPDU。

·     仅支持在设备重启或接口被shutdown时发送携带致命故障事件的Information OAMPDU,但IRF物理接口不支持发送该报文。

·     不支持发送携带紧急事件的Information OAMPDU。

1.3  以太网OAM配置任务简介

以太网OAM配置任务如下:

(1)     配置以太网OAM基本功能

(2)     (可选)配置以太网OAM连接检测定时器

(3)     (可选)配置一般链路事件检测参数

¡     配置错误信号事件检测参数

¡     配置错误帧事件检测参数

¡     配置错误帧周期事件检测参数

¡     配置错误帧秒事件检测参数

(4)     (可选)配置对远端以太网OAM事件的响应动作

1.4  配置以太网OAM基本功能

1. 功能简介

以太网OAM的连接模式分为主动和被动模式,当开启了以太网OAM功能之后,以太网接口开始使用预设的连接模式与其远端接口建立以太网OAM连接。

2. 配置限制和指导

不允许在已开启以太网OAM功能的接口上更改以太网OAM的连接模式。如需更改,请先关闭该接口上的以太网OAM功能。

3. 配置步骤

(1)     进入系统视图。

system-view

(2)     进入二层/三层以太网接口视图。

interface interface-type interface-number

(3)     配置以太网OAM的连接模式。

oam mode { active | passive }

缺省情况下,以太网OAM连接模式为主动模式。

(4)     开启以太网OAM功能。

oam enable

缺省情况下,以太网OAM功能处于关闭状态。

1.5  配置以太网OAM连接检测定时器

1.5.1  功能简介

以太网OAM连接建立后,两端的OAM实体会以一定的时间间隔为周期发送Information OAMPDU来检测连接是否正常,该间隔被称为握手报文发送间隔。如果一端OAM实体在连接超时时间内未收到远端OAM实体发来的Information OAMPDU,则认为OAM连接中断。通过调整握手报文发送间隔和连接超时时间,可以改变以太网OAM连接的检测精度。

1.5.2  配置限制和指导

用户既可在系统视图下配置对所有接口都有效的全局值,也可在接口视图下配置只对当前接口有效的接口值,后者的配置优先级更高。

由于本端OAM实体在连接超时后将老化与远端OAM实体的连接关系,导致OAM连接中断,因此连接超时时间必须大于握手报文发送间隔(建议为五倍或以上),否则将导致以太网OAM连接不稳定。

1.5.3  全局配置以太网OAM连接检测定时器

(1)     进入系统视图。

system-view

(2)     全局配置以太网OAM握手报文的发送间隔。

oam global timer hello interval

缺省情况下,以太网OAM握手报文发送间隔的全局值为1000毫秒。

(3)     全局配置以太网OAM连接的超时时间。

oam global timer keepalive interval

缺省情况下,以太网OAM连接超时时间的全局值为5000毫秒。

1.5.4  在接口上配置以太网OAM连接检测定时器

(1)     进入系统视图。

system-view

(2)     进入二层/三层以太网接口视图。

interface interface-type interface-number

(3)     在接口上配置以太网OAM握手报文的发送间隔。

oam timer hello interval

缺省情况下,接口采用全局值。

(4)     在接口上配置以太网OAM连接的超时时间。

oam timer keepalive interval

缺省情况下,接口采用全局值。

1.6  配置错误信号事件检测参数

1.6.1  配置限制和指导

用户既可在系统视图下配置对所有接口都有效的全局值,也可在接口视图下配置只对当前接口有效的接口值,后者的配置优先级更高。

1.6.2  全局配置错误信号事件检测参数

(1)     进入系统视图。

system-view

(2)     全局配置错误信号事件的检测窗口。

oam global errored-symbol-period window window-value

缺省情况下,错误信号事件检测窗口的全局值为100000000次。

(3)     全局配置错误信号事件的检测阈值。

oam global errored-symbol-period threshold threshold-value

缺省情况下,错误信号事件检测阈值的全局值为1次。

1.6.3  在接口上配置错误信号事件检测参数

(1)     进入系统视图。

system-view

(2)     进入二层/三层以太网接口视图。

interface interface-type interface-number

(3)     在接口上配置错误信号事件的检测窗口。

oam errored-symbol-period window window-value

缺省情况下,接口采用全局值。

(4)     在接口上配置错误信号事件的检测阈值。

oam errored-symbol-period threshold threshold-value

缺省情况下,接口采用全局值。

1.7  配置错误帧事件检测参数

1.7.1  配置限制和指导

用户既可在系统视图下配置对所有接口都有效的全局值,也可在接口视图下配置只对当前接口有效的接口值,后者的配置优先级更高。

1.7.2  全局配置错误帧事件检测参数

(1)     进入系统视图。

system-view

(2)     全局配置错误帧事件的检测窗口。

oam global errored-frame window window-value

缺省情况下,错误帧事件检测窗口的全局值为1000毫秒。

(3)     全局配置错误帧事件的检测阈值。

oam global errored-frame threshold threshold-value

缺省情况下,错误帧事件检测阈值的全局值为1次。

1.7.3  在接口上配置错误帧事件检测参数

(1)     进入系统视图。

system-view

(2)     进入二层/三层以太网接口视图。

interface interface-type interface-number

(3)     在接口上配置错误帧事件的检测窗口。

oam errored-frame window window-value

缺省情况下,接口采用全局值。

(4)     在接口上配置错误帧事件的检测阈值。

oam errored-frame threshold threshold-value

缺省情况下,接口采用全局值。

1.8  配置错误帧周期事件检测参数

1.8.1  配置限制和指导

用户既可在系统视图下配置对所有接口都有效的全局值,也可在接口视图下配置只对当前接口有效的接口值,后者的配置优先级更高。

1.8.2  全局配置错误帧周期事件检测参数

(1)     进入系统视图。

system-view

(2)     全局配置错误帧周期事件的检测窗口。

oam global errored-frame-period window window-value

缺省情况下,错误帧周期事件检测窗口的全局值为10000000次。

(3)     全局配置错误帧周期事件的检测阈值。

oam global errored-frame-period threshold threshold-value

缺省情况下,错误帧周期事件检测阈值的全局值为1次。

1.8.3  在接口上配置错误帧周期事件检测参数

(1)     进入系统视图。

system-view

(2)     进入二层/三层以太网接口视图。

interface interface-type interface-number

(3)     在接口上配置错误帧周期事件的检测窗口。

oam errored-frame-period window window-value

缺省情况下,接口采用全局值。

(4)     在接口上配置错误帧周期事件的检测阈值。

oam errored-frame-period threshold threshold-value

缺省情况下,接口采用全局值。

1.9  配置错误帧秒事件检测参数

1.9.1  配置限制和指导

用户既可在系统视图下配置对所有接口都有效的全局值,也可在接口视图下配置只对当前接口有效的接口值,后者的配置优先级更高。

在数量上,错误帧秒事件的检测阈值不应大于其检测窗口值(换算成秒),否则将不会产生错误帧秒事件。

1.9.2  全局配置错误帧秒事件检测参数

(1)     进入系统视图。

system-view

(2)     全局配置错误帧秒事件的检测窗口。

oam global errored-frame-seconds window window-value

缺省情况下,错误帧秒事件检测窗口的全局值为60000毫秒。

(3)     全局配置错误帧秒事件的检测阈值。

oam global errored-frame-seconds threshold threshold-value

缺省情况下,错误帧秒事件检测阈值的全局值为1次。

1.9.3  在接口上配置错误帧秒事件检测参数

(1)     进入系统视图。

system-view

(2)     进入二层/三层以太网接口视图。

interface interface-type interface-number

(3)     在接口上配置错误帧秒事件的检测窗口。

oam errored-frame-seconds window window-value

缺省情况下,接口采用全局值。

(4)     在接口上配置错误帧秒事件的检测阈值。

oam errored-frame-seconds threshold threshold-value

缺省情况下,接口采用全局值。

1.10  配置对远端以太网OAM事件的响应动作

1. 功能简介

通过本配置可以使接口在收到远端以太网OAM事件时除了记录日志外,还会自动断开OAM连接,并设置该接口的链路层状态为down。

2. 配置步骤

(1)     进入系统视图。

system-view

(2)     进入二层/三层以太网接口视图。

interface interface-type interface-number

(3)     配置接口收到远端以太网OAM事件时的响应动作。

oam remote-failure { connection-expired | critical-event | dying-gasp | link-fault } action error-link-down

缺省情况下,接口收到远端以太网OAM事件后仅记录日志。

1.11  以太网OAM显示和维护

在完成上述配置后,在任意视图下执行display命令可以显示配置后以太网OAM的运行情况,通过查看显示信息验证配置的效果。

在用户视图下执行reset命令可以清除以太网OAM的统计信息。

表1-5 以太网OAM显示和维护

操作

命令

显示以太网OAM连接的信息

display oam { local | remote } [ interface interface-type interface-number ]

显示以太网OAM的配置信息

display oam configuration [ interface interface-type interface-number ]

显示以太网OAM的紧急链路事件统计信息

display oam critical-event [ interface interface-type interface-number ]

显示以太网OAM的一般链路事件统计信息

display oam link-event { local | remote } [ interface interface-type interface-number ]

清除以太网OAM的报文和一般链路事件统计信息

reset oam [ interface interface-type interface-number ]

 

1.12  以太网OAM典型配置举例

1.12.1  以太网OAM基础配置举例

1. 组网需求

·     通过在Device A和Device B上配置以太网OAM功能,实现二者之间链路连通性故障的自动检测。

·     通过观察Device A上收到错误帧的情况,来评判Device A与Device B之间的链路性能。

2. 组网图

图1-1 以太网OAM典型配置组网图

3. 配置步骤

(1)     配置Device A

# 在接口Ten-GigabitEthernet3/0/1上配置以太网OAM的连接模式为主动模式,并开启其以太网OAM功能。

<DeviceA> system-view

[DeviceA] interface ten-gigabitethernet 3/0/1

[DeviceA-Ten-GigabitEthernet3/0/1] oam mode active

[DeviceA-Ten-GigabitEthernet3/0/1] oam enable

# 在接口Ten-GigabitEthernet3/0/1上配置错误帧事件的检测窗口为20000毫秒,检测阈值为10次。

[DeviceA-Ten-GigabitEthernet3/0/1] oam errored-frame window 200

[DeviceA-Ten-GigabitEthernet3/0/1] oam errored-frame threshold 10

[DeviceA-Ten-GigabitEthernet3/0/1] quit

(2)     配置Device B

# 在接口Ten-GigabitEthernet3/0/1上配置以太网OAM的连接模式为被动模式,并开启其以太网OAM功能。

<DeviceB> system-view

[DeviceB] interface ten-gigabitethernet 3/0/1

[DeviceB-Ten-GigabitEthernet3/0/1] oam mode passive

[DeviceB-Ten-GigabitEthernet3/0/1] oam enable

[DeviceB-Ten-GigabitEthernet3/0/1] quit

4. 验证配置

通过使用display oam critical-event命令可以显示以太网OAM的紧急链路事件统计信息,例如:

# 显示Device A所有接口上以太网OAM的紧急链路事件统计信息。

[DeviceA] display oam critical-event

----------- [Ten-GigabitEthernet3/0/1] -----------

 Local link status   : UP

 Event statistics

   Link fault        : Not occurred

   Dying gasp        : Not occurred

   Critical event    : Not occurred

以上信息表明:Device A与Device B之间的链路上尚未发生任何紧急链路事件。

通过使用display oam link-event命令可以显示以太网OAM的一般链路事件统计信息,例如:

# 显示Device A所有接口上以太网OAM的一般链路事件的本端统计信息。

[DeviceA] display oam link-event local

----------- [Ten-GigabitEthernet3/0/1] -----------

 Link status: UP

 OAM local errored frame event

   Event time stamp        : 5789 x 100 milliseconds

   Errored frame window    : 200 x 100 milliseconds

   Errored frame threshold : 10 error frames

   Errored frame           : 13 error frames

   Error running total     : 350 error frames

   Event running total     : 17 events

以上信息表明:从Device A开始运行时起,总共有350个错误帧,产生了17次错误帧事件,链路性能并不稳定。

 

不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!

新华三官网
联系我们