03-以太网OAM配置
本章节下载: 03-以太网OAM配置 (299.21 KB)
目 录
以太网OAM(Operation, Administration and Maintenance,操作、管理和维护)是一种监控网络故障的工具,主要用于解决以太网接入“最后一公里”中常见的链路问题,能够有效提高以太网的管理和维护能力,保障网络的稳定运行。用户通过在两个点到点连接的设备上启用以太网OAM功能,可以监控这两台设备之间的链路状态。
以太网OAM的主要功能包括:
· 链路性能监测:对链路的各种性能进行监测,包括对丢包、时延和抖动等的衡量,以及对各类流量的统计;
· 故障侦测和告警:通过发送检测报文来探测链路的连通性,当链路出现故障时及时通知网络管理员;
· 环路测试:通过监测所发出报文的返回情况来检测链路质量和定位链路故障。
以太网OAM工作在数据链路层,其协议报文被称为OAMPDU(OAM Protocol Data Units,OAM协议数据单元)。以太网OAM就是通过设备之间定时交互OAMPDU来报告链路状态,使网络管理员能够对网络进行有效的管理。
如图1-1所示,是几种常见OAMPDU的报文格式,各重要字段的含义如表1-1所示。
表1-1 OAMPDU重要字段含义
字段 |
含义 |
Dest addr |
以太网OAM报文目的MAC地址,为慢协议组播地址:0x0180-C200-0002。由于慢协议报文不能被网桥转发,因此以太网OAM报文也不能被转发 |
Source addr |
以太网OAM报文源MAC地址,为发送端的桥MAC地址,是一个单播MAC地址 |
Type |
以太网OAM报文的协议类型,为0x8809 |
Subtype |
以太网OAM报文的协议子类型,为0x03 |
Flags |
Flag域,包含了以太网OAM实体的状态信息 |
Code |
OAMPDU报文的类型 |
我们称使能了以太网OAM功能的端口为“以太网OAM实体”,简称“OAM实体”。
表1-2 各类OAMPDU报文的作用
报文类型 |
中文含义 |
作用 |
Information OAMPDU |
信息OAMPDU |
用于将OAM实体的状态信息(包括本地信息、远端信息和自定义信息)发给远端OAM实体,以保持以太网OAM连接 |
Event Notification OAMPDU |
事件通知OAMPDU |
一般用于链路监控,对连接本端和远端OAM实体的链路上所发生的故障进行告警 |
Loopback Control OAMPDU |
环回控制OAMPDU |
主要用于远端环回控制,用来控制远端设备的OAM环回状态,该报文中带有使能或去使能环回功能的信息,根据该信息开启或关闭远端环回功能 |
以太网OAM功能建立在以太网OAM连接的基础上,下面对以太网OAM的工作流程进行简要介绍。
以太网OAM连接的建立过程也称为Discovery阶段,即本端OAM实体发现远端OAM实体、并与之建立稳定对话的过程。
在这个过程中,相连的OAM实体通过交互Information OAMPDU通报各自的以太网OAM配置信息和本端支持的以太网OAM能力信息。当OAM实体收到对端的配置参数后,决定是否建立OAM连接。当两端OAM实体对Loopback功能、单向链路检测及链路事件等配置信息的检查都通过之后,以太网OAM协议开始正常工作。
以太网OAM的连接模式有两种:主动模式和被动模式,在这两种模式下设备的处理能力如表1-3所示。
处理能力 |
主动模式 |
被动模式 |
初始化以太网OAM Discovery过程 |
可以 |
不可以 |
对以太网OAM Discovery初始化过程的响应 |
可以 |
可以 |
发送Information OAMPDU |
可以 |
可以 |
发送Event Notification OAMPDU |
可以 |
可以 |
发送不携带TLV的Information OAMPDU |
可以 |
可以 |
发送Loopback Control OAMPDU |
可以 |
不可以 |
对Loopback Control OAMPDU的响应 |
可以,但需要对端为主动模式 |
可以 |
· 以太网OAM连接只能由主动模式的OAM实体发起,而被动模式的OAM实体只能等待对端OAM实体的连接请求。
· 都处于被动模式下的两个OAM实体之间无法建立以太网OAM连接。
以太网OAM连接建立后,两端的OAM实体会以一定的时间间隔为周期发送Information OAMPDU来检测连接是否正常,该间隔被称为握手报文发送间隔。如果一端OAM实体在连接超时时间内未收到对端OAM实体发来的Information OAMPDU,则认为OAM连接中断。
以太网的故障检测非常困难,特别是在网络物理通信没有中断而网络性能缓慢下降的情况下。链路监控用于在各种环境下检测和发现链路层故障,以太网OAM通过交互Event Notification OAMPDU来监控链路:当一端OAM实体监控到一般链路事件(其所含类型如表1-4所示)时,将向其对端发送Event Notification OAMPDU以进行通报,管理员可以通过观察日志信息动态地掌握网络的状况。
事件类型 |
描述 |
错误信号事件(Errored Symbol Event) |
单位时间内的错误信号数量超过定义的阈值 |
错误帧事件(Errored Frame Event) |
单位时间内的错误帧数量超过定义的阈值 |
错误帧周期事件(Errored Frame Period Event) |
指定帧数N为周期,在收到N个帧的周期内错误帧数超过定义的阈值 |
错误帧秒数事件(Errored Frame Seconds Event) |
指定M秒数下有错误帧的秒数超过了定义的阈值 |
· 错误帧周期事件的检测周期将被系统转换为某端口在该周期内能发送64字节帧的最大帧数(不含帧间隙和前导码),即以最大帧数作为周期,其计算公式为:最大帧数=接口带宽(bps)×错误帧周期事件的检测周期(ms)÷(64×8×1000)。
· 错误帧秒:如果在某一秒内发生了错误帧,则将该秒称为错误帧秒。
在以太网OAM连接已建立的情况下,两端的OAM实体会不断交互Information OAMPDU。当设备故障或不可用导致流量中断时,故障端OAM实体会通过Information OAMPDU中的Flag域将故障信息(即紧急链路事件类型)通知给对端OAM实体。这样,管理员可以通过观察日志信息动态地了解链路状态,对相应的错误及时进行处理。紧急链路事件的类型及其对应的Information OAMPDU发送频率如表1-5所示。
事件类型 |
描述 |
OAMPDU发送频率 |
链路故障(Link Fault) |
对端链路信号丢失 |
每秒发送一次 |
致命故障(Dying Gasp) |
不可预知的状态发生,比如电源中断 |
不间断发送 |
紧急事件(Critical Event) |
不能确定的紧急事件发生 |
不间断发送 |
本系列设备对收发携带有紧急链路事件的Information OAMPDU的支持情况如下:
· 支持接收携带以上三种类型紧急链路事件的Information OAMPDU。
· 不支持发送携带链路故障事件的Information OAMPDU。
· 仅支持在设备重启或端口被shutdown时发送携带致命故障事件的Information OAMPDU,但IRF物理端口不支持发送该报文。有关IRF物理端口的详细介绍,请参见“IRF配置指导”中的“IRF”。
· 不支持发送携带紧急事件的Information OAMPDU。
与以太网OAM相关的协议规范有:
· IEEE 802.3ah:Carrier Sense Multiple Access with Collision Detection (CSMA/CD) Access Method and Physical Layer Specifications
表1-6 以太网OAM配置任务简介
配置任务 |
说明 |
详细配置 |
|
配置以太网OAM基本功能 |
必选 |
||
配置以太网OAM连接检测定时器 |
可选 |
||
配置一般链路事件的检测参数 |
配置错误信号事件的检测参数 |
可选 |
|
配置错误帧事件检测参数 |
可选 |
||
配置错误帧周期事件检测参数 |
可选 |
||
配置错误帧秒数事件检测参数 |
可选 |
以太网OAM的连接模式分为主动和被动模式,当使能了以太网OAM功能之后,以太网端口开始使用预设的连接模式与其对端端口建立以太网OAM连接。
表1-7 配置以太网OAM基本功能
操作 |
命令 |
说明 |
进入系统视图 |
system-view |
- |
进入二层以太网端口视图 |
interface interface-type interface-number |
- |
配置以太网OAM的连接模式 |
oam mode { active | passive } |
可选 缺省情况下,以太网OAM的连接模式为主动模式 |
使能以太网OAM功能 |
oam enable |
必选 缺省情况下,以太网端口的以太网OAM功能处于关闭状态 |
在使能了以太网OAM功能的端口上不能改变以太网OAM的连接模式。如需改变连接模式,请先关闭该端口上的以太网OAM功能。
以太网OAM连接建立后,两端的OAM实体会以一定的时间间隔为周期发送Information OAMPDU来检测连接是否正常,该间隔被称为握手报文发送间隔。如果一端OAM实体在连接超时时间内未收到对端OAM实体发来的Information OAMPDU,则认为OAM连接中断。
通过调整握手报文发送间隔和连接超时时间,可以改变以太网OAM连接的检测精度。
表1-8 配置以太网OAM连接检测定时器
操作 |
命令 |
说明 |
进入系统视图 |
system-view |
- |
配置以太网OAM握手报文的发送间隔 |
oam timer hello interval |
可选 缺省情况下,以太网OAM握手报文的发送间隔为1000毫秒 |
配置以太网OAM连接的超时时间 |
oam timer keepalive interval |
可选 缺省情况下,以太网OAM连接的超时时间为5000毫秒 |
由于以太网OAM连接超时后,本端OAM实体将老化与对端OAM实体的连接关系,使OAM连接中断,因此连接超时时间必须大于握手报文发送间隔(建议配置为其五倍或以上),否则会导致以太网OAM连接的不稳定。
当以太网OAM连接建立后,本节中所配置的各事件检测周期和阈值将会在所有以太网端口上自动有效。
在错误信号事件的检测周期内,如果某以太网端口上所发生的错误信号数大于或等于错误信号事件的检测阈值,则将在该端口上产生一个错误信号事件。
表1-9 配置错误信号事件的检测参数
操作 |
命令 |
说明 |
进入系统视图 |
system-view |
- |
配置错误信号事件的检测周期 |
oam errored-symbol period period-value |
可选 缺省情况下,错误信号事件的检测周期为1秒 |
配置错误信号事件的检测阈值 |
oam errored-symbol threshold threshold-value |
可选 缺省情况下,错误信号事件的检测阈值为1 |
在错误帧事件的检测周期内,如果某以太网端口上所发生的错误帧数大于或等于错误帧事件的检测阈值,则将在该端口上产生一个错误帧事件。
表1-10 配置错误帧事件的检测参数
操作 |
命令 |
说明 |
进入系统视图 |
system-view |
- |
配置错误帧事件的检测周期 |
oam errored-frame period period-value |
可选 缺省情况下,错误帧事件的检测周期为1秒 |
配置错误帧事件的检测阈值 |
oam errored-frame threshold threshold-value |
可选 缺省情况下,错误帧事件的检测阈值为1 |
在错误帧周期事件的检测周期内,如果某以太网端口上所发生的错误帧数大于或等于错误帧周期事件的检测阈值,则将在该端口上产生一个错误帧周期事件。
表1-11 配置错误帧周期事件的检测参数
操作 |
命令 |
说明 |
进入系统视图 |
system-view |
- |
配置错误帧周期事件的检测周期 |
oam errored-frame-period period period-value |
可选 缺省情况下,错误帧周期事件的检测周期为1000毫秒 |
配置错误帧周期事件的检测阈值 |
oam errored-frame-period threshold threshold-value |
可选 缺省情况下,错误帧周期事件的检测阈值为1 |
在错误帧秒数事件的检测周期内,如果某以太网端口上所发生的错误帧秒数大于或等于错误帧秒数事件的检测阈值,则将在该端口上产生一个错误帧秒数事件。
表1-12 配置错误帧秒数事件的检测参数
操作 |
命令 |
说明 |
进入系统视图 |
system-view |
- |
配置错误帧秒数事件的检测周期 |
oam errored-frame-seconds period period-value |
可选 缺省情况下,错误帧秒数事件的检测周期为60秒 |
配置错误帧秒数事件的检测阈值 |
oam errored-frame-seconds threshold threshold-value |
可选 缺省情况下,错误帧秒数事件的检测阈值为1 |
错误帧秒数事件检测的阈值不要大于设定的周期值,否则不会发生错误帧秒数事件。
在完成上述配置后,在任意视图下执行display命令可以显示配置后以太网OAM的运行情况,通过查看显示信息验证配置的效果。
在用户视图下执行reset命令可以清除以太网OAM的统计信息。
表1-13 以太网OAM显示和维护
操作 |
命令 |
查看以太网OAM的全局配置信息 |
display oam configuration [ | { begin | exclude | include } regular-expression ] |
查看以太网OAM的紧急链路事件统计信息 |
display oam critical-event [ interface interface-type interface-number ] [ | { begin | exclude | include } regular-expression ] |
查看以太网OAM的一般链路事件统计信息 |
display oam link-event { local | remote } [ interface interface-type interface-number ] [ | { begin | exclude | include } regular-expression ] |
查看以太网OAM连接的信息 |
display oam { local | remote } [ interface interface-type interface-number ] [ | { begin | exclude | include } regular-expression ] |
清除以太网OAM的报文和一般链路事件统计信息 |
reset oam [ interface interface-type interface-number ] |
· 通过在Device A和Device B上配置以太网OAM功能,实现二者之间链路连通性故障的自动检测;
· 通过观察Device A上收到错误帧的情况,来检测Device A与Device B之间的链路性能。
图1-2 以太网OAM典型配置组网图
(1) 配置Device A
# 在端口GigabitEthernet1/0/1上配置以太网OAM的连接模式为被动模式,并使能以太网OAM功能。
<DeviceA> system-view
[DeviceA] interface gigabitethernet 1/0/1
[DeviceA-GigabitEthernet1/0/1] oam mode passive
[DeviceA-GigabitEthernet1/0/1] oam enable
[DeviceA-GigabitEthernet1/0/1] quit
# 配置错误帧事件的检测周期为20秒,检测阈值为10。
[DeviceA] oam errored-frame period 20
[DeviceA] oam errored-frame threshold 10
(2) 配置Device B
# 在端口GigabitEthernet1/0/1上配置以太网OAM的连接模式为主动模式,并使能以太网OAM功能。
<DeviceB> system-view
[DeviceB] interface gigabitethernet 1/0/1
[DeviceA-GigabitEthernet1/0/1] oam mode active
[DeviceB-GigabitEthernet1/0/1] oam enable
[DeviceB-GigabitEthernet1/0/1] quit
(3) 检验配置效果
通过使用display oam configuration命令可以查看以太网OAM的配置信息,例如:
# 查看Device A上以太网OAM的配置信息。
[DeviceA] display oam configuration
Configuration of the link event window/threshold :
--------------------------------------------------------------------------
Errored-symbol Event period(in seconds) : 1
Errored-symbol Event threshold : 1
Errored-frame Event period(in seconds) : 20
Errored-frame Event threshold : 10
Errored-frame-period Event period(in ms) : 1000
Errored-frame-period Event threshold : 1
Errored-frame-seconds Event period(in seconds) : 60
Errored-frame-seconds Event threshold : 1
Configuration of the timer :
--------------------------------------------------------------------------
Hello timer(in ms) : 1000
Keepalive timer(in ms) : 5000
以上显示信息表明:除错误帧事件的检测周期为20秒、检测阈值为10以外,其余参数都为缺省值。
通过使用display oam critical-event命令可以查看以太网OAM的紧急链路事件统计信息,例如:
# 查看Device A所有端口上以太网OAM的紧急链路事件统计信息。
[DeviceA] display oam critical-event
Port : GigabitEthernet1/0/1
Link Status : Up
Event statistic :
-------------------------------------------------------------------------
Link Fault :0 Dying Gasp : 0 Critical Event : 0
以上显示信息表明:Device A与Device B之间的链路上尚未发生过任何紧急链路事件。
通过使用display oam link-event命令可以查看以太网OAM的一般链路事件统计信息,例如:
# 查看Device B所有端口上以太网OAM的一般链路事件的远端统计信息。
[DeviceB] display oam link-event remote
Port :GigabitEthernet1/0/1
Link Status :Up
OAMRemoteErrFrameEvent : (ms = milliseconds)
---------------------------------------------------------------------
Event Time Stamp : 5789 Errored Frame Window : 10(100ms)
Errored Frame Threshold : 1 Errored Frame : 3
Error Running Total : 35 Event Running Total : 17
以上显示信息表明:从Device A开始运行时起,总共发生了35次错误,其中错误帧事件有17次,链路性能并不稳定。
在S7500E系列交换机上使用EPON(Ethernet Passive Optical Network,以太网无源光网络)业务板,可以使交换机成为EPON系统的OLT(Optical Line Terminal,光线路终端)设备,与对端的ONU(Optical Network Unit,光网络单元)设备进行对接。
扩展OAM功能主要用于在OLT和ONU设备之间建立连接,并完成OLT对ONU设备的远程管理。
扩展OAM在以太网OAM技术的基础上,增加了OAMPDU的种类。通过新型的OAMPDU,OLT和ONU设备间可以完成连接的请求和应答,以及各种管理功能的信息传输。
扩展OAM在Information OAMPDU(请参见图1-1)中增加了一种TLV字段——Orgnization Specific Information TLV(组织详细信息字段),包含这个字段的Information OAMPDU称为Extended Information OAMPDU。
“组织详细信息”字段中包含以下内容:
· 本地OUI(Organizationally Unique Identifier,全球统一标识符)地址:标识本设备的生产厂商。
· 可支持的OUI地址:用于标识本OLT或ONU设备能够与哪些厂商的设备进行连接。
· OAM版本号:标识本OLT或ONU设备使用的OAM协议版本。
Organization Specific OAMPDU是一种新增的OAMPDU,它使用0xFE作为类型字段进行标识,如图2-1所示。
图2-1 Organization Specific OAMPDU报文格式
当用户在OLT端对ONU设备进行管理时,扩展OAM可以将各种操作和确认信息封装在Organization Specific OAMPDU的Data字段中进行传输。Data字段由以下几部分组成:
· OUI:发送设备的OUI地址。
· Ext.Opcode:扩展操作代码,扩展OAM使用不同的代码来标识报文的操作类型,详情请参见表2-1。
表2-1 扩展操作代码说明
代码 |
操作类型 |
说明 |
0x01 |
Extended Variable Request(扩展属性查询请求) |
携带用户对ONU发起的查询指令,由OLT发送至ONU设备 |
0x02 |
Extended Variable Response(扩展属性查询响应) |
ONU响应用户的查询指令,将输出信息反馈给OLT设备 |
0x03 |
Set Request(扩展属性配置) |
携带用户对ONU进行的配置指令,由OLT发送至ONU设备 |
0x04 |
Set Response(扩展属性配置确认) |
ONU完成用户的配置后,向OLT设备返回确认信息 |
0x0A |
DBA(Dynamic Bandwidth Allocation,动态带宽分配)配置 |
DBA功能的查询和配置操作均使用此类报文完成 |
· Payload:包含用户需要查询或配置的功能对应的代码和配置内容,OLT可以对ONU进行管理的功能请参见2.1.2 2. 扩展OAM管理。
· Pad:填充字段。
扩展OAM功能包括“扩展OAM发现”和“扩展OAM管理”两个部分。
OLT与ONU设备在进行数据传输前,需要通过扩展OAM发现功能来确认是否可以和对端设备进行正常对接。
首先OLT和ONU设备需要使用标准OAM来判断链路状态是否正常。在确定链路正常后,OLT和ONU将使用Extended Information OAMPDU进行交互,告知对方自身的OUI地址、可支持的OUI地址和OAM版本号。如果两端的OUI地址和OAM版本均在对端的可支持范围内,则扩展OAM发现过程正常结束,开始传输数据;否则将不能正常通信。
在完成扩展OAM发现过程后,OLT设备可以通过Organization Specific OAMPDU来远程配置ONU设备的管理功能。
OLT可以对ONU进行管理的功能包括:
· 端口基本配置,如双工、速率、流量控制等
· VLAN配置和管理
· 组播功能
· QoS
· DBA(Dynamic Bandwidth Allocation,动态带宽分配)
OLT对以上功能的管理包含“查询”和“配置”两部分,用户既可以通过查询命令获取当前ONU设备上各功能的状态信息,也可以在OLT设备上对某个功能的参数进行配置,由OLT来自动下发至ONU设备。查询或配置的操作由Organization Specific OAMPDU中的“扩展操作代码”字段来标识,需要进行查询或配置的功能代码以及配置内容被封装在Payload字段中(请参见2.1.1 2. 扩展OAM管理)。
H3C的OLT和ONU设备缺省开启扩展OAM功能,用户无需手动开启。
扩展OAM发现超时时间,也就是扩展OAM发现过程中OLT与ONU之间交互的扩展OAM消息的超时时间。
表2-2 配置扩展OAM发现超时时间
操作 |
命令 |
说明 |
进入系统视图 |
system-view |
- |
进入FTTH视图 |
ftth |
- |
配置扩展OAM发现超时时间 |
oam-discovery-timeout value slot slot-number |
可选 以100ms为单位,缺省情况下,扩展OAM发现超时时间为30(即3s) |
· 一般情况下,不建议用户直接进行此项配置,保持缺省情况即可。
· 如果ONU已经连接到OLT且绑定到ONU端口后还一直处于DOWN状态,可以尝试修改扩展OAM发现超时时间为更大一点的数值。
有关扩展OAM可管理功能的配置,请参见“二层技术-以太网交换配置指导”中的“EPON-OLT”。
不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!