13-以太网OAM配置
本章节下载 (260.37 KB)
目 录
以太网OAM(Operation, Administration and Maintenance,操作、管理和维护)是一种监控网络故障的工具。它工作在数据链路层,利用设备之间定时交互OAMPDU(OAM Protocol Data Units,OAM协议数据单元)来报告网络的状态,使网络管理员能够更有效地管理网络。
目前,以太网OAM主要用于解决以太网接入的“最后一公里”中常见的链路问题。通过在两个点到点连接的设备上启用以太网OAM功能,可以监控两台设备之间的链路状态。其主要功能包括:
l 链路性能监测:对链路故障进行检测;
l 故障侦测和告警:当链路出现故障时及时通知网络管理员;
l 环路测试:通过将非OAMPDU环回来检测链路故障。
在本文中,我们称使能了以太网OAM功能的端口为“以太网OAM实体”,也简称为“OAM实体”。
几种OAMPDU的具体格式如图1-1所示。
是几种常见OAMPDU的报文格式,各重要字段的含义如表1-1所示。
表1-1 OAMPDU重要字段含义
字段 |
含义 |
Dest addr |
以太网OAM报文目的MAC地址,为慢协议组播地址:0x0180-C200-0002。由于慢协议报文不能被网桥转发,因此以太网OAM报文也不能被转发 |
Source addr |
以太网OAM报文源MAC地址,为发送端的桥MAC地址,是一个单播MAC地址 |
Type |
以太网OAM报文的协议类型,为0x8809 |
Subtype |
以太网OAM报文的协议子类型,为0x03 |
Flags |
Flag域,包含了以太网OAM实体的状态信息 |
Code |
OAMPDU报文的类型 |
上述各类OAMPDU报文的作用如表1-2所示。
表1-2 各类OAMPDU报文的作用
报文类型 |
中文含义 |
作用 |
Information OAMPDU |
信息OAMPDU |
用于将OAM实体的状态信息(包括本地信息、远端信息和自定义信息)发给远端OAM实体,以保持以太网OAM连接 |
Event Notification OAMPDU |
事件通知OAMPDU |
一般用于链路监控,对连接本端和远端OAM实体的链路上所发生的故障进行告警 |
Loopback Control OAMPDU |
环回控制OAMPDU |
主要用于远端环回控制,用来控制远端设备的OAM环回状态,该报文中带有使能或去使能环回功能的信息,根据该信息开启或关闭远端环回功能 |
以太网OAM功能建立以太网OAM连接的基础上,下面对以太网OAM的工作流程进行简要介绍。
以太网OAM连接建立过程也称作Discovery阶段,即本端OAM实体发现远端OAM实体、并与之建立稳定对话的过程。
在这个阶段中,相连的以太网OAM实体通过交互Information OAMPDU通报各自的以太网OAM配置信息和本端支持的以太网OAM能力信息,OAM实体收到对端配置参数后,决定是否同意建立OAM连接。当两端OAM实体对Loopback功能、单向链路检测及链路事件的配置信息的检查都通过之后,以太网OAM协议开始正常工作。
以太网OAM的连接模式有两种:主动模式、被动模式。两种模式下设备的处理能力如表1-3所示
处理能力 |
主动模式 |
被动模式 |
初始化以太网OAM Discovery过程 |
可以 |
不可以 |
对以太网OAM Discovery初始化过程的响应 |
可以 |
可以 |
发送Information OAMPDU |
可以 |
可以 |
发送Event Notification OAMPDU |
可以 |
可以 |
发送不携带TLV的Information OAMPDU |
可以 |
可以 |
发送Loopback Control OAMPDU |
可以 |
不可以 |
对Loopback Control OAMPDU的响应 |
可以,但需要对端也处于主动模式下 |
可以 |
发送组织指定的OAMPDU |
可以 |
可以 |
l 以太网OAM连接只能由主动模式的OAM实体发起,而被动模式的OAM实体只能等待对端OAM实体的连接请求。
l 都处于被动模式下的两个OAM实体之间无法建立以太网OAM连接。
以太网OAM连接建立后,两端的OAM实体通过持续发送Information OAMPDU保持连接。若在5秒钟内未收到对端OAM实体的Information OAMPDU,则认为连接超时,OAM连接中断。
Information OAMPDU报文的发送由内部计数器控制,一秒钟内最多可发送10个。
以太网的故障检测非常困难,特别是在网络物理通信没有中断而网络性能缓慢下降的情况下。链路监控用于在各种环境下检测和发现链路层故障,以太网OAM通过交互Event Notification OAMPDU来监控链路:当一端OAM实体监控到一般链路事件(其所含类型如表1-4所示)时,将向其对端发送Event Notification OAMPDU以进行通报,管理员可以通过观察日志信息动态地掌握网络的状况。
链路事件 |
定义 |
错误信号事件(Errored Symbol Event) |
单位时间内的错误信号数量超过定义的阈值 |
错误帧事件(Errored Frame Event) |
单位时间内的错误帧数量超过定义的阈值 |
错误帧周期事件(Errored Frame Period Event) |
指定帧数N为周期,在收到N个帧的周期内错误帧数超过定义的阈值 |
错误帧秒数事件(Errored Frame Seconds Event) |
指定M秒数下有错误帧的秒数超过了定义的阈值 |
l 错误帧周期事件的检测周期将被系统转换为某端口在该周期内能发送64字节帧的最大帧数,即以最大帧数作为周期,其计算公式为:最大帧数=接口带宽(bps)×错误帧周期事件的检测周期(ms)÷(64×8×1000)。
l 错误帧秒:如果在某一秒内发生了错误帧,则将该秒称为错误帧秒。
对于由于设备故障或不可用而导致流量中断的情况,OAMPDU定义了一个标志(即Flag域)允许以太网OAM实体将故障信息通知给对端,该标志可表示的紧急链路事件类型如表1-5所示。
事件类型 |
定义 |
链路故障(Link Fault) |
对端链路信号丢失 |
致命故障(Dying Gasp) |
不可预知的状态发生,比如电源中断 |
紧急事件(Critical Event) |
不能确定的紧急事件发生 |
由于在以太网OAM连接已建立的情况下,两端的OAM实体会不断地交互Information OAMPDU,因此本端OAM实体可以将本端发生的紧急链路事件通过Information OAMPDU告诉远端OAM实体。这样,管理员可以通过观察日志信息动态地了解链路状态,对相应的错误及时进行处理。
远端环回只有在以太网OAM连接建立完成后才能实现。在连接建立的情况下,主动模式的OAM实体发起远端环回命令,对端实体对该命令进行响应。当远端处于环回模式下,除了OAMPDU报文以外的所有报文都将按照原路返回。
定期地进行环回检测可以及时发现网络故障,并通过分段环回检测来帮助定位故障发生的具体区域,可以帮助用户排除故障。
与以太网OAM相关的协议规范有:
表1-6 以太网OAM配置任务简介
配置任务 |
说明 |
详细配置 |
|
配置以太网OAM基本功能 |
必选 |
||
配置一般链路事件的检测参数 |
配置错误帧事件检测参数 |
可选 |
|
配置错误帧周期事件检测参数 |
可选 |
||
配置错误帧秒数事件检测参数 |
可选 |
||
配置以太网OAM远端环回功能 |
可选 |
以太网OAM的连接模式分为主动和被动模式,当使能了以太网OAM功能之后,以太网端口开始使用预设的连接模式与其对端端口建立以太网OAM连接。
表1-7 配置以太网OAM基本功能
操作 |
命令 |
说明 |
进入系统视图 |
system-view |
- |
进入以太网端口视图 |
interface interface-type interface-number |
- |
配置以太网OAM的连接模式 |
oam mode { active | passive } |
可选 缺省情况下,以太网OAM的连接模式为主动模式 |
使能以太网OAM功能 |
oam enable |
必选 缺省情况下,以太网端口的以太网OAM功能处于关闭状态 |
在使能了以太网OAM功能的端口上不能改变以太网OAM的连接模式。如需改变连接模式,请先关闭该端口上的以太网OAM功能。
当以太网OAM连接建立后,本节中所配置的各事件检测周期和阈值将会在所有以太网端口上自动有效。
在错误帧事件的检测周期内,如果某以太网端口上所发生的错误帧数大于或等于错误帧事件的检测阈值,则将在该端口上产生一个错误帧事件。
表1-8 配置错误帧事件的检测参数
操作 |
命令 |
说明 |
进入系统视图 |
system-view |
- |
配置错误帧事件的检测周期 |
oam errored-frame period period-value |
可选 缺省情况下,错误帧事件的检测周期为1秒 |
配置错误帧事件的检测阈值 |
oam errored-frame threshold threshold-value |
可选 缺省情况下,错误帧事件的检测阈值为1 |
在错误帧周期事件的检测周期内,如果某以太网端口上所发生的错误帧数大于或等于错误帧周期事件的检测阈值,则将在该端口上产生一个错误帧周期事件。
表1-9 配置错误帧周期事件的检测参数
操作 |
命令 |
说明 |
进入系统视图 |
system-view |
- |
配置错误帧周期事件的检测周期 |
oam errored-frame-period period period-value |
可选 缺省情况下,错误帧周期事件的检测周期为1000毫秒 |
配置错误帧周期事件的检测阈值 |
oam errored-frame-period threshold threshold-value |
可选 缺省情况下,错误帧周期事件的检测阈值为1 |
在错误帧秒数事件的检测周期内,如果某以太网端口上所发生的错误帧秒数大于或等于错误帧秒数事件的检测阈值,则将在该端口上产生一个错误帧秒数事件。
表1-10 配置错误帧秒数事件的检测参数
操作 |
命令 |
说明 |
进入系统视图 |
system-view |
- |
配置错误帧秒数事件的检测周期 |
oam errored-frame-seconds period period-value |
可选 缺省情况下,错误帧秒数事件的检测周期为60秒 |
配置错误帧秒数事件的检测阈值 |
oam errored-frame-seconds threshold threshold-value |
可选 缺省情况下,错误帧秒数事件的检测阈值为1 |
错误帧秒数事件检测的阈值不要大于设定的周期值,否则不会发生错误帧秒数事件。
表1-11 配置以太网OAM远端环回功能
操作 |
命令 |
说明 |
进入系统视图 |
system-view |
- |
进入以太网端口视图 |
interface interface-type interface-number |
- |
使能以太网OAM远端环回功能 |
oam loopback |
必选 缺省情况下,以太网OAM远端环回功能处于关闭状态 |
l 远端环回功能只有在以太网OAM连接建立完成之后才能实现,且只有工作在主动模式下的以太网OAM实体才可以发起远端环回。
l 只有本端和对端端口都支持远端环回功能、且在全双工链路上才能实现远端环回功能。
l 远端环回功能需要远端硬件的支持,如果远端硬件不支持,会提示用户。
l 在开启远端环回时,将引起所有数据流量的中断;当退出远端环回后,端口将自动执行一次先关闭再开启的操作。导致端口退出远端环回的原因有:使用undo oam enable命令关闭以太网OAM功能、使用undo oam loopback命令关闭以太网OAM远端环回功能或OAM连接超时等。
l 由于远端环回功能主要用于测单条链路,所以聚合成员端口和业务环回成员端口并不支持该功能;此外,处于远端环回过程中的端口也不能加入聚合组或业务环回组。有关聚合组和业务环回组的详细介绍,请分别参见“接入分册”中的“链路聚合配置”和“业务环回组配置”。
l 如果在远端环回过程中开启了内部环回测试功能,远端环回将终止。有关环回测试功能的详细介绍,请参见“接入分册”中的“以太网端口配置”。
在完成上述配置后,在任意视图下执行display命令可以显示配置后以太网OAM的运行情况,通过查看显示信息验证配置的效果。
在用户视图下执行reset命令可以清除以太网OAM的报文统计信息。
表1-12 以太网OAM显示和维护
操作 |
命令 |
查看以太网OAM的全局配置信息 |
display oam configuration |
查看以太网OAM的紧急链路事件的统计信息 |
display oam critical-event [ interface interface-type interface-number ] |
查看以太网OAM的一般链路事件的统计信息 |
display oam link-event { local | remote } [ interface interface-type interface-number ] |
查看以太网OAM连接的信息 |
display oam { local | remote } [ interface interface-type interface-number ] |
清除以太网OAM的和报文统计信息和一般链路事件统计信息 |
reset oam [ interface interface-type interface-number ] |
l 通过在Device A和Device B上配置以太网OAM协议,从而对数据链路层进行管理;
l 验证链路性能,测试Device A上收到错误帧的情况。
图1-2 以太网OAM典型配置组网图
(1) 配置Device A
# 在端口GigabitEthernet2/0/1上,配置其以太网OAM的连接模式为被动模式,并使能以太网OAM功能。
<DeviceA> system-view
[DeviceA] interface GigabitEthernet 2/0/1
[DeviceA-GigabitEthernet2/0/1] oam mode passive
[DeviceA-GigabitEthernet2/0/1] oam enable
[DeviceA-GigabitEthernet2/0/1] quit
# 配置错误帧事件的检测周期为20秒,检测阈值为10。
[DeviceA] oam errored-frame period 20
[DeviceA] oam errored-frame threshold 10
(2) 配置Device B
# 在端口GigabitEthernet2/0/1上,配置其以太网OAM的连接模式为主动模式,并使能以太网OAM功能。
<DeviceB> system-view
[DeviceB] interface GigabitEthernet 2/0/1
[DeviceA- GigabitEthernet 2/0/1] oam mode active
[DeviceB- GigabitEthernet 2/0/1] oam enable
[DeviceB- GigabitEthernet 2/0/1] quit
(3) 检验配置效果
通过使用display oam configuration命令可以查看以太网OAM的配置信息,例如:
# 查看Device A上以太网OAM的配置信息。
[DeviceA] display oam configuration
Configuration of the link event window/threshold :
--------------------------------------------------------------------------
Errored-symbol Event period(in seconds) : 1
Errored-symbol Event threshold : 1
Errored-frame Event period(in seconds) : 20
Errored-frame Event threshold : 10
Errored-frame-period Event period(in ms) : 1000
Errored-frame-period Event threshold : 1
Errored-frame-seconds Event period(in seconds) : 60
Errored-frame-seconds Event threshold : 1
通过使用display oam link-event命令可以查看以太网OAM的一般链路事件统计信息,例如:
# 查看Device B上以太网OAM的一般链路事件的远端统计信息。
[DeviceB] display oam link-event remote
Port :GigabitEthernet2/0/1
Link Status :Up
OAMRemoteErrFrameEvent : (ms = milliseconds)
---------------------------------------------------------------------
Event Time Stamp : 5789 Errored FrameWindow : 10(100ms)
Errored Frame Threshold : 1 Errored Frame : 3
Error Running Total : 35 Event Running Total : 17
以上显示信息表明:从Device A开始运行时起,总共发生了35次错误,其中错误帧事件有17次,链路性能并不稳定。
在S7500E系列交换机上使用EPON(Ethernet Passive Optical Network,以太网无源光网络)业务板,可以使交换机成为EPON系统的OLT(Optical Line Terminal,光线路终端)设备,与对端的ONU(Optical Network Unit,光网络单元)设备进行对接。
扩展OAM功能主要用于在OLT和ONU设备之间建立连接,并完成OLT对ONU设备的远程管理。
扩展OAM在以太网OAM技术的基础上,增加了OAMPDU的种类。通过新型的OAMPDU,OLT和ONU设备间可以完成连接的请求和应答,以及各种管理功能的信息传输。
扩展OAM在Information OAMPDU(请参见图1-1)中增加了一种TLV字段——Orgnization Specific Information TLV(组织详细信息字段),包含这个字段的Information OAMPDU称为Extended Information OAMPDU。
“组织详细信息”字段中包含以下内容:
l 本地OUI(Organizationally Unique Identifier,全球统一标识符)地址:标识本设备的生产厂商。
l 可支持的OUI地址:用于标识本OLT或ONU设备能够与哪些厂商的设备进行连接。
l OAM版本号:标识本OLT或ONU设备使用的OAM协议版本。
Organization Specific OAMPDU是一种新增的OAMPDU,它使用0xFE作为类型字段进行标识,如图2-1所示。
图2-1 Organization Specific OAMPDU报文格式
当用户在OLT端对ONU设备进行管理时,扩展OAM可以将各种操作和确认信息封装在Organization Specific OAMPDU的Data字段中进行传输。Data字段由以下几部分组成:
l OUI:发送设备的OUI地址。
l Ext.Opcode:扩展操作代码,扩展OAM使用不同的代码来标识报文的操作类型,详情请参见表2-1。
表2-1 扩展操作代码说明
代码 |
操作类型 |
说明 |
0x01 |
Extended Variable Request(扩展属性查询请求) |
携带用户对ONU发起的查询指令,由OLT发送至ONU设备 |
0x02 |
Extended Variable Response(扩展属性查询响应) |
ONU响应用户的查询指令,将输出信息反馈给OLT设备 |
0x03 |
Set Request(扩展属性配置) |
携带用户对ONU进行的配置指令,由OLT发送至ONU设备 |
0x04 |
Set Response(扩展属性配置确认) |
ONU完成用户的配置后,向OLT设备返回确认信息 |
0x0A |
DBA(Dynamic Bandwidth Allocation,动态带宽分配)配置 |
DBA功能的查询和配置操作均使用此类报文完成 |
l Payload:包含用户需要查询或配置的功能对应的代码和配置内容,OLT可以对ONU进行管理的功能请参见2.1.2 2. 。
l Pad:填充字段。
扩展OAM功能包括“扩展OAM发现”和“扩展OAM管理”两个部分。
OLT与ONU设备在进行数据传输前,需要通过扩展OAM发现功能来确认是否可以和对端设备进行正常对接。
首先OLT和ONU设备需要使用标准OAM来判断链路状态是否正常。在确定链路正常后,OLT和ONU将使用Extended Information OAMPDU进行交互,告知对方自身的OUI地址、可支持的OUI地址和OAM版本号。如果两端的OUI地址和OAM版本均在对端的可支持范围内,则扩展OAM发现过程正常结束,开始传输数据;否则将不能正常通信。
在完成扩展OAM发现过程后,OLT设备可以通过Organization Specific OAMPDU来远程配置ONU设备的管理功能。
OLT可以对ONU进行管理的功能包括:
l 端口基本配置,如双工、速率、流量控制等
l VLAN配置和管理
l 组播功能
l QoS
l DBA(Dynamic Bandwidth Allocation,动态带宽分配)
OLT对以上功能的管理包含“查询”和“配置”两部分,用户既可以通过查询命令获取当前ONU设备上各功能的状态信息,也可以在OLT设备上对某个功能的参数进行配置,由OLT来自动下发至ONU设备。查询或配置的操作由Organization Specific OAMPDU中的“扩展操作代码”字段来标识,需要进行查询或配置的功能代码以及配置内容被封装在Payload字段中(请参见2.1.1 2. )。
S7500E系列交换机的扩展OAM功能无需手动开启,当用户开启了端口的以太网OAM功能后(请参见1.3 ),该端口将自动具备扩展OAM功能。
有关在扩展OAM可管理功能的配置,请参见“EPON-OLT操作”部分。
不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!