01-以太网OAM配置
本章节下载: 01-以太网OAM配置 (230.01 KB)
以太网OAM(Operation, Administration, and Maintenance,操作、管理和维护)是一种监控网络故障的工具,主要用于解决以太网接入“最后一公里”中常见的链路问题,能够有效提高以太网的管理和维护能力,保障网络的稳定运行。用户通过在两个点到点连接的设备上启用以太网OAM功能,可以监控这两台设备之间的链路状态。
以太网OAM的主要功能包括:
· 链路性能监测:对链路的各种性能进行监测,包括对丢包、时延和抖动等数据的衡量,以及对各类流量的统计。
· 故障侦测和告警:通过发送检测报文来探测链路的连通性,当链路出现故障时及时通知网络管理员。
· 环路测试:通过监测所发出报文的返回情况来检测链路质量和定位链路故障。
以太网OAM工作在数据链路层,其协议报文被称为OAMPDU(OAM Protocol Data Unit,OAM协议数据单元)。以太网OAM就是通过设备之间定时交互OAMPDU来报告链路状态,使网络管理员能够对网络进行有效的管理。几种常见的OAMPDU及其作用如表1-1所示。
表1-1 常见的OAMPDU及其作用
报文类型 |
中文含义 |
作用 |
Information OAMPDU |
信息OAMPDU |
用于将OAM实体的状态信息(包括本地信息、远端信息和自定义信息)发给远端OAM实体,以保持以太网OAM连接 |
Event Notification OAMPDU |
事件通知OAMPDU |
一般用于链路监控,对连接本端和远端OAM实体的链路上所发生的故障进行告警 |
Loopback Control OAMPDU |
环回控制OAMPDU |
主要用于远端环回控制,用来控制远端设备的OAM环回状态,该报文中带有开启或关闭环回功能的信息,根据该信息开启或关闭远端环回功能 |
我们将开启了以太网OAM功能的接口称为“以太网OAM实体”,简称“OAM实体”。
以太网OAM连接的建立过程也称为Discovery阶段,即本端OAM实体发现远端OAM实体、并与之建立稳定对话的过程。
在这个过程中,相连的OAM实体通过交互Information OAMPDU通报各自的以太网OAM配置信息和本端支持的以太网OAM能力信息。当OAM实体收到远端的配置参数后,决定是否建立OAM连接。当两端OAM实体对远端环回功能、单向链路检测及链路事件等配置信息的检查都通过之后,以太网OAM协议开始正常工作。
以太网OAM的连接模式有两种:主动模式和被动模式。以太网OAM连接只能由主动模式的OAM实体发起,而被动模式的OAM实体只能等待远端OAM实体的连接请求;同处于被动模式下的两个OAM实体之间无法建立以太网OAM连接。在这两种模式下设备的处理能力如表1-2所示。
处理能力 |
主动模式 |
被动模式 |
初始化以太网OAM Discovery过程 |
可以 |
不可以 |
对以太网OAM Discovery初始化过程的响应 |
可以 |
可以 |
发送Information OAMPDU |
可以 |
可以 |
发送Event Notification OAMPDU |
可以 |
可以 |
发送不携带TLV的Information OAMPDU |
可以 |
可以 |
发送Loopback Control OAMPDU |
可以 |
不可以 |
对Loopback Control OAMPDU的响应 |
可以,但需要远端为主动模式 |
可以 |
以太网OAM连接建立后,两端的OAM实体会以一定的时间间隔为周期发送Information OAMPDU来检测连接是否正常,该间隔被称为握手报文发送间隔。如果一端OAM实体在连接超时时间内未收到远端OAM实体发来的Information OAMPDU,则认为OAM连接中断。
以太网的故障检测非常困难,特别是在网络物理通信没有中断而网络性能缓慢下降的情况下。链路监控用于在各种环境下检测和发现链路层故障,以太网OAM通过交互Event Notification OAMPDU来监控链路:当一端OAM实体监控到一般链路事件(其所含类型如表1-3所示)时,将向其远端发送Event Notification OAMPDU以进行通报,管理员可以通过观察日志信息动态地掌握网络的状况。
事件类型 |
描述 |
错误信号事件(Errored Symbol Event) |
以收到设定数量的信号为检测窗口,在窗口期内检测到的错误信号数量如果达到或超过了检测阈值,就产生一次错误信号事件 |
错误帧事件(Errored Frame Event) |
以设定的时间为检测窗口,在窗口期内检测到的错误帧数量如果达到或超过了检测阈值,就产生一次错误帧事件 |
错误帧周期事件(Errored Frame Period Event) |
以收到设定数量的帧为检测窗口,在窗口期内检测到的错误帧数量如果达到或超过了检测阈值,就产生一次错误帧周期事件 |
错误帧秒事件(Errored Frame Seconds Event) |
以设定的时间为检测窗口,在窗口期内检测到的错误帧秒(在某一秒内检测到至少一个错误帧,就称该秒为错误帧秒)数量如果达到或超过了检测阈值,就产生一次错误帧秒事件 |
在以太网OAM连接已建立的情况下,两端的OAM实体会不断交互Information OAMPDU。当设备故障或不可用导致流量中断时,故障端OAM实体会通过Information OAMPDU中的Flag域将故障信息(即紧急链路事件类型)通知给远端OAM实体。这样,管理员可以通过观察日志信息动态地了解链路状态,对相应的错误及时进行处理。紧急链路事件的类型及其对应的Information OAMPDU发送频率如表1-4所示。
事件类型 |
描述 |
OAMPDU发送频率 |
链路故障(Link Fault) |
远端链路信号丢失 |
每秒发送一次 |
致命故障(Dying Gasp) |
不可预知的状态发生,比如电源中断 |
不间断发送 |
紧急事件(Critical Event) |
不能确定的紧急事件发生 |
不间断发送 |
远端环回是指主动模式下的OAM实体向远端发送除OAMPDU以外的所有其它报文时,远端收到报文后不按其目的地址进行转发,而是将其按原路返回给本端。远端环回只有在以太网OAM连接建立之后才能实现。
远端环回功能可用于检测链路质量和定位链路故障。定期进行环回检测可以及时发现网络故障,并可通过分段进行环回检测来定位故障发生的具体区域。
与以太网OAM相关的协议规范有:
· IEEE 802.3ah:Carrier Sense Multiple Access with Collision Detection (CSMA/CD) Access Method and Physical Layer Specifications
设备对收、发携带有紧急链路事件的Information OAMPDU的支持情况如下:
· 支持接收携带所有类型紧急链路事件的Information OAMPDU。
· 支持发送携带链路故障事件的Information OAMPDU。
· 仅支持在设备重启或接口被shutdown时发送携带致命故障事件的Information OAMPDU,但IRF物理接口不支持发送该报文。
· 不支持发送携带紧急事件的Information OAMPDU。
以太网OAM配置任务如下:
(1) 配置以太网OAM基本功能
(2) (可选)配置以太网OAM连接检测定时器
(3) (可选)配置一般链路事件检测参数
(4) (可选)配置对远端以太网OAM事件的响应动作
(5) (可选)配置以太网OAM远端环回功能
以太网OAM的连接模式分为主动和被动模式,当开启了以太网OAM功能之后,以太网接口开始使用预设的连接模式与其远端接口建立以太网OAM连接。
不允许在已开启以太网OAM功能的接口上更改以太网OAM的连接模式。如需更改,请先关闭该接口上的以太网OAM功能。
(1) 进入系统视图。
system-view
(2) 进入二层/三层以太网接口视图。
interface interface-type interface-number
(3) 配置以太网OAM的连接模式。
oam mode { active | passive }
缺省情况下,以太网OAM连接模式为主动模式。
(4) 开启以太网OAM功能。
oam enable
缺省情况下,以太网OAM功能处于关闭状态。
以太网OAM连接建立后,两端的OAM实体会以一定的时间间隔为周期发送Information OAMPDU来检测连接是否正常,该间隔被称为握手报文发送间隔。如果一端OAM实体在连接超时时间内未收到远端OAM实体发来的Information OAMPDU,则认为OAM连接中断。通过调整握手报文发送间隔和连接超时时间,可以改变以太网OAM连接的检测精度。
用户既可在系统视图下配置对所有接口都有效的全局值,也可在接口视图下配置只对当前接口有效的接口值,后者的配置优先级较高。
由于本端OAM实体在连接超时后将老化与远端OAM实体的连接关系,导致OAM连接中断,因此连接超时时间必须大于握手报文发送间隔(建议为五倍或以上),否则将导致以太网OAM连接不稳定。
(1) 进入系统视图。
system-view
(2) 全局配置以太网OAM握手报文的发送间隔。
oam global timer hello interval
缺省情况下,以太网OAM握手报文发送间隔的全局值为1000毫秒。
(3) 全局配置以太网OAM连接的超时时间。
oam global timer keepalive interval
缺省情况下,以太网OAM连接超时时间的全局值为5000毫秒。
(1) 进入系统视图。
system-view
(2) 进入二层/三层以太网接口视图。
interface interface-type interface-number
(3) 在接口上配置以太网OAM握手报文的发送间隔。
oam timer hello interval
缺省情况下,接口采用全局值。
(4) 在接口上配置以太网OAM连接的超时时间。
oam timer keepalive interval
缺省情况下,接口采用全局值。
用户既可在系统视图下配置对所有接口都有效的全局值,也可在接口视图下配置只对当前接口有效的接口值,后者的配置优先级较高。
(1) 进入系统视图。
system-view
(2) 全局配置错误信号事件的检测窗口。
oam global errored-symbol-period window window-value
缺省情况下,错误信号事件检测窗口的全局值为100000000次。
(3) 全局配置错误信号事件的检测阈值。
oam global errored-symbol-period threshold threshold-value
缺省情况下,错误信号事件检测阈值的全局值为1次。
(1) 进入系统视图。
system-view
(2) 进入二层/三层以太网接口视图。
interface interface-type interface-number
(3) 在接口上配置错误信号事件的检测窗口。
oam errored-symbol-period window window-value
缺省情况下,接口采用全局值。
(4) 在接口上配置错误信号事件的检测阈值。
oam errored-symbol-period threshold threshold-value
缺省情况下,接口采用全局值。
用户既可在系统视图下配置对所有接口都有效的全局值,也可在接口视图下配置只对当前接口有效的接口值,后者的配置优先级较高。
(1) 进入系统视图。
system-view
(2) 全局配置错误帧事件的检测窗口。
oam global errored-frame window window-value
缺省情况下,错误帧事件检测窗口的全局值为1000毫秒。
(3) 全局配置错误帧事件的检测阈值。
oam global errored-frame threshold threshold-value
缺省情况下,错误帧事件检测阈值的全局值为1次。
(1) 进入系统视图。
system-view
(2) 进入二层/三层以太网接口视图。
interface interface-type interface-number
(3) 在接口上配置错误帧事件的检测窗口。
oam errored-frame window window-value
缺省情况下,接口采用全局值。
(4) 在接口上配置错误帧事件的检测阈值。
oam errored-frame threshold threshold-value
缺省情况下,接口采用全局值。
用户既可在系统视图下配置对所有接口都有效的全局值,也可在接口视图下配置只对当前接口有效的接口值,后者的配置优先级较高。
(1) 进入系统视图。
system-view
(2) 全局配置错误帧周期事件的检测窗口。
oam global errored-frame-period window window-value
缺省情况下,错误帧周期事件检测窗口的全局值为10000000次。
(3) 全局配置错误帧周期事件的检测阈值。
oam global errored-frame-period threshold threshold-value
缺省情况下,错误帧周期事件检测阈值的全局值为1次。
(1) 进入系统视图。
system-view
(2) 进入二层/三层以太网接口视图。
interface interface-type interface-number
(3) 在接口上配置错误帧周期事件的检测窗口。
oam errored-frame-period window window-value
缺省情况下,接口采用全局值。
(4) 在接口上配置错误帧周期事件的检测阈值。
oam errored-frame-period threshold threshold-value
缺省情况下,接口采用全局值。
用户既可在系统视图下配置对所有接口都有效的全局值,也可在接口视图下配置只对当前接口有效的接口值,后者的配置优先级较高。
在数量上,错误帧秒事件的检测阈值不应大于其检测窗口值(换算成秒),否则将不会产生错误帧秒事件。
(1) 进入系统视图。
system-view
(2) 全局配置错误帧秒事件的检测窗口。
oam global errored-frame-seconds window window-value
缺省情况下,错误帧秒事件检测窗口的全局值为60000毫秒。
(3) 全局配置错误帧秒事件的检测阈值。
oam global errored-frame-seconds threshold threshold-value
缺省情况下,错误帧秒事件检测阈值的全局值为1次。
(1) 进入系统视图。
system-view
(2) 进入二层/三层以太网接口视图。
interface interface-type interface-number
(3) 在接口上配置错误帧秒事件的检测窗口。
oam errored-frame-seconds window window-value
缺省情况下,接口采用全局值。
(4) 在接口上配置错误帧秒事件的检测阈值。
oam errored-frame-seconds threshold threshold-value
缺省情况下,接口采用全局值。
通过本配置可以使接口在收到远端以太网OAM事件时除了记录日志外,还会自动断开OAM连接,并设置该接口的链路层状态为down。
(1) 进入系统视图。
system-view
(2) 进入二层/三层以太网接口视图。
interface interface-type interface-number
(3) 配置接口收到远端以太网OAM事件时的响应动作。
oam remote-failure { connection-expired | critical-event | dying-gasp | link-fault } action error-link-down
缺省情况下,接口收到远端以太网OAM事件后仅记录日志。
在本端接口上开启了以太网OAM远端环回功能之后,该接口将向远端接口发送Loopback Control OAMPDU,使远端进入OAM环回状态。然后,远端会返回本端发送来的报文(除OAMPDU以外),用户可以通过观察这些报文的返回情况来计算链路丢包率,以此来评判链路性能。
由于远端环回功能将使正常业务受到影响,因此请慎重开启该功能。
只有当接口上的以太网OAM连接已建立完成,且以太网OAM的连接模式为主动模式时,才允许在该接口上开启以太网OAM远端环回功能。
只有本端和远端接口都支持远端环回功能、且在全双工链路上才能实现远端环回功能。
在开启远端环回时,将引起所有数据流量的中断;当退出远端环回后,接口将自动执行一次先关闭再开启的操作。导致接口退出远端环回的原因有:关闭接口上的以太网OAM功能、关闭接口上的以太网OAM远端环回功能或OAM连接超时等。
如果在远端环回过程中开启了内部环回功能,远端环回将终止。有关环回功能的详细介绍,请参见“二层技术-以太网交换配置指导”中的“以太网接口”。
用户既可在用户视图或系统视图下开启指定接口的以太网OAM远端环回功能,也可在接口视图下开启当前接口的以太网OAM远端环回功能,三者的配置效果相同。
(1) (可选)进入系统视图。
system-view
用户也可以在用户视图下执行以下任务。
(2) 开启指定接口的以太网OAM远端环回功能。
oam remote-loopback start interface interface-type interface-number
缺省情况下,以太网OAM远端环回功能处于关闭状态。
(1) 进入系统视图。
system-view
(2) 进入二层/三层以太网接口视图。
interface interface-type interface-number
(3) 开启当前接口的以太网OAM远端环回功能。
oam remote-loopback start
缺省情况下,以太网OAM远端环回功能处于关闭状态。
由于远端环回功能会使正常业务受到影响,为了避免这种情况,用户可通过本配置使本端接口不受远端发来的Loopback Control OAMPDU的控制,从而拒绝其发起的以太网OAM远端环回。
在执行本配置时若接口已处于环回状态,则该配置将从下次环回开始时生效。
(1) 进入系统视图。
system-view
(2) 进入二层/三层以太网接口视图。
interface interface-type interface-number
(3) 配置接口拒绝远端发起的以太网OAM远端环回。
oam remote-loopback reject-request
缺省情况下,接口不拒绝远端发起的以太网OAM远端环回。
在完成上述配置后,在任意视图下执行display命令可以显示配置后以太网OAM的运行情况,通过查看显示信息验证配置的效果。
在用户视图下执行reset命令可以清除以太网OAM的统计信息。
表1-5 以太网OAM显示和维护
操作 |
命令 |
显示以太网OAM连接的信息 |
display oam { local | remote } [ interface interface-type interface-number ] |
显示以太网OAM的配置信息 |
display oam configuration [ interface interface-type interface-number ] |
显示以太网OAM的紧急链路事件统计信息 |
display oam critical-event [ interface interface-type interface-number ] |
显示以太网OAM的一般链路事件统计信息 |
display oam link-event { local | remote } [ interface interface-type interface-number ] |
清除以太网OAM的报文和一般链路事件统计信息 |
reset oam [ interface interface-type interface-number ] |
· 通过在Device A和Device B上配置以太网OAM功能,实现二者之间链路连通性故障的自动检测。
· 通过观察Device A上收到错误帧的情况,来评判Device A与Device B之间的链路性能。
图1-1 以太网OAM典型配置组网图
(1) 配置Device A
# 在接口Ten-GigabitEthernet1/0/1上配置以太网OAM的连接模式为主动模式,并开启其以太网OAM功能。
<DeviceA> system-view
[DeviceA] interface ten-gigabitethernet 1/0/1
[DeviceA-Ten-GigabitEthernet1/0/1] oam mode active
[DeviceA-Ten-GigabitEthernet1/0/1] oam enable
# 在接口Ten-GigabitEthernet1/0/1上配置错误帧事件的检测窗口为20000毫秒,检测阈值为10次。
[DeviceA-Ten-GigabitEthernet1/0/1] oam errored-frame window 200
[DeviceA-Ten-GigabitEthernet1/0/1] oam errored-frame threshold 10
[DeviceA-Ten-GigabitEthernet1/0/1] quit
(2) 配置Device B
# 在接口Ten-GigabitEthernet1/0/1上配置以太网OAM的连接模式为被动模式,并开启其以太网OAM功能。
<DeviceB> system-view
[DeviceB] interface ten-gigabitethernet 1/0/1
[DeviceB-Ten-GigabitEthernet1/0/1] oam mode passive
[DeviceB-Ten-GigabitEthernet1/0/1] oam enable
[DeviceB-Ten-GigabitEthernet1/0/1] quit
通过使用display oam critical-event命令可以显示以太网OAM的紧急链路事件统计信息,例如:
# 显示Device A所有接口上以太网OAM的紧急链路事件统计信息。
[DeviceA] display oam critical-event
----------- [Ten-GigabitEthernet1/0/1] -----------
Local link status : UP
Event statistics
Link fault : Not occurred
Dying gasp : Not occurred
Critical event : Not occurred
以上信息表明:Device A与Device B之间的链路上尚未发生任何紧急链路事件。
通过使用display oam link-event命令可以显示以太网OAM的一般链路事件统计信息,例如:
# 显示Device A所有接口上以太网OAM的一般链路事件的本端统计信息。
[DeviceA] display oam link-event local
----------- [Ten-GigabitEthernet1/0/1] -----------
Link status: UP
OAM local errored frame event
Event time stamp : 5789 x 100 milliseconds
Errored frame window : 200 x 100 milliseconds
Errored frame threshold : 10 error frames
Errored frame : 13 error frames
Error running total : 350 error frames
Event running total : 17 events
以上信息表明:从Device A开始运行时起,总共有350个错误帧,产生了17次错误帧事件,链路性能并不稳定。
不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!