03-硬件资源管理配置
本章节下载: 03-硬件资源管理配置 (544.41 KB)
目 录
1.26 配置关键硬件表项奇偶校验和ECC校验错误不可恢复通知功能
1.28 配置LSXM1CGQ72KCR1单板的端口速率工作模式
1.29 配置LSXM1TGS24C1接口模块扩展卡的端口速率工作模式
1.33 配置Telemetry Stream采集报文中的入接口索引类型
通过硬件资源管理功能,用户能够查看CPU、内存的使用情况,电源和风扇的工作状态,配置设备运行的相关参数,实现对设备硬件资源的日常维护和管理。
设备管理的所有配置任务均为可选配置,配置时无先后顺序要求,请根据实际需要选择配置。设备管理配置任务如下:
· 监控CPU
¡ CPU一键诊断
¡ 监控DMA内存
¡ CPU显示和维护
· 监控CPU核
· 监控内存
¡ 配置内存告警门限
¡ 内存一键诊断
¡ 内存显示和维护
¡ 监控MDB资源
· 监控资源剩余情况
· 监控设备温度
¡ 配置温度告警门限
¡ 显示设备温度信息
· 开启芯片复位
· 电源管理
¡ 开启电源管理功能
¡ 配置冗余电源
¡ 开启电源睡眠功能
¡ 显示电源信息
· 监控风扇
¡ 显示风扇信息
· 定位设备
¡ 开始定位设备
¡ 停止定位设备
· 配置关键硬件表项奇偶校验和ECC校验错误不可恢复通知功能
· 配置LSXM1TGS24C1接口模块扩展卡的端口速率工作模式
· 配置
· 配置磁盘分区功能
· 显示设备硬件信息
系统每隔1分钟会对CPU的利用率进行采样,并将采样值和用户配置的CPU利用率告警门限比较。
· 当采样值大于低级别告警门限时,则CPU进入低级别告警状态,会周期发送CPU低级别告警通知,直到CPU进入高级别告警状态或者低级别告警状态解除。
· 当采样值大于高级别告警门限时,则CPU进入高级别告警状态,会周期发送CPU高级别告警通知,直到高级别告警状态解除。
· 当采样值回落,小于CPU利用率恢复门限时,则认为CPU利用率已经恢复到正常范围,并发送恢复告警通知。
CPU告警通知会同时向NETCONF、SNMP、信息中心三个方向输出,通过配置NETCONF、SNMP、信息中心功能,CPU告警最终能以NETCONF事件、SNMP Trap或Inform消息、日志的形式发送给用户。NETCONF和SNMP的详细介绍请参见“网络管理和监控配置指导”中的“NETCONF”和“SNMP”。信息中心的详细介绍请参见“设备管理配置指导”中的“信息中心”。
图1-1 CPU告警示意图
(1) 进入系统视图。
system-view
(2) 配置CPU利用率阈值。
monitor cpu-usage threshold severe-threshold [ minor-threshold minor-threshold recovery-threshold recovery-threshold ] [ slot slot-number [ cpu cpu-number ] ]
缺省情况下,CPU利用率高级别告警门限为99%,低级别告警门限为79%,未配置恢复门限。
CPU利用率高级别告警门限如果设置过低,可能导致设备提前进入门限状态,不再进行正常业务处理。
(3) 配置发送CPU告警事件的间隔。
monitor resend cpu-usage { minor-interval minor-interval | severe-interval severe-interval } * [ slot slot-number [ cpu cpu-number ] ]
缺省情况下,持续300秒超过低级别告警门限则上报一次CPU低级别告警事件,持续60秒超过高级别告警门限则上报一次CPU高级别告警事件。
开启CPU利用率历史记录功能后,系统会每隔一定时间对CPU的利用率进行采样,并把采样结果保存到历史记录区。这些记录可通过display cpu-usage history命令查看,以便用户监控设备近期的运行情况。
(1) 进入系统视图。
system-view
(2) 配置CPU利用率历史记录的采样周期。
monitor cpu-usage interval interval [ slot slot-number [ cpu cpu-number ] ]
缺省情况下,CPU使用率历史记录采样周期为1分钟。
(3) 开启CPU利用率历史记录功能。
monitor cpu-usage enable [ slot slot-number [ cpu cpu-number ] ]
缺省情况下,CPU使用率历史记录功能处于开启状态。
CPU一键诊断功能用于诊断CPU利用率是否处于正常范围内,例如,是否发生过CPU利用率超门限、CPU利用率突增事件,帮助用户定位CPU利用率异常问题。关于CPU一键诊断功能的详细描述和配置请参见“智能运维配置指导”中的“一键诊断”。
可在任意视图下执行以下命令:
· 显示CPU监控功能的相关配置。
display cpu-usage configuration [ slot slot-number [ cpu cpu-number ] ]
· 显示CPU利用率的统计信息。
display cpu-usage [ summary ] [ slot slot-number [ cpu cpu-number ] [ core { core-number | all } ] ]
· 以图表方式显示CPU利用率的历史记录。
display cpu-usage history [ job job-id ] [ slot slot-number [ cpu cpu-number ] ]
系统按5秒周期对CPU核的利用率进行采样,然后对统计周期内的采样值进行计算,并将计算值和用户配置的CPU核利用率的门限比较。当计算值大于门限值时,则认为CPU核利用率过高,设备会发送告警信息并记录日志。
统计周期建议配置为5的整数倍,不是整数倍时,最接近且小于配置值的、5的整数倍数生效。例如统计周期配置为18秒,实际生效的统计周期为15秒。
(1) 进入系统视图。
system-view
(2) 配置发送CPU核告警事件的间隔。
monitor resend cpu-usage core-interval { minor-interval minor-interval | severe-interval severe-interval } * [ slot slot-number [ cpu cpu-number ] ]
发送CPU核低级别事件告警间隔时间为300秒,发送CPU核高级别事件告警间隔时间为60秒。
系统实时监控剩余空闲内存大小,当条件达到一级、二级、三级告警门限或者恢复正常状态门限时,就产生相应的告警/告警解除通知,通知关联的业务模块/进程采取相应的措施,以便最大限度的利用内存,又能保证设备的正常运行。
除了一级、二级、三级告警,设备还支持预警功能。预警门限用于内存使用率尚处于正常范围内,但需要提醒用户提前关注内存的情况。预警恢复门限用于解除预警。
预告警(early-warning)、一级(minor)、二级(severe)和三级(critical)门限,对应的剩余空闲内存越来越少,紧急程度越来越严重。
设备监控的是系统内存中剩余空闲内存的大小,使用display memory命令可以查看系统内存的使用情况。
· 当剩余空闲内存值从大于变成小于等于预告警门限时,产生预告警。
· 当剩余空闲内存值从大于变成小于等于一级告警门限时,产生一级告警。
· 当剩余空闲内存值从大于变成小于等于二级告警门限时,产生二级告警。
· 当剩余空闲内存值从大于变成小于等于三级告警门限时,产生三级告警。
· 当剩余空闲内存值从小于等于变成大于二级告警门限时,产生三级告警解除通知。
· 当剩余空闲内存值从小于等于变成大于一级告警门限时,产生二级告警解除通知。
· 当剩余空闲内存值从小于等于变成大于正常内存大小时,产生一级告警解除通知。
· 当剩余空闲内存值从小于等于变成大于预告警内存大小时,产生预告警解除通知。
同一级别的告警/告警解除通知是交替进行的:当剩余空闲内存值小于等于某级告警门限,设备产生相应级别的告警,后续只有该告警解除了,剩余空闲内存值再次小于等于某级告警门限时,才会再次生成该级别的告警。
当剩余空闲内存大小如图1-2中曲线所示时,会生成如图1-2所示的告警和解除告警通知。
缺省情况下,S12500R设备二级门限和三级门限相同,可以手工配置使二级门限和三级门限不同。
二、三级门限值相同时,二级门限满足以下条件,单板会重启。
· 产生二级告警后,剩余空闲内存值持续小于二级告警门限,其时长到达30秒,则系统会重启单板。
· 如果连续产生两次二级告警的时间间隔小于30秒,则系统会重启单板。
· 如果3分钟内产生二次二级告警,则系统会重启单板。
· 产生二级告警后,系统将会周期采样,预测剩余空闲内存是否会在30秒之内耗尽,如果预测结果为会在30秒之内耗尽,则系统会重启单板。
二、三级门限值不同时,单板达到二级门限则不会重启,三级门限满足以下条件,单板才会重启。
· 产生三级告警后,剩余空闲内存值持续小于三级告警门限,其时长到达30秒,则系统会重启单板。
· 如果连续产生两次三级告警的时间间隔小于30秒,则系统会重启单板。
· 如果3分钟内产生二次三级告警,则系统会重启单板。
· 产生三级告警后,系统将会周期采样,预测剩余空闲内存是否会在30秒之内耗尽,如果预测结果为会在30秒之内耗尽,则系统会重启单板。
当设备出现内存告警时,可删除暂时不用的配置或关闭部分功能来释放内存。但因为内存不足,部分配置可能删除失败。
(1) 进入系统视图。
system-view
(2) 配置内存利用率阈值。
memory-threshold [ slot slot-number [ cpu cpu-number ] ] usage memory-threshold
缺省情况下,内存利用率阈值为100%。
(3) 配置空闲内存告警的门限值。
memory-threshold [ slot slot-number [ cpu cpu-number ] ] [ ratio ] minor minor-value severe severe-value critical critical-value normal normal-value [ early-warning early-warning-value secure secure-value ]
缺省情况下,一级告警门限为1024MB,二级和三级告警门限均为768MB,系统恢复到正常的内存门限为1280MB,预告警门限和预告警恢复门限均为1152MB。
内存一键诊断功能用于诊断内存使用量是否处于正常范围内,例如,是否发生过内存使用量超门限、内存使用量突增事件,帮助用户定位内存使用量异常问题。关于内存一键诊断功能的详细描述和配置请参见“智能运维配置指导”中的“一键诊断”。
部分业务的运行需要使用DMA(Direct Memory Access,直接内存存取)内存,如果DMA内存不足,会导致业务模块功能异常。系统周期监控DMA空闲内存大小,当DMA空闲内存小于或等于告警阈值,产生告警事件并重启对应单板。
DMA内存告警通知会同时向NETCONF、SNMP和信息中心三个方向输出,通过配置NETCONF、SNMP、信息中心功能,告警最终能以NETCONF事件、SNMP Trap或Inform消息、日志的形式发送给用户。NETCONF、SNMP、信息中心的详细介绍请参见“网络管理和监控配置指导”中的“NETCONF”、“SNMP”、“信息中心”。
(1) 进入系统视图。
system-view
(2) 配置DMA内存告警阈值。
memory-threshold dma [ slot slot-number [ cpu cpu-number ] ] [ ratio ] critical critical-value normal normal-value
缺省情况下,告警阈值为2048KB,告警恢复阈值为4096KB。
(3) 配置发送DMA内存告警事件的间隔。
monitor resend memory-threshold dma critical-interval critical-interval [ slot slot-number [ cpu cpu-number ] ]
undo monitor resend memory-threshold dma critical-interval [ slot slot-number [ cpu cpu-number ] ]
缺省情况下,DMA内存告警事件周期发送的间隔为300秒。
可在任意视图下执行以下命令:
· 显示设备的内存使用状态。
display memory [ summary ] [ slot slot-number [ cpu cpu-number ] ]
· 显示内存告警门限相关信息。
display memory-threshold [ slot slot-number [ cpu cpu-number ] ]
· 显示内存告警门限相关信息。
display memory dma [ slot slot-number [ cpu cpu-number ] ]
· 显示DMA内存告警相关信息。
display memory-threshold dma [ slot slot-number [ cpu cpu-number ] ]
用户可以配置MDB资源运行的分配模式,从而更改MAC地址表、ARP表和路由表的规格大小。
配置成功后需要重启设备才能生效。
(1) 进入系统视图。
system-view
(2) 配置MDB资源运行的分配模式。
hardware-resource mdb { normal | routing }
缺省情况下,MDB资源运行的分配模式为路由模式。
可在任意视图下执行以下命令,显示MDB资源运行功能的相关信息。
display hardware-resource [ mdb ]
配置本功能后,设备会监测ARP表项等资源的剩余情况,周期采样监测对象的值,并和配置的告警门限进行比较:
· 如果剩余的资源小于或等于低级别告警门限且大于高级别告警门限,则资源进入低级别告警状态,并生成低级别告警通知;
· 如果剩余的资源小于或等于高级别告警门限,则资源进入高级别告警状态,并生成高级别告警通知;
· 如果剩余的资源大于低级别告警门限,则资源进入恢复告警状态,并生成恢复通知。
当资源一直处于低级别告警状态时:
· 开启周期发送低级别资源告警通知功能后,第一次达到低级别告警状态时,会生成低级别告警通知,后续还会周期生成低级别告警通知。当剩余资源达到更高级别告警门限时,将会生成更高级别的告警通知,暂时抑制低级别的告警通知。直到高级别的告警状态解除,再周期输出低级别的告警通知。
· 关闭周期发送低级别资源告警通知功能后,只有第一次达到低级别告警状态时,才生成低级别告警通知,不会连续生成低级别告警通知。
当资源一直处于高级别告警状态时,设备会周期生成高级别告警通知。
资源告警通知可向NETCONF、SNMP、信息中心三个方向输出,通过配置NETCONF、SNMP、信息中心功能,资源告警最终能以NETCONF事件、SNMP Trap或Inform消息、日志的形式发送给用户。NETCONF和SNMP的详细介绍请参见“网络管理和监控配置指导”中的“NETCONF”和“SNMP”。信息中心的详细介绍请参见“设备管理配置指导”中的“信息中心”。
图1-3 资源监控示意图
(1) 进入系统视图。
system-view
(2) 配置生成资源告警通知的门限。
resource-monitor resource resource-name slot slot-number cpu cpu-number { by-absolute | by-percent } minor-threshold minor-threshold severe-threshold severe-threshold
不同类型资源的缺省情况不同,请使用display resource-monitor命令查看。
(3) 配置资源告警通知的输出方向。
resource-monitor output { netconf-event | snmp-notification | syslog } *
缺省情况下,资源告警通知会同时向NETCONF、SNMP、信息中心三个方向输出。
(4) 开启周期发送低级别资源告警通知功能。
resource-monitor minor resend enable
缺省情况下,周期发送低级别资源告警通知功能处于开启状态。
可在任意视图下执行以下命令,显示资源监控功能的相关信息。
display resource-monitor [ resource resource-name ] [ slot slot-number [ cpu cpu-number ] ]
通过以下配置任务,用户可以根据实际应用的需要配置不同的温度告警门限,来监控设备上不同位置温度传感器的温度。
设备可配置的温度告警门限包括:低温告警门限、一般级(Warning)高温告警门限、严重级(Alarm)高温告警门限。
如果温度低于低温告警门限、高于一般级或严重级高温门限,系统均会生成相应的日志信息和告警信息提示用户,并通过设备面板上的指示灯来告警,以便用户及时进行处理。
(1) 进入系统视图。
system-view
(2) 配置设备的温度告警门限。
temperature-limit slot slot-number { hotspot } sensor-number lowlimit warninglimit [ alarmlimit ]
不同温度传感器的温度门限可能不同,请先使用undo temperature-limit命令恢复缺省情况后,再通过display environment命令查看设备的缺省温度告警门限。
高温告警门限必须大于低温告警门限;Alarm高温告警门限必须大于Warning高温告警门限。
可在任意视图下执行以下命令,显示设备的温度信息。
display environment [ slot slot-number ]
当设备检测到器件、单板和转发层面的硬件故障时,会自动采取用户配置的处理措施,以便降低故障对设备的影响。
用户可配置的处理措施有:
· off:检测到故障时,设备不进行任何操作。
· isolate:检测到故障时,设备会自动关闭端口、隔离单板、禁止单板加载或给单板下电,从而尽量减小故障的影响。
· reset:检测到故障时,设备会自动重启器件/单板以尝试修复故障。
· warning:检测到故障时,设备发送Trap信息,不会修复故障。
(1) 进入系统视图。
system-view
(2) 配置当系统检测到硬件故障时自动采取的修复操作。
hardware-failure-detection { board | chip | forwarding } { off | isolate | reset | warning }
缺省情况下,系统检测到硬件故障时自动采取的操作为reset。
通过配置芯片复位功能,可指定芯片发生故障时系统的处理方式。
(1) 进入系统视图。
system-view
(2) 开启芯片复位功能。
monitor chipblock reset [ logging ]
缺省情况下,芯片复位功能处于开启状态。
某些电源模块发生过载、过流、过压、过温、短路等故障时,会进行自我硬件保护,比如:当电源由于输出过压而告警时,电源可能进入锁死状态、停止对整个机框进行供电,以便保护电源和设备不被损坏。这样虽然保护了电源和设备的安全使用,但会对设备的正常使用造成一定的影响,严重时将导致业务全部中断。为了尽可能减小这种影响,用户可使用电源管理功能,来尽可能的避免电源模块过载现象的发生。
电源管理功能的原理是,系统实时监控电源的可用功率和系统负载,在电源将要过载、进行自身硬件保护之前,采取保护措施(比如给用户发送提示信息、启用冗余电源以及抑制接口板供电)。
电源管理配置任务如下:
(1) 开启电源管理功能
(2) (可选)配置冗余电源
通过配置冗余电源,可以给设备预留功率。
(1) 进入系统视图。
system-view
(2) 开启电源管理功能。
power-supply policy enable
缺省情况下,电源管理功能处于开启状态。
冗余电源技术通过部署多余的电源模块,来避免电源过载。比如,设备至少需要N个电源才能运行,我们通常会给设备配备M(M大于N)个电源,多余的(M-N)个电源可配置为冗余电源。正常情况下,这M个电源负载均衡,共同为设备输出功率。当其中某个电源故障时,其余电源能立即接管其工作,从而避免发生电源过载。
配置冗余电源后,如果有接口板插入,系统会先比较待上电接口板的最大功耗和系统的剩余功率:
· 当最大功耗小于等于剩余功率时,直接给接口板供电。
· 当最大功耗大于剩余功率时,不会给接口板供电,接口板不能启动。此时,可增加电源模块,或者减少冗余电源的数量。
只有在开启电源管理功能后,本特性才会生效。
(1) 进入系统视图。
system-view
(2) 配置冗余电源模块数。
power-supply policy redundant module-count
缺省情况下,冗余电源模块数量的值为0。
配置电源模块的监控模式为enhanced时,将会占用一定系统的资源。
(1) 进入系统视图。
system-view
(2) 配置电源模块的监控模式。
power-exception-monitor { normal | enhanced }
缺省情况下,电源模块的监控模式为normal模式。
开启电源睡眠功能后,系统会根据设备当前的实际功耗,智能控制电源模块进入或者退出睡眠状态,以降低能耗:
· 当系统剩余功率大于单个电源模块输入功率时,将其设置为睡眠模式并关断输出。
· 当系统剩余功率不足时,唤醒睡眠的电源模块。
仅适配PSR2400-54A、PSR2400-54D或PSR3000-54A电源模块的交换机支持开启电源睡眠功能。
只有使用power-supply policy enable命令开启电源管理功能后,电源睡眠配置才能生效。
处于睡眠状态的电源模块无法提供冗余备份功能,若正常工作的电源模块突然故障或被拔出,可能会影响设备正常运行。用户可通过display power命令查看电源模块的工作状态。
(1) 进入系统视图。
system-view
(2) 配置开启电源睡眠功能。
power-supply surplus-power enable
当系统供电不足时,设备会根据单板的供电优先级自动对单板供电,用户也可以通过display power-supply命令随时了解电源的使用情况以及各单板的供电情况,再结合网络业务情况,手工对单板进行供电和断电操作,来调节系统可用功率。
请先开启电源管理功能,再配置本功能。否则,本功能配置失败。
请在用户视图下执行本命令,手工给单板供电。
power-supply on slot slot-number
请在用户视图下执行本命令,手工给单板断电。
power-supply off slot slot-number
强制给单板下电后,单板将无法收发报文,请谨慎使用。
可在任意视图下执行以下命令,显示设备的电源状态。
display power [ power-id ]
可在任意视图下执行以下命令,显示指定电源的电子标签信息。
display device manuinfo power power-id
可在任意视图下执行以下命令:
· 显示风扇的工作状态。
display fan [ fan-id ]
· 显示指定风扇的电子标签信息。
display device manuinfo fan fan-id
某些协议模块(比如STP、DLDP等)在特定情况下会自动关闭某个端口。在协议自动关闭端口的同时,系统会启动一个检测端口状态的定时器。当定时器超时,如果该端口仍处于关闭状态,则系统自动将端口恢复到真实的物理状态。本功能用于配置系统检测端口状态定时器的时长。
(1) 进入系统视图。
system-view
(2) 配置端口状态检测定时器的时长。
shutdown-interval time
缺省情况下,端口状态检测定时器时长为30秒。
可以通过显示可插拔接口模块的主要特征参数或者电子标签信息来识别可插拔接口模块。
· 可插拔接口模块的主要特征参数包括:模块型号、连接器类型、发送激光的中心波长、信号的有效传输距离、模块生产厂商名称等信息。
· 电子标签信息也可以称为永久配置数据或档案信息,在光模块或者设备的调试、测试过程中被写入到光模块或者设备的存储器件中,包括光模块或者设备的名称、生产序列号、MAC地址、制造商等信息。
另外,当设备上插入的光模块的生产厂商不是H3C时,设备会打印Log信息提醒用户,要求用户更换成H3C的光模块,以便管理和维护光模块。关于Log输出规则的配置请参见“设备管理配置指导”中的“信息中心”。
请在任意视图下执行以下命令。
· 显示可插拔接口模块的主要特征参数。
display transceiver interface [ interface-type interface-number ]
· 显示可插拔接口模块的电子标签信息。
display transceiver manuinfo interface [ interface-type interface-number ]
系统提供故障告警信息描述了可插拔接口模块的故障来源,以便用户诊断和解决故障。系统还提供了数字诊断功能,其原理是对影响光模块工作的关键参数进行监控(这些关键参数包括:温度、电压、激光偏置电流、发送光功率和接收光功率等),当这些参数的值异常时,用户可以采取相应的措施,预防故障发生。
请在任意视图下执行以下命令。
· 显示可插拔接口模块的当前故障告警信息。
display transceiver alarm interface [ interface-type interface-number ]
· 显示可插拔光模块的数字诊断参数的当前测量值。
display transceiver diagnosis interface [ interface-type interface-number ]
· 显示可插拔光模块的主要光学参数。
display transceiver optics interface [ interface-type interface-number ]
仅QSFPDD-400G-ZR光模块支持本命令。
· 显示可插拔光模块的VDM(Versatile diagnostics monitoring,多功能诊断监控)信息。
display transceiver vdm interface interface-type interface-number vdm-id vdm-id
仅支持CMIS 4.0的200G和400G光模块支持本命令。
ITU(International Telecommunication Union,国际电信联盟)按照频率和波长对光信号进行了划分,并用编号来标识这些光信号。为光模块配置ITU通道编号后,该光模块就会发送对应波长和频率的光信号。当设备用于密集波分复用场合时,需要为光模块设置ITU通道编号。
仅SFP-XG-LH80-Tunable光模块支持本特性。
设备会将ITU通道编号配置保存在光模块内部的寄存器中,不会保存到配置文件中。
(1) 进入系统视图。
system-view
(2) 进入以太网接口视图。
interface interface-type interface-number
(3) 配置光模块的ITU通道编号。
itu-channel channel-number
缺省情况下,光模块的ITU通道编号为1。
可在任意视图下执行以下命令,显示光模块的ITU通道信息。
display transceiver itu-channel interface [ interface-type interface-number [ supported-channel ] ]
本功能主要用于调测光模块的功能是否正常,正常情况下,不建议配置。
关闭光通道将导致光模块不能传输信号。
本配置会保存在光模块内部的寄存器中,不会保存到配置文件中。
(1) 进入系统视图。
system-view
(2) 进入以太网接口视图。
interface interface-type interface-number
(3) 开启光模块的光通道。
transceiver lane [ lane-number ] enable
缺省情况下,光模块的光通道处于开启状态。
本功能主要用于配置光通道的输出功率。
仅QSFPDD-400G-ZR光模块支持本功能。
(1) 进入系统视图。
system-view
(2) 进入400G以太网接口及其拆分接口视图。
interface interface-type interface-number
(3) 配置光通道的输出功率。
transceiver optical-channel optical-channel-number tx-power power-value
缺省情况下,光通道的输出功率为-10dBm。
本功能主要用于配置光通道的工作频率和工作频率的调整间隔。
仅QSFPDD-400G-ZR光模块支持本功能。
配置本功能之前,请先基于基准频率193100000MHz和工作频率调整间隔(grid-value)计算出光通道的工作频率(frequency-value),再执行本功能。如果frequency-value值配置错误,会导致配置失败。光通道工作频率的计算公式为:
光通道工作频率=193100000MHz±光通道工作频率的调整间隔×n,n取值为整数。
(1) 进入系统视图。
system-view
(2) 进入以太网接口视图。
interface interface-type interface-number
(3) 配置光通道的工作频率和工作频率的调整间隔。
transceiver optical-channel optical-channel-number frequency frequency-value [ grid grid-value ]
本命令的缺省情况与光模块的型号有关,请以光模块的实际情况为准。
通常情况下,光模块处于高功耗工作模式。当光模块长时间不需要工作时,可将光模块切换到低功耗工作模式,节省能耗。低功耗模式下,光模块不能传输信号,如果有流量传输需求,需要手工将光模块调整到高功耗工作模式。
本配置会保存在光模块内部的寄存器中,不会保存到配置文件中。
(1) 进入系统视图。
system-view
(2) 进入以太网接口视图。
interface interface-type interface-number
(3) 配置400G光模块的功耗模式。
transceiver power-mode { high | low }
本命令的缺省情况与光模块的型号有关,请以光模块的实际情况为准。
本功能用于调测和优化400G光模块的高速信号,以便光链路达到最优工作状态。通常情况下,使用缺省配置即可置。如果确实需要调整,请在专业人士指导下进行,以免光模块工作异常。
当接口在传输业务流量时,建议不要执行本命令。因为执行本命令,设备会自动关闭、开启光模块一次,影响流量的传输。
本配置会保存在光模块内部的寄存器中,不会保存到配置文件中。
(1) 进入系统视图。
system-view
(2) 进入400G以太网接口及其拆分接口视图。
interface interface-type interface-number
(3) 设置光模块光模块接收通道的平衡因子和功率幅值。
transceiver lane [ lane-number ] equalization { precursor precursor-value | postcursor postcursor-value | amplitude amplitude-value }
本命令的缺省情况与光模块的型号有关,请以光模块的实际情况为准。
可在任意视图下执行以下命令:
· 显示可插拔400G光模块的当前运行参数。
display transceiver active-control interface [ interface-type interface-number ]
· 显示可插拔400G光模块支持的能力。
display transceiver advertising interface [ interface-type interface-number ]
· 显示可插拔400G光模块支持的应用及相关信息。
display transceiver application interface [ interface-type interface-number ]
· 显示可插拔400G光模块的状态信息。
display transceiver status interface [ interface-type interface-number ]
当光模块工作异常时,可以通过软件复位光模块来尝试修复光模块。正常情况下,不建议配置。
使用本功能会重启光模块,请谨慎使用。
在用户视图下,使用以下命令可软件复位400G光模块。
reset transceiver interface [ interface-type interface-number]
本功能用于配置可插拔光模块诊断的选项,并显示对应的诊断信息。
仅支持CMIS 4.0的200G和400G光模块支持本功能。
本功能的配置将会保存到光模块内部的寄存器中,如果光模块掉电,本功能的配置会被清空。当光模块重新上电后,需要重新设置本功能。
(1) 进入系统视图。
system-view
(2) 进入以太网接口视图。
interface interface-type interface-number
(3) 配置可插拔光模块诊断的选项,并显示对应的诊断信息。
transceiver diagnostic selector selector-id
缺省情况下,未配置可插拔光模块诊断的选项。
本功能用于开启光通道的通道环回检测功能,并配置环回检测模式。
仅支持CMIS 4.0的200G和400G光模块支持本功能。
光通道环回检测功能用于测试指定发送端和接收端之间能否正常转发报文,如果不能正常转发报文,用于判断故障点。当光模块能正常转发报文时,无需配置本功能。
本功能配置后会保存到光模块内部的寄存器中,如果光模块掉电,本功能会被清除。当光模块重新上电后,需要重新配置。
(1) 进入系统视图。
system-view
(2) 进入以太网接口视图。
interface interface-type interface-number
(3) 开启光通道的通道环回检测功能,并配置环回检测模式。
transceiver lane [ lane-number ] loopback loopback-mode
缺省情况下,可插拔光模块通道的环回功能处于关闭状态。
本功能主要用于开启光模块主机侧的故障检查功能。
仅QSFPDD-400G-ZR光模块支持本功能。
当光模块进行热插拔或者重置时,要使本功能继续生效,需要重新配置。
(1) 进入系统视图。
system-view
(2) 进入400G以太网接口及其拆分接口视图。
interface interface-type interface-number
(3) 开启光模块主机侧的故障检查功能。
transceiver host-fault-detect enable
缺省情况下,光模块主机侧的故障检查功能处于关闭状态。
本功能主要用于开启光模块介质侧的故障检查功能。
仅QSFPDD-400G-ZR光模块支持本功能。
当光模块进行热插拔或者重置时,要使本命令的配置继续生效,需要重新配置。
(1) 进入系统视图。
system-view
(2) 进入400G以太网接口及其拆分接口视图。
interface interface-type interface-number
(3) 开启光模块介质侧的故障检查功能。
transceiver media-fault-detect enable
缺省情况下,光模块介质侧的故障检查功能处于关闭状态。
本功能用于配置光通道的模式和传输信号的码型。
仅支持CMIS 4.0的200G和400G光模块支持本功能。
本功能配置后会保存到光模块内部的寄存器中,如果光模块掉电,本功能会被清除。当光模块重新上电后,需要重新配置。
(1) 进入系统视图。
system-view
(2) 进入以太网接口视图。
interface interface-type interface-number
(3) 配置光通道的模式和传输信号的码型。
transceiver lane [ lane-number ] pattern [ host-checker | host-generator media-checker | media-generator ] prbs-pattern
本命令的缺省情况以及各参数的支持情况与光模块的型号有关,请以光模块的实际情况为准。
开启光模块监控功能后,设备会按周期检查光模块的参数(例如光模块的输出功率、输入功率等),当参数的采样值达到软件设定的阈值时,会生成相应的日志提醒用户。
(1) 进入系统视图。
system-view
(2) 开启光模块监控功能。
transceiver monitor enable [ grey | tunable ]
缺省情况下,光模块监控功能处于关闭状态。
(3) 配置光模块的监控周期。
transceiver monitor interval interval
缺省情况下,光模块的监控周期是600秒。
开启光模块性能采样功能后,系统会每隔一定时间(可通过transceiver performance-collection interval命令配置)对光模块的性能信息进行采样,并把采样结果保存到历史记录区。这些记录可通过display transceiver history performance-collection命令查看,以便用户监控光模块近期的运行情况。
仅缺省MDC支持本功能,非缺省MDC不支持。
仅QSFPDD-400G-ZR光模块支持本功能。
(1) 进入系统视图。
system-view
(2) 开启光模块性能采样功能。
transceiver performance-collection enable
缺省情况下,光模块性能采样功能处于关闭状态。
(3) (可选)配置光模块的性能采样周期。
transceiver performance-collection interval interval
缺省情况下,光模块的历史性能采样周期为15分钟。
可在任意视图下执行以下命令,显示光模块的历史性能采样信息。
display transceiver history performance-collection interface [ interface-type interface-number ]
配置locator blink blink-time命令后,指定设备上用于定位的LED灯会以间隔快闪的方式闪烁,并持续指定的时间。用户可根据LED灯的指示来定位设备所在的位置。
blink-time时间到或者执行locator blink stop命令,则定位闪烁的LED灯会恢复正常点亮状态。
请在用户视图下执行本命令,定位设备的位置。
locator blink blink-time
请在用户视图下执行本命令,停止定位。
设备在运行过程中,会对转发芯片中的硬件表项和软件表项进行一致性检查。设备按周期收集软硬件表项一致性检查错误发生的次数。使能软硬件表项一致性检查错误通知功能后,如果设备在日志采样周期内发生软硬件表项一致性检查错误的次数达到配置的错误次数阈值,则发送日志提醒用户。
(1) 进入系统视图。
system-view
(2) 配置软硬件表项一致性检查的错误次数阈值。
parity-error consistency-check threshold value
缺省情况下,软硬件表项一致性检查的错误次数阈值为10次。
(3) 开启软硬件表项一致性检查日志信息功能。
parity-error consistency-check log enable
缺省情况下,软硬件表项一致性检查日志信息功能处于开启状态。
设备在运行过程中,会自动对转发芯片中硬件表项进行奇偶校验和ECC校验,并记录错误次数。设备按周期收集硬件表项奇偶校验和ECC校验错误的次数。使能硬件表项奇偶校验和ECC校验错误通知功后,如果设备在日志采样周期内发生硬件表项奇偶校验和ECC校验错误的次数达到配置的错误次数阈值,则发送日志提醒用户。
(1) 进入系统视图。
system-view
(2) 配置硬件表项奇偶校验和ECC校验错误次数的采样周期。
parity-error monitor period value
缺省情况下,硬件表项奇偶校验和ECC校验错误次数的采样周期为60秒。
(3) 配置硬件表项奇偶校验和ECC校验的错误次数阈值。
parity-error monitor threshold value
缺省情况下,对于R5212P01之前的版本,硬件表项奇偶校验和ECC校验的错误次数阈值为5000次;对于R5212P01及以上版本,硬件表项奇偶校验和ECC校验的错误次数阈值为20000次。
(4) 开启硬件表项奇偶校验和ECC校验日志信息功能。
parity-error monitor log enable
缺省情况下,对于R5212P01之前的版本,硬件表项奇偶校验和ECC校验日志信息功能处于关闭状态;对于R5212P01及以上版本,硬件表项奇偶校验和ECC校验日志信息功能处于开启状态。
设备在运行过程中,会对转发芯片中的硬件表项进行奇偶校验和ECC校验。在硬件表项奇偶校验和ECC校验发现错误时,会尝试恢复这些错误。使用关键硬件表项奇偶校验和ECC校验错误不可恢复通知功能,当一些关键硬件表项的校验错误不可恢复时,可以让设备按周期收集关键硬件表项奇偶校验和ECC校验错误不可恢复的次数。如果设备在日志采样周期内发生关键硬件表项奇偶校验和ECC校验错误不可恢复的次数达到配置的错误不可恢复次数阈值,则发送日志提醒用户。
如果设备转发芯片上关键硬件表项发生奇偶校验和ECC校验错误,且不可恢复时,可能会影响业务正常进行,则可以通过开启生成关键硬件表项奇偶校验和ECC校验错误不可恢复日志信息后设备自动重启功能,使设备通过重启来恢复关键硬件表项。
(1) 进入系统视图。
system-view
(2) 配置关键硬件表项奇偶校验和ECC校验错误不可恢复次数的采样周期。
parity-error unrecoverable period value
缺省情况下,关键硬件表项奇偶校验和ECC校验错误不可恢复次数的采样周期为60秒。
(3) 配置关键硬件表项奇偶校验和ECC校验错误不可恢复的次数阈值。
parity-error unrecoverable threshold value
缺省情况下,关键硬件表项奇偶校验和ECC校验错误不可恢复的次数阈值为1。
(4) 开启关键硬件表项奇偶校验和ECC校验错误不可恢复日志信息功能。
parity-error unrecoverable log enable
缺省情况下,关键硬件表项奇偶校验和ECC校验错误不可恢复日志信息功能处于开启状态。
(5) (可选)开启生成关键硬件表项奇偶校验和ECC校验错误不可恢复日志信息后设备自动重启功能。
parity-error unrecoverable reboot
缺省情况下,生成关键硬件表项奇偶校验和ECC校验错误不可恢复日志信息后设备自动重启。
接口板启动完成后,会主动向主控板注册,以便接受主控板的管理。在设备运行期间,主控板会定期向接口板发送握手报文,来确认接口板是否运行正常。本功能用于配置主控板与接口板之间握手的超时时长。
如果接口板在本功能设置的握手超时时长内未回复报文,主控板将认为该接口板故障,则会重启该接口板。
在一些对此握手时间有要求的场景(比如板卡重启断流时间要求短的场景),可以通过本功能调整主控板与接口板之间握手的超时时长,实现缩短握手时间,尽早发现接口板故障。
(1) 进入系统视图。
system-view
(2) 配置主控板与接口板之间握手的超时时长。
system handshake timeout timeout
缺省情况下,设备主控板与接口板之间握手的超时时长为30秒。
本命令仅对LSXM1CGQ72KCR1单板生效。
修改LSXM1CGQ72KCR1单板的端口速率工作模式后,必须重启该单板,配置才能生效。
(1) 进入系统视图。
system-view
(2) 配置LSXM1CGQ72KCR1单板的端口速率工作模式。
hardware-resource port-speed { high | low | mix } [ slot slot-number ]
缺省情况下,LSXM1CGQ72KCR1单板的端口以低速率模式工作。
可在任意视图下执行以下命令,显示LSXM1CGQ72KCR1单板的端口速率工作模式。
display hardware-resource [ port-speed ]
本命令仅对LSXM1TGS24C1接口模块扩展卡生效。
修改LSXM1TGS24C1单板的端口速率工作模式后,必须重启该单板,配置才能生效。
(1) 进入系统视图。
system-view
(2) 配置LSXM1TGS24C1接口模块扩展卡的端口速率工作模式。
hardware-resource scd-port-speed { high | low } [ slot slot-number ]
缺省情况下,LSXM1TGS24C1接口模块扩展卡以低速率模式工作。
可在任意视图下执行以下命令,显示LSXM1TGS24C1接口模块扩展卡的端口速率工作模式。
display hardware-resource [ scd-port-speed ]
若要执行license的相关功能时,必须首先为设备安装相应的license,本命令仅用来控制已安装的license是否能够正常生效。
修改生效状态后,必须重启设备,配置才能生效。
(1) 进入系统视图。
system-view
(2) 配置端口的licence生效状态。
hardware-resource smartman { enable | disable }
缺省情况下,端口的licence不能正常生效。
可在任意视图下执行以下命令,显示端口的licence生效状态。
display hardware-resource [ smartman ]
本功能用来使能或者去使能ACL哈希模式。
本功能仅适用于普通IPv4报文,不适用于封装报文与IPv6报文。
配置完本功能后,必须保存配置并重启设备才能生效。
仅R5212P01及以上版本支持本功能。
(1) 进入系统视图。
system-view
(2) 配置ACL哈希模式。
hardware-resource acl-hash { disable | enable }
缺省情况下,未使能ACL哈希模式。
可在任意视图下执行以下命令,显示ACL哈希模式的状态。
display hardware-resource acl-hash
synce功能用于时钟的频率同步,通过配置该功能可以控制单板的时钟源选取,是使用本地晶振时钟还是使用synce时钟。
当切换成synce时钟时,单板的时钟频率将跟随外部时钟源,通过改变外部时钟可进行时钟频率同步,配合PTP技术可以达到时间同步的目的;当采用本地晶振时钟时,单板将不能接收外部时钟源,无法进行频率同步,时间同步精度将会受到较大影响。
LSXM1CGMS48KBR1单板不支持本功能。
配置完本功能后,必须保存配置并重启设备才能生效。
(1) 进入系统视图。
system-view
(2) 配置单板的synce功能。
hardware-resource synce { enable | disable | default [slot slot-number] }
缺省情况下,单板的synce功能处于关闭状态。
可在任意视图下执行以下命令,显示单板synce功能的生效状态。
display hardware-resource synce
在聚合成员接口、三层聚合接口或三层聚合子接口上配置Telemetry Stream动作时,通过本功能可以配置Telemetry Stream采集流量入接口的索引值为聚合成员接口或者聚合接口的索引值。
本命令配置后立即生效,无需重启设备。
仅R5212P06及以上版本支持本功能。
(1) 进入系统视图。
system-view
(2) 配置Telemetry Stream采集报文中的入接口索引类型。
hardware-resource telemetry-stream { link-aggregation | link-aggregation-memberports }
缺省情况下,在聚合成员接口、三层聚合接口或三层聚合子接口上配置Telemetry Stream动作采集流量入接口索引值时,Telemetry Stream会采集聚合接口的索引值。
可在任意视图下执行以下命令,显示Telemetry Stream采集报文中的接口索引类型。
display hardware-resource telemetry-stream
为了规避MACsec可能出现的拥塞问题,避免影响端口的配置数据同步,MACsec单板默认开启端口模块识别延迟功能,可以通过hardware-resource opttask-delay disable关闭。
本功能仅对LSXM1CDMS36KCR1、LSXM1CGQ72KCR1和LSXM1CDQ18KCR1接口板生效。
配置完本功能后,必须保存配置并重启该单板才能生效。
仅R5212P06及以上版本支持本功能。
(1) 进入系统视图。
system-view
(2) 配置MACsec单板端口识别延迟功能。
hardware-resource opttask-delay { enable | disable } [ slot slot-number ]
缺省情况下,MACsec单板端口模块识别延迟功能处于开启状态。
可在任意视图下执行以下命令,显示MACsec单板端口识别延迟配置。
display hardware-resource opttask-delay
设备支持磁盘分区功能,执行fdisk-flash slot命令能将物理硬盘再额外多出一个分区,启动第三方容器后便可以访问该分区。
分区后,flash的空间会减少,可以通过dir命令查看剩余的flash空间。用户可以根据实际需求配置size的取值,来指定分区的大小,从而合理的利用硬盘空间。
仅R5212P01及以上版本支持本功能。
分区操作前,请做好如下准备:
· 请务必做好文件备份,分区操作会清除磁盘中的所有数据。
· 请确认分区过程中,无其他用户访问该磁盘。
· 对磁盘介质分区前,请确保没有对磁盘设置写保护。
仅LSXM1SUP04TR1、LSXM1SUP02TR1、LSXM2SUP02LR1单板支持磁盘分区功能。
对磁盘分区完后需要重启设备且在BTW下格式化才能生效。
(1) 进入系统视图。
system-view
(2) 对磁盘进行分区。
fdisk-flash slot slot-id [ size size-value ]
缺省情况下,未对磁盘进行分区。
可在任意视图下执行以下命令,显示设备的硬件信息。
display device [ flash | usb ] [ slot slot-number [ subslot subslot-number ] | verbose ]
可在任意视图下执行以下命令,显示设备的电子标签信息。
display device manuinfo [ slot slot-number [ subslot subslot-number ] ]
可在任意视图下执行以下命令,显示指定机框背板的电子标签信息。
display device manuinfo chassis-only
可在任意视图下执行以下命令,显示设备硬件的告警信息。
display alarm [ slot slot-number ]
当设备的电源、CPU、风扇等运行异常时,使用display alarm命令可以查看到相应的告警信息。对于过去发生的、已经恢复的告警可以使用http://localhost:7890/pages/31180AHC/03/31180AHC/03/resources/software/nev8r10_vrpv8r16/user/vrp/display_alarm_history.html命令查看;对于过去发生的、当前仍未恢复的告警可以使用http://localhost:7890/pages/31180AHC/03/31180AHC/03/resources/software/nev8r10_vrpv8r16/user/vrp/display_alarm_history.html命令查看。
可在任意视图下执行以下命令,显示设备当前仍未恢复的告警信息。
display alarm active
当设备的电源、CPU、风扇等运行异常时,使用display alarm命令可以查看到相应的告警信息。对于过去发生的、已经恢复的告警可以使用http://localhost:7890/pages/31180AHC/03/31180AHC/03/resources/software/nev8r10_vrpv8r16/user/vrp/display_alarm_history.html命令查看;对于过去发生的、当前仍未恢复的告警可以使用http://localhost:7890/pages/31180AHC/03/31180AHC/03/resources/software/nev8r10_vrpv8r16/user/vrp/display_alarm_history.html命令查看。
可在任意视图下执行以下命令,显示设备告警历史信息。
display alarm history [ verbose ]
不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!