• 产品与解决方案
  • 行业解决方案
  • 服务
  • 支持
  • 合作伙伴
  • 新华三人才研学中心
  • 关于我们

02-设备管理配置指导

目录

03-硬件资源管理配置

本章节下载 03-硬件资源管理配置  (336.84 KB)

03-硬件资源管理配置


1 硬件资源管理

通过硬件资源管理功能,用户能够查看CPU、内存的使用情况,电源和风扇的工作状态,配置设备运行的相关参数,实现对设备硬件资源的日常维护和管理。

1.1  硬件资源管理任务简介

设备管理的所有配置任务均为可选配置,配置时无先后顺序要求,请根据实际需要选择配置。设备管理配置任务如下:

·     监控CPU

¡     配置CPU利用率告警功能

¡     配置CPU利用率历史记录功能

¡     CPU显示和维护

·     监控内存

¡     配置内存告警门限

¡     内存显示和维护

·     监控资源剩余情况

¡     配置资源告警通知功能

¡     资源监控功能显示和维护

·     监控设备温度

¡     配置温度告警门限

¡     显示设备温度信息

·     监控风扇

¡     显示风扇信息

·     配置端口状态检测定时器

·     配置设备的MAC地址表、ARP表/ND表、路由表的硬件资源模式

·     可插拔接口模块的识别与诊断

¡     识别可插拔接口模块

¡     诊断可插拔接口模块

·     管理和维护400G光模块

¡     开启400G光模块的光通道

¡     配置400G光模块的功耗模式

¡     配置400G光模块的平衡因子和功率幅值

¡     显示400G光模块的参数和状态

¡     软件复位400G光模块

·     显示设备硬件信息

·     显示设备硬件电子标签信息

1.2  监控CPU

1.2.1  配置CPU利用率告警功能

1. 功能简介

系统每隔1分钟会对CPU的利用率进行采样,并将采样值和用户配置的CPU利用率告警门限比较。

·     当采样值大于低级别告警门限时,则CPU进入低级别告警状态,会周期发送CPU低级别告警通知,直到CPU进入高级别告警状态或者低级别告警状态解除。

·     当采样值大于高级别告警门限时,则CPU进入高级别告警状态,会周期发送CPU高级别告警通知,直到高级别告警状态解除。

CPU告警通知会同时向NETCONF、SNMP、信息中心三个方向输出,通过配置NETCONF、SNMP、信息中心功能,CPU告警最终能以NETCONF事件、SNMP Trap或Inform消息、日志的形式发送给用户。NETCONF和SNMP的详细介绍请参见“网络管理和监控配置指导”中的“NETCONF”和“SNMP”。信息中心的详细介绍请参见“设备管理配置指导”中的“信息中心”。

图1-1 CPU告警示意图

2. 配置步骤

(1)     进入系统视图。

system-view

(2)     配置CPU利用率阈值。

monitor cpu-usage threshold severe-threshold [ minor-threshold minor-threshold ]

缺省情况下,CPU利用率阈值为99%。

注意

CPU利用率高级别告警门限如果设置过低,可能导致设备提前进入门限状态,不再进行正常业务处理。

 

(3)     配置发送CPU告警事件的间隔。

monitor resend cpu-usage { minor-interval minor-interval | severe-interval severe-interval } *

缺省情况下,持续300秒超过低级别告警门限则上报一次CPU低级别告警事件,持续60秒超过高级别告警门限则上报一次CPU高级别告警事件。

1.2.2  配置CPU利用率历史记录功能

1. 功能简介

开启CPU利用率历史记录功能后,系统会每隔一定时间对CPU的利用率进行采样,并把采样结果保存到历史记录区。这些记录可通过display cpu-usage history命令查看,以便用户监控设备近期的运行情况。

2. 配置步骤

(1)     进入系统视图。

system-view

(2)     配置CPU利用率历史记录的采样周期。

monitor cpu-usage interval interval

缺省情况下,CPU使用率历史记录采样周期为1分钟。

(3)     开启CPU利用率历史记录功能。

monitor cpu-usage enable

缺省情况下,CPU使用率历史记录功能处于开启状态。

1.2.3  CPU显示和维护

可在任意视图下执行以下命令:

·     显示CPU监控功能的相关配置。

display cpu-usage configuration

·     显示CPU利用率的统计信息。

display cpu-usage [ control-plane ] [ summary ]

·     以图表方式显示CPU利用率的历史记录。

display cpu-usage history [ job job-id ]

 

1.3  监控内存

1.3.1  配置内存告警门限

1. 功能简介

系统实时监控剩余空闲内存大小,当条件达到一级、二级、三级告警门限或者恢复正常状态门限时,就产生相应的告警/告警解除通知,通知关联的业务模块/进程采取相应的措施,以便最大限度的利用内存,又能保证设备的正常运行。

一级(minor)、二级(severe)和三级(critical)门限,对应的剩余空闲内存越来越少,紧急程度越来越严重。

设备监控的是系统内存中剩余空闲内存的大小,使用display memory命令可以查看系统内存的使用情况。

当剩余空闲内存值从大于变成小于等于预告警门限时,产生预告警。

·     当剩余空闲内存值从大于变成小于等于一级告警门限时,产生一级告警。

·     当剩余空闲内存值从大于变成小于等于二级告警门限时,产生二级告警。

·     当剩余空闲内存值从大于变成小于等于三级告警门限时,产生三级告警。

·     当剩余空闲内存值从小于等于变成大于二级告警门限时,产生三级告警解除通知。

·     当剩余空闲内存值从小于等于变成大于一级告警门限时,产生二级告警解除通知。

·     当剩余空闲内存值从小于等于变成大于正常内存大小时,产生一级告警解除通知。

·     当剩余空闲内存值从小于等于变成大于预告警内存大小时,产生预告警解除通知。

同一级别的告警/告警解除通知是交替进行的:当剩余空闲内存值小于等于某级告警门限,设备产生相应级别的告警,后续只有该告警解除了,剩余空闲内存值再次小于等于某级告警门限时,才会再次生成该级别的告警。

当剩余空闲内存大小如图1-2中曲线所示时,会生成如图1-2所示的告警和解除告警通知。

图1-2 内存告警示意图

内存告警事件的发送周期如下:持续1小时超过预告警门限则上报一次预告警事件通知,持续12小时超过一级告警门限则上报一次一级告警事件通知,持续3小时超过二级告警门限则上报一次二级告警事件通知,持续1小时超过三级告警门限则上报一次三级告警事件通知。

2. 配置限制和指导

当设备出现内存告警时,可删除暂时不用的配置或关闭部分功能来释放内存。但因为内存不足,部分配置可能删除失败。

满足以下条件时,系统会重启单板。

·     产生三级告警后,剩余空闲内存值持续小于三级告警门限,其时长到达30秒,则系统会重启单板。

·     如果连续产生两次三级告警的时间间隔小于30秒,则系统会重启单板。

·     如果3分钟内产生三次三级告警,则系统会重启单板。

·     产生三级告警后,系统将会周期采样,预测剩余空闲内存是否会在30秒之内耗尽,如果预测结果为会在30秒之内耗尽,则系统会重启单板。

系统监控到剩余空闲内存值达到一级、二级、三级告警门限以及预告警门限后,用户在Console或Telnet登录设备,以及执行每条命令时,都会显示当前内存使用情况。

3. 配置步骤

(1)     进入系统视图。

system-view

(2)     配置内存利用率阈值。

memory-threshold usage memory-threshold

缺省情况下,内存利用率阈值为100%。

(3)     配置空闲内存告警的门限值。

memory-threshold [ ratio ] minor minor-value severe severe-value critical critical-value normal normal-value

缺省情况下,一级告警门限为256MB,二级告警门限为192MB,三级告警门限为128MB,系统恢复到正常的内存门限为320MB。

1.3.2  内存显示和维护

可在任意视图下执行以下命令:

·     显示设备的内存使用状态。

display memory [ summary ]

·     显示内存告警门限相关信息。

display memory-threshold

1.4  监控资源剩余情况

1.4.1  配置资源告警通知功能

1. 功能简介

配置本功能后,设备会监测ARP表项等资源的剩余情况,周期采样监测对象的值,并和配置的告警门限进行比较:

·     如果剩余的资源小于或等于低级别告警门限且大于高级别告警门限,则资源进入低级别告警状态,并生成低级别告警通知;

·     如果剩余的资源小于或等于高级别告警门限,则资源进入高级别告警状态,并生成高级别告警通知;

·     如果剩余的资源大于低级别告警门限,则资源进入恢复告警状态,并生成恢复通知。

当资源一直处于低级别告警状态时:

·     开启周期发送低级别资源告警通知功能后,第一次达到低级别告警状态时,会生成低级别告警通知,后续还会周期生成低级别告警通知。当剩余资源达到更高级别告警门限时,将会生成更高级别的告警通知,暂时抑制低级别的告警通知。直到高级别的告警状态解除,再周期输出低级别的告警通知。

·     关闭周期发送低级别资源告警通知功能后,只有第一次达到低级别告警状态时,才生成低级别告警通知,不会连续生成低级别告警通知。

当资源一直处于高级别告警状态时,设备会周期生成高级别告警通知。

资源告警通知可向NETCONF、SNMP、信息中心三个方向输出,通过配置NETCONF、SNMP、信息中心功能,资源告警最终能以NETCONF事件、SNMP Trap或Inform消息、日志的形式发送给用户。NETCONF和SNMP的详细介绍请参见“网络管理和监控配置指导”中的“NETCONF”和“SNMP”。信息中心的详细介绍请参见“设备管理配置指导”中的“信息中心”。

图1-3 资源监控示意图

 

2. 配置步骤

(1)     进入系统视图。

system-view

(2)     配置生成资源告警通知的门限。

resource-monitor resource resource-name cpu cpu-number by-percent minor-threshold minor-threshold severe-threshold severe-threshold

不同类型资源的缺省情况不同,请使用display resource-monitor命令查看。

(3)     配置资源告警通知的输出方向。

resource-monitor output { netconf-event | snmp-notification | syslog } *

缺省情况下,资源告警通知会同时向NETCONF、SNMP、信息中心三个方向输出。

(4)     开启周期发送低级别资源告警通知功能。

resource-monitor minor resend enable

缺省情况下,周期发送低级别资源告警通知功能处于开启状态。

1.4.2  资源监控功能显示和维护

可在任意视图下执行以下命令,显示资源监控功能的相关信息。

display resource-monitor [ resource resource-name ] [ slot slot-number [ cpu cpu-number ] ]

1.5  监控设备温度

1.5.1  配置温度告警门限

1. 功能简介

通过以下配置任务,用户可以根据实际应用的需要配置不同的温度告警门限,来监控设备上不同位置温度传感器的温度。

设备可配置的温度告警门限包括:低温告警门限、一般级(Warning)高温告警门限、严重级(Alarm)高温告警门限。

如果温度低于低温告警门限、高于一般级或严重级高温门限,系统均会生成相应的日志信息和告警信息提示用户,并通过设备面板上的指示灯来告警,以便用户及时进行处理。

2. 配置步骤

(1)     进入系统视图。

system-view

(2)     配置设备的温度告警门限。

temperature-limit slot slot-number hotspot sensor-number lowlimit warninglimit [ alarmlimit ]

不同温度传感器的温度门限可能不同,请先使用undo temperature-limit命令恢复缺省情况后,再通过display environment命令查看设备的缺省温度告警门限。

高温告警门限必须大于低温告警门限;Alarm高温告警门限必须大于Warning高温告警门限。

1.5.2  显示设备温度信息

可在任意视图下执行以下命令,显示设备的温度信息。

display environment [ slot slot-number ]

1.6  监控风扇

 

 

1.6.1  显示风扇信息

可在任意视图下执行以下命令:

·     显示风扇的工作状态。

display fan [ slot slot-number [ fan-id ] ]

·     显示指定风扇的电子标签信息。

display device manuinfo slot slot-number fan fan-id

1.7  配置端口状态检测定时器

1. 功能简介

某些协议模块(比如STP、DLDP等)在特定情况下会自动关闭某个端口。在协议自动关闭端口的同时,系统会启动一个检测端口状态的定时器。当定时器超时,如果该端口仍处于关闭状态,则系统自动将端口恢复到真实的物理状态。本功能用于配置系统检测端口状态定时器的时长。

2. 配置步骤

(1)     进入系统视图。

system-view

(2)     配置端口状态检测定时器的时长。

shutdown-interval time

缺省情况下,端口状态检测定时器时长为30秒。

1.8  配置设备的MAC地址表、ARP表/ND表、路由表的硬件资源模式

1. 功能简介

设备支持多种类型的硬件资源模式,不同硬件资源模式下支持的MAC地址表、ARP表/ND表、路由表容量不同。

表1-1 各表项模式下MAC地址表、ARP表/ND表、路由表容量

表项模式

MAC地址表

ARP表/ND表

IPv4路由

IPv6路由

0  NORMAL

128K

88K /66K

216K

108K

1  ROUTING

32K

40K /34K

504K

252K

2  MAC

256K

96K /96K

16K

8K

 

2. 配置限制和指导

配置该特性后,须手工保存配置并重启设备才能生效。重启设备前请评估重启对网络造成的影响,做好相关准备工作。

各硬件资源模式下MAC地址表、ARP表/ND表、路由表容量支持的规格为理论最大值。请以实际情况为准。

3. 配置步骤

(1)     进入系统视图。

system-view

(2)     配置MAC地址表、ARP表/ND表、路由表的硬件资源模式。

hardware-mode { 0 | 1 | 2 }

缺省情况下,MAC地址表、ARP表/ND表、路由表的硬件资源模式为NORMAL模式。

4. 显示和维护

可在任意视图下执行以下命令,显示硬件资源模式信息。

display hardware-mode status

1.9  可插拔接口模块的识别与诊断

1.9.1  识别可插拔接口模块

1. 功能简介

可以通过显示可插拔接口模块的主要特征参数或者电子标签信息来识别可插拔接口模块。

·     可插拔接口模块的主要特征参数包括:模块型号、连接器类型、发送激光的中心波长、信号的有效传输距离、模块生产厂商名称等信息。

·     电子标签信息也可以称为永久配置数据或档案信息,在光模块或者设备的调试、测试过程中被写入到光模块或者设备的存储器件中,包括光模块或者设备的名称、生产序列号、MAC地址、制造商等信息。

另外,当设备上插入的光模块的生产厂商不是H3C时,设备会打印Log信息提醒用户,要求用户更换成H3C的光模块,以便管理和维护光模块。关于Log输出规则的配置请参见“设备管理配置指导”中的“信息中心”。

2. 配置步骤

请在任意视图下执行以下命令。

·     显示可插拔接口模块的主要特征参数。

display transceiver interface [ interface-type interface-number ]

·     显示可插拔接口模块的电子标签信息。

display transceiver manuinfo interface [ interface-type interface-number ]

1.9.2  诊断可插拔接口模块

1. 功能简介

系统提供故障告警信息描述了可插拔接口模块的故障来源,以便用户诊断和解决故障。系统还提供了数字诊断功能,其原理是对影响光模块工作的关键参数进行监控(这些关键参数包括:温度、电压、激光偏置电流、发送光功率和接收光功率等),当这些参数的值异常时,用户可以采取相应的措施,预防故障发生。

2. 配置步骤

请在任意视图下执行以下命令。

·     显示可插拔接口模块的当前故障告警信息。

display transceiver alarm interface [ interface-type interface-number ]

·     显示可插拔光模块的数字诊断参数的当前测量值。

display transceiver diagnosis interface [ interface-type interface-number ]

·     显示可插拔光模块的VDM(Versatile diagnostics monitoring,多功能诊断监控)信息。

display transceiver vdm interface interface-type interface-number vdm-id vdm-id

仅支持CMIS 4.0的400G光模块支持本命令。

仅S9820-8M交换机支持本命令。

1.10  管理和维护400G光模块

1.10.1  硬件适配关系

仅S9820-8M交换机支持本特性。

1.10.2  开启400G光模块的光通道

1. 功能简介

本功能主要用于调测光模块的功能是否正常,正常情况下,不建议配置。

2. 配置限制和指导

关闭光通道将导致光模块不能传输信号。

本配置会保存在光模块内部的寄存器中,不会保存到配置文件中。

3. 配置步骤

(1)     进入系统视图。

system-view

(2)     进入以太网接口视图。

interface interface-type interface-number

(3)     开启光模块的光通道。

transceiver lane [ lane-number ] enable

缺省情况下,光模块的光通道处于开启状态。

1.10.3  配置400G光模块的功耗模式

1. 功能简介

通常情况下,光模块处于高功耗工作模式。当光模块长时间不需要工作时,可将光模块切换到低功耗工作模式,节省能耗。低功耗模式下,光模块不能传输信号,如果有流量传输需求,需要手工将光模块调整到高功耗工作模式。

2. 配置限制和指导

本配置会保存在光模块内部的寄存器中,不会保存到配置文件中。

3. 配置步骤

(1)     进入系统视图。

system-view

(2)     进入以太网接口视图。

interface interface-type interface-number

(3)     配置400G光模块的功耗模式。

transceiver power-mode { high | low }

本命令的缺省情况与光模块的型号有关,请以光模块的实际情况为准。

1.10.4  配置400G光模块的平衡因子和功率幅值

1. 功能简介

本功能用于调测和优化400G光模块的高速信号,以便光链路达到最优工作状态。通常情况下,使用缺省配置即可置。如果确实需要调整,请在专业人士指导下进行,以免光模块工作异常。

2. 配置限制和指导

当接口在传输业务流量时,建议不要执行本命令。因为执行本命令,设备会自动关闭、开启光模块一次,影响流量的传输。

本配置会保存在光模块内部的寄存器中,不会保存到配置文件中。

3. 配置步骤

(1)     进入系统视图。

system-view

(2)     进入400G以太网接口及其拆分接口视图。

interface interface-type interface-number

(3)     设置光模块光模块接收通道的平衡因子和功率幅值。

transceiver lane [ lane-number ] equalization { precursor precursor-value | postcursor postcursor-value | amplitude amplitude-value }

本命令的缺省情况与光模块的型号有关,请以光模块的实际情况为准。

1.10.5  显示400G光模块的参数和状态

可在任意视图下执行以下命令:

·     显示可插拔400G光模块的当前运行参数。

display transceiver active-control interface [ interface-type interface-number ]

·     显示可插拔400G光模块支持的能力。

display transceiver advertising interface [ interface-type interface-number ]

·     显示可插拔400G光模块支持的应用及相关信息。

display transceiver application interface [ interface-type interface-number ]

·     显示可插拔400G光模块的状态信息。

display transceiver status interface [ interface-type interface-number ]

1.10.6  软件复位400G光模块

1. 功能简介

当光模块工作异常时,可以通过软件复位光模块来尝试修复光模块。正常情况下,不建议配置。

2. 配置限制和指导

使用本功能会重启光模块,请谨慎使用。

3. 配置步骤

在用户视图下,使用以下命令可软件复位400G光模块。

reset transceiver interface [ interface-type interface-number]

1.11  配置可插拔光模块诊断的选项

1. 功能简介

本功能用于配置可插拔光模块诊断的选项,并显示对应的诊断信息。

2. 配置限制和指导

仅支持CMIS 4.0的 400G光模块支持本功能。

S6880系列交换机不支持本功能。

本功能的配置将会保存到光模块内部的寄存器中,如果光模块掉电,本功能的配置会被清空。当光模块重新上电后,需要重新设置本功能。

3. 配置步骤

(1)     进入系统视图。

system-view

(2)     进入以太网接口视图。

interface interface-type interface-number

(3)     配置可插拔光模块诊断的选项,并显示对应的诊断信息。

transceiver diagnostic selector selector-id

缺省情况下,未配置可插拔光模块诊断的选项。

1.12  配置光通道的模式和传输信号的码型

1. 功能简介

本功能用于配置光通道的模式和传输信号的码型。

2. 配置限制和指导

仅支持CMIS 4.0的400G光模块支持本功能。

仅S9820-8M交换机支持本功能。

本功能配置后会保存到光模块内部的寄存器中,如果光模块掉电,本功能会被清除。当光模块重新上电后,需要重新配置。

3. 配置步骤

(1)     进入系统视图。

system-view

(2)     进入以太网接口视图。

interface interface-type interface-number

(3)     配置光通道的模式和传输信号的码型。

transceiver lane [ lane-number ] pattern [ host-checker | host-generator media-checker | media-generator ] prbs-pattern

本命令的缺省情况以及各参数的支持情况与设备所插入的光模块的型号有关,请以设备的实际情况为准。

 

1.13  显示设备硬件信息

可在任意视图下执行以下命令,显示设备的硬件信息。

display device [ flash | usb ] [ slot slot-number [ subslot subslot-number ] | verbose ]

1.14  显示设备硬件电子标签信息

可在任意视图下执行以下命令,显示设备的电子标签信息。

display device manuinfo [ slot slot-number [ subslot subslot-number ] ]

 

不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!

新华三官网
联系我们