03-硬件资源管理命令
本章节下载: 03-硬件资源管理命令 (308.38 KB)
目 录
1.1.4 display cpu-usage configuration
1.1.5 display cpu-usage history
1.1.11 display memory-threshold
1.1.13 display transceiver alarm
1.1.14 display transceiver diagnosis
1.1.15 display transceiver interface
1.1.16 display transceiver manuinfo
1.1.19 monitor cpu-usage enable
1.1.20 monitor cpu-usage interval
1.1.21 monitor cpu-usage threshold
1.1.22 monitor resend cpu-usage
1.1.23 monitor resend cpu-usage core-interval
acg log-disk switch-to命令用来切换ACG设备使用的日志盘。
【命令】
acg log-disk switch-to partition
本命令的支持情况与设备型号有关,请以设备的实际情况为准。
产品系列 |
产品型号 |
产品代码 |
说明 |
WX3500X系列 |
· WX3510X · WX3520X · WX3540X |
· EWP-WX3510X · EWP-WX3520X · EWP-WX3540X |
不支持 |
WCG380系列 |
WCG382 |
EWP-WCG382 |
支持 |
【缺省情况】
ACG使用内置日志盘。
【视图】
用户视图
【缺省用户角色】
network-admin
【参数】
partition:磁盘分区的名称,当有可切换的日志盘时,执行acg log-disk switch-to ?命令,通过帮助信息可获得该参数的取值。
【使用指导】
缺省状态下ACG设备使用内置硬盘存储应用控制和审计日志等信息,但内置硬盘存储空间小,可存储的日志信息较少。当用户需要存储更多日志时,可以通过配置本命令切换至具有更大存储空间的外置磁盘。
需要注意的是,切换日志盘时ACG设备会自动重启,并导致流经ACG设备的流量中断,影响业务传输,请谨慎操作。
【举例】
# 将ACG设备使用的日志盘切换为hda0。
<Sysname> acg log-disk switch-to hda0
【相关命令】
· display acg log-disk
display acg log-disk命令用来显示ACG设备当前使用的日志盘。
【命令】
display acg log-disk
本命令的支持情况与设备型号有关,请以设备的实际情况为准。
产品系列 |
产品型号 |
产品代码 |
说明 |
WX3500X系列 |
· WX3510X · WX3520X · WX3540X |
· EWP-WX3510X · EWP-WX3520X · EWP-WX3540X |
不支持 |
WCG380系列 |
WCG382 |
EWP-WCG382 |
支持 |
【视图】
任意视图
【缺省用户角色】
network-admin
network-operator
【举例】
# 显示ACG设备当前使用的日志盘。
<Sysname> display acg log-disk
Current log disk is hd-internal.
【相关命令】
· acg log-disk switch-to
display cpu-usage命令用来显示CPU利用率的统计信息。
【命令】
display cpu-usage [ control-plane | data-plane ] [ summary ]
【视图】
任意视图
【缺省用户角色】
network-admin
network-operator
【参数】
control-plane:显示控制平面对CPU利用率的统计信息。本参数的支持情况与设备的型号有关,请以设备的实际情况为准。
data-plane:显示数据平面对CPU利用率的统计信息。本参数的支持情况与设备的型号有关,请以设备的实际情况为准。
summary:以列表形式显示CPU利用率的统计信息。不指定该参数时,以区段形式显示CPU利用率的统计信息。
core { core-number | all }:显示CPU核利用率的统计信息。其中,all表示显示所有CPU核利用率的统计信息;core-number表示CPU核的编号,显示指定CPU核利用率的统计信息。
【使用指导】
当最近5秒、最近1分钟、最近5分钟的CPU利用率取值均显示为“--”时,可能原因为命令行从设备内部数据库获取数据失败,请稍候重试。
【举例】
# 以段的形式显示当前CPU利用率统计信息。
<Sysname> display cpu-usage
CPU usage:
1% in last 5 seconds
1% in last 1 minute
1% in last 5 minutes
# 以表的形式显示当前CPU利用率统计信息。
<Sysname> display cpu-usage summary
CPU Last 5 sec Last 1 min Last 5 min
0 2% 2% 10%
表1-1 display cpu-usage命令显示信息描述表
字段 |
描述 |
1% in last 5 seconds |
设备启动后,会以5秒为周期计算并记录一次该5秒内的CPU的平均利用率。该字段显示的是最近一个5秒统计周期内CPU的平均利用率 |
Last 5 sec |
设备启动后,会以5秒为周期计算并记录一次该5秒内的CPU的平均利用率。该字段显示的是最近一个5秒统计周期内CPU的平均利用率。如果Last 5 sec的取值为“--”,则表示不支持统计该信息 |
1% in last 1 minute |
设备启动后,会以1分钟为周期计算并记录一次该1分钟内的CPU的平均利用率。该字段显示的是最近一个1分钟统计周期内CPU的平均利用率 |
Last 1 min |
设备启动后,会以1分钟为周期计算并记录一次该1分钟内的CPU的平均利用率。该字段显示的是最近一个1分钟统计周期内CPU的平均利用率。如果Last 1 min的取值为“--”,则表示不支持统计该信息 |
1% in last 5 minutes |
设备启动后,会以5分钟为周期计算并记录一次该5分钟内的CPU的平均利用率。该字段显示的是最近一个5分钟统计周期内CPU的平均利用率 |
Last 5 min |
设备启动后,会以5分钟为周期计算并记录一次该5分钟内的CPU的平均利用率。该字段显示的是最近一个5分钟统计周期内CPU的平均利用率。如果Last 5 min的取值为“--”,则表示不支持统计该信息 |
display cpu-usage configuration命令用来显示CPU监控功能的相关配置。
【命令】
display cpu-usage configuration
【视图】
任意视图
【缺省用户角色】
network-admin
【举例】
# 显示CPU监控功能的相关配置。
<Sysname> display cpu-usage configuration
CPU usage monitor is enabled.
Current monitor interval is 60 seconds.
Current severe alarm threshold is 90%.
Current minor alarm threshold is 80%.
Current recovery threshold is 40%.
Current severe alarm threshold is 85% for the following cores: 0.
Current minor alarm threshold is 8% for the following cores: 0.
Current recovery threshold is 5% for the following cores: 0.
Current statistics interval is 90 seconds for the following cores: 0.
表1-2 display cpu-usage configuration命令显示信息描述表
字段 |
描述 |
CPU usage monitor is enabled. |
CPU利用率历史记录功能处于开启状态 |
Current monitor interval is 60 seconds. |
CPU利用率历史记录的采样周期为60秒 |
Current severe alarm threshold is 90%. |
CPU利用率严重级别告警门限为90% |
Current minor alarm threshold is 80%. |
CPU利用率轻度级别告警门限为80% |
Current recovery-threshold is 40%. |
CPU利用率恢复门限为40% |
Current severe alarm threshold is 85% for the following cores: |
CPU核利用率的严重级阈值。本字段的支持情况与设备的型号有关,请以设备的实际情况为准 |
Current minor alarm threshold is 8% for the following cores: |
CPU核利用率的轻度级阈值。本字段的支持情况与设备的型号有关,请以设备的实际情况为准 |
Current recovery threshold is 5% for the following cores: |
CPU核利用率的恢复级阈值。本字段的支持情况与设备的型号有关,请以设备的实际情况为准 |
Current statistics interval is 90 seconds for the following cores: |
CPU核利用率的统计周期。本字段的支持情况与设备的型号有关,请以设备的实际情况为准 |
【相关命令】
· monitor cpu-usage enable
· monitor cpu-usage interval
· monitor cpu-usage threshold
display cpu-usage history命令用来以图表方式显示CPU利用率的历史信息。
【命令】
display cpu-usage history [ job job-id ]
【视图】
任意视图
【缺省用户角色】
network-admin
network-operator
【参数】
job job-id:显示指定进程的CPU利用率的历史信息。job-id表示进程的编号,取值范围为1~2147483647。不指定该参数时,显示的是整个系统的相应信息(整个系统的CPU利用率等于所有进程CPU利用率之和)。可以使用display process命令可以查看当前运行的进程的编号和名称,display process命令的详细介绍请参见“网络管理和监控命令参考”中的“系统维护与调试”。
【使用指导】
开启CPU利用率历史记录功能后,系统每隔一定时间(可通过monitor cpu-usage interval命令配置)会对CPU的利用率进行采样,并把采样结果保存到历史记录区。通过display cpu-usage history命令可以查看到最近60个采样点的值。结果以坐标的形式进行显示,显示信息中:
· 纵坐标表示利用率,采用就近显示的原则。比如,利用率的间隔为5%,则实际统计值53%将被显示成55%,实际统计值52%将被显示成50%。
· 横坐标表示时间,时间越靠左表示距离当前时间越近。
· 用连续的#号表示该时刻的利用率,某个时间点上最高处的#号对应的纵坐标值即为该时刻CPU的利用率。
【举例】
# 以图表方式显示CPU利用率的历史记录。
<Sysname> display cpu-usage history
100%|
95%|
90%|
85%|
80%|
75%|
70%|
65%|
60%|
55%|
50%|
45%|
40%|
35%|
30%|
25%|
20%|
15%| #
10%| ### #
5%| ########
------------------------------------------------------------
10 20 30 40 50 60 (minutes)
cpu-usage (Slot 1 CPU 0) last 60 minutes (SYSTEM)
以上显示信息表明系统(用“SYSTEM”表示)在最近60分钟内CPU的利用率情况:12分钟前大约为5%,13分钟前大约为10%,14分钟前大约为15%,15分钟前大约为10%,16、17分钟前大约为5%,18分钟前大约为10%,19分钟前大约为5%,其它时间均小于或等于2%。
【相关命令】
· monitor cpu-usage enable
· monitor cpu-usage interval
display device命令用来显示设备硬件信息。
【命令】
display device [ flash ] [ verbose ]
【视图】
任意视图
【缺省用户角色】
network-admin
network-operator
【参数】
flash:显示Flash的信息。
verbose:显示设备的详细信息。不指定该参数时,显示设备的简要信息,且此时不会显示防火墙插卡的信息。
【使用指导】
不指定flash参数时,显示设备的硬件信息。
【举例】
# 显示设备硬件信息。
<Sysname> display device
Slot No. Subslot No. Board Type Status Max Ports
1 0 WX3510X Normal 17
1 3 EWPXM1XG03 Normal 10
表1-3 display device命令显示信息描述表
字段 |
描述 |
Board Type |
设备的硬件类型 |
Status |
设备的状态: · Illegal表示该设备不能正常工作 · Normal表示该设备处于正常工作状态 |
Max Ports |
设备的物理端口数 |
display device manuinfo命令用来显示设备硬件的电子标签信息。
【命令】
display device manuinfo [ subslot subslot-number ]
【视图】
任意视图
【缺省用户角色】
network-admin
network-operator
【参数】
subslot subslot-number:显示指定子卡的电子标签信息。subslot-number表示子卡所在的子槽位号。不指定该参数时,不会显示子卡的信息。
【使用指导】
电子标签信息也可以称为永久配置数据或档案信息等,在硬件的调测(调试、测试)过程中被写入到设备的存储器件中,包括硬件的名称、生产序列号、MAC地址、制造商等信息。
【举例】
# 显示设备硬件的电子标签信息。
<Sysname> display device manuinfo
显示信息略……。
display environment命令用来显示设备上温度传感器的温度信息。
【命令】
display environment
【视图】
任意视图
【缺省用户角色】
network-admin
network-operator
【举例】
# 显示设备上所有温度传感器的温度信息。
<Sysname> display environment
System temperature information (degree centigrade):
-----------------------------------------------------------------------------
Slot Sensor Temperature LowerLimit WarningLimit AlarmLimit ShutdownLimit
0 hotspot 1 27 -10 50 70 100
0 hotspot 2 53 10 50 80 100
表1-4 display environment命令显示信息描述表
字段 |
描述 |
System Temperature information (degree centigrade) |
系统温度信息,单位为摄氏度 |
sensor |
温度传感器 · hotspot:表示热点温度传感器 · inflow:表示入风口温度传感器 · outflow:表示出风口温度传感器 |
Slot |
当显示数字时表示指定slot上温度传感器的温度信息 |
Temperature |
当前温度 |
Lower |
低温告警门限。当显示为NA时,表示不支持该门限 |
Warning |
一般级(Warning)高温告警门限。当显示为NA时,表示不支持该门限 |
Alarm |
严重级(Alarm)高温告警门限。当显示为NA时,表示不支持该门限 |
Shutdown |
关断级(Shutdown)高温告警门限,当温度传感器的温度大于该门限时,设备会自动关闭。当显示为NA时,表示不支持该门限 |
display fan命令用来显示风扇的工作状态。
【命令】
display fan [ fan-id ]
【视图】
任意视图
【缺省用户角色】
network-admin
network-operator
【参数】
fan-id:表示设备内置风扇的编号。不指定该参数时,表示指定位置的所有风扇。
【举例】
# 显示设备上所有风扇的工作状态。
<Sysname> display fan
Fan 1 State: Normal
Fan 2 State: Normal
Fan 3 State: Normal
Fan 4 State: Normal
Fan 5 State: Normal
表1-5 display fan命令显示信息描述表
字段 |
描述 |
Fan X State |
风扇X 的状态,取值包括:: · Absent:风扇不在位 · Normal:风扇正常工作 · Fault:风扇故障 · FanDirectionFault:用户期望的风道方向与风扇框的实际风道方向不一致 |
display memory命令用来显示内存使用情况。
【命令】
display memory [ summary ]
【视图】
任意视图
【缺省用户角色】
network-admin
network-operator
【参数】
summary:显示内存使用情况的简要信息。不指定该参数时,显示内存使用情况的详细信息。
【使用指导】
当显示信息中某一行所有参数的取值均显示为“--”时,可能原因为命令行从设备内部数据库获取数据失败,请稍候重试。
【举例】
# 显示设备的内存使用情况的详细信息。
<Sysname> display memory
Memory statistics are measured in KB:
Total Used Free Shared Buffers Cached FreeRatio
Mem: 507980 154896 353084 0 488 54488 69.5%
-/+ Buffers/Cache: 99920 408060
Swap: 0 0 0
LowMem: 888420 80776 807644 -- -- -- 90.9%
HighMem: 904128 564844 339284 -- -- -- 37.5%
# 显示设备的内存使用情况的简要信息。
<Sysname> display memory summary
Memory statistics are measured in KB:
CPU Total Used Free Buffers Caches FreeRatio
0 8065116 4751820 3313296 7204 1075556 41.7%
Container memory statistics are measured in KB:
CPU Total Used Free UsageRatio
0 8065116 462672 3313296 5.7%
表1-6 display memory命令显示信息描述表
字段 |
描述 |
Memory statistics are measured in KB: |
物理设备中内存使用情况,以下统计信息均以KB为单位 |
Mem |
内存使用信息 |
Total |
系统可分配的物理内存的大小 设备总物理内存分为不可分配物理内存和可分配物理内存。其中,不可分配物理内存用于内核代码段存储、内核管理开销以及ISSU功能运行等;可分配物理内存用于支撑业务模块的运行、文件存储等操作。不可分配内存的大小由设备根据系统运行需要自动计算划分,可分配物理内存的大小等于设备总物理内存减去不可分配内存的大小 |
Used |
整个系统已用的物理内存大小 |
Free |
整个系统可用的物理内存大小 |
Shared |
多个进程共享的物理内存总额。取值为“--”时,表示不支持统计该参数的值 |
Buffers |
已使用的文件缓冲区的大小。取值为“--”时,表示不支持统计该参数的值 |
Cached |
高速缓冲寄存器已使用的内存大小。取值为“--”时,表示不支持统计该参数的值 |
Caches |
高速缓冲寄存器已使用的内存大小 |
FreeRatio |
整个系统物理内存的空闲率 |
-/+ buffers/cache |
-/+ Buffers/Cache:used = Mem:Used – Mem:Buffers – Mem:Cached,表示应用程序已用的物理内存大小 -/+ Buffers/Cache:free = Mem:Free + Mem:Buffers + Mem:Cached,表示应用程序可用的物理内存大小 |
Swap |
交换分区的使用信息 |
LowMem |
低端内存使用信息 |
HighMem |
高端内存使用信息 |
Container memory statistics are measured in KB |
Comware容器对内存的使用情况,包括: · Total:Comware容器总共可分配的物理内存的大小,单位为KB · Used:Comware容器已使用的物理内存的大小,单位为KB · Free:Comware容器可用的物理内存的大小,单位为KB · UsageRatio:Comware容器对物理内存的使用率 |
display memory-threshold命令用来显示内存告警门限相关信息。
【命令】
display memory-threshold
【视图】
任意视图
【缺省用户角色】
network-admin
network-operator
【使用指导】
当设备已经使用的物理内存大小超过内存某个告警门限阈值时,系统会认为发生了一次该类型内存异常,并记录第一次、最近一次发生异常的时间,以及这段时间内发生的该类异常的次数。如果想了解该类异常的详细情况,请查看日志信息,可按日志摘要关键字“MEM_EXCEED_THRESHOLD”或“MEM_BELOW_THRESHOLD”进行搜索。
【举例】
# 显示内存告警门限相关信息。
<Sysname> display memory-threshold
Memory usage threshold: 100%
Free memory threshold:
Minor: 512M
Severe: 448M
Critical: 384M
Normal: 576M
Early-warning: 640M
Secure: 704M
Current memory state: Normal
Event statistics:
[Back to normal state]
First notification: 0.0
Latest notification: 0.0
Total number of notifications sent: 0
[Enter minor low-memory state]
First notification at: 0.0
Latest notification at: 0.0
Total number of notifications sent: 0
[Back to minor low-memory state]
First notification at: 0.0
Latest notification at: 0.0
Total number of notifications sent: 0
[Enter severe low-memory state]
First notification at: 0.0
Latest notification at: 0.0
Total number of notifications sent: 0
[Back to severe low-memory state]
First notification at: 0.0
Latest notification at: 0.0
Total number of notifications sent: 0
[Enter critical low-memory state]
First notification at: 0.0
Latest notification at: 0.0
Total number of notifications sent: 0
表1-7 display memory-threshold命令显示信息描述表
字段 |
描述 |
Memory usage threshold |
内存利用率阈值 |
Free-memory thresholds Minor Severe Critical Normal Early-warning Secure |
剩余内存门限阈值: · Minor:一级告警门限,单位为MB · Severe:二级告警门限,单位为MB · Critical:三级告警门限,单位为MB · Normal:恢复到正常状态的阈值,单位为MB · Early-warning:预警门限,单位为MB · Secure:恢复预警门限状态的阈值,单位为MB |
Current free-memory state |
系统当前内存使用状态: · Normal:正常状态 · Minor:一级告警门限状态 · Severe:二级告警门限状态 · Critical:三级告警门限状态 · Normal (early-warning):预告警状态 · Normal (secure):安全状态 |
Free-memory event statistics: |
门限事件统计信息,事件分为: · Back to secure state:恢复到预警前的状态 · Entered early-warning state:进入预告警门限状态 · Back to normal state:内存恢复到正常状态 · Entered minor alarm state:进入一级告警门限状态 · Back to minor alarm state:恢复到一级告警前的状态 · Entered severe alarm state:进入二级告警门限状态 · Back to severe alarm state:恢复到二级告警前的状态 · Entered critical alarm state:进入三级告警门限状态 |
First notification at |
事件第一次发生的时间,格式yyyy-mm-dd hh:mm:ss.msec |
Latest notification at |
事件最近一次发生的时间,格式yyyy-mm-dd hh:mm:ss.msec |
Total number of notification send |
事件发生的总次数 |
display power命令用来显示设备电源的信息。
【命令】
display power [ power-id ]
【视图】
任意视图
【缺省用户角色】
network-admin
network-operator
【参数】
power-id:表示电源模块的编号。不指定该参数时,表示指定位置的所有电源。
【举例】
# 显示设备电源的简要信息。
<Sysname> display power
Power 1 State: Normal
Power 2 State: Absent
表1-8 display power命令显示信息描述表
字段 |
描述 |
Power X State |
电源模块编号为X的状态 · Absent:电源不在位 · Normal:电源正常工作 · Fault:电源故障 |
表1-9 display power verbose命令显示信息描述表
字段 |
描述 |
System power information |
设备上电源系统的相关信息 |
Power modules installed |
设备中已安装的电源模块数量 |
Power modules usable |
设备中可用的电源模块数量 |
Rated power |
处于Normal状态的电源模块的额定功率之和,单位为瓦 |
Usable power |
处于Normal状态的电源模块可分配的功率之和,单位为瓦 |
Used power |
当前已分配的功率,单位为瓦 |
Redundant power |
电源系统实际的冗余功率,单位为瓦 |
Total DC output |
设备中所有电源模块输出电流值的和,单位为安 |
PowerID |
设备上电源模块的编号 |
State |
电源模块的状态,取值为: · Absent:表示未安装电源 · Normal:表示电源正常工作 · Faulty:表示电源故障 |
InVoltage(V) |
电源模块的实际输入电压 |
InPower(W) |
电源模块的实际输入功率 |
OutVoltage(V) |
电源模块的实际输出电压 |
OutCurrent(A) |
电源模块的实际输出电流 |
OutPower(W) |
电源模块的实际输出功率 |
Power information by slot |
各slot对当前电源模块的使用情况 |
Type |
单板的类型 |
Current(A) |
单板当前的输入电流,单位为安,显示为“--”表示设备暂不支持统计该信息 |
Power(W) |
单板的额定功率,单位为瓦,显示为“--”表示设备暂不支持统计该信息 |
Status |
单板的状态: · Absent:表示单板不在位 · Normal:表示单板正常 · Faulty:表示单板故障 |
display transceiver alarm命令用来显示可插拔接口模块的当前故障告警信息。
【命令】
display transceiver alarm interface [ interface-type interface-number ]
【视图】
任意视图
【缺省用户角色】
network-admin
network-operator
【参数】
interface [ interface-type interface-number ]:显示接口上插入的可插拔接口模块的当前故障告警信息。interface-type interface-number表示接口类型和接口编号,如果不指定该参数,表示所有接口。
【使用指导】
目前,使用的可插拔接口模块可能出现的故障告警信息见“display transceiver alarm命令输出信息描述表”。如果没有故障,则显示为None。
表1-10 SFP/SFP+的display transceiver alarm命令输出信息描述表
字段 |
描述 |
RX loss of signal |
接收信号丢失 |
RX power high |
接收光功率高 |
RX power low |
接收光功率低 |
TX fault |
发送错误 |
TX bias high |
偏置电流高 |
TX bias low |
偏置电流低 |
TX power high |
发送光功率高 |
TX power low |
发送光功率低 |
Temp high |
温度高 |
Temp low |
温度低 |
Voltage high |
电压高 |
Voltage low |
电压低 |
Transceiver info I/O error |
模块信息读写错误 |
Transceiver info checksum error |
模块信息校验和错误 |
Transceiver type and port configuration mismatch |
模块类型和端口配置不匹配 |
Transceiver type not supported by port hardware |
端口不支持该模块类型 |
TEC fault |
TEC(Thermoelectric Cooler,热点冷却器)错误。仅HPE X130 10G SFP+ LC LH80 tunable Transceiver (JL250A)、SFP-XG-LH80-Tunable光模块支持显示该信息 |
Wavelength unlocked |
光信号波长失锁。仅HPE X130 10G SFP+ LC LH80 tunable Transceiver (JL250A)、SFP-XG-LH80-Tunable光模块支持显示该信息 |
Tx is not ready due to tunning |
光信号波长改变时发射端处于准备过程状态告警。仅HPE X130 10G SFP+ LC LH80 tunable Transceiver (JL250A)、SFP-XG-LH80-Tunable光模块支持显示该信息 |
表1-11 QSFP-DD光模块的display transceiver alarm命令输出信息描述表
字段 |
描述 |
Data path firmware fault |
数据通道固件错误 |
Module firmware fault |
模块固件错误 |
Module state changed |
模块状态改变 |
Data path state changed in channel x |
通道x的数据路径状态改变 |
TX loss in channel x |
通道x的发送信号丢失 |
TX CDR LOL in channel x |
通道x的TX 时钟和数据恢复失锁 |
TX input eq fault in channel x |
通道x的TX输入均衡错误 |
RX CDR LOL in channel x |
通道x的RX 时钟和数据恢复失锁 |
Loss of reference clock |
基准时钟丢失 |
L-host pattern generator LOL in channel x |
通道x的主机端码型发生器失锁 |
L-media pattern generator LOL in channel x |
通道x的介质端模式发生器失锁 |
L-host pattern checker LOL in channel x |
通道x的主机端码型检查器失锁 |
L-media pattern checker LOL in channel x |
通道x的介质端模式检查器失锁 |
TEC Current high |
制冷器工作电流/制冷器的额定电流高告警 |
TEC Current low |
制冷器工作电流/制冷器的额定电流低告警 |
Laser Temperature high |
激光器温度高告警 |
Laser Temperature low |
激光器温度低告警 |
Temp high warning |
模块温度高预警 |
Temp low warning |
模块温度低预警 |
Voltage high warning |
模块电压高预警 |
Voltage low warning |
模块电压低预警 |
RX power high warning(channel x) |
通道x的接收功率高预警 |
RX power low warning(channel x) |
通道x的接收功率低预警 |
TX power high warning(channel x) |
通道x的发送功率高预警 |
TX power low warning(channel x) |
通道x的发送功率低预警 |
TX bias high warning(channel x) |
通道x的发送电流高预警 |
TX bias low warning(channel x) |
通道x的发送电流低预警 |
TEC Current high warning |
制冷器工作电流/制冷器的额定电流高预警 |
TEC Current low warning |
制冷器工作电流/制冷器的额定电流低预警 |
Laser Temperature high warning |
激光器温度高预警 |
Laser Temperature low warning |
激光器温度低预警 |
【举例】
# 显示接口GigabitEthernet1/0/1上插入的可插拔接口模块的当前故障告警信息。
<Sysname> display transceiver alarm interface gigabitethernet 1/0/1
GigabitEthernet1/0/1 transceiver current alarm information:
RX loss of signal
RX power low
表1-12 display transceiver alarm显示信息描述表
字段 |
描述 |
transceiver current alarm information |
接口光模块当前故障告警信息 |
RX loss of signal |
接收信号丢失 |
RX power low |
接收光功率低告警 |
display transceiver diagnosis命令用来显示可插拔光模块的数字诊断参数的当前测量值。
【命令】
display transceiver diagnosis interface [ interface-type interface-number ]
【视图】
任意视图
【缺省用户角色】
network-admin
network-operator
【参数】
interface [ interface-type interface-number ]:显示接口上插入的可插拔光模块的数字诊断参数的当前测量值。interface-type interface-number表示接口类型和接口编号,如果不指定该参数,表示所有接口。
【举例】
# 显示接口GigabitEthernet1/0/1上插入的可插拔光模块的数字诊断参数的当前测量值。
<Sysname> display transceiver diagnosis interface gigabitethernet 1/0/1
GigabitEthernet1/0/1 transceiver diagnostic information:
Current diagnostic parameters:
Temp(°C) Voltage(V) Bias(mA) RX power(dBm) TX power(dBm)
36 3.31 6.13 -35.64 -5.19
Alarm thresholds:
Temp(°C) Voltage(V) Bias(mA) RX power(dBM) TX power(dBM)
High 50 3.55 1.44 -10.00 5.00
Low 30 3.01 1.01 -30.00 0.00
表1-13 display transceiver diagnosis显示信息描述表
字段 |
描述 |
transceiver diagnostic information |
接口插入的光模块的数字诊断信息 |
Current diagnostic parameters |
当前的诊断参数 |
Wave.er(nm) |
波长偏移,单位为nm,精确到0.001nm。仅HPE X130 10G SFP+ LC LH80 tunable Transceiver (JL250A)、SFP-XG-LH80-Tunable光模块支持显示该字段 |
Freq.er(GHz) |
频率偏移,单位为GHZ,精确到0.1GHZ。仅HPE X130 10G SFP+ LC LH80 tunable Transceiver (JL250A)、SFP-XG-LH80-Tunable光模块支持显示该字段 |
[Module] |
整个光模块的参数信息 |
Temp.(°C) |
数字诊断参数——温度,单位为°C,精确到1°C |
Voltage(V) |
数字诊断参数——电压,单位为V,精确到0.01V |
TEC Current(%) |
数字诊断参数——制冷器工作电流/制冷器的额定电流,单位为%,精确到0.01% |
Laser Temp(°C) |
数字诊断参数——激光器温度,单位为°C,精确到0.01°C |
[Channel] |
光通道的编号,也称为lane |
Bias(mA) |
数字诊断参数——偏置电流,单位为mA,精确到0.01mA |
RX power(dBm) |
数字诊断参数——接收光功率,单位为dBm,精确到0.01dBm |
TX power(dBm) |
数字诊断参数——发送光功率,单位为dBm,精确到0.01dBm |
Alarm thresholds |
告警门限 |
High |
高告警门限 |
Low |
低告警门限 |
TEC Curr. (%) |
数字诊断参数——制冷器工作电流,单位为%,精确到0.01% |
Laser Temp. (°C) |
数字诊断参数——激光器温度,单位为°C,精确到0.01°C |
表1-14 display transceiver diagnosis显示信息中光学参数统计信息描述表(本表中的显示信息仅CMIS 4.0光模块支持)
字段 |
描述 |
Media performance monitoring |
介质侧性能监控 |
Host performance monitoring |
主机侧性能监控 |
Rx bits |
接收比特数 |
FEC corrected bits |
FEC纠正的比特数 |
Rx frames |
接收帧数 |
Rx uncorrectable frames |
FEC无法纠正的帧数 |
display transceiver interface命令用来显示可插拔接口模块的主要特征参数。
【命令】
display transceiver interface [ interface-type interface-number ]
【视图】
任意视图
【缺省用户角色】
network-admin
network-operator
【参数】
interface-type interface-number:显示接口上插入的可插拔接口模块的主要特征参数。interface-type interface-number表示接口类型和接口编号,如果不指定该参数,表示所有接口。
【举例】
# 显示接口GigabitEthernet1/0/1上插入的可插拔接口模块的主要特征参数。
<Sysname> display transceiver interface gigabitethernet 1/0/1
GigabitEthernet1/0/1 transceiver information:
Transceiver type : 400G_BASE_SR8_QSFPDD
Connector type : MPO
Wavelength (nm) : 850
Transfer distance (m) : 70(OM3),100(OM4)
Max power(W) : 12
Digital diagnostic monitoring : Yes
Vendor name : H3C
表1-15 display transceiver命令显示信息描述表
字段 |
描述 |
transceiver information |
可插拔接口模块信息 |
Transceiver Type |
可插拔接口模块的物理型号 |
Connector Type |
可插拔接口模块的连接器类型,其中: · 光纤连接器包括SC(SC Connector,NTT公司推出的拔插锁紧式光纤连接器)、LC(LC Connector,Lucent公司推出的1.25mm/RJ45锁紧式光纤连接器)两种类型 · 其他连接器包括RJ-45、CX4等类型 |
Wavelength(nm) |
· 光模块:显示发送激光中心波长,单位nm;对于支持多条不同波长光路的模块(例如10GBASE-LX4模块),各个波长值之间用逗号分隔 · 电模块:显示为“N/A” |
Transfer Distance(xx) |
传输距离,对于单模模块,xx显示为km,其他模块xx显示为m。当模块支持多种传输介质时,各个传输距离值之间用逗号分隔。距离值后面括号里包含对应的“传输介质”。下面是各个介质的名称: · 9um:表示9/125um单模光纤 · 50um:表示50/125um多模光纤 · 62.5um:表示62.5/125um多模光纤 · TP:表示双绞线 · CX4:表示CX4电缆 |
Max power(W) |
光模块的最大功耗 |
Digital Diagnostic Monitoring |
对数字诊断功能的支持情况,其中: · YES:表示支持数字诊断 · NO:表示不支持数字诊断 |
Vendor Name |
模块生产或定制厂商名称 |
Ordering Name |
可插拔接口模块的对外型号 |
display transceiver manuinfo命令用于显示可插拔接口模块的电子标签信息。
【命令】
display transceiver manuinfo interface [ interface-type interface-number ]
【视图】
任意视图
【缺省用户角色】
network-admin
network-operator
【参数】
interface [ interface-type interface-number ]:显示接口上插入的可插拔接口模块的部分电子标签信息。interface-type interface-number表示接口类型和接口编号,如果不指定该参数,表示所有接口。
【举例】
# 显示接口GigabitEthernet1/0/1上插入的可插拔接口模块的电子标签信息。
<Sysname> display transceiver manuinfo interface gigabitethernet 1/0/1
GigabitEthernet1/0/1 transceiver manufacture information:
Manu. Serial Number : 213410A0000054000251
Manufacturing Date : 2019-09-01
Vendor Name : H3C
表1-16 display transceiver manuinfo命令显示信息描述表
字段 |
描述 |
Manu. Serial Number |
在调测(调试、测试)过程中生成的序列号 |
Manufacturing Date |
调测日期,取值为调测平台计算机的系统日期 |
Vendor Name |
定制厂商名称,即H3C |
memory-threshold命令用来配置空闲内存告警的门限值。
undo memory-threshold命令用来恢复缺省情况。
【命令】
memory-threshold [ ratio ] minor minor-value severe severe-value critical critical-value normal normal-value [ early-warning early-warning-value secure secure-value ]
undo memory-threshold
【缺省情况】
【视图】
系统视图
【缺省用户角色】
network-admin
【参数】
ratio:表示以百分比形式配置门限。不指定该参数时,表示配置的是门限的大小,单位为MB。
minor minor-value:一级告警门限。输入该参数的值时可通过输入?,来获取该参数的取值范围。取值为0时,表示关闭该级门限告警功能。
severe severe-value:二级告警门限。输入该参数的值时可通过输入?,来获取该参数的取值范围。取值为0时,表示关闭该级门限告警功能。
critical critical-value:三级告警门限。输入该参数的值时可通过输入?,来获取该参数的取值范围。取值为0时,表示关闭该级门限告警功能。
normal normal-value:系统内存恢复正常状态时的内存大小。输入该参数的值时可通过输入?,来获取该参数的取值范围。
early-warning early-warning-value:预警门限。输入该参数的值时可通过输入?,来获取该参数的取值范围。取值为0时,表示关闭该级别的告警功能。
secure secure-value:预警恢复门限。输入该参数的值时可通过输入?,来获取该参数的取值范围。
【使用指导】
系统实时监控剩余空闲内存大小,当条件达到一级、二级、三级告警门限或者恢复正常状态门限时,就产生相应的告警/告警解除通知,通知关联的业务模块/进程采取相应的措施,以便最大限度的利用内存,又能保证设备的正常运行。
设备监控的是系统内存中剩余空闲内存的大小,使用display memory命令可以查看系统内存的使用情况。(不支持低端内存的设备)
设备监控的是低端内存中剩余空闲内存的大小,使用display memory命令可以查看低端内存的使用情况。(支持低端内存的设备)
对于支持低端内存的slot,设备监控的是低端内存中剩余空闲内存的大小;对于不支持低端内存的slot,设备监控的是系统内存中剩余空闲内存的大小。执行display memory命令,如果显示信息中包含LowMem字段,则表示该slot支持低端内存。(部分单板支持低端内存的设备)
除了一级、二级、三级告警,设备还支持预警功能。预警门限用于内存使用率尚处于正常范围内,但需要提醒用户提前关注内存的情况。预警恢复门限用于解除预警。
当设备出现内存告警时,可删除暂时不用的配置或关闭部分功能来释放内存。但因为内存不足,部分配置可能删除失败。
关于告警门限的详细介绍请参见“基础配置指导”中的“设备管理”。
【举例】
# 配置一级、二级、三级告警门限分别为64MB、48MB、32MB,当剩余空闲内存大于96MB时,恢复到正常状态。
<Sysname> system-view
[Sysname] memory-threshold minor 64 severe 48 critical 32 normal 96
# 配置一级、二级、三级告警门限分别为设备总内存的3%、2%、1%,当剩余空闲内存大于设备总内存的5%时,恢复到正常状态。
<Sysname> system-view
[Sysname] memory-threshold ratio minor 3 severe 2 critical 1 normal 5
【相关命令】
· display memory-threshold
memory-threshold usage命令用来配置内存利用率阈值。
undo memory-threshold usage命令用来恢复缺省情况。
【命令】
memory-threshold usage memory-threshold
undo memory-threshold usage
【缺省情况】
内存利用率阈值为100%。
【视图】
系统视图
【缺省用户角色】
network-admin
【参数】
memory-threshold:内存利用率阈值百分比,取值范围为0~100。
【使用指导】
系统每隔1分钟会对内存利用率进行采样,并将采样值和用户配置的内存利用率阈值比较。当采样值大时,则认为内存利用率过高,设备会发送Trap报文。
【举例】
# 配置内存利用率阈值为80%。
<Sysname> system-view
[Sysname] memory-threshold usage 80
【相关命令】
· display memory-threshold
monitor cpu-usage enable命令用来开启CPU利用率历史记录功能。
undo monitor cpu-usage enable命令用来关闭CPU利用率历史记录功能。
【命令】
monitor cpu-usage enable
undo monitor cpu-usage enable
【缺省情况】
CPU利用率历史记录功能处于开启状态。
【视图】
系统视图
【缺省用户角色】
network-admin
【使用指导】
开启CPU利用率历史记录功能后,系统会每隔一定时间(可通过monitor cpu-usage interval命令配置)对CPU的利用率进行采样,并把采样结果保存到历史记录区。这些记录可通过display cpu-usage history命令查看,以便用户监控设备近期的运行情况。
【举例】
# 打开CPU利用率历史记录功能。
<Sysname> system-view
[Sysname] monitor cpu-usage enable
【相关命令】
· display cpu-usage configuration
· display cpu-usage history
· monitor cpu-usage interval
monitor cpu-usage interval命令用来配置CPU利用率历史记录的采样周期。
undo monitor cpu-usage interval命令用来恢复缺省情况。
【命令】
monitor cpu-usage interval interval
undo monitor cpu-usage interval
【缺省情况】
CPU利用率历史记录采样周期为1分钟。
【视图】
系统视图
【缺省用户角色】
network-admin
【参数】
interval:CPU利用率历史记录采用周期,取值为5Sec、1Min或者5Min,不区分大小写。输入该参数时,请完整输入,否则,系统会提示参数错误。
【使用指导】
开启CPU利用率历史记录功能后,系统会每隔一定时间(可通过monitor cpu-usage interval命令配置)对CPU的利用率进行采样,并把采样结果保存到历史记录区。这些记录可通过display cpu-usage history命令查看,以便用户监控设备近期的运行情况。
【举例】
# 配置CPU利用率历史记录的采样周期为5秒。
<Sysname> system-view
[Sysname] monitor cpu-usage interval 5Sec
【相关命令】
· display cpu-usage configuration
· display cpu-usage history
· monitor cpu-usage enable
monitor cpu-usage threshold命令用来配置CPU利用率告警门限。
undo monitor cpu-usage threshold命令用来恢复缺省情况。
【命令】
monitor cpu-usage threshold severe-threshold [ minor-threshold minor-threshold]
undo monitor cpu-usage threshold [ minor-threshold ]
【缺省情况】
CPU利用率告警门限是99%。
【视图】
系统视图
【缺省用户角色】
network-admin
【参数】
severe-threshold:CPU利用率高级别告警门限,取值范围为2~100,单位为百分比。
minor-threshold minor-threshold:CPU利用率低级别告警门限,取值范围为1~“severe-threshold的配置值减1”,单位为百分比。不指定该参数时,该参数的取值为severe-threshold*0.8。
【使用指导】
系统每隔1分钟会对CPU以及CPU核的利用率进行采样,并将采样值和用户配置的告警门限比较。当采样值大时,则认为利用率过高,设备会进行相应的处理。
【举例】
# 配置CPU利用率告警门限为90%。
<Sysname> system-view
[Sysname] monitor cpu-usage threshold 90
【相关命令】
· display cpu-usage configuration
monitor resend cpu-usage命令用来配置发送CPU告警事件的间隔。
undo monitor resend cpu-usage命令用来取消CPU告警事件发送间隔的配置。
【命令】
monitor resend cpu-usage { minor-interval minor-interval | severe-interval severe-interval } *
undo monitor resend cpu-usage [ minor-interval | severe-interval ]
【缺省情况】
持续300秒超过低级别告警门限则上报一次CPU低级别告警事件,持续60秒超过高级别告警门限则上报一次CPU高级别告警事件。
【视图】
系统视图
【缺省用户角色】
network-admin
【参数】
minor-interval minor-interval:CPU低级别告警事件周期发送的间隔,取值范围为10~3600,且只能是5的倍数,单位为秒。
severe-interval severe-interval:CPU高级别告警事件周期发送的间隔,取值范围为10~3600,且只能是5的倍数,单位为秒。
slot slot-number:指定VM。slot-number为VM所在的槽位号。(vBRAS-CP设备)
cpu cpu-number:表示CPU的编号。
【使用指导】
设备定期对CPU使用率进行采样,并将采样值与告警门限进行比较。当采样值从小于或等于变成大于某级别告警门限时,CPU将进入该级别告警状态并生成相应的告警事件。
CPU处于低级别告警状态时,会周期发送CPU低级别告警事件,直到CPU进入高级别告警状态或者低级别告警状态解除。CPU处于高级别告警状态时,会周期发送CPU高级别告警事件,直到高级别告警状态解除。使用本命令可以修改CPU告警事件的发送周期。
执行undo monitor resend cpu-usage命令不指定minor-interval和severe-interval参数时,表示将这两个参数恢复到缺省情况。当指定某一个参数时,仅将该参数恢复到缺省值。
【举例】
# 配置CPU低级别告警事件的发送周期为60秒。
<Sysname> system-view
[Sysname] monitor resend cpu-usage minor-interval 60
monitor resend cpu-usage core-interval命令用来配置发送CPU核告警事件的间隔。
undo monitor resend cpu-usage core-interval命令用来取消CPU核告警事件发送间隔的配置。
【命令】
monitor resend cpu-usage core-interval { minor-interval minor-interval | severe-interval severe-interval } *
undo monitor resend cpu-usage core-interval [ minor-interval | severe-interval ]
【缺省情况】
发送CPU核告警间隔时间为300S
【视图】
系统视图
【缺省用户角色】
network-admin
【参数】
minor-interval minor-interval:CPU核低级别告警事件周期发送的间隔,取值范围为10~3600,且只能是5的倍数,单位为秒。
severe-interval severe-interval:CPU核高级别告警事件周期发送的间隔,取值范围为10~3600,且只能是5的倍数,单位为秒。
slot slot-number:指定VM。slot-number为VM所在的槽位号。(vBRAS-CP设备)
cpu cpu-number:表示CPU的编号。
【使用指导】
设备定期对CPU核使用率进行统计,并将统计值与告警门限进行比较。当统计值从小于或等于变成大于告警门限时,CPU核将进入该告警状态并生成告警事件。
CPU核处于告警状态时,会周期发送CPU核告警事件,直到CPU核告警状态解除。使用本命令可以修改CPU核告警事件的发送周期。
【举例】
# 配置设备上所有CPU核发送告警事件的间隔:低级别告警为100秒、高级别告警为60秒。
<Sysname> system-view
[Sysname] monitor resend cpu-usage core-interval minor-interval 100 severe-interval 60
shutdown-interval命令用来配置端口状态检测定时器的时长。
undo shutdown-interval命令用来恢复缺省情况。
【命令】
shutdown-interval interval
undo shutdown-interval
【缺省情况】
端口状态检测定时器的时长为30秒。
【视图】
系统视图
【缺省用户角色】
network-admin
【参数】
interval:端口状态检测定时器的时长,取值范围为0~300,单位为秒。取值为0时,表示不进行定时检测。
【使用指导】
某些协议模块在特定情况下会自动关闭某个端口,比如当开启了BPDU保护功能的端口收到配置消息时,MSTP协议模块将自动关闭该端口。同时,系统会启动一个检测定时器,如果直到定时器超时(即经过time秒之后),该端口仍处于关闭状态,协议模块则自动激活该端口,令其恢复到真实的物理状态。
如果用户在端口定时检测过程中将检测时间间隔修改为T1,修改时刻距协议关闭端口时间间隔为T。
· 若T<T1,则被关闭的端口会再经过T1-T时间后被恢复。
· 若T>=T1,则被关闭的端口会立即恢复。
例如当前time配置为30,当端口被协议模块关闭2秒(T=2)后,修改time为10(T1=10),则该接口会再经过8秒后被恢复;如果当前time为30,端口被协议模块关闭10秒后,修改time为2,则该端口会立即恢复。
【举例】
# 配置端口状态检测定时器的时长为100秒。
<Sysname> system-view
[Sysname] shutdown-interval 100
temperature-limit命令用于配置设备的温度告警门限。
undo temperature-limit命令用来恢复缺省情况。
【命令】
temperature-limit { hotspot | inflow | outflow } sensor-number lowlimit warninglimit [ alarmlimit ]
undo temperature-limit { hotspot | inflow | outflow } sensor-number
【缺省情况】
不同温度传感器的温度门限可能不同,请先使用undo temperature-limit命令恢复缺省情况后,再通过display environment命令查看设备的缺省温度告警门限。
【视图】
系统视图
【缺省用户角色】
network-admin
【参数】
hotspot:配置热点传感器的温度门限。热点传感器一般置于发热量较大的芯片附近,监测芯片温度。
inflow:配置入风传感器的温度门限。入风传感器一般置于入风口附近,监测环境温度。
outflow:配置出风传感器的温度门限。出风传感器一般置于出风口附近,监测设备温度。
sensor-number:温度传感器的编号,输入该参数的值时可通过输入?,来获取该参数的取值范围。
lowlimit:低温告警门限,单位为摄氏度。不同温度传感器的低温告警门限取值范围不同,输入该参数的值时可通过输入?,来获取该参数的取值范围。
warninglimit:一般级高温告警门限,单位为摄氏度,必须大于低温告警门限。输入该参数的值时可通过输入?,来获取该参数的取值范围。
alarmlimit:严重级高温告警门限,单位为摄氏度,必须大于一般级高温告警门限。输入该参数的值时可通过输入?,来获取该参数的取值范围。
【使用指导】
如果温度低于低温告警门限、高于一般级或严重级高温门限,系统均会生成相应的日志信息和告警信息提示用户,并通过设备面板上的指示灯来告警,以便用户及时进行处理。
【举例】
# 配置热点1号温度传感器,低温门限为-10摄氏度,一般级高温门限为50摄氏度,严重级高温门限为60摄氏度。
<Sysname> system-view
[sysname] temperature-limit hotspot 1 -10 50 60
【相关命令】
· display environment
不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!