升级建议
可选升级
解决问题
10.1 HDM-3.51版本解决问题列表
问题现象:HDM Web页面不显示NIC-BCM957508-P2100G-2P网卡信息。
问题产生条件:在BIOS setup的Advance页面下将NIC-BCM957508-P2100G-2P的FunCtion Mode修改为NPAR1.0模式,并保存重启设备。
问题现象:HDM Web页面误报内存条UCE故障。
问题产生条件:服务器上报MCA告警时误解析M2M相关寄存器。
新增功能
2.1 HDM-3.51版本硬件特性变更说明
R5300 G5新增option适配
新增适配长鑫32G内存
升级建议
可选升级
解决问题
10.1 HDM-3.50版本解决问题列表
问题现象:R4900 G5服务器的HDM界面,上报硬盘missing告警但系统下无异常。
问题产生条件:HDM启动过程中与阵列卡通信获取信息异常。
新增功能
2.1 HDM-3.50版本硬件特性变更说明
R4900 G5新增option适配
新增丽台4090D GPU适配
新增适配忆联UM311b 480G/960G/1.92T/3.84T SATA SSD硬盘
R4930 G5 H3新增option适配
Scaleflux CSD3000 7.68T NVMe硬盘
NIC-ETH-N500L-FH-4P-GE网卡
R5300 G5新增option适配
新增适配metaScale-200S网卡
新增适配metaScale-200网卡
R5500 G5 AMD新增option适配
新增适配3140H网卡
升级建议
建议升级
解决问题
10.1 HDM-3.49.01版本解决问题列表
202405141974
问题现象:通过Redfish接口获取服务器电源的输入功率与输出功率,其数值相同。
问题产生条件:在配置Intel处理器的服务器上,通过Redfish接口获取电源功率。
202408230652
问题现象:通过HDM Web页面修改用户密码时,若接口URL的ID和BODY中的ID不一致,仍然可以修改成功。
问题产生条件:通过HDM Web页面修改用户密码时,URL的ID和BODY的ID不一致。
202406191302
问题现象:R4900 G5服务器概率性出现硬盘状态检测为Ready的问题。
问题产生条件:R4900 G5服务器在PMC阵列卡下配置逻辑盘,其成员盘状态概率性变为Ready状态。
202407070061
问题现象:服务器在持续运行一段时间之后,低概率出现无法通过HDM下载SDS日志,继而出现HDM反复重启的问题。
问题产生条件:服务器持续运行一段时间。
新增功能
2.1 HDM-3.49.01版本硬件特性变更说明
R5300 G5新增option适配
新增适配燧原S60 GPU
R4900 G5新增option适配
新增适配NS8500 G2 1.92&3.2&7.68TB SSD硬盘
R4950 G5新增option适配
新增适配SSD-7.68T-NVME-CD8P
新增适配SSD-7.68T-NVME-7940M
R4930 G5 H3新增option适配
新增适配SSD-1.92T-NVME-J5100
升级建议
建议升级
解决问题
10.1 HDM-3.48.01版本解决问题列表
问题现象:R4900 G5服务器功耗跳变。
问题产生条件: R4900 G5服务器使用多接口获取监控电源功耗。
新增功能
2.1 HDM-3.48.01版本硬件特性变更说明
R4900 G5新增option适配
新增适配ES3500PV6 3.84T/7.68T NVMe硬盘
升级建议
建议升级
解决问题
10.1 HDM-3.47版本解决问题列表
问题现象:批量机器报带外用户连接已满告警,IPMI命令返回会话资源不足。
问题产生条件:脚本压力执行sol activate和sol deactivate命令。
问题现象:同一机柜中8台R4900 G5服务器异常宕机,手动重启后恢复。
问题产生条件:电源外部输入异常引入服务器二次电源告警。
问题现象:调用Redfish接口获取部分性能指标,发现指标异常。
问题产生条件:Redfish接口多次获取电源输入输出功率。
问题现象:修改HDM密码带"%"后无法登录HDM。
问题产生条件:修改HDM密码带"%"字符。
问题现象:按照MIB及SNMP手册,使用OID(.1.3.6.1.4.1.25506.13.1.2.1.2.2.1.1.7)监控组件温度状态,实际返回的是组件健康状态,MIB及SNMP手册有误。
问题产生条件:使用OID(.1.3.6.1.4.1.25506.13.1.2.1.2.2.1.1.7)监控组件温度状态。
新增功能
2.1 HDM-3.47版本硬件特性变更说明
R4900 G5新增option适配
MCX515A-CCUT网卡适配
NIC-ETH-SP670-FHHL-2P 100G网卡适配
大普微R5 1.92&3.2&7.68TB硬盘适配
R5300 G5新增option适配
瀚博VA10 GPU适配
CX8028G G5新增option适配
IB-MCX755106AS-HEAT-200Gb-2P
R5500K新增option适配
VR芯片适配英飞凌方案
升级建议
建议升级
解决问题
10.1 HDM-3.46.01版本解决问题列表
问题现象:配置NVMe盘后读取到的寿命为255,触发了严重级别的寿命告警。
问题产生条件:配置NVMe盘后读取硬盘寿命。
新增功能
2.1 HDM-3.46.01版本硬件特性变更说明
R4900 G5新增option适配
Dapustor R5101-1.92T/R5301-3.2T
升级建议
建议升级
解决问题
10.1 HDM-3.45.01版本解决问题列表
无
新增功能
2.1 HDM-3.45.01版本硬件特性变更说明
R4900 G5新增option适配
NIC-ETH-3S910-LP-2P-25G 网卡
NIC-ETH-SF200T-LP-2P-GE 网卡
NIC-ETH-SF400T-LP-4P-GE 网卡
NIC-ETH-RP1000P2SFP-LP-2P 网卡
升级建议
建议升级
解决问题
10.1 HDM-3.44.01版本解决问题列表
问题现象:R4900 G3服务器运行497天后在部分监控平台的SNMP V3 Trap告警无法显示。
问题产生条件:R4900 G3服务器运行497天监控SNMP V3 Trap。
新增功能
2.1 HDM-3.44.01版本硬件特性变更说明
无
升级建议
建议升级
解决问题
10.1 HDM-3.43版本解决问题列表
问题现象:R4930 G5(H3)服务器配置25SFF硬盘背板和后置4SFF Unibay硬盘背板,且后置4SFF Unibay硬盘背板中装配NVME硬盘,HDM存储管理界面下的物理视图展示的NVME硬盘信息跟实际不符。
问题产生条件:R4930 G5(H3)服务器配置25SFF硬盘背板和后置4SFF Unibay硬盘背板,且后置4SFF Unibay硬盘背板中装配NVME硬盘。
问题现象:服务器配置LSI RAID卡,小概率出现RAID卡下挂接的硬盘全部上报drive fault误告警。
问题产生条件:服务器配置LSI RAID卡,小概率出现问题。
问题现象:R4900 G5服务器因电网环境不稳定出现AC瞬断,BMC上报为主板电源故障。
问题产生条件:R4900 G5服务器因电网环境不稳定出现AC瞬断。
新增功能
2.1 HDM-3.43版本硬件特性变更说明
R4930 G5 H3新增option适配
SSD-3.2T-NVMe-PB6537-AIC
SSD-6.4T-NVMe-PB6537-AIC
SSD-3.2T-NVMe-J5310-AIC
SSD-6.4T-NVMe-J5310-AIC
SSD-7.68T-NVMe-J5110-AIC
瀚博GPU VG1000-64G-LP
NIC-ETH-RP1000SFPH102-3S-10G-2P
R4900 G5新增option适配
X710-T2L网卡适配
升级建议
建议升级
解决问题
10.1 HDM-3.42版本解决问题列表
问题现象:服务器设置过密码有效期后,hREST工具无法获取信息。
问题产生条件:服务器设置过密码有效期。
问题现象:搭配昆仑芯R300模组,概率出现获取不到R300温度,存在散热风险。
问题产生条件:R5500K搭配昆仑芯R300模组,概率出现。
问题现象:R5500K风扇功耗页面显示不正确。
问题产生条件:R5500K,开机待启动完成后设置风扇转速100%。
新增功能
2.1 HDM-3.42版本硬件特性变更说明
R4900 G5新增option适配
瀚博VA1L GPU适配
瀚博VA1-16G GPU适配
支持Solidigm P5520 15.36T硬盘
R4930 G5 H3新增option适配
登临GPU Goldwasser-L256
SSD-7.68T-NVME-PB6531-AIC
江波龙SATA SSD硬盘
R5300 G5新增option适配
天数 BI-V150 GPU适配
升级建议
建议升级
解决问题
10.1 HDM-3.41.01版本解决问题列表
问题现象:HDM收到某一IP发来的大量网络连接时,该IP会被HDM加入黑名单,出现访问HDM失败的问题。
问题产生条件:HDM短时间内收到大量的网络连接。
新增功能
2.1 HDM-3.41.01版本硬件特性变更说明
无
升级建议
建议升级
解决问题
10.1 HDM-3.41版本解决问题列表
问题现象:服务器设置过密码有效期后,hREST工具无法获取信息。
问题产生条件:服务器设置过密码有效期。
问题现象:R4900 G5接8SFF UniBay配置安装硬盘后,HDM界面显示的硬盘在位信息与实际不符。
问题产生条件:R4900 G5接8SFF UniBay配置安装硬盘。
问题现象:服务器触发ADDDC故障后未上报日志信息。
问题产生条件:服务器触发ADDDC故障。
问题现象:当服务器配置名称中有MB字样的PCIe卡时,触发PCIe卡故障,MCA解析建议是更换卡,但是事件日志上报的却是主板故障,并建议更换主板。
问题产生条件:服务器搭配含有MB字样的PCIe卡,且该PCIe卡出现告警。
问题现象:R5500 G5服务器误上报system detected the absence of a DIMM的SEL告警。
问题产生条件:G5 Intel服务器搭配未认证的内存,执行不断电重启或者断电重启。
问题现象:R4300 G5服务器HDM获取的硬盘功耗与实际硬盘功耗不一致。
问题产生条件:R4300 G5服务器接背板、硬盘,从HDM页面读取功耗。
新增功能
2.1 HDM-3.41版本硬件特性变更说明
R4900 G5新增option适配
支持Solidigm P5520 15.36T硬盘
支持长城2700W电源
支持IVA-CP24-VA卡
R4950 G5新增硬盘背板配置适配
只接后置4SFF UniBay硬盘背板的配置
升级建议
建议升级
解决问题
10.1 HDM-3.40版本解决问题列表
问题现象:R4900 G3服务器出现部分电源故障时,健康灯亮红灯,HDM页面无告警信息。
问题产生条件:R4900 G3服务器出现部分电源故障时。
问题现象:R4930 G5 H3服务器配置多块硬盘背板,主机启动过程中低概率出现HDM上报硬盘drive fault和missing告警日志。
问题产生条件:R4930 G5 H3服务器配置多块硬盘背板,主机启动过程中HDM低概率上报硬盘误告警。
问题现象:R5500 G5 执行fieldiag,概率性报错。
问题产生条件:R5500 G5 进行搭配HDM版本,带内执行fieldiag。
新增功能
2.1 HDM-3.40版本硬件特性变更说明
R4900 G5新增配置适配
支持双95系列阵列卡接12LFF+2SFF UniBay背板配置
支持9560-8i阵列卡接8UniBay配置
R4930 G5 H3新增option适配
NIC-ETH-3S930-LP-2*100G
R5500 G5新增option适配
NVIDIA A800 HGX 40G模组适配
升级建议
建议升级
解决问题
10.1 HDM-3.39版本解决问题列表
问题现象:服务器搭配25SFF背板,概率性出现Expander温感超温导致服务器异常关机。
问题产生条件:服务器搭配25SFF背板配置。
问题现象:HDM页面下删除原有逻辑盘并重新创建同样逻辑盘并设置初始化选项为FULL后,原有逻辑盘的系统及数据未被清除。
问题产生条件:HDM页面删除并创建逻辑盘并设置初始化选项为FULL。
问题现象:服务器搭配PMC卡时接入可显示寿命的SSD和NVME后部分SSD不显示剩余寿命信息。
问题产生条件:服务器搭配PMC卡。
问题现象:R6700 G3服务器上报内存故障时,日志中的内存槽位号显示异常。
问题产生条件:R6700 G3服务器CPU3上报内存故障。
问题现象:G3/G5设备搭配9500-8i+ 9300-8i等双LSI HBA卡配置时,概率出现误报Drive Fault报错。
问题产生条件:G3/G5设备搭配9500-8i+ 9300-8i等双LSI HBA卡配置概率出现。
问题现象:R4300 G3服务器使用3.37版本,HDM页面出现内存未认证的轻微告警。
问题产生条件:R4300G3 服务器使用3.37版本,接多根内存条,执行DC操作,概率出现HDM页面误报内存未认证告警。
问题现象:B460/B5700 G3机型搭配P5408阵列卡,阵列卡告警后上报的名称为R2140M。
问题产生条件:B460/B5700 G3搭配P5408阵列卡,触发阵列卡告警。
新增功能
2.1 HDM-3.39版本硬件特性变更说明
R5300 G5新增option适配
Nvidia H800 GPU适配
Nvidia L40S GPU适配
RG800 Pro GPU适配
R4930 G5(H3)新增option适配
GPU-RG800-32GB-FHFL适配
25SFF硬盘背板PCA-BP-25SFF-2U-G5搭配NVME硬盘的配置
R4950 G5新增option适配
UN-RC-2FHFL-R3-2U-G5 适配
升级建议
建议升级
解决问题
10.1 HDM-3.38.01版本解决问题列表
202307180160
问题现象:R4900 G3搭配LSI RAID卡,Ucenter低概率出现上报逻辑盘为Unknow状态。
问题产生条件:R4900 G3搭配LSI RAID卡低概率出现。
问题现象:R4900 G3搭配24NVMe配置,在【存储管理】/【物理视图】页签会多显示硬盘在位信息。
问题产生条件:R4900 G3搭配24NVMe配置。
202307120329
问题现象:R4300 G5搭配多盘的配置时,SNMP WALK获取硬盘信息响应时间较慢。
问题产生条件:R4300 G5搭配多盘配置。
202308070270
问题现象:G3/G5设备搭配9500-8i+ 9300-8i等双LSI HBA卡配置时,概率出现误报Drive Fault报错。
问题产生条件:G3/G5设备搭配9500-8i+ 9300-8i等双LSI HBA卡配置概率出现。
202307240022
问题现象:R5500K搭配OCP网卡在压力测试后重启,批量报OCP过温。
问题产生条件:R5500K搭配OCP网卡,执行压力测试,随后执行DC重启。
202307192176
问题现象:R5500G5机型搭配332A网卡,散热存在问题。
问题产生条件:R5500G5机型,搭配332A智能网卡,进入FAKE S5。
新增功能
2.1 HDM-3.38.01版本硬件特性变更说明
R4900 G5新增option适配
无镁光芯片H460-B1阵列卡适配
无镁光芯片H460-M1阵列卡适配
升级建议
建议升级
解决问题
10.1 HDM-3.38版本解决问题列表
202306062143
问题现象:R4900 G5搭配使用QLE2692卡开启MCTP通道时,出现风扇间歇性声音大。
问题产生条件:R4900 G5搭配使用QLE2692卡开启MCTP通道。
202306051211
问题现象:R5500G5 Intel概率出现HDM使用率过高。
问题产生条件:HDM升级、重启或者执行配置导入导出动作后。
202306190034
问题现象:R4930 G5 H3配置双转子高性能风扇,在单个转子出现故障情况下,事件日志会上报告警,但是风扇的健康状态仍正常。
问题产生条件:R4930 G5 H3配置双转子高性能风扇,单个转子出现故障。
新增功能
2.1 HDM-3.38版本硬件特性变更说明
无
升级建议
建议升级
解决问题
10.1 HDM-3.37.01版本解决问题列表
202306200181
问题现象:R4300 G5搭配9300阵列卡出现概率性转速超过90%的情况。
问题产生条件:R4300 G5搭配9300阵列卡概率性出现。
202306240148
问题现象:R4900 G5使用4GPU Riser,搭配PMC卡,存储页面不显示PMC卡信息。
问题产生条件:R4900 G5使用4GPU Riser,搭配PMC卡插在槽位3位置。
202306020382
问题现象: G5 Intel机型增加内存未认证告警。
问题产生条件:G5 Intel机型针对未通过H3C认证的内存增加内存未认证告警。
202302231383
问题现象: R4300 G5搭配24LFF背板,概率性出现误报硬盘丢失。
问题产生条件:R4300 G5搭配24LFF背板概率性出现。
202305221785
问题现象: R4900 G5搭配LSI阵列卡,出现部分硬盘型号显示和实际不符的情况。
问题产生条件:R4900 G5搭配LSI阵列卡。
202306020141
问题现象:R4900 G5通过Redfish创建逻辑盘,创建成功时返回的响应体中Message拼写错误。
问题产生条件:通过Redfish创建逻辑盘。
新增功能
2.1 HDM-3.37.01版本硬件特性变更说明
R4900 G5新增option适配
遂原I20 GPU适配
升级建议
建议升级
解决问题
10.1 HDM-3.36.01版本解决问题列表
202306020170
问题现象:R4300 G3服务器搭配0302A6MQ背板使用时存在概率性上报Front 9槽位的drive fault。
问题产生条件:R4300 G3服务器搭配0302A6MQ背板概率性出现。
新增功能
2.1 HDM-3.36.01版本硬件特性变更说明
R5500K新增option适配
MBF2H536C-CEUOT适配
升级建议
建议升级
解决问题
10.1 HDM-3.36版本解决问题列表
202305061271
问题现象:R4900 G5搭配LSI阵列卡,LSI阵列卡在正常使用过程中出现了故障后未上报告警。
问题产生条件:R4900 G5搭配故障LSI阵列卡。
202207020216
问题现象:G5机型无法区分因故障被禁用的内存和因POR规则被禁用的内存。
问题产生条件:G5机型存在无法区分内存被禁用的原因,修改后可在内存页面查看禁用原因。
202304190418
问题现象:R4900 G5服务器添加内存后多台服务器显示为非认证内存。
问题产生条件:R4900 G5机型添加内存后低概率出现。
202304140556
问题现象:R6900 G5服务器机器风扇声音大,调速异常。
问题产生条件:R6900 G5机型在运行时CPU温度波动较大时会出现。
202305120122
问题现象:HDM vnc配置连接后,滑动滚轮变成右键功能。
问题产生条件:HDM配置vnc连接后存在该现象。
202305130354
问题现象:R4950 G5 Milan机型出现IF BANK类型故障,事件日志中显示的故障类型为Unknown。
问题产生条件:R4950 G5 Milan机型出现IF BANK类型故障。
新增功能
2.1 HDM-3.36版本硬件特性变更说明
R4900 G5新增option适配
ScaleFlux CSD3000
L4 GPU
BCM957416N4160C
升级建议
建议升级
解决问题
10.1 HDM-3.35.11版本解决问题列表
202303260045
问题现象:R4900 G5搭配多张R200 GPU后SN显示重复。
问题产生条件:R4900 G5搭配多张R200 GPU后可复现。
新增功能
2.1 HDM-3-35.11版本硬件特性变更说明
无
升级建议
建议升级
解决问题
10.1 HDM-3.34.01版本解决问题列表
202303291487
问题现象:升级3.33版本后HDM页面上560F网卡网口链接状态信息无法正常显示。
问题产生条件:使用3.33版本搭配560网卡网卡会出现。
新增功能
2.1 HDM-3.34.01版本硬件特性变更说明
无
3.1 HDM-3.34.01
无
升级建议
建议升级
解决问题
无
新增功能
无
版本:3.32(2023/1/18)
升级建议
建议升级
解决问题
10.1 HDM-3.32版本解决问题列表
无
新增功能
2.1 HDM-3.32版本硬件特性变更说明
R4900 G5新增option适配
大普微硬盘
R5300 G5新增option适配
GPU-BR104P-32GB
R4930 G5 H3新增option适配
NIC-ETH-SF400T-LP-4PGE
3.1 HDM-3.32
无
升级建议
建议升级
解决问题
10.1 HDM-3.31版本解决问题列表
1. 202210310602
问题现象:服务器配置两张LSI阵列卡,其中一张是HBA-LSI-9400,主机执行重启操作,概率性出现HBA-LSI-9400卡管理的所有硬盘误报Drive Fault和Disk is missing告警。
问题产生条件:服务器配置两张LSI阵列卡,其中一张是HBA-LSI-9400,主机执行重启操作。
2. 202212010962
问题现象:服务器配置一张或多张阵列卡和不带扩展芯片的硬盘背板,在主机先出现阵列卡掉卡,然后主机重启后重新识别到阵列卡的情况下,大概率出现硬盘误报Drive Fault和Disk is missing告警。
问题产生条件:服务器配置一张或多张阵列卡和不带扩展芯片的硬盘背板,主机先出现阵列卡掉卡,然后主机重启后重新识别到阵列卡。
新增功能
2.1 HDM-3.31版本硬件特性变更说明
R4900 G5新增option适配
U55C赛灵思FPGA卡
R4930 G5 H3新增option适配
GPU-Z100-16G-FHFL
GPU-Atlas 300I Pro-24G-LP
RR5300 G5新增option适配
GPU-Z100L-32G-FHFL
16G EF-I20 GPU
3.1 HDM-3.31
无
升级建议
建议升级
解决问题
10.1 HDM-3.30版本解决问题列表
1.
问题现象:R6900 G5冷重启过程中概率报错8Unibay上的所有硬盘报错driver fault。
问题产生条件:R6900 G5机型使用25SFF搭配其他非25SFF背板时概率性出现。
2.
问题现象:R8900 G3 AC reboot过程中上报“Transition toNon-recoverable from less severe---System detected a power supply failure onCMOD2.”日志。
问题产生条件:R8900机型搭配G3-RS3M9PWF-1200W交流电源模块做AC重启后概率性出现。
3.
问题现象:R4900 G3 HDM上报的故障日志和解除日志部分信息不一致导致华为esight监控软件不解除故障。
问题产生条件:触发“Bus Uncorrectable Error”日志后可复现
4.
问题现象:R4900 G3服务器配置LSI-9460-8i阵列卡HDM上报电池告警日志“BBU is Miss”。
问题产生条件: 阵列卡FW版本与系统内阵列卡驱动不匹配会概率性出现。
5.
问题现象:R4900 G3使用3.10版本在逻辑盘重建的时候,会概率上报硬盘in critical array告警,随后解除。
问题产生条件: 使用3.10到2.98间的版本,逻辑盘在进行重建时概率性出现。
新增功能
2.1 HDM-3.30版本硬件特性变更说明
R4900 G5新增option适配
UH711a、UH610a、UH630a硬盘适配
华为1300W电源适配
R5300 G5新增option适配
灵犀 GPU-HP300-8GB
R5500 G5 intel、R5500 G5 AMD新增OPTION适配
Nvidia A800 8-GPU 80GB GPU模块(PG506)
3.1 HDM-3.30
无
升级建议
建议升级
解决问题
1.
问题现象:R4900G3产生IERR告警时故障会指向主板和内存,指向不明确。
问题产生条件:触发DCU Poison error故障。
2.
问题现象:R4930 G5 H3主机BIOS启动过程中,HDM事件日志低概率出现FRB2看门狗告警,同时BIOS会自动重启,重启后业务功能正常。
问题产生条件:R4930 G5 H3主机BIOS启动过程中低概率出现。
新增功能
无
无
升级建议
建议升级
解决问题
无。
新增功能
无
无
升级建议
建议升级
解决问题
1.
问题现象:R4300 G3服务器前部接24LFF背板配置条件下概率性出现HDM误报Drive Fault,部分硬盘上报更换日志。
问题产生条件:配置前部24LFF背板。
2.
问题现象:R6900 G3服务器操作共享口反复up/down,会导致服务器风扇异响。
问题产生条件:操作共享口反复up /down。
3.
问题现象:R4900 G5服务器配置阵列、拔盘测试,HDM界面不同步信息。
问题产生条件:R4900 G5启动模式由UEFI 切换至Legacy配置逻辑盘信息,重启BIOS进入Legacy setup,HDM存储页签不更新配置逻辑盘信息。
4.
问题现象:R4900 G3服务器开机状态下频繁触发上报事件日志,在后触发的新事件日志时, test.csv不记录SEL日志。
问题产生条件:R4900 G3开机状态下频发触发上报事件日志。
5. 202207211044
问题现象:对R4950 G5主机进行内存CE注错测试,会导致操作系统死机,同时HDM出现异常重启。
问题产生条件:对R4950 G5主机进行内存CE注错测试。
新增功能
无
新增特性:
对于主板主逻辑芯片为紫光同创型号的产品,支持通过HDM在线升级主逻辑固件版本。
升级建议
建议升级
解决问题
1.
问题现象:R5500 G5 intel/AMD 服务器风扇模式默认配置为静音模式,服务器在高负载业务运行过程中,概率性出现HDM事件日志上报GPU过温告警现象。
问题产生条件:R5500 G5 intel/AMD 服务器风扇模式默认配置为静音模式,服务器在高负载业务运行过程中。
2.
问题现象:服务器在持续运行一段时间之后低概率出现无法下载SDS日志,当下载SDS日志时,HDM页面提示“所选时间段内没有SDS日志”的报错现象。
问题产生条件:服务器持续运行一段时间。
3.
问题现象:检测到HDM可能存在缓慢的HTTP拒绝服务攻击。
问题产生条件:无。
4.
问题现象:设备配置LSI Raid卡,运行中概率性会误报”Drive Fault”与”Disk missing”,上报的物理盘槽位不固定,告警会多次触发解除。
问题产生条件:设备配置LSI Raid卡。
5.
问题现象: HDM 配置VLAN,并且收到的网络报文中,报文头中宣称的长度与实际长度不同时,会概率性出现HDM无法连接情况。
问题产生条件:无。
6.
问题现象:R8900 G3服务器历史功率曲线记录的最高功率信息出现毛刺点,超出了设备的正常功率范围。
问题产生条件:无
7.
问题现象:当网络环境较差,使用WEB页面进行升级固件,页面概率性会提示提示当前用户没有权限进行升级。
问题产生条件:当网络环境较差,使用WEB页面进行升级固件。
8.
问题现象:CVE-2021-41617/CVE-2016-20012。
问题产生条件:OpenSSH存在安全漏洞。该漏洞源于允许权限提升,因为补充组未按预期初始化/OpenSSH 8.7之前版本存在安全漏洞,允许远程攻击者怀疑 SSH 服务器知道用户名和公钥的特定组合,以测试这种怀疑是否正确。 发生这种情况是因为仅当该组合对登录会话有效时才会发送质询。
新增功能
无
新增特性:
对于支持背板逻辑固件升级的产品,新增支持通过HDM在线升级逻辑芯片为紫光同创型号的背板逻辑固件版本。
升级建议
建议升级
解决问题
1.
问题现象:R5300 G5服务器未配置GPU卡,风扇转速过高,接近满转。
问题产生条件:R5300 G5服务器未配置GPU卡。
2.
问题现象:R5500 G5 intel 服务器电源功耗较高时,HDM事件日志概率性上报“Exceeded the upper minor threshold”电源告警。
问题产生条件:R5500 G5 intel 服务器电源功耗较高时,HDM事件日志概率性上报电源告警。
3.
问题现象:B5700 G5 节点服务器配置在B16000 刀箱中,正常环境温度运行时,风扇转速较高,B5700 G5 节点服务器风扇调速策略待优化。
问题产生条件:B5700 G5 节点服务器配置在B16000 刀箱中,正常环境温度运行时,风扇转速较高。
4.
问题现象:监控平台通过wsman协议访问HDM,造成HDM WEB页面无法登录。
问题产生条件:监控平台通过wsman协议访问HDM。
5.
问题现象:INTEL平台设备经过强制覆盖升级BIOS,再导入HDM配置(配置中功率封顶关闭),然后再AC下电再上电或者系统重启在初始化阶段时候重启HDM,会打开设备的功率封顶功能。
问题产生条件:INTEL平台经过强制覆盖升级BIOS,再导入HDM配置(配置中功率封顶关闭),然后再AC下电再上电或者系统重启再初始化阶段时候重启HDM 。
6.
问题现象: R4900 G5设备设置BIOS超线程的IPMI命令参数修改,保持与G3设备设置参数一致。
问题产生条件:R4900 G5使用IPMI命令设置BIOS超线程 。
7.
问题现象: R4900 G5服务器,使用12LFF(8*SATA/SAS+4*UniBay(SATA/SAS/NVMe),0302A5DA)背板,NVMe硬盘由主板SlimSAS接口控制,HDM界面无法显示NVMe硬盘信息。
问题产生条件:R4900 G5服务器,使用12LFF(8*SATA/SAS+4*UniBay(SATA/SAS/NVMe),0302A5DA)背板,NVMe硬盘由主板SlimSAS接口控制。
新增功能
无
无
升级建议
建议升级
解决问题
无
新增功能
无
升级建议
可选升级
解决问题
13.1 HDM-3.10版本解决问题列表
1.
问题现象:R4950 G5服务器配置2个电源模块,在主机开机情况下,将2个电源模块依次断电,HDM事件日志会误报Board found PSU output can't be enabled。
问题产生条件:R4950 G5服务器配置2个电源模块,在主机开机情况下,将2个电源模块依次断电。
2.
问题现象:R4930 G5产品配置5系CPU和后部NVME硬盘情况下,HDM的存储信息界面会在不同的槽位下显示同一块NVME硬盘的信息。
问题产生条件:R4930 G5产品配置5系CPU和后部NVME硬盘。
3.
问题现象:服务器配置了Intel CPU,出现内存Uncorrected Error(UCE)故障时,HDM系统健康日志上报的故障类型未区分Fatal/Recoverable/Correct 类型的故障。
问题产生条件:服务器配置了Intel CPU,并出现内存Uncorrected Error(UCE)故障。
4.
问题现象:服务器处于主机状态为开机,使用IPMI命令获取到的主机状态为关机。
问题产生条件:服务器处于主机状态为开机,使用IPMI命令尝试获取主机状态。
新增功能
5.1 HDM-3.10版本硬件特性变更说明
R4930 G5新增option适配:
SSD-3.2T-NVMe-D6456
SSD-6.4T-NVMe-D6456
SSD-3.84T-NVMe-D6436
SSD-7.68T-NVMe-D6436
NIC-ETH-RP2000-LP-2P10G
R5500 G5新增option适配:
IB-P23644-B21-200Gb-1P
R5300 G5新增option适配:
PCIE_EF_T20_64G_TYPE GPU卡
PCIE_EF_I20_16G_TYPE GPU卡
PCIE_EF_I10_16G_TYPE GPU卡
P5520 硬盘
MBF2H516C-CESOT 网卡
NIC-MCX683105AN-HDAT-1*200G网卡
6.1 HDM-3.10
无
升级建议
可选升级
解决问题
13.1 HDM-2.99版本解决问题列表
1.
问题现象:R4900 G3服务器出现内存Uncorrected Error(UCE)故障时,HDM系统健康日志上报的故障类型未体现该故障是否可恢复。
问题产生条件:R4900 G3服务器出现Uncorrected Error(UCE)故障。
新增功能
5.1 HDM-2.99版本硬件特性变更说明
R4900 G3新增option适配:
NIC-BCM95719A1904AC-LP-4P
R5300 G5新增option适配
A6000_TYPE
R5500 G5新增option适配:
P23644-B21-200Gb
R5500 G3新增长城2000W电源适配:
CRPS2000
X10828 G5/X10536H G5/X10516H G5/X10828 G5新增背板适配:
4SFF Unibay硬盘背板
X10516H G5 X10536H G5 10536H G5 新增背板适配:
2LFF SAS/SATA 硬盘背板
X10536H G5新增背板适配:
12LFF SAS/SATA硬盘背板
X10536H G5新增背板适配:
24LFF SAS/SATA 硬盘背板
18SFF SAS/SATA+6LFF Unibay硬盘背板
X10828 G5新增背板适配:
2SFF Unibay硬盘背板
6.1 HDM-2.99
无
升级建议
可选升级
解决问题
13.1 HDM-2.98版本解决问题列表
1. 202203050362
问题现象:R4950 G5主机配置Milan CPU,当CPU工作过程中发生LS-HWA故障时,HDM无法检测该故障并上报告警日志。
问题产生条件:R4950 G5主机配置Milan CPU,CPU工作过程中发生LS-HWA故障。
2. 202201210384
问题现象:R4950 G5主机在特定情况下,由于主板硬件故障导致一次电源无输出,HDM无法检测该故障并上报告警日志。
问题产生条件:R4950 G5主机在特定情况下,由于主板硬件故障导致一次电源无输出。
新增功能
5.1 HDM-2.98版本硬件特性变更说明
R4900 G3新增option适配:
DERA D527 1.92T
6.1 HDM-2.98
无
升级建议
建议升级
解决问题
13.1 HDM-2.97.03版本解决问题列表
1. 202203110599
问题现象:HDM恢复出厂设置后,功率封顶会启用,功率封顶值设为500W。
问题产生条件:HDM恢复出厂设置。
新增功能
5.1 HDM-2.97.03版本硬件特性变更说明
无
6.1 HDM-2.97.03
无
升级建议
建议升级
解决问题
13.1 HDM-2.93版本解决问题列表
1. 202112241261
问题现象:R4900 G3/R4300 G3/R6700 G3配置了PMC卡,PMC卡工作异常,HDM没有检测到异常并上报SEL日志。
问题产生条件:R4900 G3/R4300 G3/R6700 G3配置了PMC卡,PMC卡工作异常。
2. 202112280415
问题现象:R4900 G3/R5300 G3/R5300 G5/R5500 G5 AMD/R5500 G5 Intel配置了支持NVLINK检测功能的GPU,HDM上报NVLINK CRC故障的SEL日志。
问题产生条件:R4900 G3/R5300 G3/R5300 G5/R5500 G5配置了支持NVLINK检测功能的GPU。
3. 202201051030
问题现象:R5300 G3 配置支持8张GPU的GPU节点板,节点板的VR电源存在DRMOS烧毁。
问题产生条件:R5300 G3 配置支持8张GPU的GPU节点板。
新增功能
5.1 HDM-2.93版本硬件特性变更说明
R5300 G5新增option适配:
GPU-BI-V100-32G
6.1 HDM-2.93
无
升级建议
建议升级
解决问题
13.1 HDM-2.92版本解决问题列表
无
新增功能
5.1 HDM-2.92版本硬件特性变更说明
无。
6.1 HDM-2.92
新增特性:
对于支持背板逻辑固件升级的产品,新增支持通过HDM在线升级逻辑芯片为紫光同创型号的背板逻辑固件版本。
升级建议
建议升级
解决问题
13.1 HDM-2.87版本解决问题列表
1. 202109020462
问题现象:当主板的主逻辑芯片为紫光同创型号时,无法通过HDM在线升级主逻辑固件版本。
问题产生条件:主板的主逻辑芯片为紫光同创型号。
新增功能
5.1 HDM-2.87版本硬件特性变更说明
R4900/R4700/R2900/R2700 G3新增option适配:
Mlom网卡 RS33NGT4MB
6.1 HDM-2.87
新增特性:
对于主板主逻辑芯片为紫光同创型号的产品,支持通过HDM在线升级主逻辑固件版本。
升级建议
建议升级
解决问题
13.1 HDM-2.86版本解决问题列表
1. 202111250465
问题现象:S4703/S2703 G5机型,安装OCP网卡NIC-ETH-MCX623436AN-CDAB-2P,使用过程现网卡过温告警。
问题产生条件:S4703/S2703 G5机型,安装OCP网卡NIC-ETH-MCX623436AN-CDAB-2P。
2. 202111121522
问题现象:R5300 G3机型,安装HBA-LSI-9311-8i-A1-X卡,在OS下安装RAID卡驱动过程中,概率出现HDM无法读取存储卡和硬盘信息。
问题产生条件:R5300 G3机型,安装HBA-LSI-9311-8i-A1-X卡,在OS下安装RAID卡驱动。
3. 202110141209
问题现象:安装英伟达GPU卡,HDM Web PCIe页面,GPU部件号显示与OS下获取英伟达部件号不一致。
问题产生条件:安装英伟达GPU卡。
4. 202111050263
问题现象:开启功率封顶时导入功率封顶关闭的配置,功率封顶功能概率性设置失败,仍为开启,HDM重启后会发生宕机。
问题产生条件:开启功率封顶时导入功率封顶关闭的配置。
新增功能
5.1 HDM-2.86版本硬件特性变更说明
R5300 G5新增option适配:
KIOXIA 1.92T/3.84T/7.68T NVMe盘
R4930 G5新增option适配:
NIC-MCX4121A-F-B-25Gb-2P
6.1 HDM-2.86
新增特性:
增加设置存储热备盘功能,当配置LSI或PMC存储控制卡时,能够通过HDM对存储控制卡下物理盘设置热备状态。
升级建议
建议升级
解决问题
13.1 HDM-2.78版本解决问题列表
无。
新增功能
5.1 HDM-2.78版本硬件特性变更说明
R4900 G5 新增option适配:
网卡IB-MCX653105A-HDAT-200G-1P
6.1 HDM-2.78
无
升级建议
建议升级
解决问题
13.1 HDM-2.76版本解决问题列表
1. 202108251029
问题现象: RAID卡下硬盘组建逻辑盘,逻辑盘出现降级,然后再恢复,这个过程产生的告警触发日志和告警解除日志时间上存在错乱。
问题产生条件: RAID卡下硬盘组建逻辑盘,逻辑盘出现降级,然后再恢复。
2. 202108300061
问题现象: Fru信息读取失败时,BMC_Self_Test传感器显示状态异常,但是没有上报相关事件日志。
问题产生条件:Fru信息读取失败。
3. 202108300356
问题现象:HDM页面的syslog设置中的告警日志主机标识缺少主机序列号。
问题产生条件:在syslog设置中设置告警日志主机标识为主机序列号。
4. 202105130683
问题现象:R6900 G3设备,同一硬盘温感传感器下硬盘都不在位,会导致风扇转速高。
问题产生条件:R6900 G3设备,同一硬盘温感传感器下硬盘都不在位。
5. 202108310746
问题现象:使用duid作为分配地址的依据,给HDM下发地址,在BOND下DHCP v6无法获取IPV6地址,HDM 重启之后可以正常获取IPV6,但是插拔专用口网线之后IPV6就会丢失。
问题产生条件:使用duid下发HDM地址。
6. 202107130260
问题现象:HDM解析出的故障PCIe槽位没有插PCIe卡时,会导致健康灯亮,但是HDM页面显示正常;
问题产生条件:HDM解析出的故障PCIe槽位没有插PCIe卡。
新增功能
5.1 HDM-2.76版本硬件特性变更说明
R4900G3新增option适配:
NIC-MCX512A-ACUT-2*25Gb Mellanox
R6900 G5 新增option适配:
长城1300W电源GW-CRPS1300D3
长城1600W电源GW-CRPS1600D2
R4900 G5 新增option适配:
GPU卡GPU_BAIDU_R200
R5300 G3 新增option适配:
GPU卡 GPU-RTX6000B-24G
R5300 G5新增option适配:
RAID卡 RAID-P4408-MR-8i-2GB
NIC-MCX623430MS-CDAB-2*100G
R5500 G5新增option适配:
NIC-MCX653106A-HDAT-2*200G
R4950 G5新增option适配:
SSD-3.84T-NVMe-PE8010
GPU-A6000
R4930 G5新增option适配:
FAN-6056-2U-G5
6.1 HDM-2.76
无
升级建议
建议升级
解决问题
13.1 HDM-2.70版本解决问题列表
1. 202108040539
问题现象:R6900 G3服务器对于POST阶段发生的内存故障的日志没有展示槽位号。
问题产生条件:R6900 G3服务器在POST阶段发生的内存故障。
2. 202107301491
问题现象:X10529/X10529F G3服务器,通过IPMI命令对后部2LFF背板硬盘点灯失败。
问题产生条件:X10529/X10529F G3服务器,通过IPMI命令对后部2LFF背板硬盘点灯。
3. 202107280119
问题现象:R5500 G5服务器,主机重启,概率出现风扇转速为0情况。
问题产生条件:R5500 G5服务器,主机重启。
新增功能
5.1 HDM-2.70版本硬件特性变更说明
R4900G3新增option适配:
阿里定制三星PM9A3 NVMe盘(960G)
阿里定制三星PM9A3 NVMe盘(1.92T)
阿里定制三星PM9A3 NVMe盘(7.68T)
R5300 G5新增option适配:
A100-PCIe-80GB GPU卡
R4900 G5 新增option适配:
RD-4NVMe-G5 Redriver卡
长城800W电源GW-CRPS800N2
长城1300W电源GW-CRPS1300D3
长城1600W电源GW-CRPS1600D2
6.1 HDM-2.70
无
升级建议
建议升级
解决问题
13.1 HDM-2.60版本解决问题列表
1. 202107130260
问题现象:对于R4950 G5机型,当HDM解析出某槽位的PCIE设备存在故障,但是该槽位实际上并未插PCIE设备时,健康灯橙色闪烁,HDM页面显示的健康状态却为正常。
问题产生条件:R4950 G5机型,HDM解析出某槽位的PCIE设备存在故障,但是该槽位实际上并未插PCIE设备。
2. 202105280659
问题现象:在三层组网情况下,开启网口自适应模式后,会导致HDM的IPv6静态地址无法访问。
问题产生条件:在三层组网情况下,开启网口自适应模式。
3. 202106100459
问题现象:用户登录HDM,关闭网页或拔掉网线,使用IPMI命令修改用户信息时,上报失败。
问题产生条件:用户登录HDM,关闭网页或拔掉网线,用IPMI命令修改该用户的信息。
4. 202106020728
问题现象:设备配置了PMC阵列卡和硬盘扩展板,概率性出现硬盘预报错槽位信息不准。
问题产生条件:设备配置了PMC阵列卡和硬盘扩展板。
新增功能
5.1 HDM-2.60版本硬件特性变更说明
R4900G3新增option适配:
8SFF G3硬盘背板备份板
12LFF EXP G3硬盘背板备份板
620F网卡改版卡
R5300 G3 新增option适配:
RTX 3070 GPU
R5500 G5 AMD新增option适配:
NIC-BCM957508-P2100G-2P网卡
NIC-BCM957414N4140C-3S-2P网卡
R4930 G5 新增option适配:
NIC-ETH-XL710-LP-10G-4P网卡
6.1 HDM-2.60
无
升级建议
建议升级
解决问题
13.1 HDM-2.57版本解决问题列表
1. 202106300095
问题现象:安装了NIC-ETH-X2522-25Gb-2P网卡,HDM会上报“BMC read fru failed”轻微告警日志。
问题产生条件:安装了NIC-ETH-X2522-25Gb-2P网卡。
新增功能
5.1 HDM-2.57版本硬件特性变更说明
R5300 G3 新增option适配:
RTX3070 GPU卡
R4900 G5 新增option适配:
SSD-7.68T-NVMe-D5437-UCC
6.1 HDM-2.57
新增特性:
R5500 G5 GPU功率封顶特性,参见《H3C服务器 HDM用户指南》5.3.7章节
上报主机串口日志特性,参见《H3C服务器 HDM用户指南》8.4.4章节
R5500 FAN MCU固件升级特性,参见《H3C服务器 HDM用户指南》8.6.11章节
HDM联合iFIST固件带外升级特性,参见《H3C服务器 HDM用户指南》8.6.12章节
SSH免密登录特性,参见《H3C服务器 HDM用户指南》9.1章节
用户自定义权限角色组名称修改特性,参见《H3C服务器 HDM用户指南》9.1.3章节