12-监控告警
本章节下载: 12-监控告警 (1.84 MB)
目 录
本功能用于帮助用户快速直观地了解集群、节点池、硬盘池、Pool信息、存储卷、文件存储、对象存储以及主机和硬盘的运行状态。监控内容包含最为常用的IOPS、OPS、带宽、时延和负载等信息,以及整体业务的详细信息。
单击导航树中的[监控报表]菜单项进入监控报表页面,该页面的布局如图12-1所示,页面各区域的说明如表12-1所示。鼠标移到对应区域,页面上将显示该区域对应时间点的状态信息。
序号 |
名称 |
说明 |
1 |
图表页签 |
通过选中相应的页签,显示对应的图表 |
2 |
图表过滤选项 |
通过单击相应的按钮,显示或隐藏相应的图表 |
3 |
主机和时间选项 |
通过选择相应的主机和时间段,显示相应的信息, 其时间可选择设定好的时间段,也可进行自定义 |
4 |
信息过滤选项 |
通过单击相应的图表,显示或隐藏图表中相应的信息 |
5 |
详情按钮 |
通过单击此按钮,查看主机上所有硬盘的详细信息 |
6 |
图表 |
图表的主体部分 |
7 |
区域缩放 |
时间选取范围超过1小时,可通过缩放移动时间轴查看1小时前的数据信息 |
8 |
刷新 |
通过单击此按钮,获取当前页面所有图表的即时数据信息 |
选择“集群”页签,进入集群监控报表页面,如图12-2所示。该页面显示集群整体信息。
表12-2 部分参数说明
参数 |
说明 |
存储读IOPS |
集群每秒进行读操作的次数 |
存储写IOPS |
集群每秒进行写操作的次数 |
存储恢复OPS |
集群每秒恢复的对象个数 |
文件读OPS |
NFS、CIFS、FTP每秒进行读操作次数的总和 |
文件写OPS |
NFS、CIFS、FTP每秒进行写操作次数的总和 |
存储读带宽 |
集群每秒完成读操作的数据量 |
存储写带宽 |
集群每秒完成写操作的数据量 |
存储恢复带宽 |
集群每秒完成恢复的数据量 |
文件读带宽 |
NFS、CIFS、FTP每秒完成读操作的数据量的总和 |
文件写带宽 |
NFS、CIFS、FTP每秒完成写操作的数据量的总和 |
存储读流量 |
集群采样周期(30s)完成读操作的数据量 |
存储写流量 |
集群采样周期(30s)完成写操作的数据量 |
存储恢复流量 |
集群采样周期(30s)完成恢复的数据量 |
文件读流量 |
NFS、CIFS、FTP采样周期(30s)完成读操作的数据量的总和 |
文件写流量 |
NFS、CIFS、FTP采样周期(30s)完成写操作的数据量的总和 |
数据盘读时延 |
集群内所有数据盘进行读操作时的平均延时时间 |
数据盘写时延 |
集群内所有数据盘进行写操作时的平均延时时间 |
数据盘平均负载 |
集群内所有数据盘IO负载的平均值 |
数据盘最大负载 |
集群内所有数据盘IO负载的最大值 |
选择“节点池”页签,进入节点池监控报表页面,如图12-3所示。该页面显示节点池信息。
表12-3 部分参数说明
参数 |
说明 |
存储读IOPS |
节点池每秒进行读操作的次数 |
存储写IOPS |
节点池每秒进行写操作的次数 |
存储读带宽 |
节点池每秒完成读操作的数据量 |
存储写带宽 |
节点池每秒完成写操作的数据量 |
选择“硬盘池”页签,进入硬盘池监控报表页面,如图12-4所示。该页面显示硬盘池信息。
表12-4 部分参数说明
参数 |
说明 |
存储读IOPS |
硬盘池每秒进行读操作的次数 |
存储写IOPS |
硬盘池每秒进行写操作的次数 |
存储读带宽 |
硬盘池每秒完成读操作的数据量 |
存储写带宽 |
硬盘池每秒完成写操作的数据量 |
存储恢复带宽 |
硬盘池每秒完成恢复的数据量 |
选择“Pool信息”页签,进入Pool信息监控报表页面,如图12-5所示。该页面显示存储池信息。
图12-5 Pool信息监控报表
表12-5 部分参数说明
参数 |
说明 |
存储读IOPS |
存储池每秒进行读操作的次数 |
存储写IOPS |
存储池每秒进行写操作的次数 |
存储读带宽 |
存储池每秒完成读操作的数据量 |
存储写带宽 |
存储池每秒完成写操作的数据量 |
选择“文件存储”页签,进入文件存储监控报表页面,如图12-6所示。该页面显示文件存储信息。
表12-6 部分参数说明
参数 |
说明 |
已用空间 |
当前已使用的空间占总空间的百分比。鼠标指向后可显示具体容量数值 |
空闲空间 |
当前剩余可用空间占总空间的百分比。鼠标指向后可显示具体容量数值 |
已用目录数 |
/NAS/CAPFS/data目录下的总目录数 |
已用文件数 |
/NAS/CAPFS/data目录下的总文件数 |
文件读OPS |
NFS、CIFS、FTP每秒进行读操作次数的总和 |
文件写OPS |
NFS、CIFS、FTP每秒进行写操作次数的总和 |
NFS读OPS |
NFS每秒进行读操作的次数 |
NFS写OPS |
NFS每秒进行写操作的次数 |
CIFS读OPS |
CIFS每秒进行读操作的次数 |
CIFS写OPS |
CIFS每秒进行写操作的次数 |
FTP读OPS |
FTP每秒进行读操作的次数 |
FTP写OPS |
FTP每秒进行写操作的次数 |
文件读带宽 |
NFS、CIFS、FTP每秒完成读操作的数据量的总和 |
文件写带宽 |
NFS、CIFS、FTP每秒完成写操作的数据量的总和 |
NFS读带宽 |
NFS每秒完成读操作的数据量 |
NFS写带宽 |
NFS每秒完成写操作的数据量 |
CIFS读带宽 |
CIFS每秒完成读操作的数据量 |
CIFS写带宽 |
CIFS每秒完成写操作的数据量 |
FTP读带宽 |
FTP每秒完成读操作的数据量 |
FTP写带宽 |
FTP每秒完成写操作的数据量 |
选择“存储卷”页签,进入存储卷监控报表页面,若图12-7所示。该页面显示存储卷信息。
表12-7 部分参数说明
参数 |
说明 |
存储读IOPS |
存储卷每秒进行读操作的次数 |
存储写IOPS |
存储卷每秒进行写操作的次数 |
存储卷读带宽 |
存储卷每秒完成读操作的数据量 |
存储卷写带宽 |
存储卷每秒完成写操作的数据量 |
读时延 |
存储卷进行读操作的平均时延时间 |
写时延 |
存储卷进行写操作的平均时延时间 |
读IO |
存储卷内所有数据盘进行读操作的平均IO大小 |
写IO |
存储卷内所有数据盘进行写操作的平均IO大小 |
选择“对象存储”页签,进入对象存储监控报表页面,若图12-8所示。该页面显示对象存储信息。
表12-8 部分参数说明
参数 |
说明 |
读带宽 |
对象网关每秒完成读操作的数据量 |
写带宽 |
对象网关每秒完成写操作的数据量 |
读时延 |
对象网关进行读操作的平均时延时间 |
写时延 |
对象网关进行写操作的平均时延时间 |
选择“主机管理”页签,进入主机监控报表页面,若图12-9所示。该页面显示主机信息。
表12-9 部分参数说明
参数 |
说明 |
数据盘读IOPS |
主机内所有数据盘每秒进行读操作的次数总和,可单击<详情>按钮查看主机内各磁盘读IOPS |
数据盘写IOPS |
主机内所有数据盘每秒进行写操作的次数总和,可单击<详情>按钮查看主机内各磁盘写IOPS |
文件读OPS |
NFS、CIFS、FTP每秒进行读操作次数的总和 |
文件写OPS |
NFS、CIFS、FTP每秒进行写操作次数的总和 |
数据盘读带宽 |
主机内所有数据盘每秒完成读操作的数据量总和,可单击<详情>按钮查看主机内各磁盘读带宽 |
数据盘写带宽 |
主机内所有数据盘每秒完成写操作的数据量总和,可单击<详情>按钮查看主机内各磁盘写带宽 |
文件读带宽 |
NFS、CIFS、FTP每秒完成读操作的数据量的总和 |
文件写带宽 |
NFS、CIFS、FTP每秒完成写操作的数据量的总和 |
数据盘读时延 |
主机内所有数据盘进行读操作时的平均延时时间,可单击<详情>按钮查看主机内各磁盘读时延 |
数据盘写时延 |
主机内所有数据盘进行写操作时的平均延时时间,可单击<详情>按钮查看主机内各磁盘写时延 |
数据盘平均负载 |
主机内所有数据盘IO负载的平均值 |
数据盘最大负载 |
主机内所有数据盘IO负载的最大值 |
网卡接收 |
主机内所有网卡每秒接收的数据量总和 |
网卡发送 |
主机内所有网卡每秒发送的数据量总和 |
接收包数 |
主机内所有网卡每秒接收的数据包个数 |
发送包数 |
主机内所有网卡每秒发送的数据包个数 |
接收错误包数 |
主机内所有网卡每秒接收的错误包个数 |
发送错误包数 |
主机内所有网卡每秒发送的错误包个数 |
接收丢弃包数 |
主机内所有网卡每秒接收的丢弃包个数 |
发送丢弃包数 |
主机内所有网卡每秒发送的丢弃包个数 |
选择“硬盘”页签,进入硬盘监控报表页面,若图12-10所示。该页面显示硬盘使用率信息。
当集群或设备出现故障时,通过告警管理特性可以上报实时告警并通知用户进行处理。用户通过查询和统计分析历史告警数据,可以了解到哪些部件易产生告警等信息。
告警管理特性的整体系统设计如图12-11所示。
数据采集模块主要包含diamond组件,负责采集告警项数据,并将采集的数据通过进程间通信传递给告警产生模块onestor-peon。
告警产生模块onestor-peon,主要负责决策是否产生告警,并上报告警,如图12-12所示。
(1) 接收数据采集模块传递的告警项数据。
(2) 根据告警相关配置及是否有相同告警未恢复等条件,决策是否产生告警。
(3) 若满足产生告警的条件则生成告警。
(4) 将生成的告警保存至本地数据库sqlite中,防止无法成功上报告警时导致告警丢失。
(5) 保存告警至本地数据库后,将告警上报至告警管理模块,上报成功后将该告警从本地数据库中删除。
如图12-13所示,告警管理模块onestor-leader主要负责与Handy交互、保存用户配置、接收并保存告警产生模块上报的告警、向邮件服务器发送告警邮件等。
· 保存、查询、更新告警相关配置,如告警阈值、告警级别等。
· 接收告警并保存告警,包括告警状态更新,告警导出等。
· 发送告警邮件。
表12-10 配置任务概览
配置任务 |
说明 |
||
开启或关闭告警功能 |
|||
配置告警邮件发送间隔、发送告警级别、邮件服务器信息,开启或关闭邮件告警功能 |
|||
开启或关闭短信告警功能,配置短信告警功能相关信息 |
|||
添加用于接收告警邮件的用户电子邮箱地址 |
|||
查看、测试、删除告警接收邮箱 |
|||
添加用于接收告警短信的用户手机号码 |
|||
查看、测试、删除告警接收号码 |
|||
修改告警指标的告警阈值、告警恢复阈值及持续时间 |
|||
将告警指标的告警阈值、告警恢复阈值及持续时间恢复为缺省值 |
|||
修改告警指标的告警级别,开启或关闭告警指标的告警上报功能 |
|||
将告警指标的告警级别及告警上报功能开关恢复为缺省值 |
|||
配置联系人的相关信息 |
|||
查询实时告警的详细信息 |
|||
查询历史告警的详细信息 |
|||
查看、编辑实时告警的维护记录 |
|||
查看、编辑历史告警的维护记录 |
|||
手动确认实时告警已恢复 |
|||
从UniStor中导出部分或全部实时告警数据 |
|||
从UniStor中导出部分或全部历史告警数据 |
|||
若UniStor未开启告警功能、未开启邮件告警功能或未配置告警接收邮箱,则在登录或刷新UniStor页面时会自动弹出风险告警提示框,单击<去配置>按钮可直接跳转至告警设置相关配置页面进行配置。
告警功能在缺省情况下已经开启。若关闭告警功能,UniStor将不再上报新的实时告警。
(1) 单击导航树中的[告警设置]菜单项,进入基础配置页面。
(2) 单击告警配置框中的<修改>按钮,根据需要单击选择“开启”或“关闭”,如图12-14所示。
图12-14 告警配置页面
参数 |
说明 |
设置 |
告警开关 |
告警功能的开关 |
可选择“开启”或“关闭” |
(3) 单击<保存>按钮完成操作。
配置邮件告警时,若邮件告警开关选择为“开启”但邮件服务器不可用,则单击<保存>按钮后将不会保存本次的新配置信息。可先将邮件告警开关选择为“关闭”,以便保存本次配置,待邮件服务器恢复可用时,再次进入该配置页面开启邮件告警功能。
(1) 单击导航树中的[告警设置]菜单项,进入基础配置页面。
(2) 单击邮件告警配置框中的<修改>按钮,配置相关信息,如图12-15所示。
表12-12 参数说明
参数 |
说明 |
设置 |
重复发送设置 |
向用户发送重复告警功能 |
可选择“启用”或“不启用” |
发送间隔 |
向用户发送告警邮件的时间间隔 |
单位可选择“分钟”或“小时”: · 单位为“分钟”时,可选择5分钟~1440分钟,以1分钟为步长 · 单位为“小时”时,可选择1小时~24小时,以1小时为步长 |
发送次数 |
向用户发送告警邮件的最多次数 |
支持输入1~65535之间的整数或选择“无限” |
发送的告警级别 |
向用户发送的告警的告警级别 |
可选择“紧急”、“重要”、“一般”、“提示”、“自定义”中的一个或多个 |
服务器地址 |
UniStor访问的邮件服务器的IP地址 |
合法的IP地址 |
端口号 |
邮件服务器的邮件发送服务的监听端口号 |
合法的端口号 |
发件人邮箱 |
发送告警邮件的电子邮箱地址。邮件告警开关开启时,若勾选其后的“校验”,系统会发送一封测试邮件到该邮箱 |
合法的电子邮箱地址 |
数据加密 |
告警邮件加密方式 |
可选择“SSL”、“TLS”或“不加密” |
身份验证 |
登录邮件服务器时是否需要进行身份验证 |
根据邮件服务器的要求选择“启用”或“不启用”。若启用,须输入登录邮件服务器的用户名和密码 |
邮件语言设置 |
告警邮件使用的语言 |
可选择“中文”或“英文” |
邮件告警开关 |
邮件告警功能的开关 |
可选择“开启”或“关闭” |
(3) (可选)单击<重置>按钮,可一次将相关信息恢复为编辑前的状态。重置后需要重新配置相关信息。
(4) 单击<保存>按钮完成操作。
(1) 单击导航树中的[告警设置]菜单项,进入基础配置页面。
(2) 单击短信告警配置框中的<修改>按钮,配置相关信息,如图12-16所示。
表12-13 参数说明
参数 |
说明 |
设置 |
短信告警开关 |
短信告警功能的开关 |
可选择“开启”或“关闭” |
短信猫地址 |
系统访问的短信服务器的IP地址 |
合法的IP地址 |
端口号 |
短信服务器的短信发送服务的监听端口号 |
合法的端口号 |
发送密码 |
登录短信服务器的密码 |
- |
短信模板 |
向用户发送告警短信的信息头,用户自定义短信模板内容后,将按照模板内容为信息头发送告警短信 |
支持输入1~64位中文、字母、数字、空格和特殊字符,特殊字符包括:@#&()-_[]{}:’,<>. |
发送间隔 |
向用户发送告警短信的时间间隔 |
可选择5分钟~60分钟,以5分钟为步长 |
短信语言设置 |
告警短信使用的语言 |
可选择“中文”或“英文” |
(3) (可选)单击<重置>按钮,可一次将相关信息恢复为编辑前的状态。重置后需要重新配置相关信息。
(4) 单击<保存>按钮完成操作。
· UniStor最多支持添加96个告警接收邮箱,但实际添加的数量不能超过邮件服务器的邮件群发数量限制,否则会导致发送告警邮件失败。
· 建议告警接收邮箱地址与发件人邮箱地址(即发送告警邮件的电子邮箱地址)的域名保持一致,否则可能会无法正常接收告警邮件。
(1) 单击导航树中的[告警设置]菜单项,进入基础配置页面。
(2) 选择“告警接收邮箱”页签,进入告警接收邮箱页面。
(3) 单击<添加>按钮,在弹出的图12-17所示对话框中输入邮箱地址(若尚未开启邮件告警开关,则会先弹出提示框,单击<取消>按钮即可进入本步骤)。
表12-14 参数说明
参数 |
说明 |
设置 |
邮箱地址 |
用户用来接收告警邮件的电子邮箱的地址 |
合法的电子邮箱地址 |
(4) 单击<确定>按钮完成操作。
· 查看告警接收邮箱
(1) 单击导航树中的[告警设置]菜单项,进入基础配置页面。
(2) 选择“告警接收邮箱”页签,进入图12-18所示告警接收邮箱页面,查看已添加的告警接收邮箱。
· 测试告警接收邮箱
测试告警接收邮箱需要使用邮件服务器,请首先配置邮件告警功能。
(1) 单击导航树中的[告警设置]菜单项,进入基础配置页面。
(2) 选择“告警接收邮箱”页签,进入告警接收邮箱页面。
(3) 选中一个告警接收邮箱,单击<测试>按钮,在弹出的对话框中单击<确定>按钮完成操作。
· 删除告警接收邮箱
(1) 单击导航树中的[告警设置]菜单项,进入基础配置页面。
(2) 选择“告警接收邮箱”页签,进入告警接收邮箱页面。
(3) 选中待删除的告警接收邮箱,单击<删除>按钮,在弹出的图12-19所示对话框中,单击<删除>按钮完成操作。
(1) 单击导航树中的[告警设置]菜单项,进入基础配置页面。
(2) 选择“告警接收号码”页签,进入告警接收号码页面,如图12-20所示。
(3) 单击<添加>按钮,在弹出的图12-21所示对话框中输入手机号码(若尚未开启短信告警开关,则会先弹出提示框,单击<取消>按钮即可进入本步骤)。
表12-15 参数说明
参数 |
说明 |
设置 |
手机号码 |
用户用来接收告警短信的手机号码 |
合法的手机号码 |
(4) 单击<确定>按钮完成操作。
· 查看告警接收号码
(1) 单击导航树中的[告警设置]菜单项,进入基础配置页面。
(2) 选择“告警接收号码”页签,进入告警接收号码页面,查看已添加的告警接收号码。
· 测试告警接收号码
(1) 单击导航树中的[告警设置]菜单项,进入基础配置页面。
(2) 选择“告警接收号码”页签,进入告警接收号码页面。
(3) 选中一个手机号码,单击<测试>按钮完成操作。
· 删除告警接收号码
(1) 单击导航树中的[告警设置]菜单项,进入基础配置页面。
(2) 选择“告警接收号码”页签,进入告警接收号码页面。
(3) 选中待删除的手机号码,单击<删除>按钮,在弹出的图12-22所示对话框中,单击<删除>按钮完成操作。
配置阈值时,告警阈值必须大于告警恢复阈值。
(1) 单击导航树中的[告警设置]菜单项,进入基础配置页面。
(2) 选择“阈值配置”页签,进入阈值配置页面,如图12-23所示。
(3) 选中一个告警指标,单击<修改>按钮,在弹出的如图12-24所示对话框中输入告警阈值、告警恢复阈值和持续时间。
表12-16 参数说明
参数 |
说明 |
设置 |
告警阈值 |
触发告警的最低值,当告警指标达到该值时会触发相应告警 |
不同的告警类型设置不同,请参考页面提示 |
告警恢复阈值 |
当告警指标恢复至该值及以下并持续预设的时长,恢复相应告警 |
不同的告警类型设置不同,请参考页面提示 |
持续时间 |
预设的一个时长,当告警指标恢复至告警恢复阈值及以下并持续该时长,则恢复相应告警 |
不同的告警类型设置不同,请参考页面提示 |
(4) 单击<确定>按钮完成操作。
重置某告警指标后,该告警指标的告警阈值、告警恢复阈值及持续时间将恢复为缺省值。
(1) 单击导航树中的[告警设置]菜单项,进入基础配置页面。
(2) 选择“阈值配置”页签,进入阈值配置页面。
(3) 选中一个告警指标,单击<重置>按钮完成操作。
若某告警指标的告警上报开关被设置为“禁用”,则UniStor不再上报该项告警指标的告警信息。
(1) 单击导航树中的[告警设置]菜单项,进入基础配置页面。
(2) 选择“告警级别”页签,进入告警级别页面,如图12-25所示。
(3) 选中一个告警指标,单击<修改>按钮,在弹出的如图12-26所示对话框中,单击选择要设置的告警级别。根据需要单击选择启用或禁用告警上报。
表12-17 参数说明
参数 |
说明 |
设置 |
告警级别 |
表示告警的重要程度 |
可选择“紧急”、“重要”、“一般”、“提示”或“自定义” |
告警上报 |
所选告警指标的告警上报功能开关 |
可选择“启用”或“禁用” |
(4) 单击<确定>按钮完成操作。
重置某告警指标后,该告警指标的告警级别及告警上报状态将恢复为缺省值。
(1) 单击导航树中的[告警设置]菜单项,进入基础配置页面。
(2) 选择“告警级别”页签,进入告警级别页面。
(3) 选中一个告警指标,单击<重置>按钮完成操作。
(1) 单击导航树中的[告警设置]菜单项,进入基础配置页面。
(2) 选择“联系人信息”页签,进入联系人信息页面进行查看,如图12-27所示。
表12-18 参数说明
参数 |
说明 |
设置 |
联系人 |
接收告警信息的用户接口人或H3C提供技术支持的工程师的名称 |
- |
电话号码 |
接收告警信息的用户接口人或H3C提供技术支持的工程师的电话号码 |
合法的电话号码 |
邮箱地址 |
用户用来接收告警邮件的电子邮箱的地址 |
合法的电子邮箱地址 |
(1) 单击导航树中的[告警设置]菜单项,进入基础配置页面。
(2) 选择“联系人信息”页签,进入联系人信息页面,如图12-28所示。
(3) 单击<添加>按钮,在弹出的如图12-29所示对话框中输入联系人、电话号码和邮箱地址。
(4) 单击<确定>按钮完成操作。
(1) 单击导航树中的[告警设置]菜单项,进入基础配置页面。
(2) 选择“联系人信息”页签,进入联系人信息页面,如图12-30所示。
(3) 选中待修改的联系人,单击<修改>按钮,在弹出的如图12-31所示对话框中修改联系人、电话号码和邮箱地址,单击<确定>按钮完成操作。
(1) 单击导航树中的[告警设置]菜单项,进入基础配置页面。
(2) 选择“联系人信息”页签,进入联系人信息页面,如图12-32所示。
(3) 选中待删除的联系人,单击<删除>按钮,在弹出的如图12-33所示的对话框中单击<确定>按钮完成操作。
· 告警级别按钮组和高级查询可以进行联合条件筛选。
· UniStor最多可以保留最近的5万条实时告警。
· 单击用户信息区域中的按钮,在弹出的浮动页面中,单击某一告警级别,可直接跳转到实时告警页面,查看对应告警级别的所有实时告警。
按钮中的数字表示当前实时告警的数量。
(1) 单击导航树中的[告警信息]菜单项,进入实时告警页面,缺省显示所有的实时告警,如图12-34所示。
(2) (可选)单击<紧急/重要/一般/提示/自定义>按钮(支持多选),可显示所选告警级别的所有实时告警。单击<全部>按钮,可显示所有的实时告警。
(3) (可选)单击<逆序/正序>按钮,可按告警产生时间对显示的实时告警进行相应排序(若告警产生时间相同,则按告警ID进行相应排序)。
(4) (可选)单击<高级查询>按钮,在弹出的图12-35所示对话框中,选择开始时间、结束时间、告警模块,输入关键字,单击<确定>按钮,可筛选出符合相应条件的实时告警。单击<重置>按钮,显示清除高级查询筛选条件后的实时告警。
(5) 选中一条实时告警,单击<详情>按钮(或者双击一条实时告警),在弹出的图12-36所示告警详情对话框中可以查看该条实时告警的详情信息。
表12-19 参数说明
参数 |
说明 |
设置 |
告警ID |
告警的唯一标识符,用于区分告警 |
- |
告警级别 |
表示告警的重要程度,有“紧急”、“重要”、“一般”、“提示”、“自定义”五个级别 |
- |
告警模块 |
实时告警产生的来源 |
可选择“系统”、“网络”、“设备”、“集群”和“NAS服务器” |
产生时间 |
实时告警产生的时间 |
- |
告警状态 |
实时告警仅有“未恢复”一种状态 |
- |
开始时间 |
待查询的实时告警的起始日期,筛选该日期00:00:00以后发生的所有实时告警 |
- |
结束时间 |
待查询的实时告警的结束日期,筛选该日期23:59:59以前发生的所有实时告警 |
- |
关键字 |
待查询的实时告警的告警内容中包含的关键字 |
可输入0~20个字符 |
类型ID |
告警类型的唯一标识符,用于区分告警类型 |
- |
告警原因 |
引起告警的故障原因 |
- |
维护建议 |
建议的故障解决方法 |
- |
· 告警级别按钮组、告警状态按钮组和高级查询可以进行联合条件筛选。
· UniStor最多可以保留最近的10万条告警。
(1) 单击导航树中的[告警信息]菜单项,进入实时告警页面。
(2) 选择“所有告警”页签,进入所有告警页面,如图12-37所示。
(3) (可选)单击<紧急/重要/一般/提示/自定义>按钮(支持多选),可显示所选告警级别的所有告警。单击告警级别按钮组的<全部>按钮,可显示全部告警级别的所有告警。
(4) (可选)单击<未恢复/已确认/已恢复>按钮,可显示所选告警状态的所有告警。单击告警状态按钮组的<全部>按钮,可显示全部告警状态的所有告警。
(5) (可选)单击<逆序/正序>按钮,可按告警产生时间对显示的告警进行相应排序(若告警产生时间相同,则按告警ID进行相应排序)。
(6) (可选)单击<高级查询>按钮,在弹出的对话框中,选择开始时间、结束时间、告警模块,输入关键字,单击<确定>按钮,可筛选出符合相应条件的告警。单击<重置>按钮,显示清除高级查询筛选条件后的告警。
(7) 选中一条告警,单击<详情>按钮(或者双击一条告警),在弹出的告警详情对话框中可以查看该条告警的详情信息。
参数 |
说明 |
设置 |
告警ID |
告警的唯一标识符,用于区分告警 |
- |
告警级别 |
表示告警的重要程度,有“紧急”、“重要”、“一般”、“提示”、“自定义”五个级别 |
- |
告警模块 |
告警产生的来源 |
可选择“系统”、“网络”、“设备”、“集群”和“NAS服务器” |
产生时间 |
告警产生的时间 |
- |
恢复/确认时间 |
告警自动恢复或手动确认的时间 |
- |
告警状态 |
有“未恢复”、“已确认”和“已恢复”三种状态。 |
- |
开始时间 |
待查询的告警的起始日期,筛选该日期00:00:00以后发生的所有告警 |
- |
结束时间 |
待查询的告警的结束日期,筛选该日期23:59:59以前发生的所有告警 |
- |
关键字 |
待查询的告警的告警内容中包含的关键字 |
可输入0~20个字符 |
类型ID |
告警类型的唯一标识符,用于区分告警类型 |
- |
告警原因 |
引起告警的故障原因 |
- |
维护建议 |
建议的故障解决方法 |
- |
维护记录最多可以输入500个字符。
(1) 单击导航树中的[告警信息]菜单项,进入实时告警页面。
(2) 选中一条实时告警,单击<详情>按钮(或者双击一条实时告警),在弹出的告警详情对话框中的维护记录输入框中编辑维护记录。
(3) 单击<确定>按钮,完成操作。
(1) 单击导航树中的[告警信息]菜单项,进入实时告警页面。
(2) 选择“所有告警”页签,进入所有告警页面。
(3) 选中一条告警,单击<详情>按钮(或者双击一条告警),在弹出的告警详情对话框中的维护记录输入框中编辑维护记录。
(4) 单击<确定>按钮,完成操作。
· 手动确认实时告警后,在所有告警页面中其告警状态将变为“已确认”,表示该告警是经手动确认恢复的。
· 若UniStor自动监测到实时告警已经恢复,则在所有告警页面中其告警状态将自动变为“已恢复”,表示该告警是经UniStor自动监测到其已经恢复的。
(1) 单击导航树中的[告警信息]菜单项,进入实时告警页面。
(2) 选中一到多条实时告警,单击<确认>按钮完成操作。
· 在导出告警文件时,若浏览器设置了下载前询问,则会弹出“另存为”对话框,输入要保存的文件名并选择保存路径后单击<保存>按钮保存导出的文件,否则浏览器会以缺省的文件名(实时告警以“real_time_alarm”开头,所有告警以“all_alarm”开头)将导出后的文件保存到浏览器预设的缺省下载路径下。
· 导出选中告警时仅可以在同页显示的告警中进行选择,不支持跨页选择。可根据需要先对告警进行筛选,然后在同页显示的筛选结果中选择导出。
· 导出选中实时告警
(1) 单击导航树中的[告警信息]菜单项,进入实时告警页面。
(2) 选中一到多条实时告警,单击<导出>按钮,在弹出的图12-38所示对话框中单击<导出选中告警>按钮完成操作。
· 导出所有实时告警
(1) 单击导航树中的[告警信息]菜单项,进入实时告警页面。
(2) 单击<导出>按钮,在弹出的对话框中单击<导出所有告警>按钮完成操作。
· 导出选中告警
(1) 单击导航树中的[告警信息]菜单项,进入实时告警页面。
(2) 选择“所有告警”页签,进入所有告警页面。
(3) 选中一到多条告警,单击<导出>按钮,在弹出的对话框中单击<导出选中告警>按钮完成操作。
· 导出所有告警
(1) 单击导航树中的[告警信息]菜单项,进入实时告警页面。
(2) 选择“所有告警”页签,进入所有告警页面。
(3) 单击<导出>按钮,在弹出的对话框中单击<导出所有告警>按钮完成操作。
为了以更通用的形式向第三方网管平台发送告警,并使得第三方管理平台能够纳管和获取存储产品的告警信息,UniStor支持以SNMP协议发送告警,并能响应第三方网管平台GET请求。
SNMP(Simple Network Management Protocol,简单网络管理协议)广泛用于网络设备的远程管理和操作。SNMP允许管理员对网络上不同厂商、不同物理特性、采用不同互联技术的设备进行管理,包括状态监控、数据采集和故障处理。
SNMP网络架构由三部分组成:NMS、Agent和MIB。
· NMS(Network Management System,网络管理系统)是SNMP网络的管理者,能够提供友好的人机交互界面,方便网络管理员完成大多数的网络管理工作。
· Agent是SNMP网络的被管理者,负责接收、处理来自NMS的SNMP报文。在某些情况下,如接口状态发生改变时,Agent也会主动向NMS发送告警信息。
· MIB(Management Information Base,管理信息库)是被管理对象的集合。NMS管理设备的时候,通常会关注设备的一些参数,比如接口状态、CPU利用率等,这些参数就是被管理对象,在MIB中称为节点。每个Agent都有自己的MIB。MIB定义了节点之间的层次关系以及对象的一系列属性,比如对象的名称、访问权限和数据类型等。被管理设备都有自己的MIB文件,在NMS上编译这些MIB文件,就能生成该设备的MIB。NMS根据访问权限对MIB节点进行读/写操作,从而实现对Agent的管理。
SNMP提供四种基本服务:
· Get:查询被管理节点的信息。
· Set:配置被管理节点的信息。
· 告警:SNMP告警包括Trap和Inform两种。
¡ Trap:Agent使用该操作向NMS发送Trap报文。Agent不要求NMS发送回应报文。NMS也不会对Trap报文进行回应。SNMPv1、SNMPv2c和SNMPv3均支持Trap操作。
¡ Inform:Agent使用该操作向NMS发送Inform报文。Agent要求NMS发送回应报文,因此,Inform报文比Trap报文更可靠,但消耗的系统资源更多。如果Agent在一定时间内没有收到NMS的回应报文,则会启动重发机制。只有SNMPv2c和SNMPv3支持Inform操作。
当前UniStor支持通过Trap上报集群告警信息至第三方网管平台,支持第三方网管平台通过Get获取集群的告警信息。
当前SNMP支持三个版本:SNMPv1、SNMPv2c与SNMPv3。
· SNMPv1采用团体名(Community Name)认证机制。团体名类似于密码,用来限制NMS和Agent之间的通信。如果NMS配置的团体名和被管理设备上配置的团体名不同,则NMS和Agent不能建立SNMP连接,从而导致NMS无法访问Agent,Agent发送的告警信息也会被NMS丢弃。
· SNMPv2c也采用团体名认证机制。SNMPv2c对SNMPv1的功能进行了扩展:提供了更多的操作类型;支持更多的数据类型;提供了更丰富的错误代码,能够更细致地区分错误。
· SNMPv3采用USM(User-Based Security Model,基于用户的安全模型)认证机制。网络管理员可以配置认证和加密功能。认证用于验证报文发送方的合法性,避免非法用户的访问;加密则是对NMS和Agent之间的传输报文进行加密,以免被窃听。采用认证和加密功能可以为NMS和Agent之间的通信提供更高的安全性。
表12-21 SNMP配置和管理任务概览
配置任务 |
说明 |
|
切换当前SNMP服务的状态 |
||
创建USM用户,为SNMPv3进行用户鉴权和数据加密 |
||
修改USM用户信息 |
||
删除USM用户信息 |
||
创建Trap,采用SNMP Trap的方式将所有的告警信息发送至第三方网管平台 |
||
修改Trap信息 |
||
删除Trap信息 |
||
创建GET,使第三方网管平台可以通过GET方式获取告警信息 |
||
修改GET信息 |
||
删除GET信息 |
关闭SNMP服务后,后续的USM用户、Trap与GET只允许查看,无法创建、修改和删除,Trap告警上报与响应GET请求功能也无法使用。
(1) 单击导航树中的[SNMP设置]菜单项,进入USM用户管理页面。
(2) 如图12-39所示,单击右上角的SNMP状态按钮,在弹出的对话框中选择与当前状态相反的操作,单击<确定>按钮完成操作。
· 集群最多允许创建100个USM用户。
· 启用数据加密前必须先启用用户鉴权,关闭用户鉴权前必须先关闭数据加密。
(1) 单击导航树中的[SNMP设置]菜单项,进入USM用户管理页面。
(2) 单击<创建>按钮,在弹出的图12-40所示对话框中,输入用户名,选择用户权限。
(3) (可选)如图12-41所示,启用用户鉴权,输入鉴权相关信息。
(4) (可选)如图12-42所示,启用数据加密,输入加密相关信息。
(5) 单击<确定>按钮完成操作。
参数 |
说明 |
设置 |
用户名 |
USM用户名称,不允许重复 |
· 长度必须为1~30个字符。 · 由大写字母、小写字母、数字、中划线与下划线组成且只能以字母和数字开头,区分大小写 |
鉴权协议 |
USM用户的鉴权协议 |
可选择“MD5”(信息摘要算法,目前只支持usmHMACMD5AuthProtocol)或“SHA”(安全哈希算法,目前只支持usmHMACSHAAuthProtocol),缺省为“SHA” |
鉴权密码 |
- |
· 长度必须为8~16个字符。 · 由大写字母、小写字母、数字与特殊字符组成,区分大小写且不支持空格,其中特殊字符包括:`~!@#$%^&*()-_=+[]{}|;:',<>\"./? |
加密协议 |
USM用户的加密协议 |
可选择“DES”(数据加密标准,目前只支持usmDESPrivProtocol)或“AES”(高级加密标准,目前只支持usmAesCfb128Protocol),缺省为“AES” |
加密密码 |
- |
· 长度必须为8~16个字符。 · 由大写字母、小写字母、数字与特殊字符组成,区分大小写且不支持空格,其中特殊字符包括:`~!@#$%^&*()-_=+[]{}|;:',<>\"./? |
用户权限 |
USM用户的读写权限 |
可选择“wr”或“ro”。“wr”为读写,“ro”为只读,缺省为“wr” |
· 正在被使用的USM用户无法被修改。
· 启用数据加密前必须先启用用户鉴权,关闭用户鉴权前必须先关闭数据加密。
(1) 单击导航树中的[SNMP设置]菜单项,进入USM用户管理页面。
(2) 选择一个USM用户,单击<修改>按钮,在弹出的图12-43所示对话框中,修改相关信息,单击<确定>按钮完成操作。
参数 |
说明 |
设置 |
用户名 |
USM用户名称,不允许重复 |
· 长度必须为1~30个字符。 · 由大写字母、小写字母、数字、中划线与下划线组成且只能以字母和数字开头,区分大小写 |
鉴权协议 |
USM用户的鉴权协议 |
可选择“MD5”(信息摘要算法,目前只支持usmHMACMD5AuthProtocol)或“SHA”(安全哈希算法,目前只支持usmHMACSHAAuthProtocol),缺省为“SHA” |
鉴权密码 |
- |
· 长度必须为8~16个字符。 · 由大写字母、小写字母、数字与特殊字符组成,区分大小写且不支持空格,其中特殊字符包括:`~!@#$%^&*()-_=+[]{}|;:',<>\"./? |
加密协议 |
USM用户的加密协议 |
可选择“DES”(数据加密标准,目前只支持usmDESPrivProtocol)或“AES”(高级加密标准,目前只支持usmAesCfb128Protocol),缺省为“AES” |
加密密码 |
- |
· 长度必须为8~16个字符。 · 由大写字母、小写字母、数字与特殊字符组成,区分大小写且不支持空格,其中特殊字符包括:`~!@#$%^&*()-_=+[]{}|;:',<>\"./? |
用户权限 |
USM用户的读写权限 |
可选择“wr”或“ro”。“wr”为读写,“ro”为只读,缺省为“wr” |
正在被使用的USM用户无法被删除。
(1) 单击导航树中的[SNMP设置]菜单项,进入USM用户管理页面。
(2) 勾选一个或多个USM用户,单击<删除>按钮,在弹出的图12-44所示对话框中单击<确定>按钮完成操作。
· 集群最多允许创建10个Trap。
· 服务器地址和端口的组合不允许重复。
· 上报告警给第三方网管平台前,需要在对端导入存储端的MIB文件。
· 第三方网管平台与存储端的读团体名不一致时,仍可以收到告警信息。
· 第三方网管平台配置用户鉴权和数据加密,存储端只配置用户鉴权时,仍可以收到告警信息。
(1) 单击导航树中的[SNMP设置]菜单项,选择“Trap管理”页签,进入Trap管理页面。
(2) 单击<创建>按钮,在弹出的对话框中输入服务器地址、端口,选择版本。
¡ 如图12-45所示,若版本选择SNMPv1或SNMPv2c,(可选)输入读团体名。
¡ 如图12-46所示,若版本选择SNMPv3,选择USM用户。
(3) 单击<确定>按钮,完成操作。
参数 |
说明 |
设置 |
服务器地址 |
集群的告警信息上报至该地址所指定的网管平台 |
必须使用业务网段、管理网段、存储前端网段或存储后端网段内的IP地址,推荐使用管理网段内的IP地址 |
端口 |
服务器地址的端口信息 |
取值范围1~65535 |
版本 |
SNMP协议的版本 |
可选择SNMPv1、SNMPv2c或SNMPv3 |
读团体名 |
类似于密码,用于限制SNMP网络管理系统与SNMP管理代理之间的通信,缺省为public |
· 长度必须为8~16个字符。 · 由大写字母、小写字母、数字与特殊字符组成,区分大小写且不支持空格,其中特殊字符包括:`~!@#$%^&*()-_=+[]{}|;:',<>\"./? |
USM用户 |
通过SNMPv3上报告警的用户 |
- |
· 服务器地址和端口的组合不允许重复。
· 第三方网管平台与存储端的读团体名不一致时,仍可以收到告警信息。
· 第三方网管平台配置用户鉴权和数据加密,存储端只配置用户鉴权时,仍可以收到告警信息。
(1) 单击导航树中的[SNMP设置]菜单项,选择“Trap管理”页签,进入Trap管理页面。
(2) 选择一个Trap,单击<修改>按钮,在弹出的对话框中修改服务器地址、端口和版本。
¡ 如图12-47所示,若版本选择SNMPv1或SNMPv2c,可以修改读团体名。
¡ 如图12-48所示,若版本选择SNMPv3,可以修改USM用户。
(3) 单击<确定>按钮,完成操作。
参数 |
说明 |
设置 |
服务器地址 |
集群的告警信息上报至该地址所指定的网管平台 |
必须使用业务网段、管理网段、存储前端网段或存储后端网段内的IP地址,推荐使用管理网段内的IP地址 |
端口 |
服务器地址的端口信息 |
取值范围1~65535 |
版本 |
SNMP协议的版本 |
可选择SNMPv1、SNMPv2c或SNMPv3 |
读团体名 |
类似于密码,用于限制SNMP网络管理系统与SNMP管理代理之间的通信,缺省为public |
· 长度必须为8~16个字符。 · 由大写字母、小写字母、数字与特殊字符组成,区分大小写且不支持空格,其中特殊字符包括:`~!@#$%^&*()-_=+[]{}|;:',<>\"./? |
USM用户 |
通过SNMPv3上报告警的用户 |
- |
(1) 单击导航树中的[SNMP设置]菜单项,选择“Trap管理”页签,进入Trap管理页面。
(2) 勾选一个或多个Trap,单击<删除>按钮,在弹出的图12-49所示对话框中单击<确定>按钮完成操作。
图12-49 删除Trap
· 只允许创建一个GET。
· 端口不允许重复,且不能为存储已使用的端口(445、2003、2004、2013、2014、2023、2024、2049、2050、2103、2104、2203、2204、2303、2304、2403、2404、5050、5432、6789、7302、7402、7502、7602、7702、9527、9528、54306、6800-7300)。
· 第三方网管平台使用GET操作前,需要导入存储端的MIB文件。
(1) 单击导航树中的[SNMP设置]菜单项,选择“GET管理”页签,进入GET管理页面。
(2) 单击<创建>按钮,在弹出的对话框中输入端口,选择版本。
¡ 如图12-50所示,若版本选择SNMPv1或SNMPv2c,输入读团体名。
¡ 如图12-51所示,若版本选择SNMPv3,选择USM用户。
(3) 单击<确定>按钮,完成操作。
参数 |
说明 |
设置 |
端口 |
集群响应第三方网管平台GET请求的端口。 |
取值范围162~65535 |
版本 |
SNMP协议的版本 |
可选择SNMPv1、SNMPv2c或SNMPv3 |
读团体名 |
类似于密码,用于限制SNMP网络管理系统与SNMP管理代理之间的通信,缺省为public |
· 长度必须为8~16个字符。 · 由大写字母、小写字母、数字与特殊字符组成,区分大小写且不支持空格,其中特殊字符包括:`~!@#$%^&*()-_=+[]{}|;:',<>\"./? |
USM用户 |
通过SNMPv3响应GET请求的用户 |
- |
端口不允许重复,且不能为存储已使用的端口(445、2003-2004、2013-2014、2023-2024、2049-2050、2103、2104、2203-2204、2303-2304、2403-2404、5050、5432、6789、7302、7402、7502、7602、7702、9527、9528、54306、6800-7300)。
(1) 单击导航树中的[SNMP设置]菜单项,选择“GET管理”页签,进入GET管理页面。
(2) 选择一个GET,单击<修改>按钮,在弹出的对话框中修改端口和版本。
¡ 如图12-52所示,若版本选择SNMPv1或SNMPv2c,可以修改读团体名。
¡ 如图12-53所示,若版本选择SNMPv3,可以修改USM用户。
(3) 单击<确定>按钮,完成操作。
参数 |
说明 |
设置 |
端口 |
集群响应第三方网管平台GET请求的端口 |
取值范围162~65535 |
版本 |
SNMP协议的版本 |
可选择SNMPv1、SNMPv2c或SNMPv3 |
读团体名 |
类似于密码,用于限制SNMP网络管理系统与SNMP管理代理之间的通信,缺省为public |
· 长度必须为8~16个字符。 · 由大写字母、小写字母、数字与特殊字符组成,区分大小写且不支持空格,其中特殊字符包括:`~!@#$%^&*()-_=+[]{}|;:',<>\"./? |
USM用户 |
通过SNMPv3响应GET请求的用户 |
- |
(1) 单击导航树中的[SNMP设置]菜单项,选择“GET管理”页签,进入GET管理页面。
(2) 勾选一个或多个GET,单击<删除>按钮,在弹出的图12-54所示对话框中单击<确定>按钮完成操作。
图12-54 删除GET
不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!