08-HDM Zabbix监控服务器典型配置
本章节下载: 08-HDM Zabbix监控服务器典型配置 (1.43 MB)
H3C HDM
Zabbix监控服务器典型配置
Copyright © 2023 新华三技术有限公司 版权所有,保留一切权利。
非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。
除新华三技术有限公司的商标外,本手册中出现的其它公司的商标、产品标识及商品名称,由各自权利人拥有。
本文档中的信息可能变动,恕不另行通知。
本文档介绍Zabbix软件通过HDM SNMP接口监控目标服务器的典型配置举例。Zabbix是一个基于Web界面的提供分布式系统监视以及网络监视功能的企业级开源软件。Zabbix可以通过SNMP(Simple Network Management Protocol,简单网络管理协议)协议监视服务器的健康状态。
本文档不严格与具体软、硬件版本对应,如果使用过程中与产品实际情况有差异,请以设备实际情况为准。
本文档中的配置均是在实验室环境下进行的配置和验证,配置前设备的所有参数均采用出厂时的缺省配置。如果您已经对设备进行了配置,为了保证配置效果,请确认现有配置和以下举例中的配置不冲突。
本文档假设您已了解Zabbix和HDM SNMP相关功能。
本文档适用于需要通过Zabbix获取服务器信息,监控服务器状态的场景,通过部署监控提升了告警的及时性,从而能尽快响应并处理服务器问题。
如图4-1所示,目标服务器(本文以H3C UniServer R4900 G5为例进行介绍,以下简称R4900 G5)的HDM管理IP地址和Zabbix服务端IP地址、PC客户端的IP地址保持网络正常通信,实现通过PC客户端访问Zabbix Web,并通过HDM SNMP接口监控服务器的健康状态。
· HDM管理软件相关信息如下:
¡ IP地址:172.14.88.197/24
¡ 管理员账号:admin
¡ 管理员密码:Password@_
· Zabbix服务端相关信息如下:
¡ IP地址:172.14.64.156/24
¡ 登录地址:172.14.64.156/zabbix
¡ Zabbix用户名:Admin
¡ Zabbix密码:zabbix
· PC客户端相关信息如下:
¡ IP地址:172.14.64.98/24
本举例是在HDM-2.63版本上进行配置和验证的,使用的Zabbix版本是4.0.36。
请确保Zabbix服务端正常运行,且Zabbix服务端IP地址和HDM管理IP地址、PC客户端的IP地址保持网络正常通信。
(1) 打开PC客户端浏览器,在地址栏输入HDM管理IP地址:172.14.88.197,进入HDM登录页面,如图4-2所示。在HDM登录页面输入缺省的用户名“admin”和密码“Password@_”,单击<登录>按钮,登录HDM。
(2) 进入如图4-3所示的服务配置页面,查看SNMP服务是否处于开启状态,如果否,需要先开启SNMP服务并设置SNMP端口号。
(3) 进入如图4-4所示的SNMP页面,配置SNMP版本和只读团体名。
¡ SNMP版本:可选择v1、v2c,勾选表示支持该版本进行SNMP get/set操作,本文以v2c为例。
¡ 只读团体名:SNMP协议只读团体名,本文以public为例。
(1) 访问H3C官网,进入如图4-5所示的HDM 2.63版本固件下载页面,下载HDM配套版本的MIB文件。
(2) 登录Zabbix服务器,把MIB文件hh3c-server-agent.mib上传到Zabbix服务器的指定目录/usr/share/snmp/mibs,如图4-6所示,上传成功后需要通过restart命令重启Zabbix服务器。
图4-6 上传MIB库文件
(1) 打开PC客户端浏览器,在地址栏输入Zabbix服务端IP地址:172.16.64.156/zabbix,进入Zabbix Web登录页面,如图4-7所示。在登录页面输入缺省的用户名“Admin”和密码“zabbix”,单击<登录>按钮,登录Zabbix Web。
图4-7 Zabbix登录页面
(2) (可选)登录成功后,用户可以单击当前登录用户,在用户信息中修改界面语言为中文。
(3) 单击[配置/主机]菜单项,进入主机页面,如图4-8所示。
(4) 单击右上方的<创建主机>按钮,进入如图4-9所示的“创建主机”页面,填写主机信息。
a. 输入“主机名称”和“可见的名称”(可选)信息,本文以172.14.88.197为例进行介绍。
b. “群组”信息选择Linux servers,因为HDM是基于Linux系统研发的管理软件。
c. 在“agent代理程序的接口”栏单击<移除>按钮,移除默认的agent代理程序的接口。
d. 在“SNMP接口”栏单击<添加>按钮,添加SNMP接口,输入对应的HDM管理IP地址和SNMP管理端口,默认端口号为161。
(5) 添加成功后,主机列表会显示已添加的服务器信息,如图4-10所示。
(6) 单击目标主机,选择“宏/继承以及主机宏”菜单栏,进入如图4-11所示的“配置宏信息”页签,配置主机宏信息的“可用值”为HDM Web端SNMP的只读团体名public。
应用集是监控项(被监控的SNMP节点)的集合,即对监控项的分类。
(1) 单击图4-10中目标主机的<应用集>按钮,进入如图4-12所示的应用集页面。
(2) 单击右上方的<创建应用集>按钮,进入如图4-13所示的创建应用集页面,用户可以根据实际需求添加应用集,本文以CPU为例进行介绍。
监控项是被监控的SNMP节点,服务器支持的节点信息请参见4.4.2 配置Zabbix服务端下载的《HH3C-SERVER-AGENT-MIB》。
监控项可以分为两种类型:
· 属性监控项:仅支持监控该节点的某个属性值,如CPU序列号,返回值是属性值或N/A。
· 状态监控项:仅支持监控该节点的状态,如CPU健康状态,返回值是状态值。
(1) 单击图4-10中目标主机的<监控项>按钮,进入如图4-14所示的监控项页面。
(2) 单击右上角的<创建监控项>按钮,进入如图4-15所示的页面,输入监控项相关信息。
¡ 用户可以自定义“名称”,本文以hh3cCPUSerialNumber_cpu1为例进行介绍。
¡ “类型”选择SNMPv2客户端。
¡ “键值”就是节点名称(hh3cCPUSerialNumber),节点名称可以从如图4-16所示的从MIB文件里查找,因为CPU可能有多个,且不同CPU的序列号不一样,所以在需要名称后面加上“1”以示区分。
¡ “主机接口”选择目标主机。
¡ “SNMP OID”输入节点对应的OID,OID信息可以从如图4-16所示的MIB文件里查找,因为节点名称后面加了“1”,所以OID后面也需要加上“1”以示区分。
¡ “SNMP community”输入4.4.1 HDM SNMP配置章节设置的只读团体名public。
¡ “信息类型”选择字符。
¡ “应用集”选择CPU。
¡ 其他信息使用缺省设置即可。
(3) 重复以上操作,如图4-17所示,把键值和SNMP OID的后缀改成“2”,就可以添加CPU2序列号的监控项。
(4) 进入如图4-18所示的页面,创建一个CPU健康状态的状态监控项。
¡ 用户可以自定义“名称”,本文以hh3cCPUHealthStatus.0为例进行介绍。
¡ “类型”选择SNMPv2客户端。
¡ “键值”就是节点名称(hh3cCPUHealthStatus),节点名称可以从如图4-19所示的从MIB文件里查找。因为CPU健康状态是多个CPU的总体健康状态,所以在节点名称后面加上“0”。
¡ “主机接口”选择目标主机。
¡ “SNMP OID”输入节点对应的OID,OID信息可以从如图4-19所示的MIB文件里查找,因为节点名称后面加了“0”,所以OID后面也需要加上“0”。
¡ “SNMP community”输入4.4.1 HDM SNMP配置章节设置的只读团体名public。
¡ “信息类型”选择字符。
¡ “应用集”选择CPU。
¡ 其他信息使用缺省设置即可。
图4-18 新增CPU健康状态
触发器是Zabbix系统中针对状态监控项返回值是否需要触发告警的判断标准,本文以hh3cCPUHealthStatus(CPU健康状态)监控项为例进行说明。
hh3cCPUHealthStatus有4个等级的状态,分别是正常(返回值0)、警告(返回值1)、严重(返回值2)和致命(返回值3)。除正常状态外,其他三个等级的状态均会触发告警,因此针对这个监控项,需要创建三个触发器。
(1) 单击图4-10中目标主机的<触发器>按钮,进入如图4-20所示的触发器页面。
(2) 单击右上角的<创建触发器>按钮,进入如图4-21所示的页面,输入触发器相关信息。
¡ 用户可以自定义名称,本文以hh3cCPUHealthStatus_caution为例进行介绍。
¡ 选择触发器的“严重性”,本文以“警告”等级为例进行介绍。
¡ 单击表达式的<编辑>按钮,在如图4-22所示的对话框中输入相关信息。
- “监控项”选择已添加的监控项,本文以hh3cCPUHealthStatus.0为例进行介绍。
- “功能”选择“str() – 在最后(最近)值中找到字符串V(1-找到,0-未找到)”
- “V”输入“警告”等级的返回值“1”,返回值信息可以参见MIB文档。
- “最后一个(T)”输入“1”,表示1个周期。
- “结果”输入“1”,“1”表示找到字符串“V”对应的返回值。
(3) 重复以上操作,只需要在编辑表达式时把“V”值修改为待创建触发器等级的返回值,就可以创建多个等级的触发器,如图4-23和图4-24所示。
图4-24 创建灾难触发器
(4) 触发器创建成功后,可以在触发器页面查看触发器列表,如图4-25所示。
(1) 进入[监测/最新数据]页面,查看已添加的3个监控项的最新数据,如图4-26所示。
¡ hh3cCPUHealthStatus.0的最新数据是0,说明CPU健康状态处于正常状态。
¡ hh3cCPUSerialNumber_cpu1的最新数据是A5-9B-81-E3-00-15-F1-85,即CPU1的产品序列号是A5-9B-81-E3-00-15-F1-85。
¡ hh3cCPUSerialNumber_cpu2的最新数据是N/A,说明未获取到CPU2的产品序列号。
(2) 登录HDM Web页面,进入如图4-27所示的处理器页面,查看CPU健康状态和CPU的序列号(对应界面上的PPIN),和Zabbix监测到的最新数据一致。
(1) 通过技术手段模拟触发一个CPU告警,HDM Web页面的告警信息如图4-28所示。
(2) 登录Zabbix Web,进入如图4-29所示的触发器页面,发现灾难级别的触发器(对应的返回值是3)提示有问题,和HDM Web页面的“紧急”告警级别(对应MIB文件里的“Critical”等级,返回值是3)一致,两个等级对应的返回值都是3。
图4-29 触发器告警信息
(3) 再进入仪表盘页面,发现目标服务器所在的主机群组也提示有“灾难”级别的告警信息,如图4-30所示。
图4-30 仪表盘告警信息
· H3C HDM技术白皮书
· H3C服务器 HDM用户指南
不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!