手册下载
H3C CloudOS 高危操作手册-5W103-整本手册.pdf (390.26 KB)
H3C CloudOS云操作系统
高危操作手册
资料版本:5W103-20220919
Copyright © 2022 新华三技术有限公司 版权所有,保留一切权利。
非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。
除新华三技术有限公司的商标外,本手册中出现的其它公司的商标、产品标识及商品名称,由各自权利人拥有。
本文档中的信息可能变动,恕不另行通知。
本文档介绍的所有高危操作,根据危险程度共分为严重、警告、一般三种级别。在实际业务使用过程中,请先了解各操作可能带来的风险再按照操作建议进行操作,以防止影响业务正常运行。
· 严重:功能全部丧失或者业务中断
· 警告:大部分功能丧失或者业务不可用
· 一般:部分功能不可用或者不影响业务
针对Web端高危操作的定义是:可能影响客户业务的操作。这里的业务主要是指系统管理的虚拟化资源提供的业务。高危险的Web类操作只能由有资质、且经过培训的维护人员执行。如果操作不当,可能会导致设备重启、业务中断、业务运行异常、用户无法登录、用户下线等现象发生。
Web类高危操作包括但不限于本手册中介绍的内容,在进行Web类高危操作之前,请先了解可能带来的风险再进行操作。
销毁云主机。
· 云主机销毁不能恢复。
· 云主机提供的业务会中断。
请谨慎执行本操作,仅建议在客户确认需要销毁云主机,且做好数据备份后,才进行云主机的销毁。
请严格按照如下步骤操作:
(1) 将云主机关闭,无法正常关闭的云主机请关闭云主机电源。
(2) 确认云主机关闭后,先卸载云主机磁盘。
(3) 卸载云主机磁盘后,再执行云主机销毁操作。
关闭或者重启云主机。
云主机提供的业务会中断。
请谨慎执行本操作,仅建议在确认该云主机提供的业务可以中断之后,再进行相关操作。
挂起云主机(包含正在虚拟化的中云主机)。
导致业务中断。
请谨慎执行本操作。
更改云主机的规格:CPU、内存或者系统盘的规格。
云主机会暂时停止运行,提供的业务会中断。
请谨慎执行本操作。
加载/卸载云主机的虚拟网卡。
云主机提供的业务会中断。
请谨慎执行本操作,仅建议在确认该云主机提供的业务可以中断之后,再进行相关操作。
编辑网卡地址。
云主机提供的业务会中断。
请谨慎执行本操作。
修改网络策略后,将重新下发该网络策略。
云主机的业务会中断或者异常。
请谨慎执行本操作。
卸载云主机的云硬盘。
云主机提供的业务会中断。
请谨慎执行本操作,仅建议在确认该云主机提供的业务可以中断之后,再进行相关操作。
回收云主机的弹性IP。
云主机对外提供的业务会中断。
请谨慎执行本操作,仅建议在确认该云主机提供的业务可以中断之后,再进行相关操作。
迁移云主机。
云主机提供的业务会中断。
请谨慎执行本操作,仅建议在确认该云主机提供的业务可以中断之后,再进行相关操作。
修改云主机规格。
云主机提供的业务会中断。
请谨慎执行本操作,关机修改可能会导致提供的业务中断,仅建议在确认该云主机提供的业务可以中断之后,再进行相关操作。
删除云硬盘。
该云硬盘数据会丢失,且不可恢复。
请谨慎执行本操作,仅建议在做好数据备份,且客户明确确认可以删除之后,再进行相关操作。
根据云主机备份恢复云主机硬盘。
可能导致应用中断。
请谨慎执行本操作。
删除桶。
数据丢失,业务错误中断。
请谨慎执行本操作。
删除桶对象。
数据丢失,业务错误中断。
请谨慎执行本操作。
删除文件共享。
数据丢失,业务错误中断。
请谨慎执行本操作。
销毁裸金属实例。
· 裸金属销毁不能恢复。
· 裸金属提供的业务会中断。
请谨慎执行本操作,仅建议在客户确认需要销毁裸金属,且做好数据备份后才进行裸金属的销毁。
删除裸金属节点。
裸金属业务中断。
请谨慎执行本操作。
关闭裸金属节点电源。
裸金属业务中断,数据丢失。
请谨慎执行本操作。
关闭或者重启裸金属实例。
裸金属提供的业务会中断。
请谨慎执行本操作,仅建议在确认该裸金属提供的业务可以中断之后,再进行相关操作。
关闭或者重启裸金属。
该操作可能会导致用户机不可用,数据丢失。
请谨慎执行本操作,仅建议在确认该裸金属提供的业务可以中断之后,再进行相关操作。
重置裸金属计费。
历史计费数据丢失。
请谨慎执行本操作。
重建裸金属。
重建功能会根据选择的镜像重新创建实例,当前实例的现有数据将清除且无法恢复
请谨慎执行本操作。
卸载裸金属实例的云硬盘。
裸金属提供的业务会可能会中断。
请谨慎执行本操作,仅建议在确认该裸金属提供的业务可以中断之后,再进行相关操作。
回收裸金属实例的弹性IP。
裸金属实例对外提供的业务会中断。
请谨慎执行本操作,仅建议在确认该裸金属提供的业务可以中断之后,再进行相关操作。
恢复整机快照。
系统运行错误甚至异常中断。
请谨慎执行本操作。
重建云主机。
重建功能会根据选择的镜像重新创建实例,当前实例的现有数据将清除且无法恢复。
请谨慎执行本操作。
将虚拟机加入回收站。
系统运行错误甚至异常中断。
请谨慎执行本操作。
云主机回收公网IP。
导致外部访问云主机业务不通。
请谨慎执行本操作。
系统进行云主机QoS策略管理的添加、删除和修改操作。
可能影响业务。
请谨慎执行本操作。
创建整机快照。
可能短暂中断业务。
请谨慎执行本操作。
删除主机镜像。
操作导致镜像数据丢失。
请谨慎执行本操作。
纳管/取消纳管虚拟机。
操作可能导致虚拟机业务中断。
请谨慎执行本操作。
迁移虚拟机。
操作可能导致虚拟机业务中断。
请谨慎执行本操作。
断开路由器与网络的绑定。
该网络下的所有云主机资源网络中断。可能出现大范围的业务中断。
请谨慎执行本操作,仅建议在确认不影响客户业务的情况下,再进行相关操作。
断开路由器与防火墙的绑定。
该路由器下的资源不受防火墙保护,存在安全风险。
请谨慎执行本操作,仅建议在确认不影响客户业务的情况下,再进行相关操作。
断开路由器与外部网关的绑定。
该路由器绑定网络下的所有资源网络无法访问外网,可能造成对外提供的业务中断。
请谨慎执行本操作,仅建议在确认不影响客户业务的情况下,再进行相关操作。
断开防火墙与路由器/VPC连接。
断开的路由器和VPC不受该防火墙保护,存在安全风险。
请谨慎执行本操作,仅建议在确认不影响客户业务的情况下,再进行相关操作。
防火墙/服务链防火墙开启审计功能。
开启审计会同步当前配置的防火墙/服务链防火墙规则至设备,如果规则修改有误,可能会影响底层云主机的网络通信,导致相关业务中断。
请谨慎执行本操作,仅建议在确认云主机提供的业务可以中断之后,再进行相关操作。
关闭防火墙审计服务。
操作导致防火墙规则功能失效。
请谨慎执行本操作。
对虚拟网卡绑定安全组。
安全组绑定会影响到该虚拟网卡的流量转发,可能会导致该云主机网卡网络中断。影响到相关虚拟机提供的对外业务中断。
请谨慎执行本操作,仅建议在确认该虚拟网卡对应云主机提供的业务可以中断之后,再进行相关操作。
对虚拟网卡解绑安全组。
安全组解绑会影响到该虚拟网卡的流量转发,可能会导致该云主机网卡网络中断。造成该虚拟机提供的业务中断。
请谨慎执行本操作,仅建议在确认该虚拟网卡对应云主机提供的业务可以中断之后,再进行相关操作。
对安全组增加或者删除规则。
安全组增加或者删除规则会影响到绑定该安全组的虚拟网卡的流量转发,可能会导致该云主机网卡网络中断。造成该虚拟机提供的业务中断。操作建议
请谨慎执行本操作,仅建议在确认该虚拟网卡对应云主机提供的业务可以中断之后,再进行相关操作。
新建/删除NAT网关
NAT网关对应云主机对外提供的业务会中断。
请谨慎执行本操作,仅建议在确认该云主机提供的业务可以中断之后,再进行相关操作。
回收弹性IP。
资源将不能被外网访问。
请谨慎执行本操作。
删除对等连接。
两个VPC之间的网络连接会中断。
请谨慎执行本操作,仅建议在确认对应VPC之间的虚拟化资源提供的业务可以中断之后,再进行相关操作。
删除VPN。
两个网络之间的网络连接会中断。
请谨慎执行本操作,仅建议在确认对应网络之间的虚拟化资源提供的业务可以中断之后,再进行相关操作。
在负载均衡详情页面删除实服务
该负载均衡可能无法对外提供服务。相关服务无法访问,造成使用该实服务的所有业务中断。
请谨慎执行本操作,仅建议在确认该负载均衡提供的业务可以中断之后,再进行相关操作。
在负载均衡详情页面新建/修改健康检查
该负载均衡可能无法对外提供服务。
请谨慎执行本操作,仅建议在确认该负载均衡提供的业务可以中断之后,再进行相关操作。
配置了LDAP连接的环境,关闭LDAP连接。
LDAP用户无法登陆云平台。
请谨慎执行本操作,操作前请确认无LDAP用户登录云平台。
断开与License server的连接。
系统受权限控制的功能不可用。
请谨慎执行本操作,操作前请确认是否影响云平台的使用。
停用/删除云服务。
系统相关服务不可用。影响客户使用,且不能短时间恢复。
请谨慎执行本操作,操作前请确认是否影响客户对系统的使用。
配置访问控制策略。
匹配访问控制策略的IP地址无法访问云平台。
请谨慎执行本操作,操作前请确认是否影响客户对系统的使用。
重启或者关闭系统。
系统不能使用。
请谨慎执行本操作,操作前请确认是否影响客户对H3C CloudOS使用。
对产品进行安全加固操作。
产品使用异常或升级失败等问题。
请谨慎执行本操作,操作前请确认是否影响系统的使用。
删除应用组。
应用组中包含的应用均会被删除,且不能恢复。
请谨慎执行本操作,仅建议在确认该应用组提供的业务可以被删除后,再进行相关操作。
停止应用组。
应用组中包含的应用均会被停止,停止后不再提供服务。
请谨慎执行本操作,仅建议在确认该应用组提供的业务可以被停止后,再进行相关操作。
删除应用。
应用异常不可用。
请谨慎执行本操作,仅建议在确认该应用提供的业务可以被删除后,再进行相关操作。
停止应用。
该操作会停止应用提供服务,同时该应用正在处理的任务可能会被强制中断(没有配置停止前处理)。
· 如果应用涉及长时间的异步任务处理逻辑,需配置停止前处理。
· 请谨慎执行本操作,仅建议在确认该应用停止所带来的影响范围后,再进行相关操作。
删除容器可用域。
该容器可用域上的应用异常或不可用,且只能待删除。
请谨慎执行本操作,仅建议在确认该可用域上的业务应用可被删除后,再进行相关操作。
移除容器可用域中的节点。
该容器可用域的节点为0时,会导致该可用域上的应用异常或不可用,且只能待删除。
请谨慎执行本操作,仅建议在确认该可用域上的业务应用可被删除后,再进行相关操作。
移除容器集群中的子集群。
该容器子集群被移除后,其上的容器应用不会停,但是平台上无法继续管理,只能待删除。
请谨慎执行本操作,仅建议在确认该容器子集群可被删除后,再进行相关操作。
删除持久卷PV,勾选删除并格式化存储卷。
删除持久卷PV,如果勾选删除并格式化存储卷,该存储卷上的数据将被清除,不可恢复。
请谨慎执行本操作,仅建议在确认持久卷上的数据可被删除后,再进行相关操作。
(1) 创建应用时选择无状态应用类型。
(2) 配置存储卷,选择单节点读写模式的存储卷。
(3) 进行横向扩展、滚动升级等实例发生变化的操作。
存储卷中的数据内容错误,存储卷损坏。
有状态的应用需参考规范进行配置。请谨慎配置有状态应用,遵守k8s对有状态应用的使用指导,再进行相关操作。
· 当使用单节点读写的存储卷时,应避免其出现多节点读写场景。
· 当使用iSCSI存储卷时,还应保障其只有单一挂载点进行写操作。
删除容器集群工作节点。
删除工作节点时,会导致该节点上的容器异常,触发迁移动作,寻找其可调度节点,如果没有则会处于pending状态,直至存在可调度节点为止。
请谨慎执行本操作,仅建议在先将节点置为维护模式,驱散容器后,确认该节点可被删除后,再进行相关操作。
系统后台命令行操作均属于高危搞作,不建议未经过培训的人员执行,且严格限制rm、mv、mkfs、delete命令的使用。
高危险的命令只能由有资质、且经过培训的维护人员执行。如果对此类命令操作不当,可能会导致设备断电、设备重启、业务中断、业务运行异常、重要文件被删除、所有配置被清除、用户无法登录、用户下线等现象发生。
命令类高危操作包括但不限于本手册中介绍的内容,在对高危命令进行操作之前,请先了解可能带来的风险再进行操作。
功能分类 |
操作项 |
命令举例 |
可能带来的风险 |
操作建议 |
集群管理 |
修改主机名 |
通过vi /etc/hosts或 vim /etc/hosts及 hostnamectl修改主机名。 |
执行该命令可以修改主机名名称,将导致含有原主机名的配置文件失效,从而导致主机业务不可用 |
请勿执行本操作 |
系统管理 |
修改系统时间 |
date –s |
执行该命令将修改节点的系统时间,若集群中各节点的时间不同步,将导致集群业务异常 |
请谨慎执行本操作,操作前请评估所有可能产生的风险 |
系统管理 |
节点重启/关机 |
· reboot · shutdown · poweroff |
执行该命令将使节点重启或关机,将导致该节点不可用,节点上的业务将中断 |
请谨慎执行本操作,操作前请评估所有可能产生的风险 |
系统管理 |
结束任务进程 |
· kill · killall |
执行该命令将结束执行中的任务进程,若误操作,将导致对应的功能或业务异常 |
请谨慎执行本操作,操作前请评估所有可能产生的风险 |
系统管理 |
停止crond守护进程 |
· service crond stop · systemctl stop crond.service |
执行该命令将停止系统的守护进程crond,crond是linux用来定期执行程序的命令,停止该进程会造成操作系统异常,从而导致集群业务异常 |
请勿执行本操作 |
系统管理 |
停止docker服务 |
· service docker stop · systemctl stop docker.service |
执行该命令将停止系统的docker服务,docker服务是云平台底层服务的基础,停止该服务会导致云平台服务不可用,影响业务 |
请勿执行本操作 |
系统管理 |
停止origin-node服务 |
· service origin-node stop · systemctl stop origin-node.service |
执行该命令将停止系统的origin-node服务,origin-node服务是云平台底层服务的基础,停止该服务会导致云平台服务不可用,影响业务 |
请勿执行本操作 |
系统管理 |
停止网络服务 |
· service network stop · systemctl stop network.service |
执行该命令将停止系统的network服务,network服务是云平台底层服务的基础,停止该服务会导致云平台服务不可用,影响业务 |
请勿执行本操作 |
系统管理 |
运行来源未知的脚本 |
无 |
来源未知的脚本的安全性无法保证,存在一定的风险,且脚本代码中可能隐藏高危操作指令,运行脚本可能导致无法预知的问题 |
谨慎执行本操作,操作前请明确脚本来源,确保脚本安全可靠,并评估运行脚本可能产生的风险 |
磁盘管理 |
格式化硬盘 |
mkfs.ext4 /dev/sd* |
执行该命令将对硬盘进行初始化并销毁硬盘上的数据,且不可恢复 |
硬盘相关操作请在集群的管理页面进行,管理页面不支持所需操作时,请按照维护流程规范执行本操作,操作前请确认不再需要该硬盘中的数据 |
磁盘管理 |
清除OSD |
· ceph osd out osd-id · ceph osd down osd-id · ceph osd rm osd-id · ceph osd crush remove osd. osd-id · ceph auth del osd. osd-id |
执行该命令将清除OSD,若误操作,可能导致集群业务异常 |
在集群管理页面进行硬盘相关操作时将自动完成OSD相关配置。管理页面不支持所需操作时,请按照维护流程规范执行本操作 |
磁盘管理 |
卸载分区磁盘 |
umount |
执行该命令可以卸载分区磁盘,若误操作,可能破坏该磁盘设备上的文件系统和已有数据,从而导致相关业务异常或数据丢失 |
请勿执行本操作 |
网络配置 |
修改节点的网络配置 |
· ifdown · ifup · ifconfig down · ifconfig up · route |
执行该命令可以修改节点的网络配置,若误操作,将导致节点的网络异常,从而导致集群业务异常 |
请谨慎执行本操作,操作前请提前做好集群组网规划,并评估所有可能产生的风险 |
网络配置 |
启停防火墙(iptables、firewalld) |
systemctl stop iptables systemctl start iptables systemctl restart iptables systemctl stop firewalld systemctl start firewalld systemctl restart firewalld |
执行该命令可能导致k8s容器网络转发规则丢失,无法恢复 |
请勿执行本操作 |
网络配置 |
增删防火墙规则 |
iptablels相关命令 |
执行该命令可能导致k8s容器网络转发异常 |
请谨慎执行本操作,操作前请评估所有可能产生的风险 |
文件管理 |
修改文件或目录的所属群组 |
chgrp |
执行该命令可以修改文件或目录的所属群组,若误操作,可能导致集群业务异常 |
请谨慎执行本操作,操作前请评估所有可能产生的风险 |
文件管理 |
修改文件或目录的拥有者 |
chown |
执行该命令可以修改文件或目录的拥有者,若误操作,可能导致集群业务异常 |
请谨慎执行本操作,操作前请评估所有可能产生的风险 |
文件管理 |
修改文件或目录的权限 |
chmod |
执行该命令可以修改文件或目录的权限,若误操作,可能导致集群业务异常 |
请谨慎执行本操作,操作前请评估所有可能产生的风险 |
文件管理 |
递归删除目录 |
rm –rf |
执行该命令将删除目录中的子目录和文件并忽视提示信息。若误操作,可能导致重要文件或数据被删除 |
请谨慎执行本操作,操作前请确认不再需要该目录及目录中的所有子目录和文件 |
文件管理 |
强制拷贝或移动文件 |
· cp –rf · mv -f |
执行该命令将强制拷贝或移动路径下的文件至新路径并忽略提示信息。若误操作,可能导致路径下原有文件被覆盖 |
请谨慎执行本操作,操作前请确认待移动的文件与新路径下的原有文件不存在重名 |
文件管理 |
操作设备文件描述符 |
· echo · dd |
执行该命令可以修改硬盘设备映射到/dev/目录下的文件,若误操作,可能破坏磁盘设备上的文件系统和已有数据,从而导致相关业务异常或数据丢失 |
请勿执行本操作 |
文件管理 |
修改文件 |
· vi · vim |
执行该命令可以修改文件内容,若误操作,可能导致文件内容错误,从而导致无法预知的问题 |
请谨慎执行本操作,操作前请评估所有可能产生的风险 |
容器镜像管理 |
删除容器镜像 |
· docker rmi 容器镜像名称 |
删除镜像可能导致相关容器无法运行,操作不当,业务无短时间恢复 |
请勿执行本操作 |
容器管理 |
停止容器 |
· docker stop 容器ID |
停止运行的容器,执行该命令,执行后容器不会自动拉起,导致容器提供的服务不可用 |
请勿执行本操作 |
容器管理 |
删除yaml文件 |
· kubectl delete –f yaml文件 |
删除运行的容器,执行该命令,执行后容器不会自动拉起,导致容器提供的服务不可用 |
请勿执行本操作 |
容器管理 |
修改资源 |
· kubectl edit xxxx |
针对控制器、服务等资源执行该修改命令可以修改资源配置内容,如端口、容器副本数等,若误操作,可能导致相关资源不可用 |
请谨慎执行本操作,操作前请评估所有可能产生的风险 |
容器管理 |
删除pod |
· kubectl delete pod xxxx |
删除运行的pod,该命令会让相关pod发生迁移重启,可能会影响到正在使用H3C CloudOS的用户 |
请谨慎执行本操作 |
在系统前台停用/卸载类似IaaS、PaaS、DBaaS组件内容。
系统不能使用。
请谨慎执行本操作,仅建议在确认该组件没有应用价值且可以被删除后,再进行相关操作。
系统升级或对插件的更新。
系统不能使用。
请谨慎执行本操作。
后台默认使用root用户。
增加高危操作风险。
在后台使用root用户的同时增加非root用户作为默认用户。
服务器运行状态或带电状态下进行硬件插拔操作,如插拔硬盘、网卡等。
系统不能使用。
服务器正常下电后在专业指导下操作。
通过服务器电源管理直接关闭或重启服务器,或直接进行电源断电。
系统不能使用。
通过H3C CloudOS提供的关机重启功能进行关机或重启,仅在必要时在专业指导下通过服务器电源管理进行关机或重启。任何情况下都应避免出现断电的情况。
在部署系统集群的主机节点上,部署未经适配的第三方软件。
未经适配的第三方软件与系统集群混合部署,可能导致与系统集群进程或端口冲突,出现资源抢占等异常,导致集群不可用。
此操作禁止执行。