可能原因:
虚拟机的磁盘镜像文件不存在。
虚拟机未挂载光驱。
虚拟机网卡接入的交换机不存在。
虚拟机磁盘文件的类型不正确。
物理主机内存已被占满。
解决方法:
1. 检查虚拟机的磁盘镜像文件是否存在?文件大小是否正常?如果磁盘文件不存在或大小为0,请重新创建虚拟机。参考如下步骤:
展开CVM左侧“云资源”节点,选中虚拟机vm01,在右侧“概要”页签的“存储路径”中可以看到虚拟机的磁盘存放位置,比如/vms/target3/vm01;
选中虚拟机vm01所在的物理主机节点,右侧菜单中“存储”页签,选中路径为“/vms/target3”的存储,查看该存储下是否有vm01磁盘文件,其大小是否正常(不能为0)。
2. 检查虚拟机是否挂载了光驱,如果其源路径为“/dev/cdrom”,说明挂接了虚拟机所在服务器的物理光驱,请确认该服务器是否有物理光驱,如果没有,请断开虚拟机的光驱连接;如果光驱的源路径为某iso文件,例如为“/vms/isos/winxpsp3.iso”,则请确认该文件是否存在(请参考1中的步骤确认),如果不存在请断开光驱连接。查看虚拟机光驱信息的方法如下:
单击导航树中该虚拟机菜单项,进入虚拟机概要信息页面。
单击<修改虚拟机>按钮,进入修改虚拟机配置页面。
单击左侧导航<光驱>选项,如果右侧有<断开连接>按钮表示该虚拟机已挂接光驱或ISO,若要断开光驱连接,请直接单击<断开连接>即可;如果右侧有<连接>按钮表示该虚拟机没有挂接。
3. 查看虚拟机所有网卡接入的虚拟交换机是否存在,所引用的“网络策略模板”是否存在。如果不存在或不正确,请修改。
4. 请确认虚拟机磁盘文件的类型是否正确,参考如下步骤:
参考解决方法1中步骤b,记录磁盘文件的类型,比如qcow2;
参考解决方法2中的步骤a和b,进入修改虚拟机配置页面,选中磁盘,右侧菜单中的“存储格式”即描述了磁盘文件的格式。正常情况下,qcow2对应于“智能”,raw对应于“高速”。
5. 检查服务器内存是否已经已被其他启动的虚拟机占满了,如果是,请考虑增加服务器物理内存,或暂时关闭该服务器上其他的处于“运行”状态的但是暂不使用的虚拟机。
问题现象:Windows虚拟机开启内存限制后,启动过程中反复关机,导致虚拟机无法启动。
问题原因:若Windows虚拟机配置了比较大的内存,而内存限制却限制了比较小的内存,则可能会出现该问题。内存限制之后,虚拟机被限制的那部分内存需要交换到Swap,如果Swap可用大小不够,则虚拟机将无法启动。
解决方法:开启内存限制功能时需要确认服务器的Swap可用大小足够。
问题现象:虚拟机在安装Windows XP操作系统过程中,虚拟机所在主机关闭。启动主机后,重新进入虚拟机失败,无法继续安装操作系统。
解决方法:
重新启动虚拟机后,立即单击任意键,继续安装操作系统。
重新创建虚拟机并安装操作系统。
问题现象:虚拟机启动失败的情况下,通过控制台Ctrl+Alt+Del重启失败后,虚拟机控制台无法再响应键盘消息。
可能原因:
Windows虚拟机磁盘损坏。
Windows虚拟机没有安装操作系统。
解决方法:
Windows虚拟机磁盘损坏。
在CVM上,为Windows虚拟机挂接上修复镜像ISO,修改虚拟机从光驱引导。重新启动虚拟机,同时打开该虚拟机的控制台,在第一次的时候提示从CD/DVD引导时,选择任意键从光驱引导进行修复,或重新安装即可。
Windows虚拟机没有安装操作系统。
为虚拟机挂接上待安装的操作系统ISO,或配置好网络安装。修改虚拟机从光驱引导或从网络引导,重新启动虚拟机,同时打开该虚拟机的控制台,安装对应的操作系统即可。
问题现象:在集群启用/禁用HA功能过程中,或者集群启用HA功能后,对集群中的虚拟机进行启动、重启、关闭或休眠操作,有时会出现界面提示失败,但过一段时间后却看到实际操作已经成功。
问题原因:
由于主机或者数据中心网络繁忙,导致上述操作结果返回时间超过1分钟等待阈值,系统因等待超时而认为该操作失败,但实际操作已经成功。
虚拟机的存储或网络等配置错误,也会导致启动虚拟机操作失败。由于HA进程会对启动失败的虚拟机周期的启动该虚拟机,一旦虚拟机的存储或网络等配置恢复正常,虚拟机就会启动成功。
解决办法:
1. 检查网络是否出现拥塞,排查导致拥塞的原因;在主机或数据中心网络十分繁忙时,尽量减少或避免对已启用HA功能的集群进行虚拟机启动、关闭或休眠等操作。
2. 在启动虚拟机之前,请确保虚拟机的存储或网络等配置正确。
问题现象:虚拟机安装某些版本的Linux系统,在管理平台上执行关闭或重启操作,虚拟机内部在关闭过程中有时会打印"Disabling IRQ #10 BUG:Soft lockup -CPU#0 stuck for 67s! [migration/0:5]"类的字样,导致虚拟机无法正常关闭。
问题原因:一些版本的Linux系统对virtio网卡兼容性不好,安装此操作系统的虚机若使用virtio网卡,可能会出现此情况,使用普通网卡则不会出现。
解决办法:出现这种情况时,虚拟机内部系统关闭流程实际已基本结束,此时可以在管理平台上选择关闭电源来强制关闭虚拟机。
问题现象:在已启用HA的集群中,对虚拟机进行启动、关闭、迁移等动作时,任务台会提示操作失败,并显示原因为“集群进程未启动”。
问题原因:虚拟机所在主机上的HA服务未启动。
解决办法:
1. 操作员可以根据实际情况,在以下方法中选择适用的方法。
在系统中,对虚拟机所属的集群先执行禁用HA操作,再执行启动HA操作。待操作成功后,主机上的HA服务将会启动。
以root用户登录虚拟机所在的主机,通过执行service corosync start命令,启动主机上的HA服务。
重新启动虚拟机所在的主机。待主机启动后,HA服务将会启动。
2. 待根据上述方法完成操作后,再对虚拟机进行启动、关闭、迁移等动作即可。
问题现象:在增加存储卷或者克隆虚拟机时,出现错误提示信息:“internal error pool iSCSITarget8-lun1 has asynchronous jobs running.”。
问题原因:
操作员执行了如下CVM不支持的操作:
在一个存储池中同时创建多个存储卷。
对镜像文件保存在同一个存储池中的多个虚拟机,同时执行克隆操作(即在一个存储池中同时刷新并读取多个存储卷)。
同时克隆多个虚拟机,并将其镜像文件保存到同一个存储池中。
解决办法:操作失败后,重复执行相应的操作即可。
问题现象:在执行迁移虚拟机、克隆虚拟机、部署虚拟机、将虚拟机克隆为模板、将虚拟机转换为模板操作的过程中,提示“目的存储卷文件****已经存在”。
问题原因:在执行上述操作的过程中,系统检测到目标存储池中已经存在与待拷贝的存储卷(即目的存储卷文件)同名的存储卷文件。
解决办法:
如果管理员不需要保留目标存储池中与待拷贝存储卷重名的存储文件,则删除该存储文件后,重新执行操作即可。如果管理员需要保留目标存储池中与待拷贝存储卷重名的存储文件,则具体操作如下:
对于克隆虚拟机、部署虚拟机、将虚拟机克隆为模板、将虚拟机转换为模板操作:重新执行操作的过程中,更换虚拟机名称/虚拟机模板名称,或者更换目标存储池。
对于迁移虚拟机操作:重新执行操作的过程中,更换目标存储池。
问题现象:跨CVM进行模板部署虚拟机、虚拟机备份、导入虚拟机、导入文件(P2V、V2V方式)操作后,虚拟机启动时,提示找不到磁盘。
问题原因:某些虚拟机(如openSUSE)需要依赖CVM的cid文件(cid是CVM的唯一标识)来识别磁盘分区,跨CVM操作时将导致虚拟机找不到磁盘。
解决办法:对于存在这种问题的虚拟机,不能使用by-id(在Linux操作系统的/dev/disk/by-id目录下依赖磁盘ID生成的标识符)的方式识别磁盘分区,可在/etc/fstab文件中将磁盘分区识别方式修改为by-uuid或by-path方式。
问题现象:在CVM中本地目录方式导入虚拟机时,网络中断前台页面报未知异常,待网络恢复之后再次导入虚拟机,提示存储文件已存在。
问题原因:本地目录方式导入虚拟机,网络中断,后台脚本仍然在执行,后台导入成功,前台没有收到消息,故报未知异常;前台程序调用脚本没有获取返回结果“成功”,将不会去执行虚拟机数据入库、存储池刷新等动作,从而出现此问题中的现象。
解决办法:
1. 对虚拟机将要导入的主机执行连接主机操作。
2. 删除导入失败的虚拟机。
3. 进入主机的存储页签,刷新虚拟机镜像导入的存储池。
4. 删除对应的虚拟机镜像文件。
5. 待网络稳定之后再次导入虚拟机即可。
问题现象:
主机上的虚拟机操作失败。
正在运行的虚拟机突然暂停或者虚拟机状态变为“未知”。
问题原因:主机系统根目录挂接的磁盘空间的可用空间不足,造成虚拟机无法运行。
解决方法:数据中心管理员在该主机上手动释放系统根目录下的空间。建议系统根目录下预留2G以上的空间,才能确保在CVM中正常管理该主机上的虚拟机。
CVM通过Libvirt连接一个主机的连接请求数量有限制,当超过的连接请求限制时,CVM会提示操作员“连接主机失败”。遇到这种情况时,可以稍后重试连接。
问题现象:虚拟机启用大页功能后,在线迁移虚拟机,迁移失败并提示信息如下:虚拟机的内存大小不是目的主机内存页大小的整数倍,请修改虚拟机内存。
解决办法:关闭虚拟机,将其内存大小修改为目的主机内存页大小的整数倍。如果在虚拟机启用大页功能后,需要在线增加虚拟机内存,请确保增加的内存大小也是目的主机内存页大小的整数倍,否则也可能会导致迁移失败。
问题现象:在主机的虚拟机列表页面中,对若干虚拟机进行批量操作(例如启动、关闭等),返回CVM登录界面或者显示网络通信异常页面。
问题原因:任务台刷新过于频繁。
解决方法:
返回CVM登录界面的情况:重新登录CVM后,减少批量操作虚拟机的数量。
显示网络通信异常页面的情况:刷新页面并重新登录CVM后,减少批量操作虚拟机的数量。
问题现象:双机热备环境下执行动态资源扩展任务后,虚拟机状态显示为“未知”。
可能原因:虚拟机状态显示为“未知”可能是由于在双机热备环境下,配置动态资源扩展时将虚拟机回收模式配置为删除,当满足回收条件需要删除该虚拟机,后台执行删除完成而前台数据库未同步时发生主备倒换导致该虚拟机状态显示为“未知”并且在动态资源扩展业务中也存在该虚拟机。
解决方法:
1. 找到该虚拟机所在主机。
2. 选择顶部“云资源”页签,单击左侧导航树[主机池/<主机>]或者[主机池/集群/主机]菜单项,进入主机概要信息页面。
3. 单击<更多操作>按钮,选择[连接主机]菜单项,弹出连接主机确认对话框。
4. 单击<确定>按钮完成操作。
5. 重新连接主机后,该虚拟机即可正常删除并在动态资源扩展业务中消失。
问题现象:使用Red Hat Enterprise Linux 7的虚拟机模板部署虚拟机成功后,通过CAStools设置网络信息失败。
问题原因:在Red Hat Enterprise Linux 7中默认使用NetworkManager守护进程来监控和管理网络设置,通过CAStools来修改虚拟机IP信息时,无法建立NetworkManager会话连接,重启虚拟机或服务后,默认自动连接到原会话连接。所以会导致设置失败。
解决办法:在制作RHEL 7操作系统的虚拟机模板之前,为虚拟机安装最新版本的CAStools,然后使用命令“chkconfig NetworkManager off”关闭NetworkManager服务,再制作模板。
问题原因:当使用同一串口的多台虚拟机同时处于运行状态时,该串口无法确定与哪一台虚拟机进行通信。