当VSAN主机由于故障或进行扩容操作需要停机维护时,在关闭ESXi主机前和启动ESXi主机后需要进行一些必要的检查操作,以免对vSAN集群环境造成不可预知的风险,影响集群中的虚拟机运行。以下是vSAN集群中的ESXi主机停机维护的主要步骤。
1.确认受影响的虚拟机
通过vSAN集群的“监控”->“vSAN/数据迁移预检查”->“预检查”菜单,进行主机的数据迁移预检查,确认哪些虚拟机会受到vSAN关闭的影响。
如果选择vSAN主机关闭时不进行数据迁移,可以通过vSAN集群的“监控”->“vSAN/虚拟对象”->“查看放置详细信息”菜单,检查受影响的虚拟机的虚拟磁盘的组件位置。
检查组件的状态,确保在关闭主机后虚拟对象的组件在其他主机上的状态是“活动”的。例如需要关闭的是212主机,那么关机前要确保组件在其他主机(211)上的状态是“活动”的,同时212主机在维护期间要确保211主机保持正常运行,否则会影响虚拟机的数据访问。
2.配置vSAN数据重构延迟时间
vSAN主机停机时如果选择“不迁移数据”,默认情况下,60分钟后集群将会同步数据,恢复虚拟对象的数据冗余,以保证虚拟机的安全。根据主机物理维护时间的长短,可以通过vSAN集群的“配置”->“vSAN/服务”->“高级选项”菜单设置数据重构的延迟时间。
将时间调整到合理的时间值后,集群将不会在主机维护过程中重构数据,以免造成不必要的大量的数据读写操作。
3.将要关闭的主机置于维护模式
在将要关闭的主机进入维护模式后,通过vSAN集群的“监控”->“vSAN/虚拟对象”->“查看放置详细信息”菜单,确认受影响的虚拟机的虚拟磁盘的组件状态,可以看到在关闭主机上的组件处于“缺失”状态。
4.关闭主机,进行相关的物理维护操作
关闭要维护的ESXi主机的电源,然后进行相关的故障处理或扩容等维护操作。
5.启动主机,退出维护模式
在物理维护操作完成后,将主机加电,然后退出维护模式。
6.检查受影响的虚拟机的组件状态
通过vSAN集群的“监控”->“vSAN/虚拟对象”->“查看放置详细信息”菜单,确认受影响的虚拟机的虚拟磁盘的组件全部都处于“活动”状态,说明数据同步完成,停机维护过程完成。