VMware有很多工具可以在系统出现故障时确保VM可用性。对于应用程序和VM的完整性和可用性,灾难恢复 (DR) 和虚拟灾难恢复至关重要。VMware DR可以确保系统保持安全并且应用程序不会出现故障。
VMware DR的解释
从历史上看,灾难恢复是混乱的过程,需要很多手动交互才能启动DR服务。而VMware DR提供与VM类似的优势,并支持更快、更动态的DR故障转移。
VMware DR提供比DR过程更大的灵活性,因为几乎所有基于VMware的DR都是通过块级复制完成,例如使用Zerto和Veeam。大多数基于VMware的DR产品还允许你选择一个时间点进行恢复,因为它们会保留每隔几秒拍摄的时间点快照(PIT 快照)。
你可以将VMware DR视为在多个级别上工作。大多数上层VMware产品都附带大量技术来帮助确保VM可用性。这包括集群级别的VMware DRS。
VMware DRS会检测并重新启动备用主机上的任何故障虚拟机。这意味着当出现故障的虚拟机(或一组虚拟机)在备用主机上重新启动时,会有少量停机时间。然而,对于应用程序级别的故障,这并不是完美的解决方案。VMware DRS的一项非常有用的功能是,你可以将规则应用于虚拟机以将它们分开,并确保它们永远不会驻留在同一主机上,这非常适合集群应用程序。
VMware DRS可帮助你保护应用程序,并在VM级别启用DR。基于VMware的灾难恢复产品可确保应用程序的完整性和可用性,防止硬件故障、数据损坏和勒索软件。还有一种情况是,没有一对一的物理服务器设置-必须在DR数据中心内保持温暖状态。
大多数有远见的企业使用主要的云供应商来虚拟地将他们的应用程序故障转移,从而消除对昂贵硬件的需求。与二级物理站点相比,云备份的价格也更低。大多数基于VMware的云提供商不支持最终客户使用物理机,因为它们效率低下。
云备份唯一的潜在问题是很多企业希望将其应用程序虚拟地故障转移到云端的情况。大量的故障转移会导致资源短缺。
熟悉VMware环境中的常见灾难
你可以将VMware部署中最常见的灾难类型分为三大类:
- 应用程序升级失败。如果没有以前的PIT快照,答案是故障转移到DR。
- 勒索软件。如果系统受到感染,可故障恢复的多个PIT快照将非常有用。这些PIT快照可以减少信息丢失,因为恢复点非常频繁。
- 人为错误。如果你不小心删除了无法恢复的文件或文件组,则可以简单地故障转移到DR。有些先进的VMware DR产品可以恢复这些文件并加快服务恢复速度。
因为VMware服务器承载了大量的VM,所以没有哪一组特定的VM会比其他VM受到更大影响。但是某些类型的VM丢失会对服务可用性产生巨大影响,例如中间件数据库。
数据库服务器的丢失会影响依赖于该服务器的多个应用程序。所以应该始终有一个与应用程序组相关联的层。这意味着关键应用程序应在发生故障时获得优先权。
VMware DR最佳做法以确保工作负载可用性
如果你没有适当的备份方案作为最后的手段,那你可能无法恢复。最佳做法表明你应该遵循3-2-1备份策略,该策略规定你应该在两种不同类型的媒介上保留三份数据副本,一份副本位于异地。大多数现代备份产品让你可以将一份副本放在异地副本并复制到云端,并提供不变性,以保护数据免受恶意行为者的侵害。
这些备份的完整性也很重要。最佳做法要求定期测试备份以确保它们正常工作。这就是VMware使测试变得更加容易的地方。大多数基于VMware的备份服务都可以轻松恢复 VM,而不会出现问题,例如在灾难情况下将VM恢复到云端。
更有用的是,你可以将VM还原到隔离网络,这样在测试还原的VM时就不会影响生产。这些功能有助于缓解本质上困难和繁琐的测试场景,使你能够在隔离环境中按需测试,而不会影响生产。
恢复、测试和删除VM越容易,意味着你更有可能测试这些VM,并确定,即使发生最坏的情况,VM也不会发生故障。