文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

疫情对于云计算灾难恢复的启示

2024-12-11 20:02

关注

[[331898]]

一位平台架构师表示,他在2020年3月批准了一个HDInsight群集(微软公司提供的托管Hadoop产品)到我生产环境的部署。正在为期待已久的基于Azure的数据平台的下一阶段上线,当他突然从DevOps主管那里接到电话时,主管说,“我在新的生产群集上出现配置错误,无法部署。而群集无法扩展,无法获得足够的节点。虽然有足够的配额,但是没有足够的节点来扩展集群。”

事实证明,这种情况是微软Azure北欧地区数据中心容量已满。微软公司像所有云计算提供商一样,超额配置了其物理基础设施,也就是他们可以向客户提供虚拟机和CPU核心配额,因为他们知道客户不会全部尝试一次消耗掉所有容量,但却遇到了意外情况。

欧洲各国由于疫情持续蔓延而颁布出行禁令,企业必须对要求全体员工在家工作迅速做出反应。在发布出行禁令几天之后,IT部门必须应对对VDI和协作工具的空前高峰,并且他们大量地转向云计算,毕竟,这就是采用云计算技术的目的。

MicrosoftWindows虚拟桌面(基于云计算的Windows10远程工作解决方案)最近非常及时地进入了通用可用性,IT部门急于部署远程桌面解决方案。Microsoft Teams提供了可扩展且无缝的协作和电话会议解决方案,但是所有会议突然都变成了在线会议,这一峰值需要满足于某个地方的物理基础设施。

其结果是Azure数据中心对计算的需求激增,并且无法满足所有客户的需求。除了无法部署新资源之外,一些客户还难以启动现有资源,例如,一台虚拟机会在一夜之间关闭并按计划启动,而他们无法在早上再次启动。

该分析师为此与负责此特定客户的Microsoft客户团队进行了交谈,他们表示,其容量管理团队已了解情况,并正在为医疗保健和紧急服务的客户确定容量的优先级。当分析师得知有更多硬件在订购中时,情况看起来很暗淡,但供应链正在影响交货时间。

幸运的是,客户经理能够在每日容量管理会议上代表客户并提供必要容量的理由。还被告知微软公司将20,000个vCPU工作或内部工作负载移出了Azure北欧数据中心,并在一周后成功部署了HDInsight群集。

分析师目前正在为另一个客户端制定灾难恢复(DR)策略,该策略基于在一个Azure区域中发生的服务(如果不太可能发生区域性故障)的故障转移。这是一种基于微软公司自己的架构建议的标准模式。但是,如果整个Azure区域确实崩溃了,那么其余Azure区域中对资源的需求还会突然增加。在灾难恢复测试中可以实现的恢复时间目标(RTO),实际上可能由于容量限制而在实际事件中无法实现。

在设计Azure灾难恢复策略时,分析师为此提出的建议是:

 

来源:机房360内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯