因此,对于灾难准备再充分也不为过。而制定应急准备计划的时间过长可能造成灾难性后果。在飓风登陆的时候,数据中心需要采用备份电源,更要保障数据安全。
为飓风季节的到来做好准备
天气事件的频率和严重程度增加,需要对应急规划和管理采取更全面和更慎重的办法。
- 数据中心为飓风季节做好准备。数据中心运营人员安全和继续业务运营的能力至关重要,他们确定何时开始为飓风做准备,时刻关注飓风轨迹的发展,并确定在飓风发展之前、期间和之后需要进行的关键活动,有助于实现这一目标。
- 采取行动应对不确定性。一旦有迹象表明某个数据中心设施处于不确定范围内,就立即启动应急计划。而应急准备需要将计划付诸行动的时间越多越好(预计从飓风登陆前至少5天开始)。但是,大自然善变的,不会总是有那么多的事前警告。也就是说,很难假设何时遭到风暴袭击,并在预计登陆时间时采取相应行动。
- 提前120小时。数据中心运营商提醒员工有可能发生重大且不利的天气事件。领导团队应该审查紧急准备清单,以确定在启动停机程序之前必须采取的具体行动。确保现场工作人员有应急设备、食物/水供应和其他必要的设备。确认非现场工作人员可以远程执行关键工作。
- 提前96小时。如有必要,继续向员工通报天气状况和疏散程序的最新情况。检查业务连续性计划,确认调度、工具和供应是否可用。将任何缺陷上报到执行管理、业务连续性和灾难恢复团队。
- 提前72小时。确定可能影响员工住所和数据中心位置的疏散区域。保护办公室设备并开始数复制据,确保所有数据都存储在远程和安全的位置。与客户分享计划,以减轻客户的担忧。在需要的各方之间建立运营技术的桥梁。
- 提前48小时。确定哪些员工需要帮助,以便在风暴到来之前做好准备和撤离。)确定需要搬迁的其他设备。保护设施并开始关闭设施(例如,备份所有备份的数据并关闭设备;用防水罩盖住电脑和机器;关闭/断开所有非关键、非必要和敏感的电气设备。
- 提前24小时。数据中心管理者讨论最后的准备工作和风暴之后恢复计划,并进行最后的现场演练。监测政府发布的天气/紧急服务警报和当地旅行限制。
- 重返数据中心。美国国土安全部网络安全和基础设施安全局(CISA)在灾难应对中发挥着重要作用。他们制定了关键基础设施工作人员名单,并为关键基础设施地点的工作人员签发了进入和返回函。
- 飓风过后进行恢复。数据中心运营商联系员工,确定他们的安全和状态。确定哪些员工可以回去工作,哪些员工应该在家远程工作。确保设备安全,避免电线、煤气泄漏等危害。拍照记录损坏和损失。
- 实现风险评级矩阵。应急准备计划具有很强的共同性,无论地理位置或事件。实现一个风险评级矩阵可以帮助数据中心运营商确定特定位置的最高风险,并告知如何进行投资,以确保系统具有弹性。按照这些思路,如果是全球性公司,需要确保计划符合当地法规。
- 进行演习。数据中心运营商应该至少每年进行一次演习。如果想在企业内部建立一种准备充分的文化,最好表明进行两次。数据中心运营商可能有一个年度遵从性要求,以确保业务连续性和应急行动计划是最新的,但在飓风或其他灾难之后检查计划也是一个好主意,以确定哪些是有效的,哪些是不有效的,以及如何改进这些项目。
- 参与自我救援。充分利用许多专门用于跟踪和提醒人们发生恶劣天气的工具和服务。例如,美国联邦紧急事务管理署(FEMA)有一套免费工具来帮助保持对当地紧急情况的感知。联邦应急管理局的应用程序提供来自国家气象局的实时警报,而紧急警报系统和无线紧急警报提供恶劣天气的更新(不需要注册)。考虑成为国家企业紧急行动中心(NBEOC)的一员,该中心是一个加强私营和公共实体在灾害发生前、期间和之后的信息交流中心。如果数据中心运营商想要为基业务需求量身定制一些东西,可能想要考虑与一家公司签约,该公司可以在暴风雨中监控数据中心员工和经理的位置,并在恶劣天气和其他紧急情况下向他们提供关键警报。
- 保障安全。这句话从字面上和比喻上都适用,因为需要应对灾难之后的混乱。确保数据中心设施有足够的保护,不会受到抢劫者和其他罪犯的伤害,以及强大的网络安全解决方案,并将黑客拒之门外。训练员工对网络钓鱼邮件保持警惕,尤其是那些声称是为受风暴影响的受害者寻求援助的邮件。
灾害天气事件的频率和严重程度可能日益增长,需要对应急规划和管理采取更全面和更慎重的办法。然而,周密的计划和对数据中心设施风险的熟悉,再加上对员工的教育,将对最大限度地减少数据中心损失并加速恢复大有帮助。