而在任何时候都可以从容地解决重大IT事件,采取一些实践是值得的。因此,人们要了解网络安全方面的优秀实践和最新预测。
1.明确定义重大IT事件
当一个问题对很多用户造成巨大的业务影响时,可以将其归类为重大事件。它迫使企业偏离现有的事件管理流程。
在通常情况下,高优先级IT事件被错误地视为重大事件,许多企业没有针对安全漏洞的事件计划。这可能是由于缺乏明确的ITIL指南。因此为了避免混淆,企业必须根据紧急性、影响和严重性等因素明确定义重大事件。
2.拥有专属的工作流程
实施强大的工作流程可帮助企业快速恢复中断的服务,重大事件的单独工作流程有助于无缝解决问题。在为重大事件制定工作流程时,专注于自动化和简化以下工作:
- 确定重大事件。
- 与受影响的利益相关者沟通。
- 分配合适的人员。
- 在整个生命周期内跟踪重大事件。
- 违反服务等级协议(SLA)时升级。
- 解决和关闭。
- 生成和分析报告。
企业需要确保有一个无需批准的流程来解决重大IT事件。
3.投入正确的资源
企业确保其最佳资源正在处理重大IT事件。此外,由于这些事件对业务的影响很大,因此需要明确定义他们的角色和职责。企业需要设立一个专门的或临时的团队,具体取决于重大事件发生的频率。
一些企业有一个由重大事件管理人员领导的专门处理重大事件的团队,而另一些企业则有一个由各部门专家组成的充满活力的临时团队。企业的主要目标必须是保持其资源参与,并避免时间和优先事项的冲突。
4.培训员工并为他们配备正确的工具
IT团队并不知道什么时候会发生重大事件,但处理事件的第一步是做好准备。企业可以将重大事件管理团队分成几个小组,并对他们进行重大事件管理方面的培训,并通过将技能与需求相对应来分配职责。
定期运行模拟测试,以确定优势、评估性能,并根据需要解决问题。这也将帮助企业的团队应对压力,并在面对实时场景时做好准备。企业为团队配备合适的工具,例如具有无缝连接的智能手机、平板手机和平板电脑,以便他们在紧急情况下随时随地工作。
5.配置严格的服务等级协议(SLA)和分层升级
企业需要为重大IT事件定义严格的服务等级协议(SLA),可以设置单独的响应和解决服务等级协议(SLA),并为任何违反流程的行为提供明确的升级点。如果指定的技术人员缺乏解决事件的专业知识,需要遵循人工升级的流程。此外,确保备份技术人员始终可用。
6.让利益相关者了解情况
在重大IT事件的整个生命周期中,需要向利益相关者发送公告、通知和状态更新。自助服务门户中的公告将防止最终用户提出重复的问题并使服务台超载。
此外,在由重大事件引起的服务停机期间,每小时或每两小时发送一次更新。企业还要设立专线,立即响应重大事件,并为利益相关者提供支持。企业可以使用最快的通信方式,例如电话、直接预约、实时聊天和远程桌面控制,而不是依赖电子邮件。
7.将重大IT事件与其他ITIL流程联系起来
在解决重大事件之后,通过问题管理方法进行根本原因分析。然后,遵循变更管理流程,实施组织范围内的变更,以防止将来发生类似事件。
通过使用资产管理提供有关所涉及资产的详细信息,加快整个事件、问题和变更管理流程。通过确保事件响应与网络保险政策保持一致,需要覆盖所有资产。
8.创建知识库
可以创建简单的知识库文章模板来捕获关键细节,例如文章涉及的重大事件的类型、使用文章解决的最新问题、文章的所有者以及实施解决方案所需的资源。
为重大IT事件单独创建和跟踪解决方案,以便可以轻松快速地访问它们。
9.重大IT事件的审查和报告
记录和分析所有主要的IT事件,以便确定需要改进的地方。这将帮助企业的团队在未来有效地处理类似问题。
此外,生成特定于重大事件的报告,用于分析、评估和决策。可以生成以下报告以帮助进行有效的决策:
- 每月提出和关闭的重大事件数量。
- 重大事件的平均解决时间。
- 造成重大事故的停机时间百分比。
- 与重大事件相关的问题和变化。
10.记录重大事件流程以持续改进服务
最好的做法是记录主要事件流程和工作流程以供参考。这可以捕获详细信息,例如所涉及的人员数量、他们的角色和职责、沟通渠道、用于修复、批准和升级工作流的工具,以及总体战略以及响应和解决的基线指标。
企业的管理层必须定期评估流程,以检查是否达到了重大事件管理的目标绩效水平。这可以帮助纠正缺陷,并为持续的服务改进服务。
结语
虽然发生重大IT事件在所难免,但处理每一次事件都是企业IT团队的学习过程。坚持实施这些优秀实践可能是掌握处理重大事件技能的第一步。
原文10 best practice processes for dealing with major IT incidents,作者:Prithiv RajKumar