事件响应中的常见反模式
让每个人都接听电话
每次检测到事件时提醒所有人并不是最佳做法。有时通知每个人更容易或增加价值。例如:
- 组织的团队较小,更容易通知整个团队。
- 这个问题很关键,让每个人都参与进来是一个更好的选择。
当团队扩展时,这种做法可能并不理想。您最终会通知与该事件无关的人。这可能会导致警觉疲劳,人们习惯于不注意并经常忽略需要他们注意的事件。
随叫随到的轮换和有针对性的警报有助于高效路由并防止倦怠。
使用 Up 带宽提供状态更新
响应者处理利益相关者期望不断更新状态的关键事件。更新很棒,因为它让每个人都参与其中,并可能提供更多解决方案。有时,团队会处理小事件,他们可以快速解决这些问题,然后将更新传递给相关成员。但是,在处理关键事件时,团队可能被迫更多地关注发送更新,而不仅仅是解决事件。这可能会影响解决过程。
为了解决这个问题,可以指派专人负责处理沟通并向利益相关者提供及时的更新。
进步伴随着混乱
有一种看法认为,在处理重大事件时,人们会四处走动,讨论很多混乱和恐慌。这并非总是如此。当多人响应一个事件时,他们协作并使每个人与所采取的行动保持同步是绝对关键的。混乱和恐慌会使情况恶化,应该通过明确的角色和责任来避免。团队应该有一名事件指挥官,负责做出决策并授权可能影响结果的变更。团队还使用聊天室来有效地提供更新和维护记录。通过设置这些流程,团队可以确保有效沟通并防止混乱和恐慌。
事件呼叫期间的事件严重性和政策讨论
在最后一刻争论事件的严重性是浪费人们的时间。这段时间应该用于解决事件。为事件定义明确的严重性级别非常重要,因为响应、计划和策略是根据严重性选择的。理想情况下,规则应该是技术驱动的、清晰的和自动化的,以便每个事件都具有预定义的严重性级别。
应进行培训和演习,以教育团队如何更好地处理这些情况。
不将事件升级给正确的响应者
当团队没有将事件与正确的响应者关联/关联的机制时,他们无法通知正确的响应者。为了找到合适的人,团队来回走动,减慢过程。未通知合适人员的另一个原因是涉及多个团队且团队结构复杂时。每个团队都有一个可识别且可联系的人,这一点很重要。应该有一个清晰、运转良好的机制将警报发送给正确的响应者,以确保顺利路由和升级。
事后失败
事后分析对于事件响应很重要,因为它们可以帮助您从过去发生的事件中学习并帮助您计划未来的行动。
导致验尸失败的原因有多种:
- 一些团队经常因截止日期和计划外事件而倍感压力。因此,一旦事件得到解决,就不会进行任何事后分析。
- 有时,事后分析最终会陷入责备游戏。只有当人们愿意诚实地讨论问题时,才会有好的事后分析。如果你害怕在验尸过程中受到指责,那就会扼杀通过验尸来寻找问题解决方案的目的。
- 在某些情况下,进行事后分析只是因为过程需要它而不是为了找到答案。
如果没有事后分析,您将无法识别出什么在起作用以及您可以改进的地方。最重要的是,它们可以帮助您避免将来犯同样的错误。因此,事后分析应该是事件响应过程的一个组成部分,并且必须真诚地进行。
不灵活的政策和流程
组织在返回成功结果的实践中找到安慰,并喜欢继续这些实践。但是,有时您无法预测某些事件,并且已建立的解决方案不起作用。拥有灵活的政策和流程可以帮助您适应不断变化的需求并在需要时找到正确的解决方案。你不必鲁莽,应该尝试引入明智的改变。另外,不要害怕做出改变。一些变化会在短期内减慢程序的速度,但从长远来看会带来更快更好的结果。
戴上多顶帽子
在最好的情况下,事件令人困惑。人们在不知情的情况下担任不同的角色,只会增加混乱。在高压情况下,人们期望迅速采取行动。此外,获得的信息有限,并且不清楚谁需要做什么。这只会使情况变得更糟。因此,为人们定义正确的角色和职责非常重要。此外,作为个人,一个人应该让其他人参与进来,并在需要时了解变化。
结论
事件响应是我们不断寻求流程和稳定性的领域,但忽略反模式可能比选择最佳解决方案或刚性流程要糟糕得多。
事件响应团队需要及早发现问题,这样他们才能帮助节省时间、防止挫败感并从长远来看减少重构。因此,摒弃反模式并学习有助于加速事件响应的新流程非常重要。