观察网络可能会显著提高企业网络运营 (NetOps) 的成功率。企业团队可以采取几个步骤来实现网络可观察性,这样做将使网络管理员能够更好地了解他们的网络,并保证为其最终用户提供足够的服务。
什么是网络可观察性?
当团队监控网络时,他们会关注网络的性能。如果网络中出现问题,通过监控,网络管理员能够检测到问题。虽然团队能够通过管理和监控解决网络问题,但网络可观察性可以提供对网络更彻底的评估。当团队观察网络时,他们的目标是了解问题如何发生、如何纠正问题以及如何改进网络,以防止未来发生错误。
软件工程咨询公司Data Ductus的首席技术官Göran Edin在最近的网络研讨会上说,网络可观察性也可以定义为“在尽可能短的时间内,解决重建最终用户体验状态变量的问题-对比测量到的状态变量”。
Edin的定义是对Rudolf Kalman对控制系统可观察性定义的修正,他列出以下原则,企业可用于使其网络服务具有可观察性:
- 衡量最终用户体验;
- 使用遥测方法来收集数据;
- 提供服务保证,确保为客户提供优质服务。
1. 关注最终用户体验
研究表明,衡量最终用户体验具有积极影响。根据Enterprise Management Associates对2020年网络管理大趋势进行的研究表明,三分之一的IT问题由最终用户报告,然后NetOps团队才检测到这些问题。在受访者中,那些衡量和监控最终用户体验的企业,运营更为成功。
虽然这些统计数据强调网络监控的重要性,但观察最终用户体验可以提供有关如何改进网络的更有价值的信息。Edin说,监控网络只能让团队收集有关网络的信息,这“还不够”。
网络专家应该观察网络,以获得洞察力,并创建数据驱动系统来做出最适合网络发展的决策。随着越来越多的应用程序迁移到云端,或演变成复杂的分布式系统,企业投资于基于最终用户体验的可观察性系统可以简化NetOps管理。Edin说,理想情况下,该系统应该能够预测潜在问题、模拟场景,并推荐网络改进。
2. 使用遥测方法用于NetOps
网络专业人员需要收集足够的数据来创建系统,以使他们的网络服务可被观察。他们必须使用最相关的遥测方法来收集数据,以监控和观察网络服务。现在有多种遥测方法,但与网络监控最相关的类型是数据配置、合成数据和设备遥测。
- 数据配置是网络管理员选择数据来代表操作意图。发现操作意图是迈向基于意图的网络的一步,它可以让网络专业人员了解他们的网络行为。Edin说,根据他的经验,网络专业人员很难在不知道操作意图的情况下监控最终用户服务。
- 合成数据使团队能够使用合成流量进行测试以模拟最终用户体验,Edin称,这是他们最接近模拟最终用户体验的方法。模仿用户交互让管理员可以评估用户如何与网络互动。
- 设备遥测是管理员使用指标来检查网络状态。根据Edin的说法,对于团队来说,当与合成数据结合使用时,这种遥测形式是有价值的数据收集工具,因为这可以确定问题的根本原因。
虽然这些方法对于收集数据很有用,但它们主要用于监控网络。当团队想要提供服务保证时,它们变得更加相关,因为这些数据可用于确定网络是否正常运行以及其服务是否正常工作。
为了收集高质量数据,以用于网络可观察性,网络团队必须确保他们收集的数据具有相关性、连贯性、可访问性、一致性且定义明确。通过高质量数据,他们可以识别哪些服务在他们的网络中有效,哪些内容需要改进以及如何部署任何修改。
3. 确保服务保证
Edin说,网络可观察性是服务保证过程的一部分。他补充说,当使用监控网络的遥测方法构建可观察性平台或系统,团队还应该准备好“数据预处理层”,可以“清理”从遥测方法收集的数据。此清理过程可确保数据的高质量,以用于可观察性平台。
具有软件能力的网络团队可以创建自己的数据预处理层或其他服务保障系统。他们还有机会使用5G来虚拟化基础设施并,运行测试代理,以确认网络的高性能服务是否正在运行。尽管如此,可观察性平台最终必须为团队生成相关数据,以了解他们的网络,并为客户提供服务保证。
Edin 说,服务保证也应该是整个服务生命周期的一部分。
他指出:“这样做不仅可以消除通过人工处理引入错误的风险,还可以将交付速度从数周或数月缩短到至少数天”,并补充说加快流程也将降低劳动力成本。
整合可观察性与DevOps
网络团队还可以按照Edin概述的相同步骤将服务保证纳入DevOps流程。首先,他们应该衡量最终用户体验。然后,他们可以确定有关他们网络的问题,并需要相应的答案。回答这些问题的简单程度也有助于确定网络的可观察性。
网络专业人员应该使用最好的遥测方法来深入了解他们的网络服务,并创建他们的系统。Edin说他建议团队从数据配置开始,以确定操作意图。
他指出:“确保你有真实的来源,展示并告诉你有哪些服务。”
他接下来建议团队使用设备和合成遥测,以连贯地解释最终用户体验,并检查系统资源是否成功。如果需要,团队可以添加其他遥测方法。
最后,服务保证应集成到网络自动化中。应根据需要,多次执行、审查和重复整个过程。
随着NetOps变得更加自动化,以及开发新服务,团队可能会改变其网络的行为,从而改变最终用户的体验。Edin说,确保服务保证,以及服务生命周期的其他步骤,通过网络可观察性可以降低这种风险。