华为数字地图使能服务发布,发布嘉宾从左到右:
华为中国金融交付与服务部部长 杨伟
全球技术服务部企业运维与维护交付运营部部长 汤鹏
浙商银行科技运行部网络管理中心高级架构师 聂爱才
全球技术服务部网络保障与运维服务营销工程部部长 邢俊
华为企业行业运维与提升服务总架构师 张志峰
数据中心网络运维面临看不清、看不全、看不准等挑战
数据中心由存、算、网等硬件基础设施,OS、中间件、数据库等软件基础设施以及上层应用跨层级构成。单看数据中心网络也是有二层交换、三层路由、四至七层的防火墙、IPS、IDS、负载均衡等网元构成。复杂的设备形态、众多的设备厂商导致了在网络运维管理上对全局的网络视图看不清。
而随着云网的融合,进一步模糊了云和网络的边界,传统网络运维对云的虚拟网络不再有效,看不全。
网络一直以来是管道,对管道里的各种流水关注度不够即对上层应用/数据流关注不够,但从应用到基础设施的跨层级故障定位越发的成为数据中心运维的头号难题,我们发现从应用到网络等基础设施的映射、关联看不准。
华为数字地图使能服务,夯实运维数据基座
毫无疑问解决上述运维挑战需要对跨层级的运维数据进行收集、治理和关联/模型分析。因此华为公司发布了“数字地图”软件。类比我们日常生活中的导航,从应用到网络的跨层级运维有一个类似导航软件的载体——数字地图。
数字地图使能服务首先就是让数字地图能够转起来、用起来。数据中心跨层运维首要的就是收集各层运维数据甚至部分业务数据,这里通过:数据采集适配服务实现南向物理设备、东西向其他运维软件的打通来实现多层级的运维数据采集;由于各层级数据存在差异如格式等,这里通过多源数据转换服务将所有跨层关联数据进行治理、归类并作为数据资产进行管理。
有了运维数据资产,就可以基于运维需求来产生类似导航地图里的各种生活服务了,当前我们已具备的有:网络动态拓扑、网络路径导航、变更仿真校验、应用星空拓扑、应用业务重保、应用故障定界。当运维架构中上层需要数字地图里的价值数据,那需要通过北向开发适配服务来完成。
重大保障或关键业务保障场景下故障快速定位,实现应用网络一体化运维
在重大保障或关键业务保障场景下,通常大的流程节点分为保障前、中、后期。这种大的流程、逻辑是保持一致的,以 “在线支付业务”关键保障为例。
保障前期,通过对跨层运维数据分析,使得“在线支付业务”系统的端到端调用链、以及该系统相关网络的性能质量监控,做到“在线支付业务”系统的全局可看。
保障中期,我们希望保障中无任何事情发生,一旦出现突发问题,我们也可以一键式的对数字地图上应用和网络的跨层运维数据进行全域分析,秒级定位出故障点并快速进行业务恢复。
保障后期,针对保障中突发业务,我们事后可以对已经保存的数据进行回放实现故障回溯,找出故障的界面和隐患并及时消减相关隐患。
华为数字地图使能服务,就是激活数据中心中跨层级各运维数据,通过对不同运维场景的需求挖掘和功能构想,将每一个运维场景都演进为导航地图里特色的“生活服务”,助力数据中心运维越来越场景化、越来越高效。