提起科技运营指标,每个科技人都能说出几个,比如交易量、响应时间、响应率、成功率等。这些指标都是对运营工作中某个领域工作的量化评估。但是,要评估科技运营的整体水平,就必须建立科技运营的指标体系,获取全局性信息,进而通过这些信息去驱动运营工作的发展,达成组织目标。
建设目标及定位
G行建立科技运营可观测性指标体系,为管理人员提供多维度、精细化的运营管理分析框架,并以此为抓手,提升中心运营管理能力、决策水平和服务质量。指标体系建设遵循可量化、可对比、具备行动导向、多场景适配四个原则,聚焦实际业务场景,支持不同层级的应用。
设计思路
指标体系的设计基于OSM + UJM + 应用场景。OSM模型(Obejective,Strategy,Measurement)分别代表目标、策略、度量。UJM模型(User Journey Map),对应运维旅程地图。通过OSM使业务目标结构化,然后融合UJM和运维场景。
以下为OSM层级结构:
OSM层级结构
OSM与UJM模型结合,就是将UJM模型中用户体验作为重要参考指标。通过科技运营指标监测,了解系统和服务的稳定性、性能和安全性,从而更好的支持和提升用户体验。按照用户体验、容量管理、安全性、服务支持等思路梳理流程如下。
指标体系能力矩阵
由于目标和视角各不相同,需要多套指标体系共同指导科技运营工作,G行目前也已形成“横向管理”、“纵向运维”两大指标体系框架,下面分别展开说明。
基于横向管理指标体系框架
横向运营管理体系中,顶层围绕保安全、提效率、论效益、优服务的工作目标,在策略层面从资源管理、资源交付、服务支持、运行保障、安全管控五个运营管理活动要素上进行拆解到具体指标。
基于纵向运维指标体系框架
纵向运维管理以应用为核心,从业务端出发,按照IT系统自上而下调用依赖关系,分为五层技术指标:应用层、网络层、资源层、中间件层、数据库层。最终构建了一套具备总览应用系统健康度,形成立体化分析的指标体系。
如某重要渠道系统日交易量近期高于峰值,且CPU、内存等利用率偏高,就要及时跟进业务运营状态,并考虑资源扩容等问题。
指标体系应用实践
下面介绍G行科技运营横向管理的指标体系建设实践。
资源管理
在资源管理方面,通过对资源精细化控制,提升资源管理效率。主要从数据中心运维规模、资源利用率、数字化能力等方面入手。运维规模指标主要要包括机房规模、设备数量、软件数量、云资源、运维人员数量等;资源利用率指标包括机房使用效率、设备资源利用率、云资源利用率;数字化能力指标是指以数据要素作为数字经济时代的核心资产,通过接入、使用、质量合规等方面对运维数据资产持续运营管理。
资源交付
在资源交付方面,从运维过程中所需要的硬件和软件资源考量,将这些资源的交付能力以数字化形式体现,实现资源交付快速、准确、可靠的能力管理。
服务支持
在服务支持方面,从运维过程中变更、投产、问题等角度出发,通过数字化指标反映应用系统相关服务支持情况,实现数据中心服务支持能力的高效管理。
运行保障
在运行保障方面,从科技运营过程中相关保障工作考虑,将监控、灾备、批量运行、事件和可用性方面指标通过数字化形式体现,实现业务系统的运行保障工作稳定和可靠管理。
安全管控
在安全管控方面,从科技运营安全合规、应急等方面考虑,将安全管控能力相关的指标数据体现出来,使得数据中心安全运营的管理和控制能力满足内外部环境要求。
总结
科技运营指标体系没有最优解,而是企业根据自身发展阶段、战略规划、目标受众、业务流程等因素设计并持续迭代的;好的指标体系能够帮助我们找到改善业务的操作、管理和战略,围绕组织目标,驱动各层级采取对应的行动。
G行将持续以科技运营数据平台为依托,在指标分层分级应用基础上,以提升投入产出精细化管理能力、服务业务发展为目标,通过统一的平台、统一的指标体系,推动运维数据资源共享与整合,营造开放式数据生态,实现运营数据的资产沉淀。