为此,Gartner提出了组装式数据分析架构概念,以数据编织为基础,让数据进行更好的关联、从而能够服务不同用户,创造更大的价值。
Gartner研究总监孙鑫
打通数据孤岛,盘活数据资产
中国企业的数字化转型经历了比较长的进程,期间建设了诸如交易型的数据库、分析型数仓,数据湖等系统,由于在数字资产上的投资顺序不一样,导致每个系统之间相互孤立,形成了非常严重的数据孤岛,无法有效发挥数据的价值。
Gartner研究总监孙鑫在近期接受记者采访时表示,企业在IT建设上虽然投入了很多的财力和人力,但各个系统与应用之间相互割裂,存在着数据鸿沟的问题。这也是很多企业为什么要建设数据中台的根本原因。他强调,通过数据中台给予企业更快速的数据交付,将数据进行高效串联,进而挖掘数据价值、盘活数据资产,找到真正可以复用的数据,实现业务创新升级,已成为企业数字化升级的共识与挑战。
据介绍,虽然中国已经有非常多的数据中台生意,但真正只做数据整合(Data Integration)的厂商并不多。通过Gartner多年的研究显示,目前中国企业对于数据整合的需求非常旺盛,而数据整合也是数据中台最核心的解决方案。
那么,企业在构建数据中台前,如何让业务进行更好的沟通?又该如何去做呢?对此,孙鑫给出了自己的建议。他认为,如果想让数据中台真正产生价值,那就需要进行一个情境化设计,为企业的业务问题产生相关业务驱动的数据能力。
孙鑫表示,企业要考虑搭建一个兼具IT中央以及业务侧的分散数据分析团队,以联邦形式为业务侧做出贡献。业务侧的同事应该更多关注如何快速部署、贡献业务侧相关数据、产生业务报表。所以,如果要搭建技术端的数据中台,在“人”这一侧、在组织架构这一侧也要做相应努力。
更好地关联数据,服务不同用户
在本场数据中台技术洞察媒体沟通会上,孙鑫还就记者普遍关注的Gartner组装式数据分析进行了解读。
孙鑫告诉记者,Gartner组装式数据分析有一个基础,即“数据编织”,其能够帮助企业编织起一张基于知识图谱的虚拟网,对企业所有的数据资产进行编织。孙鑫表示,Gartner的数据编织并非单纯地把数据关联在一起,而是更具情境化地利用知识图谱能力对数据进行编织,涵盖每一个数据消费行为的相关信息,而这些数据消费行为是企业的元数据。因此,此知识图谱不仅仅建立在企业的数据本身,而是建立在数据消费行为之上。
孙鑫表示,如果企业要打通不同的系统,Gartner就会推荐使用数据编织这一设计理念,不仅能够把数据全部收集在一起,而是还能够对数据进行更好的关联,从而能够服务不同用户。因此,数据编织是帮助用户在合适的时间获得合适大小的数据,并且根据用户需求来及时提供,帮助企业、用户获得更具情境化的数据。
针对在中国很多企业习惯性的只用收集的方式管理自己的数据,无法把收集好的数据快速产生价值这一问题,孙鑫表示,好的数据管理模式应该是收集、采集以及连接的平衡,数据中台对于数据管理而言,不一定要用连接或用收集,这就要求企业根据自己的业务特点掌握好平衡。
孙鑫强调,数据中台可以根据元数据,即数据消费行为及机器生成的性能指标来判断数据源到底用采集好、还是连接好?并通过元数据找到数据消费行为后,对其进行资产化处理。因此,数据中台的演进方向是把握好数据采集和连接的平衡。
利用数据编织理论完善中台建设
既然提出了数据编织理论,那么对于企业而言,如何利用Gartner提出的数据编织理论来完善中台的建设?
孙鑫从利用知识图谱找到真正需要复用的数据并指导业务,构建知识图谱赋能的业务语义层,自助式分析与组装式分析的平衡,数据中台应该是个组装式能力创新平台,组装式数据和分析正在塑造分析应用的未来,以及借助DevOps加速数据和分析应用的上线-DataOps这六个方面,进行了详细的解读。
谈到组装式数据分析的优势,孙鑫表示,Gartner提到的组装式数据分析正在塑造数据分析应用的未来。据介绍,“组装式数据分析”底层依赖于Gartner提到的数据编织设计模式,上一层基于企业已经购买的类似于“报表平台、分析工作站、自助式分析平台”或“数据科学平台”,因此它给用户的体验不再是这些技术平台,而是一个能力平台。这些能力平台,将被“微服务”容器化,以高度的开放性确保用户“上”到数据中台后可以得到一个组装式体验。对于用户而言,未来需要什么样的能力,都能够在数据中台上找到,然后通过对能力进行组装,从而完成各自业务领域想要的数据产品或分析产品。
“随着快速搭建应用或快速建立数据产品需求的上涨,企业可以把DevOps实践放到数据相关的应用上,Gartner称之为DataOps。”孙鑫表示,企业可以把自己过去从应用开发中用到的一些实践,如版本控制、持续集成、持续开发等能力,放到数据相关的应用开发中,让用户能快速地从测试阶段走向生产阶段。