通俗的来理解的话,数据中台就是一个组织的公共服务产品或平台,将数据加工封装成一个公共的数据产品或者服务的逻辑概念,方便前台业务或后台研发的应用,它不同于一般的简单大数据平台或者数据仓库。
二、数据中台的价值
在过去几年中,借着移动互联网的红利,许多公司都高速发展,进行大规模业务拓展,业务拓展的速度足够快,对公司自然是好事,但是随之而来的问题就是公司内部出现了大量的重复建设和资源浪费的现象。所以中台不是凭空产生的,而是建立在业务之上,有些组织在发展过程中经常有不同的项目,需要重新搭建IT架构,造成资源浪费,搭建中台系统完美解决重复搭建问题。换句话说数据中台是在数据仓库和大数据平台的基础上,从数据采集到分析到展现,将数据包装成若干的数据API 服务,以更高效的方式提供给需求者。未处理的不能给业务带来价值的原始数据不等于数据资产,如果没有从业务的角度对数据进行规划,再多的数据也无法产生价值。数据中台的出现,就是为了弥补数据开发和应用开发之间,由于开发速度不匹配,出现的响应力跟不上的问题。
具体价值可从以下几个方面来看:
快速应对业务对数据处理的需求和业务创新,形成核心壁垒;
丰富标签数据,减低管理成本;
能体现业务系统效果而不仅是准确度;
支持跨主题域访问数据;
数据可以快速复用和共享、但不仅仅是复制;
解决前台和后台的冲突,前台对接用户,后台对接内部开发。企业的数据开发一般是跟不上应用的开发速度,更是跟不上业务的变化速度,这是一个不可调和的问题,而数据中台通过构建数据体系,将其转化为数据开发的能力,提升开发速度。
总结:数据中台把业务生产资料转变为数据生产力,同时数据生产力反哺业务,不断迭代循环的闭环过程。数据驱动决策和运营,取之于业务,用之于业务。数据中台把数据统一之后,会形成标准数据,再进行存储,形成大数据资产层,进而为其服务对象提供高效服务。
三、数据中台下的存储基础设施需求
就当前的情况来看,数据中台在未来一段时间内仍会涵盖数据仓库,数据湖等存储组件,包括结构化与非结构化数据。数据中台如此有价值,支撑这个平台的基础设施也同样重要,俗话说工欲善其事必先利其器,具有优秀的基础架构才能够让用户在未来的数据之路中越走越宽。数据中台是建立在分布式计算平台和存储平台之上的,理论上可以无限扩充平台的计算和存储能力。存储方面具体需要从以下几个方面来考虑:
1、扩展性需求
不仅需要购买行业标准的存储设备,同时还要保证产品的扩展能力,随着业务的增加,能够根据需要进行扩展,能够持续保证组织的需求,通过增加存储节点设备来维持数据增长的容量和性能需求;
2、消除数据流动和迁移麻烦
数据中台存储系统必须满足数据增长而不会受到任何其他系统约束的能力,能够方便的数据迁移和流动;
3、拒绝数据孤岛
为了能够充分利用大数据的机会,组织必须能够访问所有的数据,要实现这一点,存储平台必须能够满足这个要求,消除那些传统的存储孤岛,最好是一套存储系统就能保存和管理所有的数据,完成所有需要的任务,而不是简单的添加另一个存储解决方案;
4、提供全局管理方式
一个集中的数据管理方式在大数据增长迅速的年代已经是不可行的了,单点故障的成本会很高,一个大数据存储平台必须能够管理分布在不同机房甚至不同地域中的数据;
5、保护数据的可用性和可靠性
数据价值越来越重要,为了防止企业级的产品硬件发生故障或其他错误,存储平台必须通过智能软件的保护措施来保证数据的可用性和完整性以及可靠性;
6、集成度高
数据来源广泛与复杂,不同类型的数据访问,处理和分析的方式不同,这就要求大数据时代下存储系统的接口集成度要高,使大数据存储系统能够应对和兼容不同的数据需求;
7、自动化能力强
大数据使得数据量大幅增加以及数据处理流程,方式更加复杂,这给存储系统的管理和维护提出了更高的要求,因此管理自动化也是衡量此数据存储系统的重要指标;
8、弹性成本规划
大数据并不意味着用户必须要在基础架构上一次性投入大额成本,具有弹性扩展的存储系统能够帮助用户实现弹性成本,按需购买和扩容,让不同层面的用户都能在大数据浪潮中开展业务。
最后,个人觉得数据中台的建设并不是每个组织所必须的,打个比方,就好比做某道菜,为了以后方便的做这道菜,事先把加工过的原料和调料都准备好,想吃的时候就可以迅速做出来,但如果吃这道菜的频率很低,偶尔吃一次,可能就不需要事先都准备好了。所以当前台和后台对数据需求的变化频率很低,而组织认为目前的系统架构能很好的支撑,也可以暂时不需要单独建设数据中台。