在日常的沟通和表达上,人们通常很少对数据治理和数据管理彼此进行严格的区分,也经常将两者“混用”。
然而,数据治理和数据管理表达的是完全两种不同的意思。
虽然不必在任何交流场景中都对词汇的区别进行较真,但是明白二者之间的差异,有利于更好地开展真正的数据治理工作,推动企业的真正“转型落地”。
那么,数据治理到底是什么意思呢?
根据DAMA对数据治理的定义:数据治理是对数据资产管理行使权力和控制的活动集合。
这么官方的表达,其实并不是很好理解。但根据我的理解,可以用更通俗的语言来解释数据治理的内涵——数据治理是指通过对数据管理活动产生影响,达到业务上的目标。
在企业中和数据相关的工作中,数据治理的层次比数据管理更高。
数据管理工作属于常态化的工作,处于执行层,包含一切和数据获取、加工、维护、使用、销毁等全生命周期的活动。
几乎任何企业都会以数据打交道,因此,也可以近似讲,数据管理工作其实存在于所有企业当中。不管是传统企业,互联网企业,还是AI独角兽,都会进行数据管理。
区别只是不同企业的数据管理的成熟度而已!
相比数据管理,数据治理处于决策层,关注的是对数据管理现状的改变和优化,使其越来越好,而数据治理工作,又与数字化转型的大目标是一致的。
数据治理是一个动态的过程!
数据治理既可以面向数据管理活动,也可以面向数据内容质量。对于前者,更关注数据活动的标准、流程、方法、模型、场景的建设;对于后者,更关注基于已经确定的数据质量要求,开展具体的数据整改。
广义上讲,数据治理也包括数据加工与数据价值开发。
对于数字化转型来说,广义上讲,包括技术和业务两大方面的工作,在技术维度的重点就是数据治理,是“打基础”;在业务维度的重点就是场景建设,是“搞创新”。
数据治理和场景建设,二者之间相辅相成,原则上,分别由数据部门和业务部门牵头组织推动,但具体实施上仍需要深度联动方可达到比较好的成效。
值得注意的是,数据治理没有最好只有更好,持续推动数据管理成熟度的不断加深。另外,数据治理是成本项目,数据治理本身并不直接产生价值,必须通过场景建设来实现。
因此,数据治理工作必须有重点,有优先级,要对着业务的实际迫切需求来。例如,在数据质量整改过程中,对很多字段的准确性没有必要较真,要把重点放在对业务产生重大影响的核心字段。
另外,数据治理虽然关注数据管理活动的改变,但是在具体实施上,仍然是一个非常枯燥、劳累的活儿。
为了保障数据治理的有效性,除了顶层方法设计,最终还是要落地到广大基层一线的每一项工作环节中,只有扎根业务,耐心引导,才能真正地影响数据管理,避免“前治后乱”的现象出现。