文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

谈谈创建有效数据质量规则特别关注的五大要素

2024-12-13 15:04

关注

什么是数据质量规则

数据质量规则是企业对其数据设定的要求。这些要求旨在满足两个相互依存的目标:

1.定义数据应遵循的格式以及数据元素之间应存在的依赖关系。

2.作为企业根据这些要求衡量和检查其数据质量的参考。

比方说,对于即将发起的电子邮件营销活动,我们需要优化工作和成本,需要决定筛选出无效电子邮件。为此,创建简单的规则:

通过仅向经过验证的电子邮件发送消息,企业将能够改善与客户的沟通,并更好地评估活动在电子邮件打开率、点击率等方面的成功。

然而,这套电子邮件数据质量规则绝不是详尽无遗的。例如,如果进行有针对性的营销活动,那么再创建一个规则是有意义的。这将帮助企业避免在消息开头出现令人尴尬的“亲爱的 N/A”或“亲爱的……”:

如果想验证名称的拼写以正确称呼客户,可以提出额外的规则:

创建有效数据质量规则需要考虑的因素

1.业务主题专家需要深入参与

不同的部门有不同的优先事项。要制定全面的数据质量规则,应该正确定义所有主题专家并明智地整合他们的要求。如果不从不同部门的角度看待数据,可能会破坏所有数据管理工作。例如,银行的贷款部门会将贷款金额、贷款到期日和月利率视为关键数据。他们很可能会认为客户名称或客户访问过的分支机构的前缀不值得填写。相反,市场部对贷款相关信息不太感兴趣,但他们会找到客户数据对于有效沟通和创建单一客户视图非常重要。

2.数据质量规则的数量要适中

在争取提高数据质量的过程中,重要的是不要忘形于太多的质量规则。过多的数据质量规则显着降低系统性能,因为需要更多的计算能力和时间来运行检查。根据 10 条规则检查字段与根据 100 条规则检查字段不同。因此,应该找到一个很好的平衡点。

3. 需要采用循序渐进的方法

我们不必创建涵盖所有数据的规则,也不必一口气解决所有问题。我们应该对数据进行分类并定义需要立即关注并尽最大努力的关键元素。例如,要开展有针对性的营销活动,“客户姓名”、“出生日期”和“电子邮件”字段至关重要,而家庭住址可被视为有用的额外信息。完成关键数据后,可以继续处理 #2 优先级,依此类推。简而言之,数据质量管理是接力赛,而不是短跑,然后采取相应的行动。

4.单独对待数据库的每个字段并相应地创建规则

有多种数据质量特征,我们的任务是确定哪些最适合特定领域。我们以'员工全名'和'员工联系电话'为例。第一个字段包含关键信息,而第二个字段不包含。所以,“员工姓名”要满足完整性、唯一性和准确性的要求,而“员工联系电话”——准确性和有序性。这些特征应反映在数据质量规则中,例如:

5. 为数据质量规则选择集中存储还是本地存储

如果是大型多元化企业,应该决定是将规则集中存储还是在每个企业本地存储。每种方法都有其优点和缺点。例如,在完全集中的情况下,将采用标准方法来捕获客户的姓名,无论他们与什么业务进行交互。在分散数据管理的情况下,可以获得更大的灵活性,因为将只关注与特定业务方向相关的数据规则。

综述

如果决定管理数据质量,将不可避免地要处理数据质量规则。建立这些规则需要考虑来自不同部门的意见、不要创建太多规则,否则会损害系统的性能、不必一次完成所有操作、为数据库的每个字段选择单独的数据质量特征、为数据质量规则做出集中存储还是本地存储的决策。

来源:数据驱动智能内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯