数仓建设是数据开发的基础工作之一。在日常数据开发过程中,经常涉及多方协同、互相配合,如何在团队实现规范建表是管理者经常面临的问题。现阶段往往通过建立规范文档,并匹配人工审核的方式来解决,但不仅增加人工成本,也难以避免出现遗漏。
火山引擎DataLeap此次上线的“数仓建表规范”则一举解决这一难题。通过预设置建表规范信息,帮助开发人员实现建表规则自动检验,保障规范在项目中落地,提升数据建模质量。对于数据研发人员来说,可以根据组内规范,快速上手开发,省时省力;对于数据分析师、产品经理来说,通过表名中的产品线、业务域、主题等,方便快速定位所需的表。
据介绍,火山引擎DataLeap“数仓建标规范”功能支持表描述、表存储格式等物理数据检查和表状态、产品线、业务域等标签元数据检查。通过HSQL DDL建表或数据地图中导航式/DDL建表时,均可实现表名规范的自动化检查。
目前,火山引擎DataLeap“数仓建标规范”功能主要应用于以下四个场景:
● 场景1:通过数据研发 HSQL任务新建表,点击解析、调试或上线时,若表名不符合规范,则触发表名规范校验,出现错误提示。
● 场景2:数据研发工作流任务,通过HSQL类型的节点新建表,点击调试或上线时,若表名不符合规范,则触发表名规范校验,出现错误提示。
● 场景3:通过数据研发临时查询->HSQL新建表,点击解析或运行时,若表名不符合规范,触发表名规范校验,出现错误提示。
● 场景4:通过数据地图导航式或DDL新建表,点击解析或提交,若表名不符合规范,触发表名规范校验,出现错误提示。 通过数据地图新建表时,需先选择项目,表名规范检查才会生效。
火山引擎DataLeap是一站式数据中台套件产品,帮助用户快速完成数据集成、开发、运维、治理、资产、安全等全套数据中台建设,提升数据研发效率、降低管理成本,搭配EMR/LAS大数据存储计算引擎,加速企业数据中台及湖仓一体平台建设,为企业数字化转型提供数据支撑。目前,火山引擎DataLeap已经应用于泛互联网、制造、新零售、汽车等领域。