数据架构师的角色
数据架构师是具有远见的高级人才,他们将业务需求转化为技术要求,并定义数据标准和原则,通常是为了支持数据或数字化转型。数据架构师负责构思和设计企业的数据管理框架,该框架描述了用于规划、规范、启用、创建、获取、维护、使用、归档、检索、控制和清除数据的流程。
根据DAMA国际的数据管理知识体系,数据架构师还“提供标准的通用业务词汇表,表达战略要求,概述满足这些要求的高级综合设计,并与企业战略和相关业务架构保持一致”。
数据架构师通常也是数据科学团队的一员,负责领导数据系统项目,并且他们经常向数据基础设施和数据科学负责人汇报工作。
数据架构师的职责
根据Panoply的说法,数据架构师的典型职责包括:
- 将业务需求转化为技术规格,包括数据流、集成、转换、数据库和数据仓库。
- 定义数据架构框架、标准和原则,包括建模、元数据、安全、参考数据(如产品代码和客户类别)以及主数据(如客户、供应商、材料和员工)。
- 定义参考架构,这是一种他人可以遵循的模式,用于创建和改进数据系统。
- 定义数据流,即组织的哪些部分生成数据、哪些功能需要数据、数据流如何管理以及数据在转换过程中如何变化。
- 与多个部门、利益相关者、合作伙伴和外部供应商协作和协调。
不同类型的数据架构师
数据架构是一个复杂且多样的领域,不同的组织和行业对数据架构师有着独特的需求。数据架构师Armando Vázquez识别出了九种常见的数据架构师类型:
- 企业数据架构师负责监督组织的整体数据架构,定义数据架构策略,并设计和实施架构。
- 机器学习(ML)架构师设计可用于ML和AI模型的可扩展系统。
- 解决方案数据架构师为特定的业务需求设计和实施数据解决方案,包括数据仓库、数据集市和数据湖。
- 应用程序数据架构师为特定的软件应用程序设计和实施数据模型。
- 信息/数据治理架构师建立并执行数据治理政策和程序。
- 分析/数据科学架构师设计和实施支持高级分析和数据科学应用(包括ML和AI)的数据架构。
- 云数据架构师为基于云的平台(如AWS、Azure和Google Cloud Platform)设计和实施数据架构。
- 数据安全架构师与安全团队和IT团队紧密合作,设计数据安全架构。
- 大数据架构师设计和实施支持大数据存储、处理和分析的数据架构。
数据架构师与数据工程师
数据架构师和数据工程师的角色密切相关。在某种程度上,数据架构师是高级数据工程师。数据架构师和数据工程师共同构思并构建企业数据管理框架。数据架构师负责构思整个框架的蓝图,然后数据工程师根据这个蓝图进行构建。根据为业务和IT专业人士提供教育管理资源的Dataversity的说法,数据架构师在框架中构思、设计和准备数据,以便数据科学家、数据工程师或数据分析师使用。数据工程师协助数据架构师构建数据搜索和检索的工作框架。
数据架构师与数据科学家
Dataversity表示,数据架构师和数据科学家的角色是相关的,但数据架构师专注于将业务需求转化为技术要求、定义数据标准和原则,并为数据科学家构建模型开发框架。数据科学家则是应用计算机科学、数学和统计学来构建模型的专家。
如何成为数据架构师
数据架构师是一个不断发展的角色,目前并没有行业标准的认证或培训项目。通常,数据架构师是从数据工程师、数据科学家或解决方案架构师开始,通过多年在数据设计、数据管理和数据存储方面的工作经验,逐渐成长为数据架构师。
如何挑选数据架构师
大多数数据架构师拥有信息技术、计算机科学、计算机工程或相关领域的学位,并且对云、数据库以及这些数据库所使用的应用程序和程序有深入的了解。他们理解数据建模,包括概念化和数据库优化,并且表现出对持续教育的承诺。
数据架构师具备以下能力:
- 设计实现预期商业模式的数据处理模型。
- 开发表示关键数据实体及其关系的图表。
- 生成构建所设计系统所需组件的列表。
- 清晰、简洁、有效地沟通。
数据架构师的日常职责是什么?
根据在线课程提供商Coursera的说法,数据架构师的日常职责包括:
- 将业务需求转化为数据库、数据仓库和数据流。
- 创建程序以确保数据的准确性和可访问性。
- 分析、规划和定义数据架构框架,包括安全、参考数据、元数据和主数据。
- 创建和实施数据管理流程和程序。
- 与组织内的其他团队合作,制定和实施数据策略、构建模型,并评估股东需求和目标。
- 研究数据获取机会。
- 开发应用程序编程接口(API)以检索数据。
数据架构师的技能
数据架构师需要具备数学和计算机科学的熟练度、数据管理技能,以及分析和呈现统计信息的能力。
根据求职门户Teal的说法,重要的数据架构师技能包括:
- 数据建模和设计。数据架构师必须能够设计反映复杂业务场景的综合数据模型。他们必须熟练掌握概念、逻辑和物理模型的创建。这是数据架构师的核心技能,也是数据架构师职位描述中最常要求的技能。这通常包括SQL开发和数据库管理。
- 数据治理和合规性。随着法规的不断演变,数据架构师必须确保其组织的数据管理实践符合严格的法律和道德标准。他们需要创建维护数据质量、安全和隐私的框架的技能。
- 云计算专业知识。组织正在不断迁移到基于云的解决方案,因此了解云服务、架构和存储解决方案至关重要。他们还必须了解云安全、混合云环境和成本效益高的基础设施设计。
- 熟练掌握大数据技术。数据架构师必须了解如何实现大数据解决方案以进行数据流和实时分析。
- ML和AI集成。他们必须了解如何构建为AI算法提供数据的数据管道,以及如何为ML工作负载构建数据库结构。
- 跨学科协作。数据架构师必须能够与包括业务领导者、IT专业人员、数据科学家和开发人员在内的利益相关者紧密合作。他们还必须将业务需求转化为技术规格,反之亦然。
- 持续学习和适应。数据架构师需要了解已建立的数据管理和报告技术,并对列式和NoSQL数据库、预测分析、数据可视化和非结构化数据有一定的了解。
其他重要技能包括:
- 系统开发基础。数据架构师需要了解系统开发生命周期、项目管理方法以及需求、设计和测试技术。
- 沟通和政治敏锐性。数据架构师需要具备人际交往能力。他们必须口齿清晰、有说服力、善于销售,并且必须向他人构思和描绘大数据的全貌。
数据架构师认证
尽管没有行业标准的数据架构师认证,但有一些认证可能对数据架构师的职业生涯有所帮助。除了其组织使用的主要数据平台的认证外,以下认证也很受欢迎:
- 认证数据管理专业人员(CDMP)
- Arcitura认证的大数据架构师
- IBM认证解决方案架构师 - Cloud Pak for Data v4.x
- Salesforce认证数据架构师
- TOGAF 9认证项目
数据架构师的薪资
根据PayScale的薪酬分析,数据架构师的中位年薪为133000美元,包括奖金和利润分享在内的总薪酬每年在86000美元至192000美元之间。纽约市的数据架构师平均收入比全国平均水平高出22.7%。在华盛顿特区和马萨诸塞州波士顿,数据架构师的收入分别比全国平均水平高出15.7%和12.7%。数据架构师薪资最低的城市是明尼苏达州明尼阿波利斯(低7.4%)和伊利诺伊州芝加哥(低3.7%)。
以下是PayScale提供的与数据架构相关的一些其他热门职位及其平均薪资:
- 商业智能(BI)架构师:86000-160000美元
- 数据工程师:69000-138000美元
- 数据仓库架构师:78000-154000美元
- 数据库架构师:85000-181000美元
- 信息架构师:75000-162000美元
- 解决方案架构师:82000-174000美元
数据架构师的职位
最近在Indeed.com上搜索数据架构师职位时,显示出了多个行业中的空缺职位,包括咨询、金融服务、医疗保健、高等教育、酒店业、物流、制药、零售和技术。
对数据架构师职位描述的抽样显示了关键责任领域,如:创建DataOps和商业智能(BI)转型路线图、开发和维持数据策略、实施和优化物理数据库设计,以及设计和实施数据迁移和集成流程。
公司在招聘时通常会要求应聘者拥有计算机科学、信息科学、工程或相关领域的学士学位,不过硕士学位更受欢迎。大多数职位要求应聘者拥有8至15年的相关经验。他们希望找到积极主动、经验丰富的创新者,这些人应具备良好的人际交往能力、强大的协作能力以及出色的口头和书面沟通能力。
对数据架构师的需求
对数据架构师的需求非常强烈。美国劳工统计局表示,2023年美国有141,900个数据架构师职位,并预测从2023年到2033年,数据架构师的数量将增长9%,这一增长率高于美国所有其他职业的平均水平。