文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

五种加速云数据仓库迁移的方法

2024-12-13 15:47

关注

尽管提取、转换和加载(ETL)的世界已经从其内部部署的根源发展起来,但构建和管理将向数据消费者交付分析就绪数据的数据管道仍然是非常资源密集型的。以下是减少这些资源需求并缩短成功发行云数据仓库(CDW)的时间的五种方法。

1.为任何数据源查找连接器

您可能有一个深厚而强大的数据工程师团队,他们过去曾为源代码集成编写过代码。他们甚至可能喜欢这项工作,尽管大多数人都很乐意离开这项乏味的工作。无论如何,这是加速数据仓库迁移的最大机会之一。在您之前,许多团队都需要数据库、文件、应用程序或事件流的连接器。有各种可用的预构建连接器工具,涵盖了大多数组织的大部分数据源。当然,也可能有一些您的行业甚至企业所独有的数据源。但是,就像使用预构建的连接器一样,将受益于具有框架的供应商的经验以及处理自定义源的特定经验。

2.自动化基础设施

通过迁移到云,您已经离开了在数据中心管理物理服务器的世界,但如果不小心,您仍然可能会让基础设施工作压倒您的团队。管理数据的重复移动和准备需要调度任务及其依赖关系、配置计算集群、优化成本和性能等等。有不同的选项可以减轻您的团队的工程时间,从开源编排器和无服务器选项到完全管理的管道工具。

3.民主化数据生产

通常认为数据民主化主要是一个成功的云数据仓库(CDW)项目的结果。为更多的数据消费者提供仪表板和数据集当然是数据素养组织的关键。让数据的生产者——那些最熟悉数据的含义和历史的人——能够获得数据也很重要。如果没有这一点,就需要一个中央团队负责选择数据,并将具有意义和价值的数据交付给数据消费者。他们要么花费无数小时研究每个域和数据源,要么最终生成用户无法理解和不信任的云数据仓库(CDW)。更好的方法是为领域专家提供无代码工具,直接构建管道并为分析准备数据。

4.不要忽略排除故障的时间

当您计划迁移到云数据仓库(CDW)时,很容易将所有注意力集中在启动云数据仓库(CDW)所需的数据工程工作上。然而,企业的数据工程师可能经常花费和其他事情一样多的时间进行故障排除。有用于监视的工具,您可以编写用于错误警报的代码。更有效的是完全管理的管道产品,它提供开箱即用的这些功能,并可以在问题到达您的团队之前解决问题。所有这五个技巧将增加您的云数据仓库(CDW)的正常运行时间,这是您的数据工程师的最终时间缓解。这也是实现价值的关键,这取决于你的数据消费者的信任和采用。

5.期待意外

在这一点上,可能会认为自动化已经解决了所有问题,工具的生态系统已经涵盖了所有可以想象到的情况。现实是没有一个简单的按钮,您应该警惕黑盒解决方案,建议管道可以100%自动化。数据源和目标将会改变。您可能决定集成业务目录或数据质量工作流等功能。确保您已经投资了具有灵活性的工具或服务,以处理您独特且不断变化的环境。通过严格的自动化,可以节省数百个小时,但是当他们需要解决边缘情况时,可以节省这些时间。

来源:Harris编译内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯