文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

Hightouch如何使用“反向ETL”在仓库和SaaS应用程序之间同步数据?

2024-12-02 23:55

关注

【51CTO.com快译】Hightouch在Amplify Partners牵头的一轮融资中筹资1210万美元,这个平台旨在帮助企业将客户数据从数据仓库同步到CRM、营销及其他众多业务工具中。

现代企业数据堆栈包括各种组件,从数据摄取工具(比如Fivetran)到基于云的数据仓库(比如Snowflake和谷歌的BigQuery),不一而足。通过以这种方式汇集来自多个来源的数据,公司可以运行查询,并生成无法从独立数据孤岛获取的洞察力。一旦数据已经在仓库中,用户需要取出数据,并导入到Salesforce之类的应用程序中,Hightouch在数据工程界就有了用武之地。

因此,虽然Fivetran是许多公司用来将数据“提取、转换和加载”到仓库中的最知名平台之一,Hightouch却恰恰相反,这就是众所周知的“反向 ETL”(reverse ETL)。

图1:Hightouch:将数据从仓库导入到业务应用程序

简单来说,反向ETL就是在表之间复制粘贴数据。比如说,一家公司可能希望将数据从服务台管理平台Zendesk获取到Salesforce。为此,他们可以使用Fivetran将数据导入到仓库,然后使用Hightouch从仓库获取数据并导入到Salesforce。这么做可以帮助销售团队明确一位客户通过Zendesk请求怎样的支持。

Hightouch联合创始人Kashish Gupta告诉媒体:“由于让仓库中的数据更有用,Hightouch 使Fivetran更强大,反之亦然——如果没有Fivetran提供的数据,Hightouch中的许多工作流程将无法实现。”

Hightouch于2018年在旧金山成立,迄今为止三年内积累了众多知名客户。除了与 Nando's和Autotrader等B2C公司合作外,它还与Kong、Plaid和Mattermost等B2B公司合作。

集成式

Hightouch支持众多公司的约60个“目的地”集成,从 ActiveCampaign、Anaplan、Asana、 Amplitude到Facebook、Google Sheets和Marketo,不一而足。该公司还提供“自定义目的地”选项,使用户能够构建自己的Hightouch目的地。而在数据来源方面,Hightouch可以获取来自亚马逊的Redshift、Databricks、谷歌的BigQuery、Looker、Snowflake和Airtable等来源的数据。

Hightouch本身是一个SaaS应用程序,公司可以将其部署在选择的任何云上,允许非数据工程师通过SQL查询数据。Hightouch然后在其UI中将列映射到相应目的地SaaS工具的列。Gupta说:“然后,Hightouch自动实时同步永久有效的数据。”

图2:将“仓库”模型中的字段映射到HubSpot中的相应字段

此外,Hightouch还有一个界面,使企业能够在其他较擅长技术的用户构建的模型之上“可视化过滤”细分市场,这意味着他们本身不必了解任何SQL。

比如说,营销团队可以结合仓库中多个来源的数据,基于“30天内登录并查看过2种产品的所有用户”或“住在纽约市,往购物车添加了电视机的50岁以上的所有人”来开展广告活动。

图3:针对技术含量较低的用户的可视化过滤

据Gupta声称,为了实现Hightouch所提供的功能,许多公司采用的主要现有解决方案是编写Python脚本,并将脚本与Tray或Zapier之类的工具相结合。不过事实上,反向ETL领域还有其他类似的玩家。另一家成立于2018年的旧金山公司Census在几个月前融资1600万美元。Grouparoo和Polytomic等处于早期阶段的公司也崭露头角,它们都在过去的九个月完成了小额种子轮融资。

正如您所料,每种产品都有各自的差异化优势。比如说,Hightouch让非技术用户能够在现有模型之上过滤数据。与此同时,Grouparoo在构建一种开源数据框架。然而,多种价值主张相似的产品几乎在同一时间上市表明了企业需要将内部客户数据与其他无数的业务系统同步。

更宽泛地说,最近数据集成领域动作频频:GitLab将Meltano这个新开源平台作为一家独立公司拆分出来,Dbt Labs(前身是Fishtown Analytics)融资1.5亿美元(估值达15亿美元),可帮助分析员转换仓库中的数据。而Airbyte也在今年获得了风险投资,随后开放其平台以支持数据湖,先从支持亚马逊的S3入手。

然而,Hightouch与这些数据集成平台不一样。事实上,它的技术是互补性的。除了今天的融资外,Hightouch还宣布与Dbt Labs和Fivetran在集成方面建立深度合作伙伴关系,两家公司都会向希望在仓库外使用集体数据的自家用户推荐Hightouch。

开源?

“开源”是涉足更广泛的数据工程领域的许多公司当中的一个共同主题,Grouparoo、Meltano、Dbt Labs和Airbyte都在开源基础上构建商用产品。Hightouch尚未奉行开源理念,但这可能会在未来受到关注。Gupta解释:“我们正在考虑这方面的路线图。我们的客户还没有要求开源。”

最终,Hightouch是一种有别于数据堆栈中其他工具的产品。许多公司可能不是很迫切地在自己的基础设施上托管Hightouch——首先,它本身不存储任何客户数据。Gupta说:“应用程序托管在我们的云中,但数据百分之百驻留在客户的基础设施中。数据直接从客户的数据仓库进入到其自己的云存储桶,然后进入到SaaS工具。因此,我们能够与规模庞大的金融科技和医疗保健客户合作,他们能够证明Hightouch并不对其数据驻留或安全构成额外的风险。”

原文How Hightouch uses ‘reverse ETL’ to sync data from warehouse to SaaS apps,作者:Paul Sawers

【51CTO译稿,合作站点转载请注明原文译者和出处为51CTO.com】

 

来源:51CTO内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯