审校 | 孙淑娟
企业正在部署数据虚拟化技术解决方案,以满足各种不断增长的数据需求,从更快地提供新数据到支持客户端的自助数据访问。事实证明,它对数据消费者、IT和技术团队非常有帮助。
数据虚拟化是一项成熟的技术
数据虚拟化作为一种成熟的技术,目前已经成为公司数据集成策略的一部分。据MarketsandMarkets分析预测,2017年数据虚拟化市场规模增长到15.8亿美元,预计到2022年将达到41.2亿美元,在预测期内(2017年至2022年)的复合年增长率(CAGR)为21.1%。
数据虚拟化技术创建逻辑抽取层
数据虚拟化技术在分布式数据管理处理中创建了一个逻辑抽取层。它允许用户以标准化的方式访问任何格式和异构源(数据仓库或数据湖)的数据。
这样,数据的使用者就不需要对数据进行技术处理,如数据存储在哪里、如何存储、数据的类型及其存储结构、数据存储原始来源的接口等方面。
此外,应用程序、查询/报告工具、面向消息的中间件或其他数据管理基础设施组件通过虚拟视图使用这些数据。
数据虚拟化如何在企业中工作?
通过数据虚拟化,企业可以方便地访问所需的数据。数据虚拟化的实现包括三个步骤:
连接:数据虚拟化连接各种数据源,如数据库、数据仓库、云应用、大数据仓库,甚至Excel文件。
合并:数据虚拟化将任何格式的相关信息或日期合并,然后转换为业务视图或决策。
交付:数据虚拟化通过报表、仪表盘、用户网站、移动应用、Web应用等向企业提供实时数据。
虽然数据虚拟化技术在单个用户界面中结合了各种数据源,但虚拟层或语义层是该技术的核心。它允许数据或业务用户以不同的虚拟模式进一步组织他们的数据,并以任何格式和从任何来源组织虚拟视图。
用户可以通过虚拟层访问来自不同系统的所有数据,虚拟层产生一个统一的数据源。该信息是安全的,符合所有行业要求。
用户可以轻松地运用虚拟化数据,为分析、报告和自动化过程做好准备。
为什么需要虚拟化数据?
以下这些因素使得数据虚拟化越来越重要:
满足数据需求:随着企业越来越多的使用自助分析工具,业务和数据分析师、科学家和工程师的数据需求可能会变得难以管理。而这些数据分析往往有助于企业做出更好的决策,并提升客户满意度。因此,数据虚拟化允许您从一个单一的、集中的位置实时查看所有数据。这使得分析的完成速度比平时更快。
应对数据的复杂性和数量:对快速扩展业务的追求增加了连接物理数据库和复杂数据的数量。将数据结合起来进行分析的最快方法是使用数据虚拟化。
数据生成的速度明显在加快,这使得物理数据仓库的持续更新更具挑战性。此外,数据虚拟化是一种从多个位置传输数据的更高级的方法。
提供数据敏捷性:虽然为业务用户提供自助服务选项可能是优先事项,但企业不断努力在强大的安全性和业务敏捷性之间取得正确的平衡。数据虚拟化使不同的用户和用例可以通过单个虚拟层访问所有企业数据。此外,数据虚拟化技术还内置了原型功能,允许用户在大规模部署之前对策略进行实时测试。
提供安全管理:随着数据的数量、种类和复杂性的增加,合规性、数据资产保护和风险降低成为每个数据管理策略中更为关键的因素。
数据虚拟化为谁应该访问哪些数据建立了访问规则,从而确保数据的使用安全。此外,通过提供对公司所有类型信息的集中访问点,它支持安全管理、数据管理和性能监控。
流行的数据虚拟化工具
企业从多个目的地收集数据,并将其整合到数据仓库、数据湖中,以便进一步的分析和决策。
如前所述,随着数据量和复杂性的增加,数据集成过程非常耗时、昂贵,而且容易出错。因此,许多企业使用数据虚拟化软件查看、访问和分析数据,而无需担心数据的生命周期。以下是一些常用工具供您参考:
TIBCO
TIBCO软件公司以其数据和分析软件而闻名,后来也提供越来越多的集成选项。例如,TIBCO数据虚拟化支持访问各种数据源。该工具还有编排好的数据层、集中式元数据管理和强大的查询选项,如高级查询引擎,以便于按需交付数据。
studio设计工具、服务用户界面和业务数据目录,使用户能够从自助服务目录中搜索和选择虚拟化的业务数据,然后使用他们喜欢的分析工具分析结果。借助Web服务描述语言(WSDL),抽象数据可以在TIBCO中作为数据服务提供。内置的管控和安全性确保了数据正确的交付给用户。
K2View
K2View在市场供应商中占有重要的一席之地。它通过解决从各种底层数据源、格式和结构访问数据的困难,提供了动态数据虚拟化技术,实现敏捷数据集成。
它的功能包括从任何来源提取数据、通过语义层统一数据、存储数据(物理上或内存中)、处理数据,最终交付给数据分析师或用户的应用程序。
为了提供对真实数据的访问,该工具使用了一个称为数据产品模式的逻辑抽象层。该模式通过将所有表和字段放在一起,统一了特定业务实体的信息。
它让您轻松地虚拟化或存储数据。例如,企业可以选择保留非高度动态的数据,而不对其进行虚拟化。它还允许通过其他技术如SQL或Web服务API,平滑地访问数据,或通过数据流或消息协议向数据消费者推送数据。
Denodo
Denodo提供了一个易于使用的接口,提供企业级的数据虚拟化能力。此外,它还包括一个数据目录特性,使数据搜索和查找更加容易。这个工具可以在本地使用,也可以在云中使用,或者在混合环境中使用。
主要功能包括查询优化,它可以提高查询性能,减少响应时间。为严格保护数据的企业提供综合数据管理解决方案。
该工具包括一个用于语义搜索和数据管理的动态数据目录、基于人工智能的加速查询、用于多云和混合部署的自动化云基础设施管理,以及嵌入式数据准备功能,可实现自助式、又可管控的和安全的分析。
Denodo还提供统一的企业数据访问、商业智能、数据分析和单视图应用。
结论
随着企业运营的日益复杂,企业不断尝试各种数据管理解决方案。因此,数据架构变得越来越复杂。
作为一个使公司能跨本地、云或混合基础设施管理数据的中间件,数据虚拟化相对更容易建立。它可以在不需要数据复制的情况下实现不同数据源的实时同步,降低了基础设施成本。
使用数据虚拟化软件的综合分析、设计和开发功能创建清晰、简洁的数据视图。数据虚拟化软件将使您通过其丰富的分析、设计和开发功能设计出干净、简洁的数据视图。
当然,要找到一款最适合自己的数据虚拟化工具和解决方案,需要一一评估它们的技术能力。
译者介绍
张怡,51CTO社区编辑,中级工程师。主要研究人工智能算法实现以及场景应用,对机器学习算法和自动控制算法有所了解和掌握,并将持续关注国内外人工智能技术的发展动态,特别是人工智能技术在智能网联汽车、智能家居等领域的具体实现及其应用。
原文A Comprehensive Guide to Data Virtualization for Enterprises,作者:Yash Mehta