数据密集型应用程序的应用(如图像处理、数据分析和人工智能)依赖于快速增长的企业数据。随着这一增长,出现了架构方面的考虑。随着数据集的增长,由于网络延迟,应用程序需要越来越接近这些数据。随着越来越多的应用程序被添加到环境中,它们开始在没有巨大成本和中断的情况下将这些数据移动到别处,并以更快的速度生成数据,这使得实施云迁移几乎不可能。这就是造成云计算提供商锁定并在未来带来业务风险的数据引力悖论:收集数据越多,就越难改变处理数据的方式。
那么,企业如何在不依赖单一云平台的情况下释放创新的力量呢?在各个行业中都存在着成功和挑战。以下一些行业应用示例可以说明多云如何促进创新、增强数据敏捷性,并降低成本。
媒体和娱乐行业
如今的媒体和娱乐行业越来越多地由规模相对较小的专业工作室组成,这些工作室可以满足像Netflix和Hulu这样的大型公司不断增长的内容制作需求。为了交付轰动一时的电影和获奖电视节目,这些地理位置分散的工作室需要在动画、色彩校正、特效和编辑方面进行有效的合作。多云解决方案使这些团队能够在同一个项目上协同工作,从各种公共云平台访问他们首选的生产工具,并简化审批过程,而不会因为将大型媒体文件从一个站点移动到另一个站点而产生延迟。高吞吐量、低延迟的数据池消除了网络延迟会抑制生产力的担忧。此外,连接到多个云平台的中央存储解决方案还降低了通常与从公共云中移出大量视频文件相关联的大量出口费用。
除了需要协作之外,其他因素还推动了媒体和娱乐行业中数据和多云的增长。摄像头设备具有更高的分辨率,这意味着视频文件大小比以往任何时候都要大,分散的数据中心所需要的带宽要比内部部署实现的带宽更高。流媒体服务依靠数据分析来以编程方式了解内容的受欢迎程度,明确应创建哪些新内容以及应该搁置哪些内容。与这些工作流程相关的许多流程正越来越多地利用公共云平台,因为可以使用补充数据集和特定于用例的工具来处理不同类型的分析。
交通运输和自动驾驶行业
联网汽车和自动驾驶汽车可以通过各种传感器生成大量数据。例如,特斯拉汽车的自动驾驶仪利用8个摄像头、12个超声波传感器和1个雷达来解析汽车的周围环境,并就其行驶路线以及如何避免潜在的障碍做出决策。该领域的研究人员正在尝试容纳100PB的视频和静止图像生成的数据,这些数据用于重新训练算法。这些仍是自动驾驶汽车(AV)的早期技术。当汽车的行驶速度成倍增加时,需要处理更多变化(在任何一条街道或停车场行驶),都将需要更多的深度学习。到2030年,预计一辆自动驾驶汽车将会产生1ZB数据。
汽车制造商、公共运输公司和汽车租赁公司都将利用多云创新的动力,这些技术融合了跨多个云平台的数据可访问性,而没有大量出口费用和传输缓慢的风险,同时为每个项目保持利用最佳公共云服务的自由度。
能源行业
在能源行业,采用多云可以帮助能源厂商降低与查找和钻探油气资源相关的大量成本。例如,一家石油和天然气服务公司拥有超过4PB的数据,该数据是通过多年积累数据(例如,海底声纳扫描、地理空间照片和土地勘测)进行收集的,用于石油技术分析和地震处理。这家公司的工程师和数据科学家使用机器学习(ML)分析方法来确定哪些地方值得采用更多的资源来勘探石油,评估新项目的环境风险,并提高安全性。
通过利用跨多个云平台的服务和处理能力,该公司提高了效率,可以节省数百万美元的成本。与此同时,在多个特定云平台中使用有限数量的GPU的情况下,可以同时利用跨多个云平台的竞价型实例来以更低的成本获得更快的结果,这是可能实现的。通过同时复制其内部部署数据湖并使数据可用于多个云计算服务,该公司支持了广泛的应用程序和工作负载。这证明了这家石油和天然气公司如何在不浪费大量时间的情况下扩展上PB的数据,同时还通过实现基于云计算的恢复来提供新的弹性级别。
医疗保健和生命科学行业
医疗保健行业是在采用多云技术方面并不积极的行业之一。这不是由于缺乏使用欲望,而是由于面临数据保护的许多挑战。需要了解《医疗保险数据可移植性和责任法案》(HIPAA)法规以及数字广告联盟(DAA)指南以及数据在何处,谁有权访问,谁已经访问的需求,这些都给这一领域带来了独特的挑战。
即使有这些警告,多云仍可帮助医疗保健和生命科学释放创新的力量。在基因组分析领域,这是显而易见的,尤其是在巨大的数据集分析可以帮助改善或拯救患者生命的地方。FASTQ文件包含原始基因组的测序数据;它们包含数百万个需要像拼图游戏一样组装的DNA片段。这些文件可让研究人员进行变异分析,从而识别出个体基因组之间的差异。从存储的角度来看,密集的基因组分析过程会占用大量空间。例如,要研究150名接受特定治疗的癌症患者的基因组,然后分析治疗成功者,对治疗不佳的人之间的DNA差异,以及针对一般人群的数千种变异进行分析可能是必要的。在与世界各地的研究人员共享对数据集的访问权限的同时,跨云平台扩展和利用竞价型实例的能力对于使这些工作流切实可行且可访问至关重要。
利用云计算战略增加创新
在多云解决方案中,其中相同的数据副本可用于多个云平台,使用户能够利用每个云平台的服务,如今已有500多个可用云服务。多云存储可以提高数据的灵活性,无需供应商锁定即可提供数据接近性,并按需扩展计算和存储,彼此独立。无论组织有10TB的数据还是100 PB的数据,多云都可以节省成本,并消除许多操作复杂性。
如今,采用多云策略可以使组织在采用新的工作负载时能够适应未来的需求,而不必被迫将其复制或迁移到比较新的云计算平台。虽然一些组织现在不需要一些用例,但是有效的多云策略可以让其在未来需要时使用。