尽管许多行业组织的数字化转型计划正在顺利进行,但全球蔓延的新冠疫情引入了两个新的因素,迫使几乎所有企业都将运营转移到网络。首先,这是他们与客户沟通和联系的主要方式。在出行禁令和实体店关门的情况下,客户不得不几乎完全依赖数字服务进行购物、获得支持、参与个性化体验以及与企业互动。
其次,全部转向远程工作使得继续使用内部部署硬件和计算资源变得不切实际。为了确保远程工作的团队能够有效地协同工作,迁移到云平台是许多公司的唯一选择。尽管目前的采用统计数据证明了私营部门在这方面的成功,但大多数公司在他们的云计算之旅中遇到了一些障碍。
云采用面临的障碍
如今,有几种不同类型的云平台和多种云服务模型。为了简单起见,倾向于从两个组件的角度来考虑云计算资源:后端和前端。后端是基础设施层。在每个云计算提供商所包含的物理服务器和数据中心之外,基础设施层包含与信息架构相关的所有内容,包括数据访问和安全性、数据存储系统、计算资源、可用性和服务级别协议。前端是表示层或应用程序接口,包括最终用户配置文件、身份验证、授权、用例、用户体验、开发人员体验、工作流等。
不久前,企业通常会在漫长的阶段迁移到云平台,根据行业专家与企业客户合作的经验,花费大量时间来设计和实施后端,然后对前端进行同样的操作。发生的新冠疫情改变了这一点。在过去是一个循序渐进的过程,现在是一项具有紧迫时间表的快速工作,前端和后端系统经常协同实施,最终用户更早地被引入以参与更频繁的迭代。
此外,新冠疫情引入了与构建、维护和操作这些前端和后端系统相关成本的考虑。企业正在尽可能地寻求更多的成本节约,尽管从长远来看,云迁移可以降低总体拥有成本,但它确实需要前期投资。对于那些面临潜在劳动力和资金限制的企业来说,成本是一个需要考虑的重要因素。
激进的时间表和成本考虑本身并不是障碍,但它们肯定会在云计算部署期间带来挑战。那么成功的云集成还有哪些其他障碍?
(1)尝试“提升和转移”架构
当试图满足云迁移的最后期限时,企业通常倾向于将其云资源配置为其内部部署设置的精确副本,而不考虑可以抵消大量维护或性能开销的云原生服务。在不考虑如何使用云原生服务和重新设计其工作流程的不同组件的情况下,企业最终会将所有低效率的问题带到云中。与其相反,企业应该将云迁移视为一个考虑更好架构的机会,以节省成本、提高性能,并为最终用户带来更好的体验。
(2)关注基础设施而不是用户需求
当数据领导者决定将业务迁移到云端时,往往更关注各种云服务的特性和功能,而没有考虑数据科学家和数据工程师的工作流程。数据领导者通常不会针对开发人员的生产力和快速迭代进行优化,而是专注于开发强大且可扩展的后端系统。此外,数据专业人员希望在将用户带入云计算环境之前使云架构更加完美。但云计算环境未经最终用户测试的时间越长,对他们的用处就越小。建议在初始云环境中引入最少量的数据、开发环境和自动化工具,然后引入用户并根据他们的需求进行迭代。
(3)无法在云中访问生产数据
数据专业人员通常启用许多不同的云原生服务来帮助用户执行分布式计算、构建和存储容器映像、创建数据管道等。然而,在企业的部分或全部生产数据在云计算环境中可用之前,它不会立即有用。企业领导者应该与他们的数据工程师和数据科学团队合作,确定哪些数据子集对他们可以在云中访问、迁移数据,并让他们亲身体验云服务的好处。否则,企业领导者可能会发现,由于具有数据重力,几乎所有生产工作负载都停留在内部部署设施中。
更顺畅的云迁移
尽管面临重重障碍,但数据领导者可以采取许多措施骤来确保他们的云计算部署尽可能顺利。此外,采取这些步骤将有助于最大限度地提高云采用的长期投资回报:
(1)集中新数据和计算资源
许多企业提供的计算和数据分析资源过多或过少,最终导致解决方案比较分散,并且文档记录不足。因此,企业的采用速度很慢,用户的大部分工作都是在孤岛设施或笔记本电脑上完成的,新的数据工程师和数据科学家的入职可能是一个混乱的过程。企业领导者可以通过关注最常见用例和工作流的核心数据集和计算需求,并集中解决方案来避免这种情况。集中资源并不能解决所有问题,但它将使企业能够专注于最主要的挑战和瓶颈,并为大多数人提供支持。
(2)尽早让用户参与
通常情况下,在告知用户云计算环境准备就绪可供使用之前,需要数月甚至数年的基础设施管理和部署工作。不幸的是,这通常会导致云计算环境利用率不高。为了克服这种资源浪费,数据领导者应该针对最终用户体验、工作流程和用例进行设计;在这过程中尽快加入最终用户;然后与他们一起更新迭代,并按照优先顺序解决最大的挑战。他们应该避免以设计完美架构或理想工作流程的名义延迟使用。与其相反,企业领导者可以尽早让关键利益相关者和代表用户参与进来,以获得关于应该在哪些方面进行改进的真实反馈。
(3)首先关注工作流程
企业应该确定核心数据集(或子集)和最小可行的工具集,以使数据工程师和数据科学家能够完成80%的工作,而不是在第一次迭代时就建立一个完全健壮、可扩展和冗余的系统。然后,他们可以逐渐收集反馈并确定下一组解决方案,在每次迭代中尽可能有效地缩短反馈循环。如果一家企业处理生产数据集和工作负载,那么在安全性、性能、可扩展性或其他功能的可接受和标准级别上,不应该采取任何捷径。数据领导者可以购买现成的解决方案,也可以与他人合作提供解决方案,以弥合能力差距。
没有回头路
云计算技术在过去是一种差异化技术,而现在是一种主流技术。企业获得竞争优势的唯一方法是为其数据团队配备他们所需的工具,以更好地完成工作。即使是最昂贵、最安全和可扩展的解决方案也不会被使用,除非它真正授权给最终用户。