在今年爆火的生成式 AI 领域,亦是如此。
亚马逊云科技认为,生成式 AI 并不仅仅是大模型,整个生成式 AI 应用就像是浮在海面的冰山,露在海面上方是基础模型,而在冰山底部,也需要大量的基础模型以外的服务来支撑,比如加速芯片、数据库、数据分析和数据安全服务等等。
为此,亚马逊云科技提供了完整的端到端的生成式 AI 技术堆栈,从底层的加速层,包括加速芯片和存储优化等,到中间层模型的构建工具和服务,再到最上层的生成式 AI 应用,每一层都在根据客户的不同需求进行持续创新。
亚马逊云科技大中华区产品部总经理陈晓建表示,为了完成“技术普惠”的使命,亚马逊云科技提出实现生成式 AI 有五个关键因素,助力企业和开发者释放生成式 AI 的潜力。
第一步:选择合适的应用场景,从典型场景入手创新业务模式
根据麦肯锡咨询 2023 年 6 月发布的生成式 AI 生产力前沿技术报告显示,在生成式 AI技术带来的经济效益中,大约四分之三来自四类主要的职能:营销与销售、产品与研发、软件工程和客户运营。这四个职能也是生成式 AI 应用的主要使用领域。
为此,企业要想实现生成式 AI,首先要选择适合企业业务发展的场景,从典型的应用场景入手,从而创造新的业务模式。
亚马逊云科技认为,典型的应用场景带给企业的业务价值主要包含三个方面:增强客户体验,提升员工生产力与创造力,优化业务流程。例如,海尔创新设计中心利用生成式 AI 能够实现文生图、图生图、定量图和全场景图四个方面的提效,上线后,自动化设计系统应用让相关业务的操作周期缩短了 20%。
第二步:借助专门构建的生成式 AI 工具和基础设施,快速构建高性价比的生成式 AI 应用
随着基础模型的不断发展和迭代,新出现的每个大模型都在特定领域有着独特的优势。如何在众多的基础模型中,选择最适合自己企业的业务场景的基础模型,是每个企业在构建生成式 AI 应用时面临的挑战。
为此,亚马逊云科技推出了 Amazon Bedrock,该服务与 Amazon SageMaker Jumpstart 结合,帮助对基础模型有不同需求的客户轻松、安全地选择基础模型。
亚马逊云科技认为,没有一个基础模型能够适用于所有的业务场景。为此,Amazon Bedrock服务提供的基础模型来自 Meta、Anthropic、Stability AI、AI21 Labs、Cohere 等第三方领先供应商,以及亚马逊云科技自研的 Amazon Titan 模型家族。亚马逊云科技透露,近期 Amazon Bedrock 还加入了 Meta 下一代开源大模型 Llama2 以及 Anthropic 的 Claude2 等热门基础模型。
Amazon Bedrock 在开发之初就考虑到了安全性和隐私保护,帮助客户保护敏感数据。首先,用户的任何数据都不会被用于训练任何原始大模型。其次,用户可以配置他们的私有环境,比如说虚拟网来执行他们自己的环境训练,而这个环境和其他用户之间都是安全隔离的,所有的数据都是加密的,并且数据的传输是不会暴露在公众的网络。此外,如果客户有一些场景的高监管要求,Amazon Bedrock 符合 HIPAA(健康保险流通与责任法案)和 GDPR(欧盟《通用数据保护条例》)这样合规的标准。
Amazon Bedrock 代理功能是一项全新的全托管功能,使开发人员能够更轻松地创建基于生成式 AI 的应用程序,以完成各种用例的复杂任务,并根据专有知识源提供最新的答案。开发人员只需进行简单操作,Amazon Bedrock 代理功能就会自动分解任务并创建编排计划,无需任何手动编码。该代理通过简单的 API 接口安全地连接到公司数据,自动将数据转换为机器可读的格式,并增加相关信息以生成最准确的回答。然后,代理可以自动调用 API 来满足用户的请求。
第三步:夯实数据基座,使用私有化数据,打造差异化竞争优势
数据是将通用人工智能转变为了解业务和客户的个性化人工智能生成模型的关键。那些尚未找到有效协调和随时访问其数据方法的公司无法对生成式人工智能进行微调以释放其潜在的变革性用户。
面向生成式 AI 构建强大的数据“基座”,企业需要一套全面的服务,以便能够存储用于构建和微调模型的各种类型的数据;同时,企业还需要服务间的集成,以打破数据孤岛,确保能够随时访问所有数据;此外,企业还需要在构建生成式 AI 应用程序的整个生命周期中,确保数据安全并对其进行管理。
亚马逊云科技针对生成式 AI 领域的用户个人信息、会话信息管理、私域知识库等应用场景都提供了专门构建的数据库。针对检索增强生成(RAG,Retrieval Augment GenerationRAG)需要处理的向量数据,亚马逊云科技为 Amazon OpenSearch Service、Amazon Aurora PostgreSQL和 Amazon RDS for PostgreSQL 加入了向量数据库功能,客户可以使用这些功能来存储和搜索其机器翻译和生成式 AI 应用中使用的嵌入,将向量与数据同地放置,可以更轻松地连接数据并减少数据重复。
第四步:借助云原生服务,加速 AI 应用构建,助力业务敏捷创新
在亚马逊云科技服务百万客户、经历无数次应用现代化转型的过程,也积累了一些宝贵的经验,希望对生成式 AI 时代的构建者有所帮助。
首先,亚马逊云科技强调以微服务化和事件驱动架构为核心的设计框架。通过松耦合的方式处理每个功能模块之间的相互依赖,可以更好地实现敏捷创新。
其次,Serverless First 策略能够简化运维、提升效率。
第三,数据决策优先是亚马逊云科技重要的设计理念之一。像资产一样重视数据,将数据能力作为应用的核心竞争壁垒加入到生成式 AI 应用的设计中。
第四,安全围栏和影响面控制也是亚马逊云科技在应用构建过程中关注的重点,这能够减小事故的爆炸半径,将安全与数据的合规与保护放在前所未有的重要地位。
第五,避免重复造轮子也是亚马逊云科技一直倡导的理念。除了技术本身,亚马逊云科技也在 DevOps、基础设施即服务、自动化等现代应用治理理念上持续投入,促进企业内部的应用资产与实践的分享,构建高效敏捷的构建者文化。
第五步:借助开箱即用的生成式 AI 服务,消除重复性工作并专注创新本身。
编程将是生成式 AI 技术得到快速应用的领域之一。软件开发者需要花费大量时间编写相当浅显和无差别的代码,真正用于创新的时间少之又少。从网上复制代码片段则可能无意中复制无效代码或有安全隐患的代码,或对开源代码的使用没有进行有效追溯。
为了解决这些问题,亚马逊云科技推出了 Amazon CodeWhisperer。它是一款人工智能编码伙伴,在基础模型高级选项中使用,可以实时生成代码建议,从根本上提高开发人员的生产力。根据亚马逊云科技的一项生产力测试显示,与未使用的参与者相比,使用 Amazon CodeWhisperer 的参与者完成任务的速度平均快 57%,成功率高 27%。
近日,亚马逊云科技还推出了 Amazon CodeWhisperer 自定义功能,能够生成优于之前的代码建议。它允许客户使用私有代码库安全地定制 CodeWhisperer 代码建议,这些私有代码库可涵盖内部 API、数据库、最佳实践和架构模式等。
亚马逊云科技认为,开发生成式 AI 应用是一个充满挑战的系统工程,并不是单纯的产品和服务拼接。因此,如何加速客户最终应用的商业化落地是亚马逊云科技一直关注的问题。除了亚马逊本身的资源以外,亚马逊云科技同样需要构建强大的合作伙伴生态,携手助力解决生成式 AI 应用构建中的各种技术问题,加速应用落地。
除了云服务之外,亚马逊云科技还提供解决方案架构师、产品技术专家、人工智能实验、数据实验室、快速原型团队、专业服务团队、培训与认证部门等多个资源共同助力客户成功。同时,亚马逊云科技还将携手生态合作伙伴与初创圈,构建生成式 AI 的大生态,进一步助力生成式 AI 技术的落地。