审校 | 重楼
如今,许多开发人员和产品团队使用生成式人工智能(GenAI)代理来帮助构建软件或应用程序——真正的创新出现在多代理系统上。就像管弦乐队可以演奏出丰富复杂的交响乐,独奏音乐家只能在一个维度发出声音,多代理系统不仅限于以任务为导向的角色,真正助力开发和战略团队。
比如说,梅奥诊所、沃达丰和ADT等不同公司的开发人员使用谷歌的GenAI代理构建器在多代理环境中创建应用程序。使用多代理系统(下面会详细介绍),开发人员可以以较低的成本和创纪录的时间制作功能丰富、高度直观的产品,从而取悦用户。
多代理GenAI系统顾名思义:一批AI代理协同工作。一个代理只完成一项任务,比如编程助手,而多代理系统结合多个开发任务(产品构思、设计、测试和客户细分等),它们相互学习,以优化创造力和生产力。成功的多代理系统为开发团队充当“数字孪生”,不断生成多个新概念和未来场景。多代理系统并不取代开发和产品团队,而是相辅相成。
有许多方法可以构建多代理系统,但有三种流行的方法:
- 集中式:中心处的一个代理负责收集和吸收所有其他输出。
- 分布式:没有中央控制器,代理与“代理群”中的另一个代理直接协调。
- 分层式:代理被组织成团队或各层次。
对于产品开发团队来说,集中式或分层式架构效果最好,因为它们对过程提供了更大的控制。我们可以将每个生成式AI代理看作人类团队中某一领域的专家。你可以为产品开发过程的每个部分创建单独的AI代理:产品头脑风暴、客户细分、技术规格、特性和功能等。位于辐条中心或层次结构末端的中央代理会考虑到其他代理的所有输出,“生成”出色的产品创意。
在向量化数据库中收集数据
鉴于你已经为多代理框架选择了一种结构,并为产品构思过程的每个部分构建了多个代理,接下来需要让代理运行起来。首先,让选定的代理访问相关知识的外部数据库。为此,你需要从贵公司获取大量的专有数据:客户细分、产品信息和研究信息等。你可能还希望引入希望代理使用的相关外部数据源。
比如说,这可能是全球市场趋势、定价报告或公共数据集,也可能包括从Reddit和其他论坛获取更多关于消费者行为和偏好的定性数据。为了确保你的代理可以从一个地方访问所有这些数据,就需要代理可以访问的矢量数据库。Pinecone是一种大受欢迎的矢量数据库,原因在于其灵活性和文档质量,但市面上有众多选择。
为每个代理编写智能提示
下一步是为每个代理创建独特的提示。这可能需要一些实践和迭代,但最好的入手方式是决定你希望每个代理遵循的一种思想框架和用户角色。比如说,你可能想要一个用户研究代理,它是用户研究上下文方面的专家,并在矢量化数据库中搜索用户引用,帮助它了解特定类型的用户。一旦你有了代理的用户角色,就可以创建有结构的提示。代理应该有关于你希望输出是什么样子的具体指示,直至它返回的示例数量。这有助于你从代理中获得更多的价值,并使其能够更有效地与系统中的其他代理一起工作。
你的提示应该呈现什么内容?应该有多深入?这方面是无限灵活的,因为有无限的可能性来确定提示的结构以形成期望的输出。利用你在产品开发、业务框架和以用户为中心的设计等方面的知识库,尽可能地创建最动态、最具体的提示。
让代理们协同工作
为了让代理以一种协调的方式协同工作,有必要为此部署一个工具。用于连接多个代理的三种流行工具是CrewAI、LangChain和Microsoft Autogen。它们都有各自的一系列好处,所以我们建议你查看每种工具,找到适合你项目的解决方案。
一旦你的提示进行了微调,你的多代理系统就应该开始输出产品设计和场景。通过将多代理系统连接到Dall-E等其他GenAI工具(用于创建原型图像和动画)以及Relume.io(可以在几秒钟内生成Figma可导出的线框),就可以将这些场景变为网站的线框、完整的产品规格和数字原型。
测试原型
一旦你的多代理系统生成了几个完整的产品原型,就可以测试哪些迭代最有可能成功了。虽然你可以进行传统的A/B测试,并从真人那里收集反馈,但你也可以使用另一个代理来创建AI驱动的角色或“合成用户”,以测试不同的产品。合成用户可以高度逼真;你可以通过摄取CRM、细分数据和行业报告来创建具有目标用户所有特征的AI用户角色,然后通过指令这些用户角色(即AI代理)“像你的用户角色一样思考和行动”,向这些用户角色索要反馈。因此,多代理系统可以有力地补充用户验证测试的各个方面。
多代理GenAI系统可以大大改进和加快新产品的构思、设计和测试过程。通过结合来自专注于客户研究、技术规格、原型设计和测试等领域的不同AI代理的专业知识,多代理系统可以快速生成针对特定客户群需求的综合产品概念。借助这些强大的系统,你可以增强团队快速行动的能力,并获得创新的产品成果。
原文GenAI Multi-Agent Systems: A Secret Weapon for Tech Teams,作者:Dan Kraemer