通过对比其他商用LLM的缺陷,本文详细介绍了TigerGraph CoPilot的主要功能、优点、以及两个关键用例。
近年来,数据作为一种生产要素,已经能够有能力为我们提供横跨不同行业的变革性商业见解了。不过,如何利用好可以获得的大数据,往往给我们带来了不小的挑战。一面是过载的数据,一面却是大量未被充分利用的数据孤岛。不少专业数据科学家和分析师亟待通过专业知识,让自己所在的组织能够在不牺牲性能和运营效率的情况下,及时地处理持续增长的数据,并从复杂的数据中提取潜藏在表层之下的见解。
最近,人工智能(AI)在自然语言处理方面的突破,改变了数据集中化访问的方式。通过充分利用人工智能CoPilot的实时处理和分析大规模数据的能力,更多的用户可以轻松地查询和解释复杂的数据集,进而有助于组织快速做出明智的决策。同时,人工智能CoPilot也可以通过自动化复杂的数据流程,以及授权较少的技术人员进行深层次的数据分析,管理与控制大型数据集的高昂成本,进而优化资源的整体分配。
不过,生成式AI和大语言模型(LLM并非毫无瑕疵。由于大多数LLM都建立在通用的公共知识的基础上,因此它们无法知晓特定组织的特定数据,更不用说那些机密数据了。同时,LLM除了无法了解不断变化的信息世界,另一个更为严重的问题是“幻觉”。也就是说,生成式模型在其统计过程所生成的结论,可能只是其一厢情愿,而根本不真实。
可见,我们迫切需要一种更具备上下文相关性、更少出错的AI,在预测分析和机器学习过程中,提供能够直接提升业务决策准确度的优质数据。
TigerGraph CoPilot简介
作为一款AI助手,TigerGraph CoPilot结合了图形数据库和生成式AI的功能,旨在提高分析、开发和管理各种业务任务的生产力。TigerGraph CoPilot允许业务分析师、数据科学家、以及开发人员,使用自然语言对大规模的最新数据执行实时查询,以获得从自然语言、图形可视化、以及其他视角来展示和分析的数据见解。
针对前文提到的AI缺陷,TigerGraph CoPilot可以通过提高准确性和减少幻觉,来为组织充分挖掘数据潜力,并在客户服务、市场营销、产品销售、数据科学、开发和工程等领域推动知情决策,真正体现生成式AI应用的价值所在。
TigerGraph CoPilot的主要功能和优势
- 图形增强式自然语言查询
- 针对图形增强的生成式AI
- 可靠且负责任(相对于幻觉而言)的AI
- 高性能与扩展性
图形增强式自然语言查询
TigerGraph CoPilot允许非技术用户使用日常交流语言对数据进行查询和分析。这使得他们能够更专注于挖掘见解,而不必学习新的技术或计算机语言。针对每一个用户问题,CoPilot都会采用一种新颖的三段式交互方法(如下),同时与TigerGraph数据库及用户选择的LLM进行交互,以获得准确和相关的回答。
- 在第一阶段,TigerGraph CoPilot会将问题与数据库中可用的特定数据予以比对。具体而言,它会使用LLM将问题与图形的模式进行比较,并用图形元素替换问题中的实体。例如,如果有一个顶点(vertex)类型为BareMetalNode,并且用户询问“有多少服务器?”,那么问题就会被转换为“有多少BareMetalNode顶点?”
- 在第二阶段,TigerGraph CoPilot使用LLM将转换后的问题,与一组精心策划的数据库查询与函数进行比较,以选择最佳匹配。使用预先批准的查询通常会有两个好处:
首先,由于每个查询的含义和行为都经历了验证,因此它们有效地降低了产生幻觉的可能性。
其次,该系统具有预测回答问题所要调用的执行资源的潜力。
- 在第三阶段,TigerGraph CoPilot会执行那些已识别的查询,并以自然语言返回相关结果,及其背后运作的推理。同时,CoPilot的图形增强式自然语言查询,提供了良好的屏障,既能降低模型幻觉的风险,又可澄清每个查询的含义,还会提供对结果的理解。
针对图形增强的生成式AI
TigerGraph CoPilot可以基于用户自己的文档和数据,创建带有图形增强AI的聊天机器人,且无需现有的图形数据库。在这种操作模式下,TigerGraph CoPilot会通过资源材料来构建知识图,并应用其独特的检索增强生成(RAG)的变体,来提高自然语言问题答案的上下文相关性和准确性。
首先,在加载用户文档时,TigerGraph CoPilot会从文档块中提取实体和关系,并从文档中构造出知识图。知识图往往通过关系连接数据点,以结构化的格式来组织信息。同时,CoPilot还会识别概念,构建本体,向知识图中添加语义和推理。当然,用户也可以提供自己的概念本体。
然后,通过使用该综合知识图,CoPilot会执行混合检索,即:结合传统的矢量搜索和图形遍历,来收集更多的相关信息和更为丰富的上下文,以回答用户的各类问题。
通过将数据组织为知识图,聊天机器人可以快速且高效地访问到准确的、基于事实的信息,从而减少了对于需要根据培训过程的学习模式,来生成响应的依赖。毕竟,这样的模式有时可能并不正确、甚至已经过时。
可靠且负责任的AI
如前文所述,TigerGraph CoPilot通过允许LLM管理查询,来访问图形数据库,以缓解幻觉。同时,它能够通过采取相同的、基于角色的访问控制和安全措施(已经成为了TigerGraph数据库的一部分),来确保实现负责任的AI。此外,TigerGraph CoPilot还通过开放其主要组件,并允许用户选择其LLM服务,来保持开放性和透明性。
高性能与扩展性
通过利用TigerGraph数据库,TigerGraph CoPilot为图形分析提供了较高的性能。而作为一个基于图形的RAG解决方案,它也为知识图驱动的问答提供了大规模的可扩展的知识库。
TigerGraph CoPilot关键用例
- 从自然语言到数据见解
- 内容丰富的问答
从自然语言到数据见解
无论您是业务分析师、数据专家、还是调查人员,TigerGraph CoPilot都能够让您快速地从数据中获取信息和见解。例如,CoPilot可以通过回答“请给我展示最近误报的欺诈案件列表”等问题,为欺诈调查人员生成相关报告。同时,CoPilot也可以促进更准确的调查,例如:“谁在过去一个月里,与123账户进行了金额超过1000美元的交易?”
TigerGraph CoPilot甚至可以通过沿着依赖关系去遍历图形,以回答诸如“如果……会怎么样”等问题。例如,您可以从供应链图中,轻松找到“哪些供应商可以弥补部件123的短缺?”或从数字基础设施图中,找到“哪些服务会受到服务器321升级的影响?”
内容丰富的问答
TigerGraph CoPilot在为用户的数据和文档构建问答聊天机器人时,能够基于知识图的RAG方法,实现上下文信息的准确检索,以便给出更好的答案和更明智的决策。可以说,由CoPilot给出的、内容丰富的问答,直接提高了典型问答应用(如:呼叫中心、客户服务、以及知识搜索等场景)的生产力,并且降低了构建成本。
此外,通过将文档知识图和现有的业务图(如:产品图)合并为一个智能图,TigerGraph CoPilot可以解决其他RAG方案所无法应对的问题。例如,通过将客户的购买历史与产品图表相结合,CoPilot可以在客户键入搜索查询、或要求推荐时,做出更加准确的个性化建议。其典型场景包括:通过将患者的病史与健康图表相结合,医生或健康专家便可以获得有关患者的更多实用信息,以提供更好的诊断或治疗。
小结
综上所述,相比其他商用LLM应用,TigerGraph CoPilot解决了复杂数据管理与相关分析的挑战。通过它在自然语言处理和高级算法方面的强大功能,组织可以在克服数据过载和应对数据访问欠佳方面,获取巨大的业务洞察。同时,通过利用基于图形的RAG,它也可以确保LLM输出的准确性和相关性。
鉴于CoPilot允许更广泛的用户有效地利用数据,做出明智的决策,并能优化组织间的资源分配。我们认为,这是在实现数据访问民主化,以及赋能组织充分利用其数据资产潜力方面的重大进步。
译者介绍
陈峻(Julian Chen),51CTO社区编辑,具有十多年的IT项目实施经验,善于对内外部资源与风险实施管控,专注传播网络与信息安全知识与经验。
原文How TigerGraph CoPilot enables graph-augmented AI,作者:Hamid Azzawe
链接:https://www.infoworld.com/article/3715344/how-tigergraph-copilot-enables-graph-augmented-ai.html。