Reih 指出,自 20 世纪 70 年代初成立以来,LexisNexis 及其法律和商业数据与分析服务组合一直面临着互联网、谷歌搜索和开源软件兴起所带来的竞争威胁,而现在或许是其最强大的对手:生成式人工智能。
Reih 承认,生成式人工智能的发展速度远远超过了他在近 40 年的 IT 领导生涯中所见过的任何事物。为了应对这一新的现实,他所在公司的核心高管层在去年 3 月 OpenAI 的 GPT-4 首次亮相后就召开了战略会议。会议达成了共识,开始重新规划公司的所有年度目标并调整其优先次序,以应对新的创新。
Reih 说:“我们全员行动起来。我们做了一次重大调整,因为就其交互能力、答案的全面性和数据生成能力而言,这是一次游戏规则的改变。它的能力令人震惊。”
鉴于 LexisNexis 的核心业务是为法律、保险和金融公司以及政府和执法机构收集和提供信息与分析,生成式人工智能的威胁确实存在。但是,Reihl 确信 LexisNexis 能够应对生成式人工智能的进步,因为当今的通用大型语言模型(LLM)还不完善,而且 LexisNexis 已经磨练出专有数据和独特的工具来增强和定制其服务所使用的 LLM,包括 Anthropic 的 Claude AI 助手和 Microsoft Azure 上的 GPT-4。
LexisNexis 的 2000 多名技术专家和大约 200 名数据科学家一直在疯狂地工作,以整合利用生成式人工智能的独特功能,为公司的全球客户群增加更多价值。但这种尝试并非全新的。自 2018 年谷歌推出自然语言处理(NLP)模型系列 BERT 以及 Chat GPT 以来,LexisNexis 就一直在使用它。但现在公司支持所有主要的 LLM,Reihl 说。
Reih 表示:“如果你是终端用户,并且你是我们对话式搜索的一部分,那么其中的一些查询将在一次事务中同时进入 Azure 的 ChatGPT-4 和 AWS 的 Anthropic。如果我输入一个查询,根据你所问问题的类型,它可能会同时转到这两个地方。我们会选择最佳的 LLM。我们使用 AWS 和 Azure。我们将采用最佳模型来回答客户提出的问题。”
上月底,LexisNexis 在美国推出了自己的生成式人工智能解决方案 Lexis+ AI,承诺消除人工智能的“幻觉”,并提供链接的法律引文,以确保律师能够获得准确、最新的法律先例——这些都是在当前大量 LLM 中发现的弱点。
为创新奠定基础
如果没有向云迁移,这一切都不可能实现,LexisNexis 于 2015 年开始向云迁移。LexisNexis 主要是 AWS 的客户,同时也为许多使用 Microsoft Office 和其他微软平台的客户提供 Microsoft Azure。
但要实现云计算,还需要经历一段艰难的爬坡过程。
2007 年,Reihl 加入 LexisNexis 时,公司大约一半的基础设施,包括核心平台,都是基于大型机的。该公司在美国运营着两个非常大的数据中心,并进行了数次收购,导致技术和数据格式非常多样化。
Reihl 指出,不久之后,LexisNexis 的 IT 领导人找到董事会,要求拨款数亿美元,用基于XML 的开放式系统取代所有基础设施。公司将大部分数据从大型机迁移到这些开放式系统,同时增加了专有的搜索功能以及索引和自动化功能。但这些应用并未针对云计算进行优化,因此当公司在近十年前开始使用云计算时,最终不得不针对微服务进行重新架构。
2020 年,LexisNexis 关闭了最后一台大型机,大大节省了成本,并将全部精力投入到云平台上。
虽然有些工作负载仍在其余的数据中心运行,但 LexisNexis 利用的大部分数据都来自 5 万多个来源,如法院文件、律师事务所、新闻来源和网站,并流入公司的专有内容制作系统。该服务的编辑人员还会增强和丰富专有内容,而自动化则为云上的工作流程增添价值。
LexisNexis 也享受到了许多企业通过迁移到云端所获得的好处,包括显著的成本节约、可扩展性、灵活性和创新速度。但最大的好处可能是,LexisNexis 能够在自己的生成式人工智能应用中迅速采用机器学习和 LLM。
Reihl 说:“我们最初的一些人工智能工作就是从这里开始的。我们通过 NLP 和一些基本的机器学习来完成所有这些工作,随着时间的推移,这些工作逐渐发展成为更多的深度学习。”
转型的另一个主要方面是公司在提高员工技能和获取新人才方面所做的努力。LexisNexis 的团队构成已经从用户体验设计师、产品经理和软件工程师转变为包括主题专家、了解法律和法律语言的知识产权律师以及近 200 名数据科学家和机器学习工程师。
Reihl 表示,LexisNexis 在数字化转型上总共花费了 14 亿美元。看来这笔投资物有所值。
LexisNexis 于 10 月份在美国市场推出了 Lexis+ AI,这是其具有生成性人工智能增强功能的多模型 LLM 解决方案。据该公司称,这个针对法律行业的微调人工智能平台是市场上为数不多的人工智能 SaaS 平台之一,其特点是检索增强生成引擎可消除幻觉,提供精炼的对话式搜索功能、法律文件起草、案例总结和文件上传功能,使用户能够在几分钟内从法律文件中分析、总结和提取核心见解。
Reihl 认为,该平台是与客户共同开发的,客户参与了测试版的开发,帮助公司完善了提示和搜索功能,并实施了安全措施,以确保隐私和某些搜索可以在内部进行,这对律师来说至关重要。
LexisNexis 面临的最大挑战与所有组织面临的挑战一样:寻找足够的人才。
Reihl 说:“现在的人才并不多,所以我们也在培训具有数据敏锐度的人才掌握这些技能。”他仍然相信,随着 200 名数据科学家的加入,公司已经做好了在明年向国际市场发布产品的准备。
来源:www.cio.com