ChatGPT 的横空出世,证明了大语言模型是通往未来 AI 的道路,AI 技术经过几十年的量变积累,“质变时刻”已经到来。
IBM 大中华区董事长、总经理陈旭东在 IBM watsonx 大中华区发布会上表示,“为了迎接‘质变时刻’的到来,IBM 于 5 月发布了企业级 AI 和数据平台 watsonx,7 月各模块陆续上市,今年底到明年初全部上市,投入到客户的使用中。IBM 以前所未有的速度推出 watsonx,也是看到了‘让 AI 成为核心生产力’成为了企业领导的迫切需求。同时,这个市场机遇给 IBM 在 AI 领域数十年的积累,提供了千载难逢的机会。”
人工智能积累深厚
IBM 一直是科技领域的先行者、开拓者,从机械制表机,到商业计算机和个人电脑,再到量子计算和新材料技术,IBM 创造了多个辉煌。而在人工智能领域,IBM 也是布局多年,积累深厚。
20 世纪五六十年代,IBM 对人工智能便开始初期探索,在跳棋人机比赛,通过算法来教计算机下跳棋;
20 世纪 90 年代,在国际象棋人机大战中,IBM 深蓝计算机战胜了人类国际象棋大师,那时的人工智能更多是基于规则学习。
到了 2011 年,在《危险边缘》人机知识大赛中,人工智能战胜了人类选手,这时的人工智能开始掌握人类知识,并且可以理解人类的自然语言。
2019 年,人工智能辩手(Project Debater)可以与人类进行辩论,这时的人工智能不仅了解行业知识,还可以进行一定的推理。
2023 年,随着 ChatGPT 的热度持续不断,企业对生成式 AI 和大语言模型的关注度激增,并且迫切希望可以应用人工智能的新技术来提升竞争力。
于是,为了响应客户的需求,IBM 将多年在企业级 AI 领域积累的技术和经验,结合近五年IBM 在基础模型研究方面取得的进展,推出了企业级 AI 与数据平台 watsonx。
企业级 AI 的未来是拥抱基础模型
在 ChatGPT 出现后,国内企业纷纷追捧大模型,如今,国内市场已经形成了“百模大战”的局面。不同于其他企业推出自己的通用大模型产品,IBM 认为,企业级 AI 的未来是拥抱基础模型,它使企业加速和扩展生成式 AI 成为可能。
基础模型是基于一种特定类型的神经网络架构(称为Transformer架构)而构建,为生成相关数据元素的序列(例如句子)而设。Transformer 架构能够帮助基础模型理解未标记数据,并将输入转换为输出,从而生成新的内容,这正是生成式人工智能衍生的源头(ChatGPT 就是基于 Transformer 架构)。基础模型在大量未标记的数据上进行训练,可以适应新的场景和用例。尽管基础模型也需要前期大量投资,但每次使用时,它都会摊销 AI 模型构建的初始工作,因为微调基于基础模型构建的其他模型的数据要求要比从头开始构建低得多。这既可以大幅提高投资回报率(ROI),又可以大幅缩短上市时间。
IBM 认为,这些基础模型的灵活性和可扩展性将显著加速企业对 AI 的采用。企业现在不应再把 AI 视为战术上的“附加组件”,而应该把 AI 置于其业务的战略核心。因此,企业需要从数据为先的“+AI”时代,迈入到 AI 为先的“AI+”时代。
IBM大中华区首席技术官、研发中心总经理谢东表示,企业级生成式 AI,必须具备三个要素,首先是可信的 AI,AI 必须是可解释的、公平、稳健和透明的,务必要优先考虑和保护消费者的隐私和数据权利,以建立信任。第二是企业就绪的 AI,构建企业级 AI 差异化优势的关键,是要根据客户的特定需求和优先事项来定制和调整技术。基础模型的强适应性加速和扩展企业就绪的 AI 成为可能。第三是开放和可扩展的 AI,企业的 AI 环境应以治理和灵活性为核心,能够以可信赖的能力来延伸和扩展解决方案。
为此,IBM 发布了针对基础模型和生成式 AI 的新一代企业级 AI 与数据平台 watsonx,提供包括 AI 开发平台、湖仓一体方案和 AI 治理在内的工具包,加速企业使用可信数据,负责任地大规模应用 AI。
做技术赋能者,让 AI 成为企业核心生产力
Waston 既是 IBM 创始人的名字,又是 IBM 人工智能的代言词,IBM Watson 也逐渐成为IBM 企业级 AI 的代名称。IBM 大中华区科技事业部总经理、中国区总经理缪可延介绍道,watsonx 则是 waston + x 组成,一方面源于 IBM 研究院的创新技术,以及 IBM 首屈一指的软硬件技术和咨询专长,另一方面则是基于企业级开放技术(OpenShift)以及开放社区(Hugging Face)的合作,而 x 代表未知的无限可能,X因子则是催生奇迹的关键。而 X 因子则需要具有开放向善的技术,高瞻远瞩的领导力,以及携手共创的生态。
如今的企业需要访问完整的技术堆栈,使他们能够在一个平台上,并且在任何云环境下,以其能够信任的数据、速度和治理,在整个组织中训练、调整和部署人工智能,包括基础模型。而这正是 IBM 推出 watsonx 的原因。
据了解,IBM watsonx 包括三个模块。watsonx.ai 为 AI 构建者(数据科学家、工程师等)赋能,具有训练、验证、调优、部署AI模型等能力;watsonx.data 通过湖仓一体的数据存储方案,助力企业应对数据挑战;watsonx.governance 是企业级 AI 治理和监管工具包,可以在企业的 AI 生命周期中建立信任。
IBM watsonx.ai 基础模型库可以构建多种类型的模型,企业可以选用专有的 IBM 基础模型,以及 Hugging Face 的开源模型,同时,企业还可以添加自己的模型,通过与 IBM 研究院合作,预训练企业自己的基础模型。据了解,IBM计划在 watsonx.ai 上纳入 Meta 的 700 亿参数 Llama 2-聊天模型,现在已经可以提供给部分客户抢先体验。
此外,IBM 正在积极研究一种降低 AI 幻觉风险的方法,名为检索增强生成,这将使模型能够在生成答案之前从知识库中检索相关数据。此外,用户还可以调整现有模型以执行特定任务,这也有助于降低产生幻象的风险。
除了提供平台产品,IBM Consulting拥有 21000名数据、AI和自动化的专业顾问,以及由 1000 多名具有生成式 AI 专业知识的顾问所组成的生成式 AI 卓越中心。这些专家可以与客户合作,帮助他们对符合其具体业务需求的目标用例模型进行调整和操作化处理,从而加速生成式AI在企业中的落地应用。
缪可延表示,“IBM 不期待在每一个点上都爆发,因为我们这么多年来不是因为某一个技术而成功的公司。全面性、技术领先性和服务客户的可靠性以及基础业务的发展性,组成了 IBM 整体的竞争优势。”
为此,IBM 将自己定位为技术赋能者,从基础的算力、存力、算法,到企业级 AI 应用到咨询服务,为企业提供全栈的核心能力,通过开放式的领先的企业级技术平台构建强大生态,帮助减轻当前企业实施人工智能的负担,使企业能够更轻松地大规模开发、调整和部署企业就绪且值得信赖的 AI,让 AI 成为企业的核心生产力!
未来,IBM watsonx 将会继续演进,IBM 将专注于把企业级基础模型的用例扩展到自然语言处理(NLP)之外,实施为企业业务目标用例而定制的 100B + 参数的模型,为更为广泛的企业采用打开大门。此外,IBM 还会持续深耕,提供更加完善的 AI 治理,以及全能型多模态 AI,帮助企业在生产环境中广泛应用。