审校 | 重楼
来自OpenAI的ChatGPT和DALL-E等AI系统正在商业和内容创作领域迅速受到追捧。但是生成式AI是什么?它又是如何工作的?不妨耐心读下去。
生成式AI是什么?
简而言之,生成式AI是人工智能的一个子领域,计算机算法被用于生成类似于人类创造的内容的输出,无论是文本、图像、图形、音乐、计算机代码还是其他内容。
在生成式AI中,算法旨在从含有预期输出示例的训练数据中学习。通过分析训练数据中的模式和结构,生成式AI模型可以生成与原始输入数据有相同特征的新内容。这样一来,生成式AI就有能力生成看起来类似人类的逼真内容。
生成式AI是如何工作的?
生成式AI基于机器学习过程,其灵感来自人类大脑的内部运作,即神经网络。训练模型需要向算法馈送大量数据,这些数据充当AI模型用来学习的基础。这可以由文本、代码、图形或与手头任务相关的任何其他内容组成。
一旦收集了训练数据,AI模型就会分析数据中的模式和关系,以了解负责治理内容的基本规则。AI模型在学习过程中不断微调参数,提升模拟人类生成内容的能力。AI模型生成的内容越多,其输出就变得越复杂、越有说服力。
生成式AI的例子
近年来,生成式AI取得了重大进展,许多工具吸引了公众的注意力,尤其在内容创作者当中引起了轰动。大型科技公司也加入了这股潮流,谷歌、微软和亚马逊等公司都推出了自己的生成式AI工具。
视实际应用的不同,生成式AI工具可能依赖引导其生成预期结果的输入提示,想想ChatGPT和DALL - E2。
生成式AI工具的一些最有名的例子包括如下:
- ChatGPT:ChatGPT由OpenAI开发,它是一种AI语言模型,可以根据给定的提示生成类似人类的文本。
- DALL-E 2:DALL-E是来自OpenAI的另一种生成式AI模型,旨在基于文本提示创建图像和艺术品。
- Midjourney:Midjourney由总部位于旧金山的研究实验室Midjourney Inc.开发,它解释文本提示和上下文以生成视觉内容,类似DALL–E 2。
- GitHub Copilot:GitHub Copilot是一种由GitHub和OpenAI创建的基于AI的编程工具,它为Visual Studio和JetBrains等开发环境的用户提供代码完成建议。
生成式AI模型的类型
如今有几种类型的生成式AI模型,每种模型都旨在针对特定的挑战和应用。这些生成式AI模型大致可以分为以下几种类型。
- 基于Transformer的模型
这些模型包括OpenAI的ChatGPT和GPT-3.5,是为自然语言处理而设计的神经网络。它们接受大量数据的训练,以学习单词和句子等顺序型数据之间的关系,这使它们适用于文本生成任务。
- 生成式对抗网络(GAN)
GAN由两个神经网络组成:生成器和鉴别器,它们以竞争或对抗的方式工作。生成器创建数据,而鉴别器评估所述数据的质量和真实性。随着时间的推移,两个网络都能更好地发挥各自的作用,从而生成更真实的输出。
- 变分自编码器(VAE)
VAE使用编码器和解码器来生成内容。编码器接受图像或文本等输入数据,并将其简化成更紧凑的形式。解码器获取这些编码数据后,将其重新组织成类似原始输入的新内容。
- 多模态模型
多模态模型可以处理多种类型的输入数据,包括文本、音频和图像;它们结合不同的模态来创建更复杂的输出。例子包括DALL-E 2和OpenAI的GPT-4,它还能够接受图像和文本输入。
生成式AI的好处
生成式AI带来的最引人注目的好处是效率,原因在于它使企业能够自动处理特定任务,并将时间、精力和资源集中在更重要的战略目标上。这常常有助于降低人力成本,提高运营效率。
生成式AI常常为公司企业提供另外的好处,包括如下:
- 轻松定制或个性化营销内容。
- 生成新的想法、设计或内容。
- 编写、检查和优化计算机代码。
- 为论文或文章起草模板。
- 通过聊天机器人和虚拟助手改进客户支持。
- 为机器学习模型的数据增强提供便利。
- 分析数据以改进决策。
- 简化研究开发流程。
生成式AI的用例
尽管生成式AI仍处于比较初级的阶段,但该技术已经在各种应用和行业站稳了脚跟。
比如在内容创作方面,生成式AI可以生成文本、图像甚至音乐,帮助营销人员、记者和艺术家完成他们的创作流程。在客户支持方面,AI驱动的聊天机器人和虚拟助手可以提供更个性化的帮助,缩短响应时间,同时为客户服务工作人员减轻负担。
生成式AI的其他用途包括如下:
- 医疗保健:生成式AI用于医疗界,以加快新药的发现,并节省研发时间和金钱。
- 营销:广告商使用生成式AI来策划个性化的广告活动,并根据消费者的喜好调整内容。
- 教育:一些教育工作者使用生成式AI模型来开发定制的教学材料和评估考核,以满足不同学生的学习风格。
- 金融:金融分析师使用生成式AI来分析市场模式,并预测股市趋势。
- 环境:气候科学家使用生成式AI模型来预测天气模式,并模拟气候变化的影响。
生成式AI的危险和局限性
值得一提的是,生成式AI带来了许多需要注意的问题。一大问题是它可能传播错误信息或者恶意或敏感的内容,这可能对个人和企业造成严重损害,并可能对国家安全构成威胁。
这些风险并没有逃过政策制定者的眼睛。2023年4月,欧盟提议出台针对生成式AI的新版权规定,要求公司披露用于开发这些工具的任何受版权保护的材料。但愿这些规定会鼓励AI开发方面的透明度和伦理道德,同时最大限度地减少任何滥用或侵犯知识产权的行为。这也有望为内容创作者提供一些保护,他们的作品可能会被生成AI工具无意中模仿或剽窃。
生成式AI自动处理任务也可能影响劳动者,并导致工作岗位流失,需要受影响的员工重新学习技能或提升技能。此外,生成式AI模型可能无意中学习和放大训练数据中存在的偏误,导致有问题的输出,使刻板印象和有害的意识形态永久化。
ChatGPT、Bing AI和谷歌Bard自推出以来都因生成不正确或有害的输出内容而引发了争议。随着生成式AI的不断发展,这些担忧必须得到消除,特别是考虑到很难审查用于训练AI模型的数据源。
生成式AI vs 通用AI
生成式AI和通用AI代表了人工智能的不同方面。生成式AI侧重于基于现有数据创建新的内容或想法。它面向特定的应用,是AI的一个子集,擅长解决特定的任务。
通用AI(又叫通用人工智能)泛指这个概念:具有类人智能的AI系统。通用AI仍然是科幻作品中的东西,它代表了想象中的AI发展的未来阶段,到时计算机能够自主思考、推理和行动。
生成式AI是未来吗?
这取决于您问的对象是谁,但许多专家认为,生成式AI在未来的各行各业都将发挥重要作用。生成式AI的功能已经在内容创建、软件开发和医疗保健等领域被证明大有价值,随着这项技术不断发展,其应用和用例也将日趋丰富。
话虽如此,生成式AI的未来与解决它带来的潜在风险密不可分。随着这项技术不断进步,应当通过最大限度地减少偏误、提高透明度和问责制以及维护数据治理,确保AI的使用合乎伦理道德,这将至关重要。与此同时,在自动化与人类参与之间取得平衡对于最大限度地发挥生成式AI的好处,同时减小对劳动力的任何潜在负面影响而言至关重要。
原文Generative AI defined: How it works, benefits and dangers,作者:Owen Hughes