审校 | 重楼
人们如今在谈到人工智能时,主要有两种观点:有些人认为人工智能最终将超越人类智能,而另外一些人则认为人工智能将永远为人类服务。然而,有一件事双方都一致认同:其发展速度越来越快。
虽然人工智能目前仍处于发展的早期阶段,但它有可能彻底改变人类与技术互动的方式。
而一个简单而笼统的描述是,人工智能是一个对计算机进行编程以自行做出决策的过程。这可以通过多种方式实现,但最常见的是通过使用人工智能算法。算法是一组可以用来解决问题的规则或指令。在人工智能的例子中,算法被用来教会计算机如何做出决策。
在过去,人工智能主要用于完成简单的任务,例如下棋或解决数学问题。然而,人工智能现在被用于更复杂的任务,例如面部识别、自然语言处理,甚至自动驾驶。随着人工智能技术的不断发展,没有人知道它在未来会有什么能力。随着人工智能能力的迅速扩展,了解它是什么,它是如何工作的,以及它的潜在影响非常重要。
人工智能的好处是巨大的。凭借自主决策的能力,人工智能有潜力提高各行业的工作效率,并为人们提供更多的机会。本文将主要讨论GPT-3。
GPT-3是什么?它从何而来?
GPT-3是由OpenAI公司创建的生成式人工智能。OpenAI公司是一家总部位于旧金山的开创性人工智能研究机构,该公司将其目标定义为“确保人工智能造福全人类”。他们创造人工智能的愿景是明确的:GPT-3是一种不局限于特定任务,而是像人类一样执行各种任务的人工智能。
几个月前,OpenAI公司向所有用户发布了GPT-3这一新的语言模型。GPT-3是“Generative Pretrained Transformer 3”的简称,由名称为提示符的前提生成文本组成。简单地说,它可以被称为高级的“自动补全”。例如,人们可以就任何给定的主题提供两到三个句子,GPT-3将完成其余的工作,还可以生成对话,将基于前面的问题和答案的语境提供答案。
需要强调的是,GPT-3提供的每个答案都只是一种可能,因此它不会是唯一的答案。此外,如果对同一个前提进行多次测试,可能会得到不同的答案甚至相互矛盾的答案。因此,它是一个基于先前所说的内容以返回答案的模型,并将其与人们所知道的一切联系起来,以获得最有意义的答案。这意味着它没有义务采用真实的数据给出答案,这是人们必须考虑到的事情。这并不意味着人们不能向它提供所做的一些工作的数据并谈论它,但总是有必要对这些信息进行对比。语境越好,得到的答案就越好,反之亦然。
OpenAI公司的GPT-3语言模型之前已经进行了训练,其训练包括学习互联网上的大量信息。GPT-3得到了所有公共书籍、维基百科以及互联网上数百万网页和科学论文的支持。简而言之,它吸收了人类历史上在Web上发布的最重要的人类知识。
在阅读和分析这些信息之后,这个语言模型在一个768GB的模型中创建了连接,该模型采用48个16GB显存的GPU。就像人们理解的那样,之前的OpenAI模型GPT-2的显存总和为40GB,并且分析了4500万个网页。但二者之间的差异是巨大的,因为GPT-2有15亿个参数,GPT-3有1750亿个参数。
以下做一个测试。要求GPT-3定义它自己,其结果如下:
如何在GPT-3 Playground上使用它
为了能够使用GPT-3并进行测试,用户要做的唯一一件事就是访问他们的网站,注册并添加通常在注册中使用的个人信息。在其中一部分,它会问用户将使用这个GPT-3做什么,对于这些例子,选择了个人使用选项。
专家为此指出的是,从使用经验来看,使用英语的效果要好一些。这并不意味着它在其他语言中表现得很糟糕。事实上,在西班牙语中,GPT-3表现得很好,但有些人更喜欢它采用英语提供的结果,这就是为什么从现在开始展示的测试和结果是使用西班牙语的原因。
当用户第一次采用GPT-3时,就会得到一份免费的赠品。一旦用户注册了电子邮箱和电话号码,将会获得18美元免费的消费额。虽然看起来不多,但事实上18美元提供的服务并不少。例如采用人工智能测试5个小时,而其费用为1美元。稍后将会解释价格以便更好地理解这个问题。
一旦进入网站,通常会进入GPT-3 Playground部分。所有的奇迹都将在这里发生。
提示+提交
首先,在网络上最突出的是大文本框。这是可以开始向人工智能输入提示(这些是请求或指令)的地方。这就像输入一些内容一样简单,在本例中是提出的一个问题,然后点击下面的提交按钮,让GPT-3回答并写下所要求的内容。
预设
预设是针对不同任务的现成预置。它们可以在文本框的右上角找到。如果点击其中的几个,“更多示例”将打开一个新屏幕,在那里将获得整个列表。当选择预设时,文本区域的内容将更新为默认文本。右侧边栏中的设置也会更新。例如,如果要使用“语法纠正”预设,应该遵循以下结构,以获得最好的结果。
模型
用于训练GPT-3的大量数据集是它如此强大的主要原因。然而,数据集更大并不总是意味着更好。出于这些原因,OpenAI提供了四种主要模型。虽然还有其他的模型,但建议使用最新的版本,现在就要讨论这些模型。
这四个可用的模型称为Davinci、Babbage、Curie和Ada。在这四个模型中,Davinci是最大和功能最强大的模型,因为它可以执行其他智能引擎可以执行的任务。
以下将概述每个模型以及可能最适合每个模型的任务类型。然而请记住,虽然较小的模型可能无法使用那么多的数据进行训练,但它们仍然是通用模型,对于某些任务来说,它们非常可行且成本更低。
(1)Davinci
如上所述,它是最有能力的模型,可以做任何其他模型可以做的所有事情,通常需要更少的指令。Davinci能够解决逻辑问题,确定因果关系,理解文本意图,产生创造性的内容,解释人物动机,并处理复杂的总结性任务。
(2)Curie
这种模型试图平衡智能引擎的动力和速度。它可以做到Ada或Babbage可以做的任何事情,但它也能够处理更复杂的分类任务和更细致的任务,例如总结、情感分析、聊天机器人应用程序和问答。
(3)Babbage
Babbage的能力比Ada稍强,但效率不如Ada。它可以执行与Ada相同的所有任务,但也可以处理稍微复杂一些的分类任务,并且非常适合用于对文档与搜索查询匹配程度进行分类的语义搜索任务。
(4)Ada
最后,Ada通常是最快和最便宜的模型。它最适合于细微差别较小的任务,例如解析文本、重新格式化文本和更简单的分类任务。为Ada提供的语境越多,它的性能就越好。
引擎
可以调整其他参数以获得对提示的最佳响应,这些参数低于最重要的参数之下。没错,就是模型。以下来解释一些看起来最有趣的事情。
控制GPT-3引擎输出的最重要的设置之一是温度。这个设置控制生成文本的随机性。值为0使引擎具有确定性,这意味着它总是为给定的文本输入生成相同的输出。值为1会让引擎承担最大的风险,并使用大量的创造力。
人们可能注意到,在能够运行的一些测试中,GPT-3停在句子的中间。要控制允许生成的文本的最大数量,可以使用代币中指定的“最大长度”设置。稍后会解释这个代币是什么。
“Top P”参数是控制GPT-3生成文本的随机性和创造性的另一种方法,但在这种情况下,它与概率范围内的标记(单词)有关,这取决于将其放置在哪里(0.1将是10%)。OpenAI文档建议在Temperature和Top P之间只使用一个函数,因此在使用其中一个函数时,请确保另一个函数设置为1。
另一方面,有两个参数来惩罚GPT-3给出的答案。其中之一是“频率惩罚”,它控制着模型重复预测的趋势。它还降低了已经生成的单词的概率,这取决于一个单词在预测中已经出现了多少次。
第二种惩罚是“存在惩罚”。“存在惩罚”参数鼓励模型做出新颖的预测。如果某个单词已经出现在预测文本中,则出现惩罚会降低该单词出现的概率。与“频率惩罚”不同,出现次数的惩罚并不取决于单词在过去的预测中出现的频率。
最后,有一个“Bestof”参数,它为查询生成几个答案。然后Playground选择最好的发送给用户。GPT-3本身警告人们,这将对提示符生成多个补全,这可能导致花费比人们想象还要多的代币。
历史
为了完成本节,“提交”按钮旁边的第三个图标将展示对GPT-3的所有请求的历史记录。这样,如果用户不记得曾经使用的提示符,将会得到非常好的响应,这让它变得更容易。
成本和代币
一旦免费的服务结束,GPT-3为用户提供了一种继续使用其平台的方式,它不是任何形式的每月订阅或类似的事情。其价格与它的用途直接相关。换句话说,人们将通过代币收费。这是一个用于人工智能的术语,与产出的成本有关。标记可以是任何事物,从字母到句子。因此,很难确切地知道每次使用人工智能服务的价格。但考虑到它们通常是几美分,只需稍微尝试一下,很快就会看到每次使用服务的价格。
虽然OpenAI公司只展示了十几个GPT-3的使用示例,但可以看到每个GPT-3上使用的代币,以更好地了解其工作原理。
以下是它们各自的版本和价格:
为了了解一定数量的单词可能会花费多少费用,或者给一个代币如何工作的示例,使用了以下名为Tokenizer的工具。
这表明GPT模型家族使用标记处理文本,标记是文本中常见的字符序列。模型理解这些代币之间的统计关系,并在这些代币序列中的下一个代币的生产中被选择。
最后,这是一个非常低的水平,所以可以用别的例子来看看同一个例子会花费多少代币。
结论
从专家的角度来看,它是用户必须知道如何正确使用的一个工具。正如以上所提到的,GPT-3不必为用户提供正确的数据。这意味着,如果想用它来开展工作、回答某些问题或做作业,就必须给人工智能一个良好的语境(提示),这样的结果才真正接近想要的结果。
有些人可能会担心的一件事是,这是否会改变教育行业,或者当前存在的某些与写作有关的工作是否会消失。这是有可能发生的,因为有些工作迟早都会被人工智能取代。这个例子是关于与写作相关的人工智能,但它们存在于编程、绘图、音频等领域。
另一方面,它为许多工作和项目提供了很多可能性,无论是个人的还是专业的。例如,你曾经想过写一个恐怖故事吗?在找到语法检查器的例子列表中,有一个专门的语法检查器。
综上所述,人工智能现在正处在早期版本,这个世界仍然有很多事物可以发展和提供。人们可以学习如何使用,并对其进行训练,以提供最佳的响应。
原文GPT-3 Playground: The AI That Can Write for You,作者:Isaac Alvarez