谷歌Gemini发布一周之后,面向开发者的API也终于上线了。
目前,不管是Gemini Pro,还是Gemini Pro Vision,都可以免费体验。
虽然每分钟最多支持60次请求,但基本上可以满足大多数应用程序开发的需求。
而到了明年初上线时,谷歌将正式开启收费。
API定价,也将和GPT-3.5看齐,都是0.001刀每千token输入,0.002刀每千token输出。
Gemini Pro
GPT-3.5
具体来说:
- 目前支持32K的上下文窗口,之后还会进一步扩大。
- 而其他基本的功能也都支持:函数调用、嵌入、语义检索、自定义知识。
- 支持全球180多个国家和地区的 38 种语言。
- 支持文本的API输出,不过输出暂时还只支持文字。
- 提供了Python、Android (Kotlin)、Node.js、Swift和JavaScript的SDK支持。
微调方面,用户可以通过Google AI Studio直接接入Gemini Pro API,而且用户还可以通过Vertex AI来全面地自定义Gemini。
其中,用户可以使用自己的数据,在无代码环境构建自己的Gemini对话机器人,支持RAG,搜索,嵌入,对话剧本等功能。
而且谷歌保证,所有用户的数据和IP谷歌都不会用来训练模型。
能力方面,根据谷歌的评测,Gemini Pro不仅在大部分文字基准中优于GPT-3.5,而且由于原生支持多模态,因此在图像评测上直接实现了降维打击。
代码生成工具正式上线
同在今天,谷歌正式宣布全面推出Duet AI for Developers,用于代码补全和生成的人工智能辅助工具套件。
更令人兴奋的是,未来几周将得到Gemini模型的加持。
要知道,当今开发者中最受欢迎的代码平台工具,非微软的GitHub的Copilot莫属。
与之不同的是,谷歌采用了25家公司的平台的数据集,来帮助开发人员构建应用程序,并排除代码故障。
比如,Confluent、HashiCorp和MongoDB将提供数据来训练Duet AI for Developers,以帮助开发人员为其平台编写代码。
虽然这些合作伙伴的数据在代码补全和生成体验中大多有用,但Datadog、JetBrains和LangChain将提供文档和知识源。
这些文档和知识源可能在Duet AI for Developers聊天体验中最有用。
例如,利用这些数据,该服务将能够为开发和运营团队提供有关如何创建测试自动化、解决生产中的问题和修复漏洞的信息。
谷歌云的一位宣传者Richard Seroter表示,人工智能如何帮助摆脱我们不喜欢做的事情?我们如何让编码变得更好?这就是我们一直在追逐的很多东西。我们如何构建一种人工智能助手,既能满足开发人员使用的工具,又能在其中加入一点谷歌的元素?
那么,如何在这些工具中加入谷歌的元素?
比如,在开发人员已经使用的所有流行集成开发环境之上,确保模型经过最新云原生实践的训练,并将其集成到谷歌云控制台中。
Seroter强调,谷歌着眼于整个Duet AI产品系列,其中Duet AI in Security Operations现在也作为企业级产品正式发布。
谷歌的AI编码工具研发过程与其他所有科技公司的产品基本相同。
例如,Seroter指出,开发人员已经熟悉的IDE 中的代码自动补全功能有助于开发人员保持工作流不变。
与其他大厂一样,谷歌自身不认为这些工具会取代编码技能,但有助于提高开发人员的工作效率。
目前,一家「人工智能驱动的技术服务公司」 Turing,在采用Duet AI for Developers后,生产力提高了33%。
Duet AI for Developers目前支持20+种语言,包括C、C++、Java、JavaScript和Python。
除了常用的编码功能之外,它还包括对AI日志汇总和错误解释的支持,例如还支持与Cloud Logging、以及Smart Actions的集成,谷歌将其描述为执行单元测试生成等任务的一键式快捷方式。
明年1月底之前,Duet AI for Developers将免费开放。之后,谷歌也会采取收费制,每月19美元,按年度为单位。