新的嵌入模型和API更新

内容

我们正在推出新一代嵌入模型,新的GPT-4 Turbo和审查模型,新的API使用管理工具,以及即将推出GPT-3.5 Turbo的更低价格。

快速链接

New Embeddings Models And API Updates

我们正在发布新模型,降低 GPT-3.5 Turbo 的价格,并推出新的开发者管理 API 密钥和了解 API 使用情况的方式。新模型包括:

  • 两个新的嵌入模型
  • 更新的 GPT-4 Turbo 预览模型
  • 更新的 GPT-3.5 Turbo 模型
  • 更新的文本审核模型

默认情况下,发送到OpenAI API的数据将不会用于训练或改进OpenAI模型。

新的嵌入模型,价格更低

我们正在推出两个新的嵌入模型:一个更小更高效的 text-embedding-3-small 模型,以及一个更大更强大的 text-embedding-3-large 模型。

嵌入是表示自然语言或代码等内容中概念的一系列数字。嵌入使得机器学习模型和其他算法能够轻松理解内容之间的关系,并执行诸如聚类或检索等任务。它们驱动ChatGPT和Assistants API中的知识检索等应用,以及许多检索增强生成(RAG)开发工具。

一个新的小型文本嵌入模型

text-embedding-3-small 是我们的新高效嵌入模型,比其前身text-embedding-ada-002模型在2022年12月发布时提供了显著的升级。

性能更强大。text-embedding-ada-002text-embedding-3-small进行比较,对于多语言检索的常用基准(MIRACL),平均分数从31.4%提高到44.0%,而对于英语任务的常用基准(MTEB),平均分数从61.0%提高到62.3%。

价格下调。 text-embedding-3-small 模型的效率也比我们之前的 text-embedding-ada-002 模型高出很多。因此,与 text-embedding-ada-002 相比,text-embedding-3-small 的定价已经降低了5倍,每千个标记的价格从$0.0001降至$0.00002。

我们不会废弃 text-embedding-ada-002,因此虽然我们建议使用更新的模型,但客户仍然可以继续使用上一代模型。

一个新的大型文本嵌入模型:text-embedding-3-large

text-embedding-3-large 是我们的新一代更大的嵌入模型,可以创建高达3072维的嵌入。

性能更强大。 text-embedding-3-large 是我们的新性能最佳模型。将 text-embedding-ada-002text-embedding-3-large 进行比较:在 MIRACL 上,平均分数从 31.4% 增加到 54.9%,而在 MTEB 上,平均分数从 61.0% 增加到 64.6%。

text-embedding-3-large 将以 $0.00013 / 1k tokens 的价格销售。

您可以在我们的嵌入指南中了解更多关于使用新的嵌入模型的信息。

原生支持缩短嵌入

使用更大的嵌入,例如将它们存储在向量存储中以进行检索,通常比使用较小的嵌入成本更高,消耗更多的计算、内存和存储空间。

我们的两个新嵌入模型都是使用一种技术进行训练的,这种技术允许开发人员在使用嵌入时在性能和成本之间进行权衡。具体来说,开发人员可以通过传递“dimensions”API参数来缩短嵌入(即从序列末尾删除一些数字),而不会使嵌入失去其表示概念的属性。例如,在MTEB基准测试中,“text-embedding-3-large”嵌入可以缩短到256的大小,而仍然能够胜过大小为1536的未缩短的“text-embedding-ada-002”嵌入。

| ada v2 | text-embedding-3-small | text-embedding-3-large | | | | | | ------------------ | ---------------------- | ---------------------- | ---- | ---- | ---- | ---- | | 嵌入大小 | 1536 | 512 | 1536 | 256 | 1024 | 3072 | | 平均 MTEB 分数 | 61.0 | 61.6 | 62.3 | 62.0 | 64.1 | 64.6 |

这使得使用非常灵活。例如,当使用一个只支持长度最多为1024维的向量数据存储时,开发人员现在仍然可以使用我们最好的嵌入模型text-embedding-3-large,并为dimensions API参数指定一个值为1024,这将把嵌入从3072维缩短到1024维,以换取更小的向量尺寸,从而牺牲一些准确性。

其他新型号和更低价格

更新的 GPT-3.5 Turbo 模型和更低的定价

下周我们将推出新的GPT-3.5 Turbo模型,gpt-3.5-turbo-0125,这是过去一年中第三次降低GPT-3.5 Turbo价格,以帮助我们的客户扩展规模。新模型的输入价格降低了50%,为每千个标记0.0005美元,输出价格降低了25%,为每千个标记0.0015美元。该模型还将有各种改进,包括在请求的格式中更高的响应准确性,以及修复了一个错误,该错误导致非英语语言函数调用的文本编码问题。

使用固定的 gpt-3.5-turbo 模型别名的客户将在该模型推出两周后自动升级,从 gpt-3.5-turbo-0613 升级到 gpt-3.5-turbo-0125

更新的 GPT-4 Turbo 预览

自 GPT-4 Turbo 发布以来,超过 70% 的 GPT-4 API 客户请求已经转向 GPT-4 Turbo,开发人员利用其更新的知识截止日期、更大的 128k 上下文窗口和更低的价格。

今天,我们发布了更新的 GPT-4 Turbo 预览模型,gpt-4-0125-preview。该模型在代码生成等任务上的完成度比之前的预览模型更高,并旨在减少模型未完成任务的“懒惰”情况。新模型还包括修复影响非英文 UTF-8 生成的 bug。

对于那些希望自动升级到新的 GPT-4 Turbo 预览版本的用户,我们还推出了一个新的 gpt-4-turbo-preview 模型名称别名,它将始终指向我们最新的 GPT-4 Turbo 预览模型。

我们计划在未来几个月推出具有视觉功能的 GPT-4 Turbo 版本。

更新的审查模型

免费的 Moderation API 允许开发者识别潜在有害文本。作为我们持续的安全工作的一部分,我们发布了 text-moderation-007,这是迄今为止我们最强大的审查模型。text-moderation-latesttext-moderation-stable 别名已更新指向它。您可以通过我们的 安全最佳实践指南 了解更多构建安全 AI 系统的信息。

理解 API 使用和管理 API 密钥的新方法

我们正在推出两项平台改进,以便让开发人员更清楚地了解他们的使用情况,并对 API 密钥进行更多控制。

开发人员现在可以从API密钥页面分配权限给API密钥。例如,可以将密钥分配为只读权限,以供内部跟踪仪表板使用,或者限制其仅访问特定的端点。

其次,使用仪表板和使用导出功能现在在打开跟踪后,可以按 API 密钥级别公开指标。这样一来,只需为每个功能、团队、产品或项目分别使用不同的 API 密钥,就可以轻松查看每个级别的使用情况。

Image2

在未来几个月中,我们计划进一步改进开发人员查看其API使用情况和管理API密钥的能力,特别是在较大的组织中。

关于OpenAI API 的最新更新,请关注我们在 X 上的最新动态@OpenAIDevs

作者

致谢

庄俊堂,保罗·巴尔特斯库,乔伊·焦,阿尔温德·尼拉坎坦,安德鲁·布劳恩斯坦,杰夫·哈里斯,洛根·基尔帕特里克,莱尔·帕塔克,伊诺克·张,泰德·桑德斯,刘宇天,阿努什里·阿格拉瓦尔,安德鲁·彭,伊恩·基夫利钱,梅赫梅特·亚特巴兹,玛德琳·博伊德,安娜-路易莎·布拉克曼,弗洛伦西亚·莱昂尼·阿莱曼,亨利·海德,莫莉·林,梅根·沙,切尔西·卡尔森,山姆·托泽尔,瑞恩·格林,艾莉森·哈蒙,丹尼·金,卡罗利斯·科萨斯,玛丽·犬塚,彼得·巴库姆,巴雷特·佐夫,卢克·梅茨,翟一炜,林瑞德,亚什·帕蒂尔,米安娜·陈,安德鲁·康德里奇,布赖登·伊斯特曼,利亚姆·费杜斯,约翰·舒尔曼,弗拉德·福门科,安德烈·卡帕西,艾丹·克拉克,欧文·坎贝尔-摩尔

相关研究

总结
OpenAI发布了新的嵌入模型、GPT-4 Turbo和审查模型,以及新的API使用管理工具,并很快将降低GPT-3.5 Turbo的价格。新的嵌入模型包括两个新的嵌入模型,更新的GPT-4 Turbo预览模型,更新的GPT-3.5 Turbo模型和更新的文本审查模型。此外,他们还推出了两个新的嵌入模型,降低了GPT-3.5 Turbo的价格。