我們正在推出新一代的嵌入模型,新的 GPT-4 Turbo 和審核模型,新的 API 使用管理工具,以及不久的將來,GPT-3.5 Turbo 的降價。
快速連結
我們正在推出新模型,降低GPT-3.5 Turbo的價格,並引入開發者管理API金鑰和了解API使用情況的新方法。新模型包括:
- 兩種新的嵌入模型
- 更新後的 GPT-4 Turbo 預覽模型
- 更新後的 GPT-3.5 Turbo 模型
- 更新後的文字審核模型
預設情況下,發送到 OpenAI API 的數據將不會被用來訓練或改善 OpenAI 模型。
新的嵌入式模型與更低的價格
我們正在推出兩種新的嵌入模型:一種是體積較小且高效的 text-embedding-3-small
模型,另一種是體積較大且更強大的 text-embedding-3-large
模型。
一個嵌入是一串代表內容中概念的數字序列,如自然語言或代碼。嵌入使機器學習模型和其他算法容易理解內容之間的關係,並執行如分群或檢索等任務。它們為應用程序提供動力,如在ChatGPT和Assistants API中的知識檢索,以及許多檢索增強生成(RAG)開發者工具。
一個新的小型文本嵌入模型
text-embedding-3-small
是我們新的高效能嵌入模型,並且相較於其前身 text-embedding-ada-002
模型提供了顯著的升級,後者於 2022年12月 發布。
更強的性能。 比較 text-embedding-ada-002
與 text-embedding-3-small
,在一個常用的多語言檢索基準 (MIRACL) 上的平均分數已從 31.4% 提升至 44.0%,而在一個常用的英語任務基準 (MTEB) 上的平均分數也從 61.0% 提升至 62.3%。
降價。 text-embedding-3-small
比我們之前的一代 text-embedding-ada-002
模型要高效得多。因此,text-embedding-3-small
的價格比 text-embedding-ada-002
降低了5倍,從每千個代幣的價格 $0.0001 降至 $0.00002。
我們不會淘汰 text-embedding-ada-002
,所以雖然我們推薦更新的模型,客戶仍然可以繼續使用前一代的模型。
一個新的大型文本嵌入模型:text-embedding-3-large
text-embedding-3-large
是我們新一代的大型嵌入模型,能創建多達 3072 維度的嵌入。
更強的性能。 text-embedding-3-large
是我們新的最佳表現模型。比較 text-embedding-ada-002
與 text-embedding-3-large
:在 MIRACL 上,平均分數已從 31.4% 增加到 54.9%,而在 MTEB 上,平均分數已從 61.0% 增加到 64.6%。
text-embedding-3-large
的價格將為每千個 token $0.00013 美元。
您可以在我們的嵌入指南中了解更多關於使用新的嵌入模型的信息。
原生支持縮短嵌入
使用較大的嵌入,例如將它們存儲在向量存儲中以供檢索,通常比使用較小的嵌入花費更多,並且消耗更多的計算、記憶體和儲存空間。
我們的兩個新嵌入模型都是採用一種技術進行訓練的,該技術允許開發者在使用嵌入時權衡性能和成本。具體來說,開發者可以通過傳入 dimensions
API 參數來縮短嵌入(即從序列末尾刪除一些數字),而不會失去嵌入表示概念的屬性。例如,在 MTEB 基準測試上,一個 text-embedding-3-large
嵌入可以縮短到 256 的大小,同時仍然能夠超越未縮短的 text-embedding-ada-002
嵌入,後者的大小為 1536。
| ada v2 | 文本嵌入-3-小型 | 文本嵌入-3-大型 | | | | | | ------------------ | ---------------------- | ---------------------- | ---- | ---- | ---- | ---- | | 嵌入大小 | 1536 | 512 | 1536 | 256 | 1024 | 3072 | | 平均MTEB分數 | 61.0 | 61.6 | 62.3 | 62.0 | 64.1 | 64.6 |
這使得使用方式非常靈活。例如,當使用一個只支援長度最多1024維的向量數據存儲時,開發者現在仍然可以使用我們最好的嵌入模型 text-embedding-3-large
,並為dimensions
API參數指定一個1024的值,這將會將嵌入從3072維縮短,以較小的向量大小為代價交換一些準確性。
其他新型號和較低的價格
更新了GPT-3.5 Turbo模型和更低的價格
下週我們將推出新的 GPT-3.5 Turbo 模型,gpt-3.5-turbo-0125
,並且在過去一年中第三次降低 GPT-3.5 Turbo 的價格,以幫助我們的客戶擴展。新模型的輸入價格降低了 50% 至 $0.0005 /1K tokens,輸出價格降低了 25% 至 $0.0015 /1K tokens。這個模型還將有各種改進,包括在請求的格式中回應的準確度更高,以及修復了一個錯誤,該錯誤導致非英語語言函數調用的文本編碼問題。
使用固定的 gpt-3.5-turbo
模型別名的客戶將在該模型推出後兩週自動從 gpt-3.5-turbo-0613
升級到 gpt-3.5-turbo-0125
。
更新的 GPT-4 Turbo 預覽
超過70%的GPT-4 API客戶的請求自其發布以來已轉移到GPT-4 Turbo,因為開發者利用了其更新的知識截止日期、更大的128k上下文窗口以及更低的價格。
今天,我們正在發布一個更新的 GPT-4 Turbo 預覽模型,gpt-4-0125-preview
。這個模型比之前的預覽模型更徹底地完成像代碼生成這樣的任務,旨在減少模型未完成任務的“懶惰”情況。新模型還包括了修復影響非英語 UTF-8 生成的錯誤的修復。
對於那些希望自動升級到新的 GPT-4 Turbo 預覽版本的用戶,我們還推出了一個新的 gpt-4-turbo-preview
模型名稱別名,它將始終指向我們最新的 GPT-4 Turbo 預覽模型。
我們計劃在未來幾個月內推出具有視覺功能的 GPT-4 Turbo 一般可用版本。
更新的版主模型
免費的內容審查 API 允許開發者識別可能有害的文本。作為我們持續安全工作的一部分,我們正在發布 text-moderation-007
,我們迄今為止最強大的審查模型。text-moderation-latest
和 text-moderation-stable
別名已更新,以指向它。您可以通過我們的安全最佳實踐指南了解更多關於構建安全 AI 系統的信息。
新方法來理解 API 使用情況和管理 API 金鑰
我們正在推出兩項平台改進,以便開發者更清楚地了解他們的使用情況並對 API 金鑰進行更多控制。
首先,開發者現在可以從API金鑰頁面為API金鑰分配權限。例如,一個金鑰可以被分配只讀訪問權限以供內部追蹤儀表板使用,或者限制只能訪問某些端點。
其次,在開啟追蹤後,使用量儀表板和使用量匯出功能現在可以在 API 金鑰層級上公開指標。這使得通過為每個功能、團隊、產品或項目分別設置獨立的 API 金鑰,簡單地查看每個層級的使用情況。
在未來幾個月,我們計劃進一步改善開發者查看其API使用情況和管理API密鑰的能力,特別是在大型組織中。
要獲得 OpenAI API 的最新更新,請在 X 上關注我們 @OpenAIDevs。
作者
致謝
Juntang Zhuang, Paul Baltescu, Joy Jiao, Arvind Neelakantan, Andrew Braunstein, Jeff Harris, Logan Kilpatrick, Leher Pathak, Enoch Cheung, Ted Sanders, Yutian Liu, Anushree Agrawal, Andrew Peng, Ian Kivlichan, Mehmet Yatbaz, Madelaine Boyd, Anna-Luisa Brakman, Florencia Leoni Aleman, Henry Head, Molly Lin, Meghan Shah, Chelsea Carlson, Sam Toizer, Ryan Greene, Alison Harmon, Denny Jin, Karolis Kosas, Marie Inuzuka, Peter Bakkum, Barret Zoph, Luke Metz, Jiayi Weng, Randall Lin, Yash Patil, Mianna Chen, Andrew Kondrich, Brydon Eastman, Liam Fedus, John Schulman, Vlad Fomenko, Andrej Karpathy, Aidan Clark, Owen Campbell-Moore