OpenAI連發5款新模型:價格暴降性能大漲,還治好了GPT-4的「懶病」

2024-2-13 33 2/13
OpenAI連發5款新模型:價格暴降性能大漲,還治好了GPT-4的「懶病」

在美國時間的25號, OpenAI宣佈了一系列重大更新。這些更新不僅關乎它們的大型語言模型,還包括API訪問價格的調整、性能最佳化以及全新嵌入性模型的發佈。這些動作旨在吸引更多開發者的注意,也有望為未來的消費者市場設立新的標竿。

OpenAI連發五款新模型及新的API使用管理工具

1、GPT-3.5 Turbo模型

輸入價格暴降50%,輸出價格降低25%,同時修復各種BUG,回應精準性更高,舊使用者兩週後還可自動升級!

2、GPT-4 Turbo預覽模型

生成程式碼能力更強,模型「變懶」情況減少,修復各種BUG,帶有視覺功能的GPT-4 Turbo也會在未來幾個月內推出!

3、小型文字嵌入模型text-embedding-3-small

性能小幅提升,價格直接「打骨折」,暴降至上代的五分之一。

4、大型文字嵌入模型text-embedding-3-large

核心就是性能強,可建立多達3072維的嵌入,部分測試性能提升70%以上,價格略貴一點點。同時,OpenAI還有個新技術,直接讓開發者在略微損失精度的情況下縮短嵌入,實現性能和成本的平衡,靈活性有極大提升。

5、審查模型text-moderation-007

OpenAI將其稱之為「迄今為止最強大的審查模型」。

OpenAI還很貼心地提示說,默認情況下,傳送到OpenAI API的資料將不會被用於訓練或改進OpenAI模型。

重磅新品升級細節

一、五分之一的價格,更強的性能,模型使用靈活性顯著提升

首先來看看OpenAI此次新推出的兩個嵌入模型,更小且高效的text-embedding-3-small模型,以及更大且更強的text-embedding-3-large模型。

在看模型之前,首先要理解下什麼是「嵌入(embedding)」,簡單來說,嵌入是一系列數字,而這些數字代表自然語言或程式碼等內容中的概念。

嵌入(embedding)示意圖

嵌入讓機器學習模型和其他演算法能夠理解內容之間的關係,並執行如聚類或檢索等任務,為ChatGPT和Assistants API中的知識檢索,以及許多檢索增強生成(RAG)開發者工具提供了支援。

新的小型文字嵌入模型text-embedding-3-small,相比於2022年12月發佈的前代模型text-embedding-ada-002主要有兩方面升級:更強的性能、更低的價格。

性能方面,在一個常用的多語言檢索基準(MIRACL)測試中,text-embedding-3-small平均分數從31.4%增加到了44.0%,在一個常用的英語任務基準(MTEB)測試中,其平均分數從61.0%增加到62.3%。

text-embedding-3-small測試成績

價格方面,text-embedding-3-small的價格僅為上代的五分之一,每1000個tokens的價格從0.0001美元降低到0.00002美元。

另外一個新的大型文字嵌入模型text-embedding-3-large,據稱可以建立多達3072維(dimensions)的嵌入,其主要提升在於性能。

性能方面,text-embedding-3-large在MIRACL測試中的平均分數從31.4%增加到54.9%,而在MTEB測試中,其平均分數從61.0%增加到64.6%。價格為0.00013美元/1000 tokens。

眾所周知,用更大的嵌入,會消耗更多的計算、記憶體和儲存資源,比使用更小的嵌入成本更高。

為此,OpenAI推出一種新的技術,讓開發者可以在使用嵌入的性能和成本之間進行權衡。具體來說,開發者可以透過調整維度API參數(dimensions API parameter)來縮短嵌入,同時保證嵌入不會失去其表示概念的屬性。

比如,在MTEB基準測試中,一個text-embedding-3-large嵌入可以被縮短到256的大小,但其測試成績仍然優於一個未縮短的、大小為1536的text-embedding-ada-002嵌入。

縮短到256大小的text-embedding-3-large與未縮短的、大小為1536的text-embedding-ada-002測試成績對比

這樣的特性可以讓使用變得非常靈活。比如當開發者使用一個最多隻支援1024維嵌入的向量資料儲存時,他仍然可以使用性能最強的text-embedding-3-large模型,他只需要為維度API參數指定一個1024的值,將嵌入從3072維縮短,當然精度會略有損失。

二、兩大經典產品升級:模型更勤快、程式碼能力增強,後續還會支援視覺功能

1、新的GPT-3.5 Turbo模型——輸入輸出價格大幅下降,老使用者升級方便

除了兩個嵌入模型,這次OpenAI還宣佈將在這周推出一個新的GPT-3.5 Turbo模型——gpt-3.5-turbo-0125,並且進一步降低其使用價格,這已經是過去一年時間裡OpenAI對其進行的第三次降價了。

到底有多便宜呢?gpt-3.5-turbo-0125輸入的價格降低了50%,為0.0005美元/1000 tokens,輸出價格也降低了25%,為0.0015美元/1000 tokens。

當然,gpt-3.5-turbo-0125還會有各種升級,比如在以請求的格式回應時,會有更高精準性,同時OpenAI還修復了一些BUG。

另一個好消息是,使用pinned gpt-3.5-turbo模型alias的老客戶將在新模型發佈後的兩週內自動升級。

2、新的GPT-4 Turbo預覽模型——程式碼更強,減少「變懶」

除了GPT-3.5 Turbo,OpenAI這次還發佈新的GPT-4 Turbo預覽模型——gpt-4-0125-preview。

這個模型可以比之前的預覽模型更完整地完成像程式碼生成這樣的任務,並且可以減少模型「變懶(laziness)」不完成任務的情況。去年年底,GPT-4被發現「變懶」問題愈發嚴重,出現回應速度慢、回答敷衍、不聽指令、寫程式碼愛省略甚至拒絕回答、中斷會話等情況。

對於新的GPT-4 Turbo預覽模型,OpenAI也引入相關自動升級機制,如果使用者訂購了相關服務,他就會一直能夠使用最新版的GPT-4 Turbo預覽模型。

值得一提的是,OpenAI還提到他們計畫在未來幾個月內推出帶有視覺功能的GPT-4 Turbo。

3、「迄今為止最強大的審查模型」

最後一個新產品是一個新的審查模型——text-moderation-007,OpenAI稱之為「迄今為止最強大的審查模型」,免費的審查API可以允許開發者辨識可能有害的文字。

4、兩項平台改進,提升開發者API使用管理體驗

此外,OpenAI正在推出兩項平台改進,讓API金鑰的使用有更好的透明度,同時讓開發者對API金鑰有更多的控制權。

第一項改進是,開發者可以從API金鑰頁面為API金鑰分配權限。第二項改進是,使用儀表板和使用匯出功能在打開跟蹤後可以顯示API金鑰等級的度量。

儀表盤可以顯示API金鑰等級的度量

這樣一來,只需要為每個功能、團隊、產品或項目分配單獨的API金鑰,就可以簡單地查看每個等級的使用情況。

性能更強價格更低,OpenAI大型語言模型繼續鞏固優勢

此次OpenAI發佈的多款大型語言模型新品,都在上代產品基礎上實現了一定的性能提升,在開發者使用的便捷程度、靈活程度上有一定改進,同時在價格方面給予了不小的優惠。

對於OpenAI來說,大型語言模型生態的完善離不開開發者,一系列「加量不加價」的操作也勢必會增加OpenAI產品的競爭力。OpenAI的對手們將會做和應對、未來視覺大型語言模型的出現又會給產業帶來哪些新變數,我們拭目以待。

 

  • 延伸閱讀:OpenAI ChatGPT 降價達90%,微軟+OpenAI+NVIDIA站穩先發、別人只能望車尾燈
  • 延伸閱讀:OpenAI大型語言模型太花錢,傳微軟Copilot正自行開發更小更便宜的「小型語言模型」SLM
  • 延伸閱讀:OpenAI正式推出GPT商店,已有超過300萬自訂ChatGPT