6月14日消息,OpenAI今日宣布對其大型語言模型API(包括GPT-4和gpt-3.5-turbo)進行重大更新,包括新增函數(shù)調(diào)用功能、降低使用成本、以及為gpt-3.5-turbo模型提供16000個token的版本。

大型語言模型(LLM)是一種能夠處理自然語言的人工智能技術,它的“上下文窗口(context window)”相當于一個短期記憶,可以存儲輸入的內(nèi)容或者聊天機器人的對話內(nèi)容。在語言模型中,增加上下文窗口大小已經(jīng)成為一種技術競賽,Anthropic公司最近宣布其Claude語言模型可以提供75000個token上下文窗口選項。此外,OpenAI也開發(fā)了一個32000個token的GPT-4版本,但尚未公開推出。
OpenAI剛剛推出了一個新的16000上下文窗口的gpt-3.5-turbo版本,名為“gpt-3.5-turbo-16k”,可以處理長度達到16000個token的輸入,這意味著可以一次處理大約20頁的文本,這對于需要模型處理和生成較大文本塊的開發(fā)者來說是一個很大的提升。
除了這一變化之外,OpenAI還列出了至少四個其他主要的新功能:
在Chat Completions API中引入函數(shù)調(diào)用功能
GPT-4和gpt-3.5-turbo的改進版和“更易控(more steerable)”的版本
將“ada”嵌入模型的價格降低了75%
將gpt-3.5-turbo模型的輸入token價格降低了25%
函數(shù)調(diào)用功能可以讓開發(fā)者更容易地構建能夠調(diào)用外部工具、將自然語言轉(zhuǎn)換為外部API調(diào)用或進行數(shù)據(jù)庫查詢的聊天機器人。例如,它可以將“給Anya發(fā)郵件,看看她下周五是否想喝咖啡”這樣的輸入轉(zhuǎn)換為“send_email(to:string,body:string)”這樣的函數(shù)調(diào)用。尤其是,這個功能還可以讓API用戶更容易地生成JSON格式的輸出,這是之前很難實現(xiàn)的。
關于“更易控”方面,這是一個指代如何讓LLM按照你想要的方式行事的專業(yè)術語,OpenAI表示其新的“gpt-3.5-turbo-0613”模型將包含“通過系統(tǒng)消息更可靠地控制”的功能。系統(tǒng)消息是API中一種特殊的指令輸入,可以告訴模型如何行事,例如“你是格林姆斯,你只談論奶昔。”
除了功能上的改進之外,OpenAI還提供了相當大幅度的成本降低。值得注意的是,受歡迎的gpt-3.5-turbo模型的token價格降低了25%。這意味著開發(fā)者現(xiàn)在可以以每1000個token約0.0015美元、每1000個token約0.002美元的價格使用這個模型,相當于每美元可以處理大約700頁文本。gpt-3.5-turbo-16k模型則定價為每1000個token 0.003美元、每1000個token 0.004美元。
此外IT之家注意到,OpenAI還將其“text-embedding-ada-002”嵌入模型的價格降低了75%。嵌入模型是一種讓計算機理解單詞和概念的技術,可以將自然語言轉(zhuǎn)換為機器可以理解的數(shù)字語言,這對于搜索文本和推薦相關內(nèi)容等任務很重要。
由于OpenAI不斷更新其模型,舊的模型不會一直存在。今天,該公司還宣布開始淘汰一些早期版本的模型,包括gpt-3.5-turbo-0301和gpt-4-0314。該公司表示,開發(fā)者可以繼續(xù)使用這些模型直至9月13日,之后這些舊模型將不再可用。值得注意的是,OpenAI的GPT-4 API仍然處于等待名單中,尚未完全開放。