IT之家3月15日消息,Open-AI剛剛公布了其大型語言模型的最新版本——GPT-4(API候補申請點此)。
GPT-4可以更準(zhǔn)確地解決你的難題,多模態(tài)的GPT-4還可以生成、編輯具有創(chuàng)意性或技術(shù)性的文章,在高級推理方面的表現(xiàn)超過其前輩(當(dāng)前公開版ChatGPT基于GPT-3.5)。當(dāng)然,正如大家所猜測的那樣,微軟New Bing的聊天功能確實基于GPT-4。
此外,該公司正在與合作伙伴Be My Eyes一起測試GPT-4的圖像輸入能力(注:Be My Eyes是一款即將推出的智能手機App,可以識別場景并對其進行描述,類似于大家常見的AI識圖的加強版)。

除了介紹網(wǎng)站,OpenAI還提供了描述GPT-4功能的技術(shù)性論文,以及詳細描述其局限性的系統(tǒng)模型Card。
OpenAI計劃通過ChatGPT及其商業(yè)API為用戶提供GPT-4的文本功能支持,但目前還需要等待。IT之家這里需要提醒一下,GPT4目前僅ChatGPT plus賬號可用,可選GPT4模式進行對話,每4小時限制發(fā)送100條消息。
收費方面,大約750個單詞的提示收取約3美分的費用,約750個單詞的響應(yīng)則收取6美分(就是問和答的區(qū)別)。
據(jù)介紹,GPT-4比以前的版本“更大”,這意味著它已經(jīng)借助比前輩更多的數(shù)據(jù)進行了訓(xùn)練,并且在模型文件中有更多的權(quán)重,從而使得它的運行成本更高。
就任務(wù)而言,GPT-4的表現(xiàn)比前輩更好,它可以遵循自然語言的復(fù)雜指令并生成技術(shù)或創(chuàng)意內(nèi)容,而且它可以還更深入地做到這一點:它支持生成和處理多達32768個標(biāo)記(約25000個文本單詞),從而實現(xiàn)比前輩更長的內(nèi)容創(chuàng)建或文本分析。
OpenAI表示,GPT-4錯誤答案更少,而且也會減少偏離話題的可能,也盡可能不會再談?wù)摻稍掝},甚至在許多標(biāo)準(zhǔn)化測試中比人類表現(xiàn)得都要更好一些。
例如,GPT-4在模擬律師考試的成績在考生中排名前10%左右,在SAT閱讀考試中排名前7%左右,在SAT數(shù)學(xué)考試中排名前11%左右。相比之下,GPT-3.5在律師考試中的得分一般都是倒數(shù)10%左右。當(dāng)然,它們考個研究生還是沒問題的。
當(dāng)然,AI畢竟是AI,OpenAI也表示目前GPT-4并不完美,它在很多場景下的能力都不如人類。
據(jù)稱,該模型仍然存在“幻覺”或編造事實的問題,并且在事實方面也不一定總是可靠的,“它傾向于堅持認為它是正確的,即使它錯了”。OpenAI表示,GPT-4正在努力解決其局限性,例如社會偏見、幻覺和對抗性提示。