自5月15日首次亮相的7個(gè)月以來,豆包大模型在通用語言、視頻生成、語音對(duì)話、視覺理解等方面模型能力已經(jīng)跨入國際第一梯隊(duì)。
截至2024年12月,最新版豆包通用模型Doubao-pro-1215綜合能力較5月提升32%,已全面對(duì)齊GPT-4o。在數(shù)學(xué)、專業(yè)知識(shí)等部分復(fù)雜場(chǎng)景任務(wù)中,效果表現(xiàn)甚至更好,同時(shí)其推理服務(wù)價(jià)格僅為 GPT-4o 的八分之一。其經(jīng)過海量數(shù)據(jù)優(yōu)化及模型架構(gòu)的創(chuàng)新,包括提升模型稀疏度、引入強(qiáng)化學(xué)習(xí)等,從而使該模型理解精度、生成質(zhì)量大幅提升。
此外,豆包還首次披露了其300萬字窗口的長文本能力。其能夠一次性輕松閱讀“上百篇”學(xué)術(shù)報(bào)告,每百萬tokens處理延遲僅15秒。