国产精品久久久久久久小说,国产国产裸模裸模私拍视频,国产精品免费看久久久无码,风流少妇又紧又爽又丰满,国产精品,午夜福利

熱搜: irobot  機(jī)器人  佳士科技  工業(yè)機(jī)器人  機(jī)器人產(chǎn)業(yè)聯(lián)盟  機(jī)械手  ABB  發(fā)那科  機(jī)器人展覽  碼垛機(jī)器人 

稀宇科技發(fā)布并開(kāi)源新一代MiniMax 01系列模型,參數(shù)量達(dá)4560億

   日期:2025-01-16     評(píng)論:0    
標(biāo)簽:
       稀宇科技(MiniMax)今日宣布推出新一代 01 系列模型,包含基礎(chǔ)語(yǔ)言大模型 MiniMax-Text-01 和視覺(jué)多模態(tài)大模型 MiniMax-VL-01。

為方便開(kāi)發(fā)者研究,該公司還在 Github 上開(kāi)源了兩個(gè)模型的完整權(quán)重。這一系列模型的后續(xù)更新,包括代碼和多模態(tài)相關(guān)的后續(xù)強(qiáng)化仍待上傳。

該系列模型首次大規(guī)模實(shí)現(xiàn)線性注意力機(jī)制,打破 Transformer 傳統(tǒng)架構(gòu)記憶瓶頸,能夠處理 400 萬(wàn) token 的輸入,可輸入長(zhǎng)度是 GPT-4o 的 32 倍,Claude-3.5-Sonnet 的 20 倍。

據(jù)介紹,這個(gè)模型的參數(shù)量高達(dá) 4560 億,其中單次激活 459 億,模型綜合性能比肩海外頂尖模型,在大多數(shù)任務(wù)上追平了海外公認(rèn)最先進(jìn)的兩個(gè)模型,GPT-4o-1120 以及 Claude-3.5-Sonnet-1022。

在長(zhǎng)文任務(wù)上,隨著輸入長(zhǎng)度變長(zhǎng),MiniMax-Text-01 性能衰減更少,顯著優(yōu)于谷歌 Gemini。因此,01 系列模型在處理長(zhǎng)輸入的時(shí)候有非常高的效率,接近線性復(fù)雜度。

定價(jià)方面,IT之家發(fā)現(xiàn)該系列模型標(biāo)準(zhǔn)定價(jià)是輸入 1 元 / 百萬(wàn)輸入 token、8 元 / 百萬(wàn)輸出 token。

 
 
聲明:凡資訊來(lái)源注明為其他媒體來(lái)源的信息,均為轉(zhuǎn)載自其他媒體,并不代表本網(wǎng)站贊同其觀點(diǎn),也不代表本網(wǎng)站對(duì)其真實(shí)性負(fù)責(zé)。您若對(duì)該文章內(nèi)容有任何疑問(wèn)或質(zhì)疑,請(qǐng)立即與中國(guó)機(jī)器人網(wǎng)(www.baoxianwx.cn)聯(lián)系,本網(wǎng)站將迅速給您回應(yīng)并做處理。
電話:021-39553798-8007
更多>相關(guān)資訊
0相關(guān)評(píng)論

推薦圖文
推薦資訊
點(diǎn)擊排行
?