熱搜： 佳士科技 irobot 工業(yè)機(jī)器人機(jī)器人機(jī)器人產(chǎn)業(yè)聯(lián)盟 ABB 發(fā)那科機(jī)械手碼垛機(jī)器人機(jī)器人展覽

Meta 發(fā)布 Megabyte AI 模型抗衡 Transformer：解決后者已知問題、速度提升 4 成

日期：2023-05-31 來源：IT之家評論：0

標(biāo)簽： AI 科技創(chuàng)新

　　IT之家5月30日消息，近日meta團(tuán)隊開發(fā)了一款名為Megabyte的AI模型以抗衡Transformer，據(jù)稱Megabyte解決了Transformer模型所面臨的問題，并且在速度上提升了40%。

▲圖源Arxiv

　　目前Transformer在自然語言處理等領(lǐng)域非常流行，但由于其序列數(shù)據(jù)的處理方式是逐步進(jìn)行的，無法并行化處理，因此訓(xùn)練速度較慢；難以處理長序列，因為其在反向傳播過程中，梯度很容易消失或爆炸；此外，由于需要在每一步保留歷史信息，內(nèi)存消耗較大。

　　而Megabyte模型將輸入和輸出序列劃分為patch，而不是單個的token。這種架構(gòu)使得對大多數(shù)任務(wù)而言字節(jié)級別的預(yù)測相對容易，例如根據(jù)前幾個字符預(yù)測完成的單詞等。這意味著在大型網(wǎng)絡(luò)中可以精簡字符以提升效率，并且內(nèi)部預(yù)測可以使用更小的模型進(jìn)行。Megabyte模型的這種方法解決了當(dāng)今AI模型所面臨的訓(xùn)練速度、可靠性及硬件占用比挑戰(zhàn)。

　　此外，在計算效率方面，相比于等大的Transformer和Linear Transformer，Megabyte模型在固定模型大小和序列長度范圍內(nèi)使用更少的token。因此相對于Transformer，Megabyte模型可以在相同的計算成本下訓(xùn)練內(nèi)容更豐富、體積更大、性能更好的模型。

　　目前meta團(tuán)隊放出了Megabyte模型的論文，IT之家小伙伴可以前往查閱。

聲明：凡資訊來源注明為其他媒體來源的信息，均為轉(zhuǎn)載自其他媒體，并不代表本網(wǎng)站贊同其觀點，也不代表本網(wǎng)站對其真實性負(fù)責(zé)。您若對該文章內(nèi)容有任何疑問或質(zhì)疑，請立即與中國機(jī)器人網(wǎng)(www.baoxianwx.cn)聯(lián)系，本網(wǎng)站將迅速給您回應(yīng)并做處理。
電話：021-39553798-8007

更多>相關(guān)資訊

0 條相關(guān)評論

推薦圖文

加州大學(xué)科學(xué)家發(fā)明了	深圳又一制造業(yè)總部基
水下機(jī)器人在漁業(yè)中的	哈工程水下機(jī)器人再奪
里程碑！荊州市首臺機(jī)	超維科技精彩亮相電力

推薦資訊

點擊排行

?

• 華碩計劃推出基于英偉達(dá)芯片的本地化AI服務(wù)，可	• 和碩與英偉達(dá)合作，將AI瑕疵檢測和數(shù)字孿生技術(shù)
• 商湯聯(lián)合發(fā)布“通才 AI 智能體”通關(guān)《我的世界	• 英偉達(dá) CEO 黃仁勛：AI填平數(shù)字鴻溝，人人都是
• 研究：女性工作更易被AI取代，再培訓(xùn)成關(guān)鍵	• 廣州越秀：全國首款基于大語言模型的圖書館AI機(jī)
• 雷亞游戲：“在美術(shù)作品中導(dǎo)入 AI 技術(shù)，并大量	• AI 成美股“萬能藥”，市場過度集中或帶來風(fēng)險
• 科學(xué)家研發(fā)人造肌肉纖維：能變形且產(chǎn)生力，有望	• 美團(tuán)王興稱人工智能將改變一切，內(nèi)部團(tuán)隊正開發(fā)

恰佩克獎	機(jī)器人高峰論壇	機(jī)氣林	ITES深圳工業(yè)展	機(jī)器人研究院	API數(shù)據(jù)	庫卡機(jī)器人
中國傳動網(wǎng)	索比光伏網(wǎng)	數(shù)控機(jī)床市場網(wǎng)	國家標(biāo)準(zhǔn)化委員會

国产精品久久久久久久小说,国产国产裸模裸模私拍视频,国产精品免费看久久久无码,风流少妇又紧又爽又丰满,国产精品,午夜福利

Meta 發(fā)布 Megabyte AI 模型抗衡 Transformer：解決后者已知問題、速度提升 4 成