近日,社交媒體公司Snap旗下的Snap Research部門宣布,他們研發(fā)出了一種新的技術(shù),可以讓AI生成圖像的速度大幅提升,從原來(lái)的幾分鐘甚至幾小時(shí)縮短到不到兩秒。

這種新的技術(shù)被稱為SnapFusion,它可以根據(jù)用戶輸入的文字提示,快速生成清晰的圖像。Snap公司表示,這是目前學(xué)術(shù)界公布的最快的速度。該公司在博客文章中介紹了這項(xiàng)技術(shù)的原理和優(yōu)勢(shì):

Snap Research通過(guò)優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)和去噪過(guò)程,使得模型非常高效,同時(shí)保持了圖像質(zhì)量。因此,現(xiàn)在可以運(yùn)行模型來(lái)根據(jù)文字提示生成圖像,并在移動(dòng)設(shè)備上幾秒鐘內(nèi)得到結(jié)果,而不是像其他研究那樣需要等待很長(zhǎng)時(shí)間。
Snap Research還發(fā)布了一篇論文(PDF格式),詳細(xì)介紹了SnapFusion技術(shù),并展示了一些由該技術(shù)生成的藝術(shù)作品。論文中指出:
具體來(lái)說(shuō),我們提出了一個(gè)高效的UNet,通過(guò)識(shí)別原始模型的冗余,并通過(guò)數(shù)據(jù)蒸餾減少圖像解碼器的計(jì)算。此外,我們通過(guò)探索訓(xùn)練策略和引入無(wú)分類器指導(dǎo)的正則化,增強(qiáng)了步驟蒸餾。
不過(guò),這項(xiàng)新技術(shù)還需要一段時(shí)間才能面向廣大用戶開放。但是Snap公司表示,它“有潛力在未來(lái)為移動(dòng)設(shè)備上的高質(zhì)量AI生成圖像體驗(yàn)提供強(qiáng)大的動(dòng)力”。IT之家猜測(cè),這項(xiàng)新技術(shù)很可能會(huì)添加到Snapchat移動(dòng)應(yīng)用程序的未來(lái)更新中。