熱搜： irobot 佳士科技工業(yè)機(jī)器人機(jī)器人機(jī)器人產(chǎn)業(yè)聯(lián)盟 ABB 機(jī)械手發(fā)那科碼垛機(jī)器人機(jī)器人展覽

可通過文字生成連貫動作視頻，谷歌推出 AI 擴(kuò)散模型 Lumiere

日期：2024-01-30 來源：IT之家評論：0

　　IT之家1月29日消息，谷歌研究院日前推出了一款名為Lumiere的“文生視頻”擴(kuò)散模型，主打采用自家最新開發(fā)的“Space-Time U-Net”基礎(chǔ)架構(gòu)，號稱能夠一次生成“完整、真實、動作連貫”的視頻。

▲圖源谷歌官方新聞稿（下同）

　　谷歌表示，業(yè)界絕大多數(shù)“文生視頻”模型無法生成時間長、質(zhì)量佳、動作連貫逼真的內(nèi)容，這是因為此類模型通常“分段生成視頻”，首先產(chǎn)生幾張關(guān)鍵幀，接著用“時間超級分辨率（Temporal Super-Resolution）”技術(shù)，生成關(guān)鍵幀之間的視頻文件，這種方法雖然能夠節(jié)省RAM，但難以生成“連貫逼真”的視頻。

　　谷歌提到，他們的新模型Lumiere相對于業(yè)界模型最大的不同是采用了全新“Space-Time U-Net”基礎(chǔ)架構(gòu)，該架構(gòu)能夠在空間和時間上同時“降采樣（Downsample）”信號，從而在“更緊湊的時空中進(jìn)行更多運算”，令Lumiere生成持續(xù)時間更長、動作更連貫的視頻。

　　IT之家注意到，Lumiere一次可以生成80幀視頻（16FPS下5秒視頻/24FPS下約3.34秒視頻），雖然這一數(shù)據(jù)看起來很短，不過研究人員提到，5秒視頻長度實際上“已經(jīng)超過大多數(shù)媒體作品中的平均鏡頭時長”。

　　除了應(yīng)用“Space-Time U-Net”基礎(chǔ)架構(gòu)外，谷歌還介紹了Lumiere的基礎(chǔ)特性，該AI建立在一個經(jīng)過預(yù)先訓(xùn)練的“文生圖”模型基礎(chǔ)上，研究人員首先讓基礎(chǔ)模型生成視頻分幀的基本像素草稿，接著通過空間超分辨率（SSR）模型，逐步提升分幀分辨率及細(xì)節(jié)，并利用“Multidiffusion”通用生成框架提升模型穩(wěn)定性，從而保證了最終輸出的視頻一致性和連續(xù)性。

聲明：凡資訊來源注明為其他媒體來源的信息，均為轉(zhuǎn)載自其他媒體，并不代表本網(wǎng)站贊同其觀點，也不代表本網(wǎng)站對其真實性負(fù)責(zé)。您若對該文章內(nèi)容有任何疑問或質(zhì)疑，請立即與中國機(jī)器人網(wǎng)(www.baoxianwx.cn)聯(lián)系，本網(wǎng)站將迅速給您回應(yīng)并做處理。
電話：021-39553798-8007

更多>相關(guān)資訊

0 條相關(guān)評論

推薦圖文

加州大學(xué)科學(xué)家發(fā)明了	深圳又一制造業(yè)總部基
水下機(jī)器人在漁業(yè)中的	哈工程水下機(jī)器人再奪
里程碑！荊州市首臺機(jī)	超維科技精彩亮相電力

推薦資訊

點擊排行

?

<center id="lcddy"></center>

^{<blockquote id="lcddy"></blockquote>}

• 機(jī)器人能用AI加速發(fā)現(xiàn)化學(xué)分子	• xAI 融資 60 億美元挑戰(zhàn) OpenAI？馬斯克回應(yīng)：
• 印度首家 AI 獨角獸企業(yè)誕生：初創(chuàng)公司 Krutrim	• 約 8000 個崗位受影響，企業(yè)軟件巨頭 SAP 向商
• OpenAI 阿爾特曼訪韓：參觀三星半導(dǎo)體生產(chǎn)線，	• MIT CSAIL最新研究表明人工智能不會搶走那么多
• AI 致命弱點：科學(xué)家首次用數(shù)學(xué)方法證明無法開	• 推動人工智能技術(shù)賦能社會
• 估值飆升！馬斯克公司首個AI大模型產(chǎn)品即將發(fā)布	• 百度文心大模型落地吉利銀河 L6 車型，支持 AI

恰佩克獎	機(jī)器人高峰論壇	機(jī)氣林	ITES深圳工業(yè)展	機(jī)器人研究院	庫卡機(jī)器人	中國傳動網(wǎng)
索比光伏網(wǎng)	數(shù)控機(jī)床市場網(wǎng)	國家標(biāo)準(zhǔn)化委員會

国产精品久久久久久久小说,国产国产裸模裸模私拍视频,国产精品免费看久久久无码,风流少妇又紧又爽又丰满,国产精品,午夜福利

可通過文字生成連貫動作視頻，谷歌推出 AI 擴(kuò)散模型 Lumiere