IT之家3月13日消息,《華爾街日?qǐng)?bào)》當(dāng)?shù)貢r(shí)間13(今)日刊登了對(duì)OpenAI首席技術(shù)官米拉?穆拉蒂的采訪。她表示,Sora將在今年推出,“可能要等幾個(gè)月”。
穆拉蒂表示,除了面向公眾公開提供Sora外,OpenAI還計(jì)劃加入音頻生成功能,可能會(huì)使場(chǎng)景更為逼真。此外,公司還計(jì)劃允許用戶自己編輯Sora生成的內(nèi)容,“因?yàn)锳I工具并不總能生成準(zhǔn)確的結(jié)果”。她說,公司正在試圖找尋方法,使用戶可以自行編輯、創(chuàng)作影音內(nèi)容。

當(dāng)被問及OpenAI使用了哪些數(shù)據(jù)來訓(xùn)練Sora時(shí),穆拉蒂?zèng)]有給出非常具體的答案:“我不打算詳談所使用數(shù)據(jù)的細(xì)節(jié),但這些數(shù)據(jù)都是公開的或獲得許可的數(shù)據(jù)。”同時(shí),她也不確定是否使用了YouTube、Facebook和Instagram上的視頻,僅表示Sora使用的內(nèi)容來自Shutterstock,因?yàn)殡p方有合作關(guān)系。
此外,穆拉蒂還表示,Sora在發(fā)布之后“很可能”無法生成包含公眾人物的影音,視頻也將帶有AI水印。
綜合IT之家此前報(bào)道,三名Sora核心團(tuán)隊(duì)成員近期做客WVFRM播客頻道,他們也表示目前Sora仍處于反饋獲取階段,“還不是一個(gè)產(chǎn)品,短期之內(nèi)不會(huì)向公眾開放。”
不久之前的3月10日,另一個(gè)文生視頻平臺(tái)Pika宣布推出新功能,用戶可在Pika生成的視頻中無縫生成、整合聲音,可以通過提示詞來描述想要的聲音,也可以直接讓Pika根據(jù)視頻內(nèi)容自動(dòng)生成聲音。