IT之家11月3日消息,谷歌在發(fā)布其文本轉(zhuǎn)圖像的人工智能系統(tǒng)方面極為謹(jǐn)慎,盡管該公司的Imagen模型產(chǎn)生的輸出質(zhì)量與OpenAI的DALL-E 2或Stability AI的Stable Diffusion相當(dāng),但谷歌此前并沒(méi)有將該系統(tǒng)向公眾開(kāi)放。
不過(guò)今天,這家搜索巨頭宣布將把Imagen以非常有限的形式添加到其AI Test Kitchen應(yīng)用中,作為一種收集關(guān)于該技術(shù)的早期反饋的方式。
AI Test Kitchen是在今年早些時(shí)候推出的,目的是對(duì)谷歌的各種AI系統(tǒng)進(jìn)行測(cè)試。目前,該應(yīng)用程序提供了一些不同的方式與谷歌的文本模型LaMDA進(jìn)行互動(dòng),該公司很快將增加類似的限制性Imagen請(qǐng)求,作為其所謂的應(yīng)用程序“第二季”更新的一部分。簡(jiǎn)而言之,將有兩種方式與Imagen互動(dòng):城市夢(mèng)想家和Wobble。
在“城市夢(mèng)想家”中,用戶可以要求模型生成圍繞他們選擇的主題設(shè)計(jì)的城市元素,例如,南瓜、牛仔布。Imagen創(chuàng)建了樣本建筑和地塊(城市廣場(chǎng)、公寓樓、機(jī)場(chǎng)等等),所有的設(shè)計(jì)都以類似于在《模擬城市》中看到的等距模型出現(xiàn)。

在Wobble中,你可以創(chuàng)造一個(gè)小怪物??梢赃x擇它的材質(zhì)(粘土、毛氈、杏仁糖、橡膠),然后給它穿上你選擇的衣服。該模型會(huì)生成你的怪物,給它起個(gè)名字,然后你可以戳戳它,讓它“跳舞”。
IT之家了解到,與其它文本到圖像的模式相比,這些互動(dòng)是非常受限制的,用戶不能隨便創(chuàng)造他們喜歡的東西。不過(guò),這也是谷歌有意為之。谷歌產(chǎn)品管理高級(jí)總監(jiān)喬希-伍德沃德(Josh Woodward)解釋稱,AI Test Kitchen的全部意義在于:a)獲得公眾對(duì)這些AI系統(tǒng)的反饋;b)測(cè)試哪些行為會(huì)使得系統(tǒng)崩潰。
不過(guò)最大的問(wèn)題是,谷歌是否會(huì)想把這些模型推向更廣泛的公眾,會(huì)采取什么形式?目前,該公司的競(jìng)爭(zhēng)對(duì)手OpenAI和Stability AI正急于將文本-圖像模型商業(yè)化,谷歌是否會(huì)覺(jué)得自己的系統(tǒng)足夠安全,可以走出AI Test Kitchen提供給用戶?