
(來源:DeepMind)
在9月底于英國倫敦舉行的深度學習高峰會(Deep Learning Summit)上,DeepMind (EETT編按:該公司現(xiàn)隸屬于Google母公司Alphabet)的研究科學家Ali Eslami介紹了一個非常有趣的項目,名為“人工智能與創(chuàng)造力”(Artificial Intelligence and Creativity)。
Eslami在DeepMind的團隊設置了一個AI代理(agent,一個會采取某種行動的神經(jīng)網(wǎng)絡),以繪制人臉作為挑戰(zhàn),在一臺計算機安裝繪圖程序(Mypaint),讓它能試驗各種變量,例如選擇筆刷、放置(placement)、線壓(line pressure)以及顏色等。該AI代理被饋入未標記的人臉照片訓練數(shù)據(jù)集,而結(jié)果是令人驚訝的逼真。
以未標記人臉照片訓練的AI代理所繪制出的人臉。

(來源:DeepMind)
Eslami的團隊是利用了強化學習(reinforcement learning)技術(shù)。今日大多數(shù)的AI系統(tǒng)是采用監(jiān)督式學習(supervised learning),所饋入的數(shù)據(jù)是以某種方式標記過的,因此系統(tǒng)能將結(jié)果與標準答案進行比對;相反的,非監(jiān)督式學習則是饋入未標記的訓練數(shù)據(jù),讓系統(tǒng)嘗試以自己的方式去辨別特征。
強化學習就是某種形式的非監(jiān)督式學習,在訓練過程中,有被稱為鑒別器(discriminator)的第二個AI代理對結(jié)果提供回饋,好讓負責創(chuàng)造的AI代理去學習。在產(chǎn)生影像的情境中,該鑒別器可能會比較產(chǎn)出的影像與訓練數(shù)據(jù),然后針對是否能辨別出差異提供回饋,這種回饋可能是一種分數(shù),以量化辨別所產(chǎn)生影像與訓練數(shù)據(jù)集之間差異的困難程度。
強化學習采用兩個AI代理,其一負責創(chuàng)造影像,另一個則嘗試分辨創(chuàng)造出的影像與實際數(shù)據(jù)之間像不像。

(來源:DeepMind)
在DeepMind教導其AI系統(tǒng)如何畫圖之前,他們已經(jīng)教過該系統(tǒng)如何寫字──去年該AI系統(tǒng)一開始接受的訓練是各種英文字母的手寫字與字體的影像(采用MNIST與Omniglot數(shù)據(jù)集),而且系統(tǒng)非常成功地重現(xiàn)了那些字母。
DeepMind團隊還很驚訝地發(fā)現(xiàn),若限制筆劃數(shù),所產(chǎn)出的結(jié)果就很像是人類在匆忙中寫出的字跡,點與較小的特征會連在一起;該公司團隊還將算法與拿著畫筆的機器手臂聯(lián)機,以產(chǎn)生手寫書法。
一旦該AI系統(tǒng)能應付手寫字,Eslami的團隊就讓系統(tǒng)升級以應用更大的網(wǎng)絡,并采用更多CPU進行訓練。當采用人臉照片做為訓練數(shù)據(jù)集,AI系統(tǒng)繪制出的畫像會變得越來越逼真,如下圖所示的繪畫過程各個階段。
AI系統(tǒng)繪制人臉畫像的過程。

(來源:DeepMind)
請注意,該AI系統(tǒng)并沒有被提供目標影像,只是創(chuàng)造它認為看起來像人臉的畫像,而且計算機并沒有看過人類是如何繪圖,只是藉由強化學習的嘗試錯誤過程去探索關(guān)于繪畫的一切。Eslami表示,這里實際上有兩個復雜的任務,其一是以高精準度控制筆刷,其二是管理時間, 在過程中權(quán)衡其畫像結(jié)果要看起來有多逼真。
接下來該團隊所做的事情是自問:如果我們讓任務變得更困難呢?于是他們將筆劃的數(shù)量限制從1,000減少到20,而讓他們驚訝的是,該AI代理仍然能產(chǎn)生雖然更抽象、但看得出是人臉的畫像。
不同超參數(shù)(hyperparameters)下的不同AI代理所繪制的人臉“抽象畫”樣本。
而Eslami表示,那些抽象畫最讓人震驚的是,該AI代理已經(jīng)能清楚辨識構(gòu)成人臉特征的重點──即眼睛、鼻子與嘴巴;他們原本認為AI系統(tǒng)只能透過模仿或是以監(jiān)督式學習被教導這些抽象畫,但強化學習確實也可能達成。
所以AI已經(jīng)成功學會畫圖了..但這是一種創(chuàng)造力嗎?或者只是隨機結(jié)果?還有這能算是藝術(shù)嗎?你可能會爭辯,AI代理是利用創(chuàng)造力去嘗試以不同的方法呈現(xiàn)人臉,如上面圖片中的畫像,即使它們看起來都像人臉,其中的差異性還是比相似性更多。
不過事實是,AI系統(tǒng)的意圖并不在于將人臉抽象到繪畫的最基本元素中,也不是要產(chǎn)生能喚起情感反應的畫像,其目標是在于寫實,是以畫像看起來有多么逼真來評判其成功與否。
此外也會有人爭議,AI系統(tǒng)繪制的畫像是以高水平的技巧完成,所以這代表AI是有成就的藝術(shù)家了嗎?當訓練過程結(jié)束,該系統(tǒng)肯定能產(chǎn)出更好的畫像,甚至學著從模糊的筆觸開始,在最后添加更犀利的線條;可惜的是,今日對于何為藝術(shù)并沒有嚴格的定義,也許這個問題的答案應該由觀眾們來決定。
編譯:Judith Cheng