激進(jìn)的變革、革命、大趨勢(shì),甚至可能是一種風(fēng)險(xiǎn):人工智能已經(jīng)滲透到所有的工業(yè)領(lǐng)域,讓媒體忙個(gè)不停。rub神經(jīng)計(jì)算研究所的研究人員已經(jīng)研究了25年,他們的指導(dǎo)原則是:為了使機(jī)器真正智能化,新的方法必須首先使機(jī)器學(xué)習(xí)更加高效和靈活。
神經(jīng)系統(tǒng)理論的主席勞倫斯·維斯科特教授解釋說(shuō):“今天有兩種類型的機(jī)器學(xué)習(xí)是成功的:深神經(jīng)網(wǎng)絡(luò),也稱為深學(xué)習(xí),以及強(qiáng)化學(xué)習(xí)。神經(jīng)網(wǎng)絡(luò)能夠做出復(fù)雜的決策。它們經(jīng)常用于圖像識(shí)別應(yīng)用。”例如,他們可以從照片中分辨出拍攝對(duì)象是男性還是女性。
這種網(wǎng)絡(luò)的結(jié)構(gòu)是受到大腦中神經(jīng)細(xì)胞或神經(jīng)元網(wǎng)絡(luò)的啟發(fā),神經(jīng)元通過(guò)幾個(gè)輸入通道接收信號(hào),然后決定是否以電脈沖的形式將信號(hào)傳遞給下一個(gè)神經(jīng)元。
神經(jīng)網(wǎng)絡(luò)同樣接收幾個(gè)輸入信號(hào),例如像素。在第一步中,許多人工神經(jīng)元通過(guò)簡(jiǎn)單地將輸入乘以不同但不變的權(quán)重,然后將它們相加,計(jì)算出來(lái)自多個(gè)輸入信號(hào)的輸出信號(hào)。每一個(gè)算術(shù)運(yùn)算都會(huì)產(chǎn)生一個(gè)值,這個(gè)值——以男性/女性為例——對(duì)女性或男性的決策有一點(diǎn)幫助。”但是,如果將負(fù)結(jié)果設(shè)置為零,則結(jié)果會(huì)略有改變。這也是從神經(jīng)細(xì)胞中復(fù)制出來(lái)的,對(duì)神經(jīng)網(wǎng)絡(luò)的性能至關(guān)重要。
同樣的事情在下一層再次發(fā)生,直到網(wǎng)絡(luò)在最后階段做出決定。這個(gè)過(guò)程中的階段越多,它就越強(qiáng)大——具有100多個(gè)階段的神經(jīng)網(wǎng)絡(luò)并不少見(jiàn)。神經(jīng)網(wǎng)絡(luò)通常比人類更好地解決辨別任務(wù)。這種網(wǎng)絡(luò)的學(xué)習(xí)效果是基于選擇正確的權(quán)重因子,這些權(quán)重因子最初是隨機(jī)選擇的。”為了訓(xùn)練這樣一個(gè)網(wǎng)絡(luò),輸入信號(hào)以及最終的決定應(yīng)該從一開(kāi)始就被指定,”laurenz wiskott解釋道。因此,網(wǎng)絡(luò)能夠逐步調(diào)整權(quán)重因子,以便最終以最大的概率做出正確的決策。
另一方面,強(qiáng)化學(xué)習(xí)受到心理學(xué)的啟發(fā)。在這里,算法所做的每一個(gè)決定——專家稱之為代理——要么得到獎(jiǎng)勵(lì),要么受到懲罰。”想象一個(gè)中間有代理的網(wǎng)格。它的目標(biāo)是以最短的路線到達(dá)左上角的位置,但它并不知道這一點(diǎn),“經(jīng)紀(jì)人唯一想要的就是盡可能多地獲得獎(jiǎng)勵(lì),否則就毫無(wú)頭緒了。一開(kāi)始,它會(huì)橫沖直撞,每一步達(dá)不到目標(biāo)都會(huì)受到懲罰。只有朝著目標(biāo)邁出的一步才會(huì)有回報(bào)。

機(jī)器人應(yīng)該走哪條路?這個(gè)決定是基于無(wú)數(shù)的算術(shù)運(yùn)算。
圖源:Roberto Schirdewahn
圖源:Roberto Schirdewahn
為了學(xué)習(xí),代理為每個(gè)字段分配一個(gè)值,指示從該位置到其目標(biāo)還有多少步。最初,這些值是隨機(jī)的。經(jīng)紀(jì)人在董事會(huì)獲得的經(jīng)驗(yàn)越多,就越能使這些價(jià)值觀適應(yīng)現(xiàn)實(shí)生活條件。經(jīng)過(guò)無(wú)數(shù)次的跑步,它能夠找到最快的方式達(dá)到目標(biāo),并因此獲得獎(jiǎng)勵(lì)。
“這些機(jī)器學(xué)習(xí)過(guò)程的問(wèn)題在于它們相當(dāng)愚蠢,”勞倫斯·維斯科特說(shuō)?;A(chǔ)技術(shù)可以追溯到20世紀(jì)80年代,目前之所以取得成功,唯一的原因是我們擁有了更多的計(jì)算能力和更多的可用數(shù)據(jù)。為了訓(xùn)練神經(jīng)網(wǎng)絡(luò),有可能快速運(yùn)行幾乎效率低下的學(xué)習(xí)過(guò)程無(wú)數(shù)次,并將大量的圖像和圖像描述反饋給神經(jīng)網(wǎng)絡(luò)。
“我們想知道的是:我們?cè)鯓硬拍鼙苊饽切┤唛L(zhǎng)、毫無(wú)意義的訓(xùn)練呢?最重要的是,我們?cè)鯓硬拍苁箼C(jī)器學(xué)習(xí)更靈活?正如Wiskott簡(jiǎn)潔地指出的那樣。人工智能可能在它所訓(xùn)練的一項(xiàng)任務(wù)上優(yōu)于人類,但它不能將其知識(shí)概括或轉(zhuǎn)移到相關(guān)的任務(wù)上。
這就是為什么神經(jīng)計(jì)算研究所的研究人員將重點(diǎn)放在幫助機(jī)器自主發(fā)現(xiàn)結(jié)構(gòu)的新策略上。”為此,我們采用了無(wú)監(jiān)督學(xué)習(xí)的原則。雖然深層神經(jīng)網(wǎng)絡(luò)和強(qiáng)化學(xué)習(xí)是基于提出期望的結(jié)果或獎(jiǎng)勵(lì)或懲罰每一步,研究人員離開(kāi)學(xué)習(xí)算法很大程度上與他們的輸入。

“例如,一個(gè)任務(wù)可以是形成集群,”Wiskott解釋道。為此,指示計(jì)算機(jī)對(duì)類似數(shù)據(jù)進(jìn)行分組。對(duì)于三維空間中的點(diǎn),這意味著將坐標(biāo)彼此接近的點(diǎn)分組。如果坐標(biāo)之間的距離較大,它們將被分配給不同的組。
“回到人們的照片的例子,人們可以在分組后查看結(jié)果,可能會(huì)發(fā)現(xiàn)計(jì)算機(jī)已經(jīng)把一組男人的照片和一組女人的照片組合在一起,”勞倫斯·維斯科特解釋說(shuō)。一個(gè)主要的優(yōu)勢(shì)是,一開(kāi)始所需要的只是照片,而不是像以前那樣,一個(gè)包含謎語(yǔ)解決方案的圖片說(shuō)明,用于訓(xùn)練目的。”
此外,慢性原則這種方法提供了更多的靈活性,因?yàn)檫@樣的群集形成不僅適用于人的照片,而且適用于汽車、植物、房屋或其他物體。
wiskott所追求的另一種方法是緩慢原則。這里,不是照片構(gòu)成輸入信號(hào),而是運(yùn)動(dòng)圖像:如果從變化非常緩慢的視頻中提取所有特征,就會(huì)出現(xiàn)有助于建立環(huán)境抽象表示的結(jié)構(gòu)。”在這里,重點(diǎn)是預(yù)結(jié)構(gòu)輸入數(shù)據(jù),”勞倫斯指出。最終,研究者將這些方法以模塊化的方式與監(jiān)督學(xué)習(xí)的方法相結(jié)合,以便創(chuàng)建更靈活的應(yīng)用程序,然而這些應(yīng)用程序非常精確。
研究人員承認(rèn):“增加的靈活性自然會(huì)導(dǎo)致性能損失。”但從長(zhǎng)遠(yuǎn)來(lái)看,如果我們想開(kāi)發(fā)出能夠應(yīng)對(duì)新形勢(shì)的機(jī)器人,靈活性是必不可少的。