2017年5月21日,由中國(guó)人工智能學(xué)會(huì)、中文信息學(xué)會(huì)主辦,億歐承辦的2017全球人工智能技術(shù)大會(huì)在北京國(guó)家會(huì)議中心拉開帷幕。5月22日上午,腦科學(xué)與人工智能分論壇正式開始。
四川大學(xué)計(jì)算機(jī)學(xué)院教授唐華錦在論壇上進(jìn)行了“仿腦GPS:基于神經(jīng)科學(xué)的機(jī)器人定位與導(dǎo)航”的演講。以下是對(duì)其演講的速記整理。
唐華錦:大家好,很高興有機(jī)會(huì)跟大家分享我的工作,剛才幾位老師較多的討論了神經(jīng)科學(xué)方面的很多深入的研究,我這里主要結(jié)合說怎么樣從神經(jīng)科學(xué)或者腦科學(xué)到人工智能,今天主要談一下機(jī)器人的智能。
先解釋一下仿腦GPS,是指在大腦里面也有一個(gè)類似的GPS系統(tǒng),這里是有一個(gè)神經(jīng)科學(xué)的基礎(chǔ)。我是在四川大學(xué)計(jì)算機(jī)學(xué)院,這個(gè)神經(jīng)形態(tài)計(jì)算廣范圍的類腦計(jì)算研究中心,大致做了這樣幾個(gè)方面:
從電腦計(jì)算的基礎(chǔ)出發(fā),宋森老師談到很多,跟他們學(xué)到很多東西這是計(jì)算神經(jīng)學(xué)的范疇。在此基礎(chǔ)上做感知信息處理,神經(jīng)形態(tài)的智能硬件。人工視網(wǎng)膜、人工聽覺處理信息。
并在此基礎(chǔ)上構(gòu)造大規(guī)模認(rèn)知的計(jì)算網(wǎng)絡(luò),怎么樣模擬基于脈沖的計(jì)算程式實(shí)現(xiàn)大范圍復(fù)雜的計(jì)算,大家知道深度學(xué)習(xí)是個(gè)顯學(xué),大致門口瀏覽了一下人比較多,但是我覺得下一步怎么樣真正從大腦的計(jì)算結(jié)構(gòu)里面建立這樣一個(gè)更加高效、更加智能的計(jì)算網(wǎng)絡(luò)是類腦計(jì)算主要的目標(biāo)之一。
另外把它硬件化,實(shí)現(xiàn)一個(gè)類腦芯片、類腦軟件。潘老師提到他們?cè)陬惸X芯片里面做的比較多,還有IBM的比較了解。其實(shí)跟類腦計(jì)算結(jié)合非常緊密的就是智能機(jī)器人,因?yàn)槲覀冎乐悄茏罱K的表現(xiàn)形式是一個(gè)叫做載體或者交互實(shí)現(xiàn)的,機(jī)器人是一個(gè)真正智能的載體。
這次大會(huì)是人工智能,所以我談一下結(jié)合人工智能,剛才趙總提了這個(gè)報(bào)告,2030年的人工智能,這里面提到一個(gè)概念,專門把神經(jīng)形態(tài)計(jì)算列作下一代的人工智能技術(shù)之一,大家如果對(duì)這個(gè)領(lǐng)域比較陌生的話,關(guān)注去年的這份人工智能報(bào)告。在之前神經(jīng)形態(tài)計(jì)算是非常冷門的一個(gè)術(shù)語(yǔ)甚至一個(gè)課題。
從我的理解來說,神經(jīng)形態(tài)計(jì)算主要做這幾方面, 從微觀到宏觀,微觀的角度探索是神經(jīng)電路、單個(gè)神經(jīng)元的角度,和宋森老師講的神經(jīng)環(huán)路,還有神經(jīng)的編碼機(jī)制,記憶編碼機(jī)制,突出學(xué)習(xí)機(jī)制,這是微觀角度這一塊。
第二從宏觀來說怎么樣從底層電路、神經(jīng)元他們之間的連接來實(shí)現(xiàn)高級(jí)智能?這就需要有很多種方式,比如通過一些具體的任務(wù),我們主要著力點(diǎn)在于做機(jī)器人認(rèn)知。今年5月剛剛出版了一本書《Neuromorphic Cognitive Systems》,系統(tǒng)地介紹了這方面的研究成果。
今天側(cè)重點(diǎn)講機(jī)器人, 機(jī)器人經(jīng)歷了這樣的發(fā)展方式,當(dāng)然每個(gè)人總結(jié)有不同的方式,從工業(yè)機(jī)器人主要注重規(guī)劃控制方面,到特種機(jī)器人注重移動(dòng)和多地的適應(yīng)性,現(xiàn)在比較熱的是服務(wù)機(jī)器人,大家在大廳里可以看到非常漂亮的機(jī)器人,適應(yīng)性和環(huán)境感知。再往后達(dá)到終極目標(biāo)是智能機(jī)器人,給機(jī)器人一個(gè)類人的大腦,具有自我感知,理解和學(xué)習(xí)能力。
為什么我們認(rèn)為機(jī)器人要用神經(jīng)科學(xué)方法或者類腦的方法做呢?做一個(gè)比較,目前的機(jī)器人所謂的對(duì)空間環(huán)境的感知能力是依賴于對(duì)世界的精確建模,需要一個(gè)精確的世界模型,需要對(duì)空間有比較精準(zhǔn)的理解,比如還有依賴精確的感知傳感器,激光、視覺這些,甚至雷達(dá),如果智能駕駛會(huì)依賴更加昂貴的傳感器。
人在環(huán)境下有非常好的空間地位感知導(dǎo)航能力,其實(shí)人的視覺、聽覺都是非精確的傳感器,但是能夠幫助人完成一個(gè)非常精確可靠、自適應(yīng)的空間的認(rèn)知能力。
所以這里神經(jīng)認(rèn)知機(jī)器人就是從信息獲取處理到執(zhí)行,依賴的是腦科學(xué)里面對(duì)于空間感知這一塊,海馬體腦皮層神經(jīng)回路的理解。
這里歸納一下,目前在神經(jīng)科學(xué)里面甚至一些生理學(xué)里面得出的動(dòng)物導(dǎo)航理論,研究比較多的是大鼠,潘老師提到大鼠導(dǎo)航的神經(jīng)科學(xué)研究比較多,其實(shí)在之前還有研究蜜蜂、鴿子和海豚的導(dǎo)航,歸納了幾種,一個(gè)叫beaconing,蝙蝠的能力。
路徑導(dǎo)航的方式,昆蟲和蜜蜂可能運(yùn)用這幾種方式。另外結(jié)合了path integration,鴿子做路徑積分找回路徑甚至返回。還有鳥類長(zhǎng)距離遷徙和定位,依賴于地磁場(chǎng)。
這是一種看法,我們關(guān)注在哺乳動(dòng)物,左側(cè)下處兩個(gè)例子,蝙蝠和老鼠具有準(zhǔn)確的空間定位。為什么研究蝙蝠和老鼠呢,因?yàn)樵谏窠?jīng)科學(xué)里面它們都屬于哺乳動(dòng)物,都具有類似的神經(jīng)科學(xué)機(jī)制。舉個(gè)例子,蝙蝠從一個(gè)洞里跑到樹上尋找食物,科學(xué)家發(fā)現(xiàn)它的位置細(xì)胞精度是不斷變化的,或者它的位置感受會(huì)從細(xì)到粗,從粗到細(xì),取決于當(dāng)?shù)氐呢S富程度和精細(xì)度,粗糙的圖象或者周圍的地標(biāo)不豐富的情況下,它的位置感知也會(huì)增大,變的模糊,這是對(duì)環(huán)境的自適應(yīng)能力,造成多尺度空間表達(dá)的特點(diǎn)。
舉了兩個(gè)哺乳動(dòng)物的例子,大鼠和蝙蝠它們具有類似神經(jīng)科學(xué)的基礎(chǔ),發(fā)現(xiàn)了幾種細(xì)胞,位置細(xì)胞、網(wǎng)格細(xì)胞、邊界細(xì)胞、頭方向細(xì)胞。 人或者動(dòng)物具有一個(gè)方向的感受性,專門有一個(gè)細(xì)胞做這個(gè)事情。
對(duì)人的位置細(xì)胞沒有辦法像大鼠一樣真正進(jìn)行大腦的解剖,之前人的大腦有沒有存在這樣的,之前也沒有很好的研究,大概08年神經(jīng)科學(xué)做了一些實(shí)驗(yàn),證明人大腦里也有這樣的細(xì)胞。
比如人通常做的定位與感知也是這個(gè)方面,你看到一個(gè)圖象,依據(jù)周圍的圖象環(huán)境來判定你在哪里。到了另外一個(gè)位置,負(fù)責(zé)另外一個(gè)位置的細(xì)胞被激活,告訴你另外一個(gè)位置,這是自我感知的方式。最大的技術(shù)就是路徑積分,比如我閉上眼睛走到門口,視覺已經(jīng)不接受信息了,這個(gè)就叫路徑積分。
一開始本身并沒有說要做一個(gè)機(jī)器人,純粹從解析大腦的認(rèn)知計(jì)算機(jī)理出發(fā),最早德國(guó)的科學(xué)家提出一個(gè)概念叫 認(rèn)知地圖,直到1972年諾貝爾生理醫(yī)學(xué)獎(jiǎng)也提出一個(gè)基于大腦的設(shè)備,最早叫類腦設(shè)備的概念,提出智能必須通過與物理世界的交互來實(shí)現(xiàn)。
另外一個(gè)HMAX的深度學(xué)習(xí)網(wǎng)絡(luò)感知模型,提出感知的深度網(wǎng)絡(luò)。右側(cè)的年輕科學(xué)家他依據(jù)大鼠的生物模型構(gòu)造了空間的感知。
這里提到三個(gè)科學(xué)家,2014年獲得諾貝爾生理醫(yī)學(xué)獎(jiǎng),因?yàn)榍捌?0年代發(fā)現(xiàn)了位置細(xì)胞,但是直到2000年左右才發(fā)現(xiàn)另外一個(gè)細(xì)胞網(wǎng)格細(xì)胞,有網(wǎng)格細(xì)胞,人才能閉眼從這里走到門口的功能。這代表神經(jīng)科學(xué)巨大的進(jìn)步,怎么樣從簡(jiǎn)單的神經(jīng)元獲得高級(jí)的認(rèn)知功能。
通常之前研究的神經(jīng)科學(xué)、神經(jīng)元只是計(jì)算,至于認(rèn)知和記憶怎么從神經(jīng)元產(chǎn)生,沒有具體的模型,對(duì)空間認(rèn)知這應(yīng)該是第一個(gè)完整的模型,從單個(gè)神經(jīng)元到復(fù)雜認(rèn)知的完整形式。
大腦GPS系統(tǒng)從位置細(xì)胞、構(gòu)建空間模型到下一代,到05年發(fā)現(xiàn)grid cell完成解析了大腦的GPS系統(tǒng)。簡(jiǎn)單來說特定位置對(duì)特定空間有個(gè)感受有發(fā)放的特性。隨著大鼠走到固定位置就會(huì)監(jiān)測(cè)不同的神經(jīng)元發(fā)放,不同的環(huán)境具有非常可靠的環(huán)性,在不同位置監(jiān)測(cè)都會(huì)監(jiān)測(cè)到這個(gè)性能。
網(wǎng)格細(xì)胞的特點(diǎn)就是它在空間的發(fā)放可以存在六邊型或者網(wǎng)格狀,海馬體左側(cè)灰色的結(jié)構(gòu),網(wǎng)格細(xì)胞在藍(lán)色的結(jié)構(gòu),靠?jī)?nèi)嗅皮層,網(wǎng)格細(xì)胞通過長(zhǎng)時(shí)間的實(shí)驗(yàn)之后發(fā)現(xiàn)老刷具有這樣一個(gè)特性,這個(gè)網(wǎng)格細(xì)胞對(duì)這個(gè)空間里面呈現(xiàn)的網(wǎng)格發(fā)放的特性,如果記錄完這個(gè)神經(jīng)元的活動(dòng)之后把圖畫下來呈六邊形。
所以基于這樣一個(gè)生物機(jī)理構(gòu)建一個(gè)肌體里面路徑積分的模型,來構(gòu)造機(jī)器人的軌跡,從A到B到C三個(gè)發(fā)放特性就可以推測(cè)機(jī)器人的軌跡。但是并沒有給出網(wǎng)格細(xì)胞、位置細(xì)胞的連接方式,告訴他們之間有連接,但是中間如何連接、如何學(xué)習(xí)這是我們做大量的計(jì)算模型來得出的,所以構(gòu)造一個(gè)模型就是依據(jù)海馬體獲得自定義信息,網(wǎng)格細(xì)胞路徑積分的功能,共同協(xié)作來產(chǎn)生對(duì)空間的記憶,構(gòu)造認(rèn)知導(dǎo)航模型。
依據(jù)神經(jīng)的斯達(dá)姆系統(tǒng)有頭朝向細(xì)胞、網(wǎng)格細(xì)胞、位置細(xì)胞,位置細(xì)胞接觸網(wǎng)格細(xì)胞的輸入,同時(shí)反饋給網(wǎng)格細(xì)胞進(jìn)行所謂的校準(zhǔn)作用,走道一個(gè)路徑發(fā)現(xiàn)路徑有偏差了,是靠視覺信息重新做一個(gè)糾正功能,這就是位置細(xì)胞給網(wǎng)格細(xì)胞一個(gè)反饋。當(dāng)然在機(jī)器人里面不可能完全實(shí)現(xiàn)神經(jīng)科學(xué)所有神經(jīng)元的模型。
前面提到一個(gè)澳洲科學(xué)家做的ratSLAM模型,是基于位置信息做的模型,后期我們做了一個(gè)能夠結(jié)合網(wǎng)格細(xì)胞的功能,更加準(zhǔn)確的在復(fù)雜環(huán)境下、實(shí)際環(huán)境做導(dǎo)航。
一個(gè)模型的例子,我們構(gòu)造了機(jī)器人的位置導(dǎo)航系統(tǒng),一個(gè)視頻就是它所接受的視覺輸入完全模擬大腦對(duì)空間的定位系統(tǒng)、對(duì)空間的反應(yīng)。
這個(gè)導(dǎo)航叫g(shù)SLAM,它完整實(shí)現(xiàn)了大腦的GPS系統(tǒng),具有非常好的數(shù)據(jù)生物的擬合性對(duì)實(shí)際空間的可靠的導(dǎo)航能力。
當(dāng)然還有很多問題沒有解決,或者我們團(tuán)隊(duì)繼續(xù)做了一些東西,一是grid cell和place cell的關(guān)系;另外是如何提取記憶及識(shí)別環(huán)境中的關(guān)鍵信息,what和where的協(xié)作,大家談的是模式識(shí)別的智能,但是被空間感知是另外一個(gè)重要的人工智能,人工智能有包含多個(gè)成分。
其中邏輯、語(yǔ)言大家了解的比較多,但是對(duì)空間智能了解的不多。另外一個(gè)是如何建立語(yǔ)義、知識(shí)空間與place cell和grid cell的結(jié)合,這個(gè)系統(tǒng)可以展現(xiàn)的功能會(huì)變的更加強(qiáng)大,它是一個(gè)開放的系統(tǒng),不需要打補(bǔ)丁的方式做。
當(dāng)然構(gòu)造機(jī)器人的大腦需要多學(xué)科的共同努力,需要從大量神經(jīng)科學(xué)中獲得有用的知識(shí),向他們學(xué)習(xí)。另外人工智能、機(jī)器學(xué)習(xí)的模型,做CMOS芯片、納米神經(jīng)形態(tài)器件芯片怎么樣實(shí)現(xiàn)。另外還有感知信息處理,需要多個(gè)領(lǐng)域多個(gè)科學(xué)家的合作,神經(jīng)科學(xué)、機(jī)器人科學(xué)家、做機(jī)器、硬件的科學(xué)家合作。
今天人工智能在腦科學(xué)里面做的工作還遠(yuǎn)遠(yuǎn)不夠,舉個(gè)例子,跳蜘蛛非常不起眼,但是它有非常好的空間處理能力,還有非常好的視覺精度,對(duì)這樣一個(gè)大腦只有大概幾毫米,我們對(duì)它的理解還是非常少,所以神經(jīng)科學(xué)或者腦科學(xué)里面包含了非常多的、非常好的智能算法需要學(xué)習(xí)。
大腦的復(fù)雜性使得應(yīng)用神經(jīng)科學(xué)非常困難,正因?yàn)榇耍@樣的工作成就都會(huì)讓人非常興奮,歡迎大家投入到腦科學(xué)和人工智能工作中來,為我們這個(gè)論壇做一個(gè)號(hào)召。