
試想一下,如果你不僅通過學(xué)習(xí)和練習(xí),而且通過直接接觸他人的大腦來獲取他們的經(jīng)驗(yàn),你還能更好地掌握一些技能呢?
對(duì)于人類來說,這仍然是科幻小說,但在人工智能機(jī)器人領(lǐng)域,通過讓機(jī)器人分享他們的經(jīng)驗(yàn),縮短訓(xùn)練時(shí)間是可能的。谷歌(Google)最近通過抓握機(jī)器人手臂展示了這一點(diǎn)。
六年前,谷歌前機(jī)器人主管詹姆斯·庫(kù)夫納(JamesKuffner)為這種技能的獲取創(chuàng)造了一個(gè)術(shù)語(yǔ),稱之為“云機(jī)器人”。它承認(rèn)由數(shù)據(jù)中心和更快的網(wǎng)絡(luò)支持的分布式傳感器和處理的影響。庫(kù)夫納現(xiàn)在是豐田研究所(ToyotaResearchInstitute)的首席技術(shù)官,他專注于云機(jī)器人技術(shù),將家庭幫工機(jī)器人變成現(xiàn)實(shí)。
谷歌的研究、其英國(guó)人工智能實(shí)驗(yàn)室、Deepad和GoogleX還在繼續(xù)探索云機(jī)器人,以加速機(jī)器人的通用技能獲取。在周二發(fā)布的幾個(gè)演示視頻中,Google展示了使用共享體驗(yàn)來快速學(xué)習(xí)如何推動(dòng)對(duì)象和打開門的機(jī)器人。
兩臂好,四臂更好:機(jī)器人如何重新定義手術(shù)的未來
在世界各地的醫(yī)院里,外科醫(yī)生正從新的機(jī)器人助手那里得到幫助。
閱讀更多
研究人員正在使用的三種多機(jī)器人方法之一是強(qiáng)化學(xué)習(xí),即嘗試和錯(cuò)誤,并結(jié)合深層神經(jīng)網(wǎng)絡(luò)。這也是DeepMind用來訓(xùn)練AI掌握Atari電子游戲和中國(guó)棋盤游戲Go的方法。
每個(gè)機(jī)器人都有自己的神經(jīng)網(wǎng)絡(luò),幫助它決定打開車門的最佳動(dòng)作。Google通過添加干擾更快地建立數(shù)據(jù)。中央服務(wù)器也在記錄機(jī)器人動(dòng)作、行為和最終結(jié)果,并使用這些經(jīng)驗(yàn)建立更好的神經(jīng)網(wǎng)絡(luò),幫助機(jī)器人在任務(wù)中改進(jìn)。
正如谷歌在兩個(gè)視頻中展示的一樣,經(jīng)過20分鐘的訓(xùn)練后,機(jī)器人的機(jī)器人手臂正在摸索著尋找手柄,但最終設(shè)法打開了門。然而,在三個(gè)小時(shí)內(nèi),機(jī)器人可以很干凈地到達(dá)手柄,扭轉(zhuǎn)它,然后拉開門。
他們正在探索的另一種方法可能會(huì)幫助機(jī)器人按照指令在房子周圍移動(dòng)物體。在這里,谷歌正在教它的機(jī)器人建立心智模型,通過建立像素在某個(gè)特定動(dòng)作后在屏幕上的位置的體驗(yàn)來了解事物是如何對(duì)某些行為做出反應(yīng)的。
這一次,機(jī)器人們分享了他們?cè)谧雷又車撇煌矬w的經(jīng)驗(yàn),幫助他們預(yù)測(cè)如果他們采取某種行動(dòng)的話會(huì)發(fā)生什么。
最后,研究人員正在探索機(jī)器人向人類學(xué)習(xí)的方法。谷歌的研究人員引導(dǎo)機(jī)器人走到門前,并展示了如何打開它們。這些動(dòng)作被編碼成一個(gè)深層次的神經(jīng)網(wǎng)絡(luò),將攝像機(jī)圖像轉(zhuǎn)換為機(jī)器人動(dòng)作。
再一次,后人類訓(xùn)練,機(jī)器人分享他們的經(jīng)驗(yàn)后,試圖打開門自己。此外,通過每次嘗試逐漸改變門的位置,機(jī)器人能夠在任務(wù)中逐漸提高,幫助他們?cè)趲讉€(gè)小時(shí)內(nèi)變得更多。