
機(jī)器人的“大腦”與人類大腦有很大的不同,指導(dǎo)機(jī)器人如何處理各種事項通常來說就是編寫的代碼是否正確的問題。這聽起來似乎機(jī)器人比人類的學(xué)習(xí)方式更為簡單,但實際上則是更加困難——因為機(jī)器人沒有人類的直覺,由于不會根據(jù)不斷變化的環(huán)境而作出變通和適應(yīng),使得很多事情變得幾乎不可能實現(xiàn),比如雷鋒網(wǎng)報道過的比戰(zhàn)斗機(jī)還復(fù)雜的Atlas,還無法適應(yīng)復(fù)雜的環(huán)境。
加州大學(xué)伯克利分校(UCB)的一組研究人員展現(xiàn)了一個機(jī)器人,其可以通過不斷地試錯來學(xué)習(xí),就像人類的學(xué)習(xí)方式一樣。它的形成使人類在人工智能領(lǐng)域的研究向前邁進(jìn)了一大步。
UCB的電氣工程和計算機(jī)科學(xué)系的教授 Pieter abbeel 表示,“已經(jīng)研發(fā)出了一種全新的方法來賦予機(jī)器人學(xué)習(xí)”。
這個方法的關(guān)鍵之處在于,當(dāng)這個機(jī)器人面對了之前從未接觸過的新鮮事物時,研究人員也不必對機(jī)器人重新編程。完全相同的軟件,但在研究人員讓機(jī)器人學(xué)習(xí)所有不同的任務(wù)時,軟件卻能對機(jī)器人如何學(xué)習(xí)進(jìn)行相應(yīng)的編碼。

該團(tuán)隊開發(fā)了一系列的算法,允許一個名為 BRETT 的 Willow Garage PR2 機(jī)器人學(xué)習(xí)一系列電機(jī)操作的任務(wù),例如擰水瓶蓋子或組裝玩具飛機(jī),而這一切任務(wù)在執(zhí)行之前研究人員并沒有進(jìn)行預(yù)編程,用中國的一句俗語來表達(dá)的話,就是讓機(jī)器人“摸著石頭過河”。
這一方法允許機(jī)器人在遇到比它們通常的操作環(huán)境還要更加雜亂的環(huán)境中更有效地運作,如工廠或?qū)嶒炇摇?/div>
隨著處理的數(shù)據(jù)量不斷提升,機(jī)器人就可以開始學(xué)習(xí)如何處理更復(fù)雜的事情,在未來5到10年,我們可以看到機(jī)器人學(xué)習(xí)能力顯著的進(jìn)步,甚至是教小孩寫字了。
大多數(shù)的機(jī)器人應(yīng)用都是將機(jī)器人放置在一個受控的環(huán)境中,所有的物體都處于可預(yù)見的位置上。而把機(jī)器人放到普通的現(xiàn)實生活中的挑戰(zhàn)則是機(jī)器人必須能夠感知和適應(yīng)周圍環(huán)境,周圍的環(huán)境則是在不斷的改變。
為了讓機(jī)器人的學(xué)習(xí)能夠模仿人類學(xué)習(xí),團(tuán)隊需要接入機(jī)器學(xué)習(xí)研究的一個分支——深度學(xué)習(xí)。關(guān)于深度學(xué)習(xí)雷鋒網(wǎng)有過很多報道,它會使用一種方法,讓人造神經(jīng)網(wǎng)絡(luò)能夠從一個基線上推斷出相應(yīng)的知識,整個學(xué)習(xí)過程都無需研究人員對下一層的數(shù)據(jù)進(jìn)行編程。
人類在整個生命歷程中都會通過我們自己的經(jīng)驗和其他人那里學(xué)習(xí)到新的技能。這個學(xué)習(xí)過程深深扎根于我們的神經(jīng)系統(tǒng)中。
通常情況下,當(dāng)研究人員提供了這個物體看起來像什么和他們在什么位置的信息后,BRETT能夠在10分鐘以內(nèi)就掌握每個任務(wù)。而如果讓BRETT自行識別并定位到這個物體,則需要花費約3個小時才能完成——但隨著數(shù)據(jù)處理能力的提高,它的速度也會提高。
更多>相關(guān)資訊
0 條相關(guān)評論