在世界自動化領(lǐng)域,還有無數(shù)的大問題有待解決,而機器人學(xué)習(xí)就在接近塔頂?shù)牡胤健km然人類確實在為特定任務(wù)的系統(tǒng)編程方面已經(jīng)相當(dāng)出色,但還有一個巨大的、開放的問題:然后呢?

今天上午在紐約市舉行的Google人工智能活動上展示的新研究提出了讓機器人系統(tǒng)有效地編寫自己的代碼的概念。這個概念旨在為人類開發(fā)者省去在新信息出現(xiàn)時不得不進去重新編程的麻煩。

該公司指出,現(xiàn)有的研究和訓(xùn)練有素的模型可以有效地實現(xiàn)這一概念。所有這些工作都可以證明是開發(fā)系統(tǒng)的基礎(chǔ),這些系統(tǒng)可以根據(jù)現(xiàn)實世界中遇到的對象和場景繼續(xù)生成自己的代碼。今天展示的新作品是代碼即政策(CaP)。

Google研究實習(xí)生Jacky Liang和機器人研究科學(xué)家Andy Zeng在一篇博文中指出:
通過CaP,我們提議使用語言模型,通過提示直接編寫機器人代碼。我們的實驗證明,與直接學(xué)習(xí)機器人任務(wù)和輸出自然語言動作相比,輸出代碼可以更加泛化以及帶來任務(wù)性能的提高。CaP允許單一系統(tǒng)執(zhí)行各種復(fù)雜多樣的機器人任務(wù),而不需要特定的任務(wù)訓(xùn)練。
如上所述,該系統(tǒng)還依賴于第三方庫和API,以最佳方式生成適合特定場景的代碼--以及對語言和表情符號的支持。這些API中可獲取的信息是目前現(xiàn)有的限制之一。研究人員指出:"這些限制指出了未來工作的途徑,包括擴展視覺語言模型以描述低級別的機器人行為(如軌跡),或?qū)aPs與探索算法相結(jié)合,可以自主地增加控制基元的集合"。
作為今天公告的一部分,Google將發(fā)布一個可通過其GitHub網(wǎng)站訪問的代碼的開源版本,以建立其迄今為止提出的研究:
https://code-as-policies.github.io/