該項目在OpenAI研究論文(題為《學(xué)習(xí)靈活的手動操作》)中有詳細(xì)說明,并使用強化學(xué)習(xí)模型幫助機器人手掌握如何精確地抓住和操縱像正方體這樣的物體。
研究人員稱,機器人在短時間內(nèi)積累了相當(dāng)于100年的經(jīng)驗。研究人員在論文中寫道:“雖然對物體的靈活操控是人類的一項基本日常任務(wù),但對自主機器人來說仍然具有挑戰(zhàn)性?,F(xiàn)代機器人通常被設(shè)計用于受限設(shè)置中的特定任務(wù),并且很大程度上無法利用復(fù)雜的末端執(zhí)行器。相比之下,人們能夠在多種環(huán)境中執(zhí)行各種靈巧的操作任務(wù),使人手成為機器人操縱研究的靈感來源。”
在幫助計算機視覺模型識別被操縱物體的樣子之后,研究人員轉(zhuǎn)而進(jìn)行了艱苦的工作,即使用384臺機器來訓(xùn)練模型,以使用模擬的攝像機圖像來預(yù)測物體的方向。為了加快學(xué)習(xí)速度,研究人員將項目的許多方面隨機化,如重力和正方體表面的紋理等。所有這些都有助于讓AI更好地了解在現(xiàn)實生活中操縱像這個正方體這樣的東西會是什么樣的 - 以及足夠的變量來幫助AI學(xué)習(xí)如何處理任何模式。
卡內(nèi)基梅隆大學(xué)機器人研究所的Smruti Amarjyoti告訴The Verge,這項研究本身并未預(yù)示機器人操縱方面的任何突破。但他表示,所產(chǎn)生的機器人手部動作是“優(yōu)雅的”,他沒有意識到可以通過人工智能實現(xiàn)。其他研究人員指出,該項目仍存在許多局限性,例如任務(wù)僅限于手掌朝上的機器人和機器人使用不是特別大的正方體。