取藥、掛衣服、開瓶蓋,在日復一日大數(shù)據(jù)加持的交互學習中,具身大模型機器人訓練出決策的“大腦”和執(zhí)行的“小腦”,指揮日漸靈巧的“手”,能夠獨立完成越來越多的工作。
北京銀河通用機器人有限公司(以下簡稱“銀河通用”)專注具身智能機器人研發(fā),通過億級仿真數(shù)據(jù)訓練,幫助機器人走進商超和家庭,將科幻小說中的情節(jié)變?yōu)楝F(xiàn)實。
提升學習能力
具身智能是人工智能的一個發(fā)展領(lǐng)域,指一種擁有物理身體的智能系統(tǒng)或機器能夠通過感知和交互形成在環(huán)境中實時物理互動的能力。簡單說,就是各種不同形態(tài)的機器人在真實的物理環(huán)境中獲取信息、理解問題、作出決策,從而執(zhí)行各種任務(wù)。
銀河通用實驗室里,一場具身機器人的實操演示正在進行中:工作人員在平板電腦上點選一樣物品,雙臂輪式機器人接收到指令,通過“視覺”鎖定貨架上的目標,用右手的吸盤準確抓取,放置到左手兩指夾著的籃子里。機器人的整套動作一氣呵成,展示了其落地的商業(yè)場景——夜間無人值守藥店取藥補藥、無人商超上貨拿貨。
“機器人可以代替人完成從接單到找藥、拿藥、裝袋等一系列流程,打包好交給快遞員。”銀河通用創(chuàng)始人、首席技術(shù)官王鶴告訴記者,這款機器人只要使用充電樁充足電就可以應用,電量不足時會自動回充,能夠勝任藥店、超市、工廠配料倉內(nèi)管理員、理貨員等工作。
機器人“能干”,靠的是海量數(shù)據(jù)賦予的泛化抓取能力,并在持續(xù)數(shù)據(jù)注入中,不斷學習應付更復雜的情況。比如,當藥店貨架上最前面一盒藥處于倒放或平放狀態(tài)時,機器人右手吸盤會直接吸取正常擺放的第二盒藥,這個過程可能導致第一盒藥掉到地上。能力升級后,機器人可以先用左手將非正常排列的藥盒擺放整齊,再用右手抓取。
“作為人工智能領(lǐng)域的前沿熱點,具身智能已成為全球科技競爭的新高地、未來產(chǎn)業(yè)的新賽道。在多年深耕人工智能領(lǐng)域的基礎(chǔ)上,我們研發(fā)的大模型在視覺理解和語言溝通能力方面比較成熟,對機器人操作的研究也實現(xiàn)了一定泛化性。”身兼北京智源研究院具身智能研究中心主任的王鶴介紹,具身機器人“小腦”交互控制、靈巧操作等技能學習能力,與“大腦”的認知、理解、規(guī)劃等能力結(jié)合在一起,這就是未來通用機器人的藍圖。
把藍圖變成施工圖,銀河通用正致力于將智能機器人產(chǎn)品應用到更廣泛的商業(yè)和家庭場景中。在家庭場景的展示中,銀河通用不斷完善中的“靈巧手”可以打開冰箱拿出水瓶、撿起地上的衣服。
仿真合成數(shù)據(jù)
作為一家技術(shù)驅(qū)動的創(chuàng)新企業(yè),銀河通用最引以為傲的是其“泛化”能力。“我們研發(fā)的任意材質(zhì)物體抓取技術(shù)是成功率突破95%的通用泛化物體抓取技術(shù),在行業(yè)中處于領(lǐng)先地位。”王鶴說,公司面向通用機器人持續(xù)開展技術(shù)攻關(guān),在具身大模型、3D視覺感知和“靈巧手”深度學習算法等領(lǐng)域不斷突破核心技術(shù)。
提到機器人,不少人會想到車輛裝配流水線上的機械臂。但機械臂提前計算好工作位置,按程序運作即可,并不具備真正的智能。而具身機器人不僅可移動、更靈巧,還能發(fā)現(xiàn)問題、“聽懂”指令,分擔員工在生產(chǎn)線上來回巡查的工作壓力,完成許多任務(wù)。這樣的能力需要多模態(tài)大模型和具身智能賦予。
此前,具身機器人智能化訓練只能靠人工采集數(shù)據(jù)。以寫字為例,工程師用遙控器操作機器人完成全過程,費時費力采集的數(shù)據(jù)有限,機器人也只是“看起來很厲害”——只能在采集數(shù)據(jù)的場景中,并且物體、光照等因素絲毫不變的前提下,才能使用一支筆寫字,一旦脫離特定空間,就無法正常工作。
“想讓具身機器人不受環(huán)境影響,在常規(guī)的背景、合理的光照下都能正常工作,就需要讓其具備類似人類小腦的反應能力。”王鶴舉例,同樣抓一杯水,對人而言,是不假思索的下意識動作;對機器人來說,杯子的形態(tài)、材質(zhì)不同,抓杯動作和角度各異,只有學習得足夠多,才能知道怎樣做,這就需要海量數(shù)據(jù)訓練出泛化抓取能力。
訓練所需的海量數(shù)據(jù)從哪兒來?靠工程師采集只是杯水車薪。銀河通用打破陳規(guī)、另辟蹊徑,以合成仿真技術(shù)合成“靈巧手”物體抓取的大量數(shù)據(jù),每個物體合成200條視頻,再從一個物體到一類物體……通過成規(guī)模注入數(shù)據(jù),訓練機器人的抓取能力。
“我們是國內(nèi)較早做到泛化物體抓取的企業(yè)。用物理仿真器生產(chǎn)的數(shù)據(jù)訓練機器人學習抓取、放置等技能,是我們獨到的能力。”王鶴說,對機器人本體優(yōu)化后,使用對仿真環(huán)境、算法優(yōu)化后的數(shù)據(jù)進行訓練,能夠幫助機器人跨越虛擬到現(xiàn)實的鴻溝。
拓展應用場景
“人形機器人集成人工智能、高端制造、新材料等先進技術(shù),有望成為繼計算機、智能手機、新能源汽車后的顛覆性產(chǎn)品,將深刻變革人類生產(chǎn)生活方式,重塑全球產(chǎn)業(yè)發(fā)展格局。”銀河通用聯(lián)合創(chuàng)始人姚騰洲告訴記者,公司預計今年將發(fā)布應用于商店超市的輪式人形機器人,計劃于2026年開始量產(chǎn)。
除了輪式人形機器人,銀河通用還在加快“靈巧手”、人形機械腿和遙操設(shè)備的研發(fā)進程,以及解決雙足人形機器人軟硬件相關(guān)技術(shù)難題,不斷突破展示場景的應用。
人形機器人能否順利商用,不僅取決于它自身的能力水平,成本也是重要的影響因素。“能抓取從地面到1.8米高空之間物品的機器人,量產(chǎn)后一套成本預計有望控制在5萬元左右。”王鶴透露,這些有客來時接客取貨,沒人來時補貨盤貨,店員可以用語音指派、控制的機器人,價格并不高昂。
“新生事物往往會面對不少挑戰(zhàn)。具身智能是典型的多學科技術(shù)交叉行業(yè),做具身機器人需要產(chǎn)業(yè)和研究雙輪驅(qū)動,既是前沿探索,也能產(chǎn)出學術(shù)成果,是很好的產(chǎn)學研聯(lián)動。”王鶴告訴記者,當前,銀河通用已在北京、深圳和蘇州三地設(shè)有研發(fā)中心,不斷發(fā)展壯大算法、軟件、硬件研發(fā)團隊。
瞄準行業(yè)發(fā)展趨勢,銀河通用將不斷提升技術(shù)創(chuàng)新能力,持續(xù)開發(fā)人形機器人“大腦”和“小腦”,增強環(huán)境感知、行為控制、人機交互能力,提升人機交互、靈巧抓取、分揀搬運、智能配送等作業(yè)能力,加速大模型訓練迭代和產(chǎn)品應用。同時,銀河通用也將積極拓展應用場景,加快技術(shù)迭代速度,降低創(chuàng)新成本。(經(jīng)濟日報記者楊學聰)