《科創(chuàng)板日報》6月13日訊(記者 李明明) “在北京機器人馬拉松比賽后的一個月之內(nèi),我們就拿到了1000臺以上訂單,到今天為止,總的訂單規(guī)模已經(jīng)突破2000臺,總合同額已經(jīng)超過1個億。”近日,松延動力創(chuàng)始人、董事長姜哲源在北京前沿國際人工智能研究院“AI月光社·走入百家創(chuàng)新企業(yè)”系列活動第一站——走入松延動力活動上表示。
不只是松延動力,此前宇樹創(chuàng)始人王興興也表示,目前包括宇樹在內(nèi)的人形機器人企業(yè)發(fā)展都處于良好狀態(tài),“很多企業(yè)訂單都爆掉了?!?/span>
人形機器人爆單之后,也衍生出一系列問題,比如爆單背后的客戶需求是否真實可持續(xù)、何時能在應(yīng)用場景創(chuàng)造真正的價值?
關(guān)于人形機器人落地應(yīng)用,北京前沿國際人工智能研究院理事長、英諾天使基金合伙人王晟對《科創(chuàng)板日報》記者分析,特種行業(yè)將率先應(yīng)用,工業(yè)場景因容錯率低有挑戰(zhàn),家庭、商業(yè)服務(wù)場景對容錯和效率要求寬松或更合適。
總訂單規(guī)模已超2000臺
在昌平區(qū)未來星科能源谷智造產(chǎn)業(yè)園,《科創(chuàng)板日報》記者見到了近期名聲大噪的機器人“小頑童”,作為能實現(xiàn)室內(nèi)外多地形連續(xù)空翻的人形機器人,“小頑童”走路、空翻、握手等一系列動作流暢自然。
N2小頑童連續(xù)空翻
現(xiàn)場,《科創(chuàng)板日報》記者還與仿生機器人1.0“Hobbs”和2.0“小諾”進行了互動,Hobbs和小諾可以跟隨真人實時同步面部表情,并可實時流暢對話。據(jù)公司方面介紹,小諾面部擁有32個自由度,是全球面部自由度數(shù)量最多的仿生機器人之一,能夠?qū)崿F(xiàn)近乎于真人的面部表情。
仿生機器人1.0的Hobbs
姜哲源表示,目前,松延動力已經(jīng)形成兩大產(chǎn)品線,一類是雙足人形機器人包括N2和E1,一類是仿真人形機器人,公司的最終目標(biāo)是讓機器人真正走入千家萬戶,“給大家當(dāng)保姆和管家?!?/span>
其進一步表示,今年,松延動力著力推進商業(yè)化,通過線上渠道引流,以N2產(chǎn)品低定價制造話題。“未來公司還將談落低價市場,N2定價下探5萬元左右價格帶。”
“對于機器人是進入工業(yè)領(lǐng)域、家庭服務(wù)領(lǐng)域還是商業(yè)服務(wù)領(lǐng)域,市場上尚未形成統(tǒng)一意見。不過,我認為機器人進入工業(yè)場景的難度較大。一旦機器人在生產(chǎn)線上出現(xiàn)故障,導(dǎo)致組裝部件出現(xiàn)問題,整個生產(chǎn)線可能會停滯,造成巨大的經(jīng)濟損失。相比之下,家庭服務(wù)場景對機器人的容錯率要求相對寬松,對時間效率的要求也不那么高。例如,機器人在疊衣服時可能效率較低,但只要它能在人們上班的8小時內(nèi)完成任務(wù),就足夠了?!?王晟認為,機器人可以在人們需要休息時接管工作,例如在24小時藥店中,如果使用機器人代替人工值班,即使機器人不智能,完全依賴遠程操作,也能有效降低成本。
長遠而言,機器人的普及和實用性,仍高度依賴智能化水平的提升。在眾多人工智能方法中,強化學(xué)習(xí)因其能優(yōu)化機器人在動態(tài)環(huán)境中的自主決策,被視為實現(xiàn)智能化的重要引擎之一。松延動力的N2機器人之所以能在此前的馬拉松賽上取得優(yōu)異成績,也和優(yōu)越的強化學(xué)習(xí)訓(xùn)練密不可分。
姜哲源介紹,人類完成決策一般會經(jīng)歷試錯、重復(fù)記憶、改進的過程,強化學(xué)習(xí)也是通過不斷犯錯、改進進行學(xué)習(xí)。讓人形機器人得以跑起來的技術(shù)則是深度強化學(xué)習(xí),它將深度學(xué)習(xí)與強化學(xué)習(xí)結(jié)合,利用神經(jīng)網(wǎng)絡(luò)增強智能體的感知和決策能力。
據(jù)悉,深度強化學(xué)習(xí)在機器人中的應(yīng)用可大致分為四個步驟:算法設(shè)計、仿真訓(xùn)練、仿真環(huán)境間驗證(Sim-to-Sim)、以及真機部署。在仿真訓(xùn)練環(huán)節(jié),松延動力使用的是英偉達高性能物理仿真平臺 NVIDIA Isaac Gym,該平臺專為大規(guī)模機器人學(xué)習(xí)和強化學(xué)習(xí)任務(wù)設(shè)計,具備高效并行計算能力。
在實際訓(xùn)練流程中,松延動力通常先在低保真仿真器中測試策略,再在高保真環(huán)境(如 Mujoco)中驗證其泛化能力,最終部署到真機,以此降低風(fēng)險、提升適應(yīng)性。
不過,王晟也指出,強化學(xué)習(xí)在機器人移動任務(wù)中表現(xiàn)良好,但“Sim-to-Real Gap”(仿真與現(xiàn)實之間的性能落差)仍是一個技術(shù)瓶頸,特別是在操作類任務(wù)中,這一差距尤為明顯。