「涌現(xiàn)」也發(fā)生在現(xiàn)實世界——硅基文明一觸即發(fā),AI領(lǐng)域的創(chuàng)業(yè)者、創(chuàng)造者,正在用他們的智慧與頭腦,點亮實現(xiàn)AGI的漫漫征途。
在新舊生產(chǎn)力交替之際,《智能涌現(xiàn)》推出新欄目「涌現(xiàn)36人」,我們將通過與業(yè)界關(guān)鍵人物的對話,記錄這一階段的新思考。
美劇《西部世界》描繪了一個人類與機器人共存的社會圖景:在科技高度發(fā)達的未來,機器人與人類的外觀、行為表現(xiàn)幾乎沒有差異,人類能在一座樂園中與機器人隨意互動。
在熊友軍看來,未來機器人不會束縛在樂園中,而是成為人類生活的一部分,機器人可以是人類的生活助手,也可以是朋友,甚至是身體的一部分。正是懷揣這一夢想,讓熊友軍在機器人行業(yè)浸泡了20多年。
熊友軍是機器人公司優(yōu)必選的聯(lián)合創(chuàng)始人之一,曾主導(dǎo)多款人形機器人的開發(fā),其中一款名為“Walker”的機器人兩次登上央視春晚舞臺表演。更早之前,他還負責(zé)包括國家發(fā)改委在內(nèi)的多部門人工智能創(chuàng)新發(fā)展重大工程項目。
他將機器人的發(fā)展階段分為三個時期,分別是弱人工智能、強人工智能、超人工智能。盡管機器人技術(shù)已發(fā)展數(shù)十年,但仍停留在弱人工智能階段,他認為只有實現(xiàn)通用人工智能,機器人能與真實世界交互,機器人才可能進入下一個發(fā)展階段。
2023年,熊友軍離開生活十多年的深圳,北上北京,成為國地共建具身智能機器人創(chuàng)新中心(以下簡稱“創(chuàng)新中心)的CEO。
這是他人生中的一次不小轉(zhuǎn)變。“我們是國家級創(chuàng)新平臺,不僅需要實現(xiàn)關(guān)鍵共性技術(shù)的攻關(guān),還承擔(dān)著帶動產(chǎn)業(yè)發(fā)展的職責(zé)”。他介紹。
2023年,大量機器人初創(chuàng)公司接連冒出,探索不同的技術(shù)路線,但這也意味著,機器人行業(yè)需要經(jīng)過漫長的技術(shù)探索、驗證周期,才能讓機器人走向量產(chǎn)。與此同時,美國不僅有行業(yè)先驅(qū)波士頓動力,也誕生了Figure、Digit機器人新貴,相比中國,美國機器人公司有著更充足的資金優(yōu)勢以及頂級人才。
今年8月,熊友軍向波士頓動力創(chuàng)始人馬克·雷波特提出一個問題,為什么波士頓動力技術(shù)強大,卻不急于商業(yè)化?馬克·雷波特的回答很簡單,只是一句:“I don’t care。”
這出乎熊友軍的意料,“他根本不在乎這些,只把大量精力和資源集中在技術(shù)的領(lǐng)先性和創(chuàng)新性上。”
在熊友軍看來,中美兩國的機器人技術(shù)差距整體不大,但中國機器人初創(chuàng)公司能得到的資源更少,也存在一定的重復(fù)造輪子的問題,這是他決定加入創(chuàng)新中心,推動國內(nèi)機器人技術(shù)、行業(yè)標(biāo)準(zhǔn)加速成熟的原因。
經(jīng)過一年研發(fā),創(chuàng)新中心通過通用機器人平臺“天工”打造了三款機器人,實現(xiàn)機器人在擬人行走、擬人奔跑、具身操作等方面的技術(shù)突破。打造的多能具身智能體“開物”,則聚焦于打造通用的機器人“大腦”“小腦”,讓同一套技術(shù)方案適用于不同形態(tài)的機器人。未來,創(chuàng)新中心研發(fā)的技術(shù)都將陸續(xù)開源。
在熊友軍看來,僅僅將技術(shù)開源還不足以推動行業(yè)明顯進步,創(chuàng)新中心還負責(zé)制定機器人行業(yè)標(biāo)準(zhǔn)規(guī)范。據(jù)介紹,創(chuàng)新中心已參與制定4項國家標(biāo)準(zhǔn)、3項國際標(biāo)準(zhǔn)。
隨著人形機器人技術(shù)走向成熟,熊友軍預(yù)計未來的機器人,幾乎人人都能買得起。但他也擔(dān)憂,價格戰(zhàn)在機器人行業(yè)重演,“這對行業(yè)是一種傷害,不希望看到。”
“如果那一天真的到來,創(chuàng)新中心能發(fā)揮哪些作用?”《智能涌現(xiàn)》將這個問題拋給熊友軍。
“說明機器人技術(shù)已經(jīng)十分成熟,不再需要解決共性的技術(shù)難題,那時創(chuàng)新中心的使命已經(jīng)完成,我們也將開始下一個征程。”熊友軍說。
以下是《智能涌現(xiàn)》和國地共建具身智能機器人創(chuàng)新中心CEO熊友軍的對話,內(nèi)容略經(jīng)編輯:
打造機器人行業(yè)開源的OpenAI
《智能涌現(xiàn)》:先來聊聊創(chuàng)新中心的職責(zé),你覺得與其它商業(yè)公司的差別是什么?
熊友軍:國家地方共建具身智能機器人創(chuàng)新中心是由國家定義的新型研發(fā)機構(gòu),它代表國家和整個機器人產(chǎn)業(yè),致力于攻克共性和關(guān)鍵核心技術(shù)。最終目標(biāo)是推動中國具身智能機器人產(chǎn)業(yè)占領(lǐng)全球科技競爭的制高點。
《智能涌現(xiàn)》: 可以把創(chuàng)新中心類比為早期的 OpenAI嗎?
熊友軍: 對。我覺得創(chuàng)新中心是機器人行業(yè)的一個引導(dǎo)者,匯聚行業(yè)資源再推動應(yīng)用。
《智能涌現(xiàn)》:創(chuàng)新中心目前主要在做什么?能從哪些方面推動機器人行業(yè)發(fā)展?
熊友軍:創(chuàng)新中心主要做的是推動具身智能機器人技術(shù)的發(fā)展和生態(tài)建設(shè)。它集中在兩個重要任務(wù)上:一個是“天工”通用機器人母平臺,另一個是“開物”多能具身智能體平臺。
創(chuàng)新中心還負責(zé)牽頭國家級任務(wù),攻關(guān)關(guān)鍵技術(shù)、編寫國際和國家機器人相關(guān)標(biāo)準(zhǔn),和場景方合作推動試點機器人應(yīng)用。
《智能涌現(xiàn)》:現(xiàn)在團隊規(guī)模情況如何?
熊友軍:我們團隊目前近200人,平均年齡32歲,研發(fā)占比70%左右。
《智能涌現(xiàn)》:創(chuàng)新中心和你之前在優(yōu)必選的工作內(nèi)容差異很大,你怎么切換角色?
熊友軍:我目前還是優(yōu)必選的兼職CTO,能夠繼續(xù)關(guān)注和推動優(yōu)必選的研發(fā)工作。同時,優(yōu)必選是創(chuàng)新中心的主要股東之一,剛成立時為創(chuàng)新中心提供了巨大的支持。優(yōu)必選不僅調(diào)派了研發(fā)人員協(xié)助啟動多個項目,還將300多項專利開放給創(chuàng)新中心。
我認為,優(yōu)必選在推動創(chuàng)新中心的發(fā)展上做出了重要貢獻,尤其是在洞察機器人行業(yè)痛點方面。
《智能涌現(xiàn)》: 你覺得機器人行業(yè)需要解決什么痛點,才能促進機器人規(guī)模化量產(chǎn),實現(xiàn)商業(yè)化應(yīng)用?
熊友軍:我覺得主要方面分幾個方面:
首先,技術(shù)的成熟還需要時間。這不僅僅包括機器人本身的技術(shù),還涵蓋人工智能、具身感知等多個領(lǐng)域的技術(shù),以及運動控制技術(shù)的完善。
其次,供應(yīng)鏈的成熟度也制約了機器人大規(guī)模應(yīng)用,當(dāng)前,機器人產(chǎn)量較低,導(dǎo)致成本無法降低。
技術(shù)、供應(yīng)鏈不成熟導(dǎo)致人形機器人現(xiàn)在沒有大量生產(chǎn),其實市場需求都有。隨著技術(shù)迭代,機器人產(chǎn)量提升,這些問題會逐步得到解決,這是一個漸進的過程。
《智能涌現(xiàn)》: 如果行業(yè)出現(xiàn)新技術(shù),創(chuàng)新中心是否會立刻投入跟蹤和研發(fā)?創(chuàng)新中心如果要為行業(yè)服務(wù),會有什么舉措?
熊友軍:面對新技術(shù),我們會首先進行評估,主要考慮技術(shù)的成熟度、應(yīng)用前景以及是否符合我們的長期戰(zhàn)略。
如果新技術(shù)符合方向,我們會選擇投入研發(fā),或者與行業(yè)伙伴合作推進。此外,創(chuàng)新中心的天工開源項目和具身智能數(shù)據(jù)集建設(shè)為行業(yè)提供了技術(shù)孵化和支持,幫助推動行業(yè)的技術(shù)進步。
《智能涌現(xiàn)》:現(xiàn)在機器人的技術(shù)、零部件沒有標(biāo)準(zhǔn),創(chuàng)新中心對于機器人的技術(shù)路線有標(biāo)準(zhǔn)嗎?
熊友軍:人形機器人技術(shù)面向不同行業(yè),解決方案會有所不同,因此不會有統(tǒng)一的標(biāo)準(zhǔn)。對于工業(yè)領(lǐng)域的機器人,未來一定會找到最具成本效益的解決方案;而面向商用和家庭服務(wù)的機器人,也會有相應(yīng)的解決方案。目前,人形機器人技術(shù)路線仍在探索階段,各個方向都不夠成熟。未來可能會有某個技術(shù)方案發(fā)展更快、產(chǎn)業(yè)鏈配套更完善。
因此,面對一個高速發(fā)展的行業(yè),現(xiàn)在也不能夠定得太死,需要根據(jù)行業(yè)的發(fā)展 情況動態(tài)調(diào)整。
《智能涌現(xiàn)》:創(chuàng)新中心的職責(zé)也包括帶動機器人相關(guān)政策、標(biāo)準(zhǔn)制定嗎?
熊友軍:沒錯,這是我們解決共性關(guān)鍵技術(shù)的很重要的一個方向,行業(yè)發(fā)展首先要規(guī)范,這個標(biāo)準(zhǔn)必須要做,所以創(chuàng)新中心成立以來已經(jīng)牽頭三項機器人國際標(biāo)準(zhǔn),四項國家標(biāo)準(zhǔn),還發(fā)布了一些行業(yè)標(biāo)準(zhǔn)。
機器人智能和本體發(fā)展差距不大
《智能涌現(xiàn)》:目前創(chuàng)新中心的研發(fā)重心是什么?
熊友軍:除了“天工”之外, 我們還傾斜了更多資源投入到機器人的“大腦”建設(shè)上,這個“大腦”就是“開物”平臺。它是一個具身智能體,能讓機器人實現(xiàn)“一腦多機”和“一腦多能”。
“一腦多機”意味著“開物”平臺不僅能服務(wù)我們的天工系列機器人,還能服務(wù)其他機器人公司,包括人形機器人、四足機器人和工業(yè)機器人,使機器人更加智能化。“一腦多能”則指平臺能夠適應(yīng)不同場景,如工業(yè)、商用服務(wù)和家庭等。
圍繞這個“大腦”,我們還搭建了具身智能數(shù)據(jù)集平臺,與多方合作伙伴共同建設(shè)多樣化的應(yīng)用場景。除了工業(yè)場景外,我們還在開發(fā)特種、家庭和商業(yè)服務(wù)領(lǐng)域,未來將建成全球最大、最稠密、最通用的具身智能數(shù)據(jù)收集平臺。
《智能涌現(xiàn)》:機器人形態(tài)多樣,甚至不同機器人的手指數(shù)量也不一樣,“開物”平臺怎么實現(xiàn)服務(wù)多種類型機器人?
熊友軍:針對比如五指、四指、兩指等不同類型機器人,會各選出一種行業(yè)主流機器人,針對不同動作進行數(shù)據(jù)采集。其次,我們有一套具身智能算法調(diào)配,讓開物具備通用能力,適配各種各樣機器人。
《智能涌現(xiàn)》:創(chuàng)新中心現(xiàn)在研發(fā)的機器人,選擇什么技術(shù)路線?
熊友軍: 我們現(xiàn)在偏向于純視覺、仿生的路線。
《智能涌現(xiàn)》:原因是什么?
熊友軍:因為仿生的成本可靠,產(chǎn)品也可控。
《智能涌現(xiàn)》:了解到現(xiàn)在創(chuàng)新中心推出了三款自研的“天工”機器人,在哪些地方取得了一定的優(yōu)勢,未來還有哪些規(guī)劃?
熊友軍:天工實際上是一套完整的系統(tǒng),創(chuàng)新中心成立時,我定下了五個關(guān)鍵任務(wù):人形機器人本體、運動控制算法、具身智能大模型、機器人操作系統(tǒng)和機器人工具鏈。
目前,機器人像腿、胳膊這些部分已經(jīng)取得了一些階段性成果。接下來,我們將開源一整套運動控制算法庫,包括模型預(yù)設(shè)控制、全新運動控制算法,以及強化學(xué)習(xí)、模仿學(xué)習(xí)網(wǎng)絡(luò)等。此外,“開物”平臺未來也將陸續(xù)開源,以推動整個行業(yè)的技術(shù)進步和資源共享。
《智能涌現(xiàn)》: 創(chuàng)新中心首要任務(wù)還是解決機器人的運動控制,還是機器人本體的問題?
熊友軍:對,本體和運動控制現(xiàn)在是第一階段的重要攻關(guān)難題,我們也在同步推動機器人的“大腦”發(fā)育。
《智能涌現(xiàn)》:注意到開物可以讓機器人具備復(fù)雜長程任務(wù)拆解執(zhí)行能力,這是如何做到的?
熊友軍:長程任務(wù)執(zhí)行能力是機器人智能化的關(guān)鍵,長行程任務(wù)的步驟越多,意味著任務(wù)越復(fù)雜。我們正在努力讓“開物”能完成超過50步的復(fù)雜任務(wù),同時還能在不同場景中靈活應(yīng)對各種任務(wù)。
“開物”的核心是“具身大腦+小腦”的設(shè)計:大腦由AI模型驅(qū)動,負責(zé)任務(wù)規(guī)劃、邏輯推理和場景理解;小腦則負責(zé)具體動作,比如執(zhí)行技能、處理錯誤和實時反饋。兩者配合,通過智能體框架共同完成任務(wù)。
另外,創(chuàng)新中心還在建設(shè)一個國家級的具身智能數(shù)據(jù)平臺,用來采集、標(biāo)注和優(yōu)化各種數(shù)據(jù)。這不僅讓“開物”學(xué)得更快,也能讓它在更多場景中表現(xiàn)得更好。
《智能涌現(xiàn)》:具備50步長行程任務(wù)執(zhí)行能力,理論上可以把機器人應(yīng)用在哪些場景?
熊友軍:未來,這些能力將使機器人在制造業(yè)、服務(wù)業(yè)和家庭場景中廣泛應(yīng)用。在工廠中,機器人可以承擔(dān)高復(fù)雜度、長流程且精細的任務(wù);在服務(wù)業(yè)中,能夠執(zhí)行長程復(fù)雜任務(wù)的機器人將滿足多樣化需求,而不僅限于簡單對話。
《智能涌現(xiàn)》:現(xiàn)在天工機器人能夠理解并執(zhí)行“給我一瓶可樂”這類任務(wù)嗎?
熊友軍:目前,創(chuàng)新中心已實現(xiàn)基礎(chǔ)的長程任務(wù)執(zhí)行能力,如處理早餐備餐等場景任務(wù)。通過技術(shù)進步、數(shù)據(jù)積累和具身智能大模型優(yōu)化,未來機器人將更強大,能夠完成更多類型的復(fù)雜任務(wù)。
針對“給我一瓶可樂”這類任務(wù),可通過“具身大腦+小腦”架構(gòu)實現(xiàn):AI大模型(具身大腦)負責(zé)任務(wù)規(guī)劃,制定動作決策;數(shù)據(jù)驅(qū)動的端到端技能模塊(具身小腦)負責(zé)執(zhí)行具體動作,如打開冰箱、取出可樂并遞給用戶。
《智能涌現(xiàn)》:現(xiàn)在機器人大腦能夠執(zhí)行復(fù)雜任務(wù),但是本體剛學(xué)會跑步,這代表機器人的運動控制、肢體現(xiàn)在跟不上大腦的發(fā)展?
熊友軍:這并不意味著本體和運動控制有所落后。大模型與機器人技術(shù)的融合是近兩年才剛剛開始的,讓機器人足夠聰明,擁有自主理解和執(zhí)行任務(wù)能力來完成更復(fù)雜的任務(wù),整個具身智能行業(yè)都還有很多課題要攻克。
《智能涌現(xiàn)》:具身智能機器人距離大規(guī)模商用還需要解決哪些問題?
熊友軍:在工業(yè)和商業(yè)服務(wù)場景中,一些簡單的需求已經(jīng)有了初步應(yīng)用。但要讓人形機器人真正普及到千家萬戶,不僅需要技術(shù)突破,還要解決成本、法律、標(biāo)準(zhǔn)、倫理等多方面問題。
技術(shù)方面挑戰(zhàn)主要包括:多模態(tài)感知能力的提升、更自然的情感交互、操作泛化能力、長時間安全穩(wěn)定運行的可靠性。
成本方面,目前人形機器人尚未規(guī)?;慨a(chǎn),成本較高,不適合普通家庭使用。未來隨著技術(shù)成熟和規(guī)?;a(chǎn),成本有望大幅下降,推動商用普及。
法律和標(biāo)準(zhǔn)方面,當(dāng)前行業(yè)缺乏統(tǒng)一標(biāo)準(zhǔn),不同廠商的機器人能力差異較大。未來建立國家或行業(yè)標(biāo)準(zhǔn),將有助于提高不同機器人間的兼容性和互操作性。此外,商用后的責(zé)任歸屬、使用權(quán)限以及相關(guān)法律法規(guī)的完善,也是必須解決的問題。
這些因素共同決定了人形機器人從技術(shù)驗證走向大規(guī)模應(yīng)用的速度和廣度。
《智能涌現(xiàn)》:數(shù)據(jù)收集速度是怎樣的?預(yù)計什么時候、到多大數(shù)據(jù)量的時候,將為具身大腦帶來可見的變化?
熊友軍:目前,數(shù)據(jù)采集覆蓋6類本體和7大典型場景,日產(chǎn)數(shù)據(jù)已達10TB。同時,創(chuàng)新中心還建設(shè)了一體化綜合數(shù)據(jù)平臺,集數(shù)據(jù)生產(chǎn)、采集、標(biāo)注和存儲于一體,為機器人發(fā)展提供全面支持。
我認為,具身智能大腦的突破指日可待。隨著機器人應(yīng)用場景和數(shù)據(jù)規(guī)模的不斷擴大,量變將很快引發(fā)質(zhì)變,為具身智能大腦帶來顯著的進步和變化。
《智能涌現(xiàn)》:機器人訓(xùn)練需要的數(shù)據(jù)量大概是怎樣的量級?數(shù)據(jù)量越多越好嗎?
熊友軍:數(shù)據(jù)量大是好事,但當(dāng)數(shù)據(jù)規(guī)模持續(xù)擴大,重復(fù)場景、動作和行為的數(shù)據(jù)會占比逐漸增多,其價值相對較低。真正關(guān)鍵的是稀缺場景和高質(zhì)量數(shù)據(jù),它們對機器人能力的進一步提升至關(guān)重要。
如果把特斯拉看作一個“自動駕駛機器人”,根據(jù)馬斯克的觀點,達到全球監(jiān)管認可的自動駕駛水平需要60億英里的行駛數(shù)據(jù)。這主要依賴圖像數(shù)據(jù),輸出的基本動作是加速、減速和轉(zhuǎn)彎,雖然場景是非結(jié)構(gòu)化的,但控制自由度較低。
相比之下,機器人需要在非結(jié)構(gòu)化場景中處理多模態(tài)輸入(如音頻、視頻、圖像和文本),還需結(jié)合力度和觸覺感知,輸出動作的復(fù)雜度遠超自動駕駛。因此,機器人訓(xùn)練所需的數(shù)據(jù)量級也必然遠超自動駕駛的需求。
《智能涌現(xiàn)》:今年很多公司把端到端大模型應(yīng)用到機器人,創(chuàng)新中心會不會也嘗試端到端大模型?
熊友軍:當(dāng)然,端到端是一種很好的解決方案。關(guān)于具身智能的大腦解決方案,國際上有幾種不同的思路:
首先是端到端方案,將語音、視覺、行為等統(tǒng)一處理為一個大模型。這是一個耦合方案,語音、規(guī)劃、執(zhí)行動作等全部混在一起,訓(xùn)練成本較高。Google采用了這種方式。
其次是解耦方案,將語音、視覺、運動控制等模塊單獨作為不同的模型,這種方案的代表是Figure和OpenAI。這種方式不僅可以進行人機交互、語音交流,還能執(zhí)行動作,我個人更傾向于這種方案。
還有面向具體工作的小模型。例如特斯拉,他們采用模仿學(xué)習(xí),針對特定任務(wù)(如電池分揀)進行訓(xùn)練。這些小模型能夠快速復(fù)制,但泛化能力相對較差。
這三種方式各有優(yōu)勢,我們會根據(jù)實際需求進行嘗試和探索。
機器人大腦,中美差距大約一年
《智能涌現(xiàn)》:你覺得目前國內(nèi)外的人形機器人發(fā)展有哪些差距呢?
熊友軍:中美是全球人形機器人行業(yè)發(fā)展最快的兩個國家,尤其是在具身智能時代來臨之后,我認為中美將在未來的競爭中占據(jù)優(yōu)勢。
美國主要由一些大型科技公司主導(dǎo)這一領(lǐng)域,比如特斯拉、Figure、Digit和波士頓動力,每家公司都有獨特的優(yōu)勢。Figure背靠OpenAI,Digit則由亞馬遜提供底層技術(shù)、資本和產(chǎn)業(yè)支持,同時,他們在學(xué)術(shù)界也有深厚的背景,如斯坦福、加州理工等。
相比之下,國內(nèi)的人形機器人領(lǐng)域主要由創(chuàng)業(yè)公司推動,這意味著技術(shù)積累、資本投入和行業(yè)資源的聚集度相對較低,尚未達到美國企業(yè)的規(guī)模和影響力。
《智能涌現(xiàn)》:國內(nèi)機器人行業(yè)的優(yōu)勢是什么?
熊友軍:中國市場龐大,供應(yīng)鏈更完善,應(yīng)用場景更多,技術(shù)探索速度相對更快。
在本體研發(fā)方面,中美的差距不大,甚至在某些領(lǐng)域,中國的技術(shù)探索可能更為全面。例如,面對同一個技術(shù)方案,中國的迭代速度更快,同時在核心零部件的成本、技術(shù)可靠性和穩(wěn)定性方面也具有明顯優(yōu)勢。
在運動控制方面,中國和美國基本處于同一起跑線,許多美國公司能做到的技術(shù),我們也能做到,甚至在純電驅(qū)動領(lǐng)域,中國的運動控制能力在部分方面比美國更強。
《智能涌現(xiàn)》:本體的同一個技術(shù)方案,中國的迭代速度會更快,是指中國產(chǎn)業(yè)支持機器人應(yīng)用,因此能夠快速測試、收集數(shù)據(jù)用以迭代嗎?
熊友軍:是的,中國的優(yōu)勢在于完整的產(chǎn)業(yè)鏈、豐富的應(yīng)用場景以及政策的強力支持。政府提供了政策和資源支持,加上龐大的市場和多樣化的應(yīng)用場景,使得中國能夠更快地進行技術(shù)測試、收集數(shù)據(jù)并進行產(chǎn)品迭代。同時,中國的產(chǎn)品化速度也較快,能夠?qū)⒖蒲谐晒杆俎D(zhuǎn)化為實際產(chǎn)品,從而推動技術(shù)的優(yōu)化和應(yīng)用的落地。
《智能涌現(xiàn)》:中美之間的具身智能技術(shù)領(lǐng)域差距多大?
熊友軍:中美在具身智能領(lǐng)域的差距并不大,從數(shù)據(jù)、制造和應(yīng)用場景等方面來看,中國還有不少優(yōu)勢。
算法上,中美幾乎同步起步,中國研究人員在頂級機器人會議上頻頻獲獎,水平相當(dāng)。數(shù)據(jù)方面,具身智能需要復(fù)雜的物理世界交互數(shù)據(jù),而國外收集成本高、難度大。相比之下,中國制造業(yè)規(guī)模大、場景豐富、人力成本低,在數(shù)據(jù)收集和應(yīng)用上占據(jù)優(yōu)勢。
另外具身智能在執(zhí)行大腦的方面,雙方差距不大,差距是底層算法,我們使用了美國的一些開源大模型、底層技術(shù)架構(gòu)。但在應(yīng)用方面我們在快速迭代,所以說總體差距不是很大,各有優(yōu)勢。
《智能涌現(xiàn)》:能不能列舉一些開源大模型、底層技術(shù)架構(gòu)?這對國內(nèi)現(xiàn)階段人形機器人發(fā)展帶來哪些影響?
熊友軍:一個直觀的例子是,國內(nèi)許多大模型的早期發(fā)展是基于美國開源代碼進行二次開發(fā)和優(yōu)化的。隨著時間推移,國內(nèi)企業(yè)逐漸推出自研模型,加速了技術(shù)的應(yīng)用和落地。
借鑒美國開源模型的底層架構(gòu),可以在一定程度上節(jié)省開發(fā)成本,推動技術(shù)和產(chǎn)品的快速迭代。但同時,國內(nèi)也在加大自主研發(fā)力度,推動國產(chǎn)化進程,增強技術(shù)的自主可控性。
美國機器人領(lǐng)域的開源開放有助于避免重復(fù)造輪子,加速全球機器人產(chǎn)業(yè)的發(fā)展。同樣,國內(nèi)企業(yè)也在努力,例如我們國地共建具身智能機器人創(chuàng)新中心、上海人形機器人創(chuàng)新中心、智元機器人和宇樹等,都在積極開源技術(shù)成果,推動全球技術(shù)進步,最終造福全人類。
《智能涌現(xiàn)》:如果用時間換算,中美之間機器人發(fā)展差距相差多少個月?
熊友軍:美國推出一款新的大模型,國內(nèi)通常能在半年內(nèi)跟上,我認為差距大約在半年到一年的范圍內(nèi)。不過這只是我個人的觀點,時間差很難精確評估。
《智能涌現(xiàn)》:對于這一差距,目前行業(yè)的解決方法是什么?創(chuàng)新中心能夠做些什么?
熊友軍:中國近年來加大了研發(fā)力度,優(yōu)化算力結(jié)構(gòu),推動產(chǎn)業(yè)融合。例如,北京發(fā)布了算力基礎(chǔ)設(shè)施建設(shè)方案,并推出了國產(chǎn)算力驗證平臺。創(chuàng)新中心也與科研機構(gòu)和企業(yè)合作,致力于研發(fā)人形機器人專用的芯片,從而加速縮小與國際間的算力差距。
機器人仍處于弱人工智能時代
《智能涌現(xiàn)》:你在機器人行業(yè)20多年,機器人吸引你的地方是什么?
熊友軍:我夢想中的社會是一個人機共融的社會,隨著機器人技術(shù)的發(fā)展,機器人將越來越多地融入我們的社會生活。最初,機器人可能會在工業(yè)領(lǐng)域執(zhí)行一些工作,接著進入商業(yè)領(lǐng)域,最后走進家庭,成為我們的生活伙伴或幫手,幫助解決各種勞動問題。我相信這是一個大趨勢。
然而,現(xiàn)階段機器人的技術(shù)還不夠成熟,我們不能因此而停滯不前。我們可以借鑒智能汽車的發(fā)展思路,對機器人進行智能程度分級。就像自動駕駛從L0到L5分為六個等級,雖然現(xiàn)在大部分智能駕駛系統(tǒng)停留在L2和L3級,遠未達到L5級,但自動駕駛技術(shù)已經(jīng)在社會中廣泛應(yīng)用了。
機器人也會走類似的道路,盡管目前還沒有達到L5級,但仍然可以在很多場景中應(yīng)用。我們可以持續(xù)提升機器人的自動化能力,同時采取“沿途下蛋”的策略,先將現(xiàn)有成果應(yīng)用到實際場景中,逐步滲透到我們的社會生活和各類工作中。我認為,這是一條符合商業(yè)發(fā)展路徑的道路。
《智能涌現(xiàn)》:近兩年的大模型應(yīng)用到人形機器人,加速了行業(yè)發(fā)展?,F(xiàn)在是歷史上發(fā)展人形機器人的最佳時刻嗎?除了大模型應(yīng)用,還有哪些因素推動?
熊友軍:現(xiàn)在的確是發(fā)展人形機器人的好時機,就像當(dāng)年的 iPhone 時刻一樣。美國的特斯拉、谷歌、亞馬遜,以及國內(nèi)的華為、騰訊等科技巨頭都在加速布局,推動這一領(lǐng)域的發(fā)展。
推動人形機器人發(fā)展的原因有很多:大模型的爆發(fā)讓具身智能有了更大的可能性,產(chǎn)業(yè)鏈逐漸成熟,機器人成本降低,實際應(yīng)用的可能性大大增加。另外,勞動力短缺、人力成本上升,以及危險和特殊作業(yè)的替代需求,讓工業(yè)自動化和服務(wù)業(yè)對人形機器人的需求越來越旺盛。
《智能涌現(xiàn)》:前段時間你在世界機器人大會上,和美國波士頓動力的創(chuàng)始人馬克·雷波特交流,他對人形機器人的看法有哪些令你印象深刻呢?
熊友軍:我曾經(jīng)問過他很多次,為什么波士頓動力的技術(shù)那么強大,卻沒有進行產(chǎn)業(yè)化?為什么不做一些商業(yè)化運作,或者去融資?他的回答很簡單,只說了一句:“I don’t care。” 他根本不在乎這些。波士頓動力把大量精力和資源集中在技術(shù)的領(lǐng)先性和創(chuàng)新性上,這種專注精神和態(tài)度是非常值得敬佩的。
《智能涌現(xiàn)》:你之前把機器人發(fā)展分為三個階段,分別是弱人工智能、強人工智能,超人工智能。你覺得現(xiàn)在的機器人發(fā)展到哪個階段了?
熊友軍:我覺得現(xiàn)在仍然處于弱人工智能的時代,雖然我們正在朝著通用人工智能的方向發(fā)展,但人工智能的應(yīng)用大多還是集中在數(shù)字空間或信息空間,真正與物理世界打交道的場景還很少。具身智能時代還沒有真正到來,雖然我們已經(jīng)開始邁出步伐,但仍處于初期階段。
目前,無論是與機器人對話,還是讓它幫你生成方案、寫文字、制作視頻,這些都屬于虛擬世界或信息空間的范疇。但人類的智能遠遠不僅限于此。正如李飛飛所說,空間智能是一個重要的方向,我們對物理世界的理解仍然非常有限。
《智能涌現(xiàn)》: 如果機器人與物理空間進行強交互,能被稱為超人工智能嗎?
熊友軍:我覺得不一定到那個時候就一定是超人工智能。其實我們?nèi)祟悓ψ约捍竽X的思考方式也還不是很清楚,關(guān)于人類大腦的很多機制仍然是未知的。所以,即便人工智能取得了很大的進步,也遠沒有達到我們想象的那種“超人工智能”階段。
《智能涌現(xiàn)》:到超人工智能時代,機器人會有哪些表現(xiàn)?
熊友軍:我覺得可以發(fā)揮大家的想象力。以前我提到過一個類似《三體》的觀點:我們生活中可能會有幾種形式的存在。除了我們這些原生的肉體碳基生命之外,可能還會有仿生人——他們一部分是肉體,一部分是機器人,甚至可能會出現(xiàn)全身都是機器人的情況。
舉個例子,坐在我對面的,或許就是一個機器人帥哥,或者是一個機器人助手。它看起來和我們一模一樣,擁有皮膚和非常擬人的表情,聊天時它的神態(tài)和舉止也可能完全像真人一樣。這種機器人能夠融入我們的生活,幾乎無法區(qū)分它和真人的不同,就像美劇《西部世界》里呈現(xiàn)的那樣。
《智能涌現(xiàn)》:你認為機器人最終形態(tài)外觀會是怎樣的?
熊友軍:機器人的應(yīng)用場景還在不斷探索中,機器人外觀也會根據(jù)場景需求有所不同。在家庭場景中,機器人可能更注重外觀,擁有表情、皮膚和更多的觸覺傳感器,整體看起來更具親和力。而在工業(yè)場景中,外觀要求相對簡單,更多強調(diào)穩(wěn)定性、精度和速度等實用性特征。
《智能涌現(xiàn)》:目前機器人行業(yè)還在初期發(fā)展階段,大家都在找落地場景,距離商業(yè)應(yīng)用仍有一段距離?,F(xiàn)在一些投資人急于看到場景應(yīng)用成果,您怎么看待機器人初創(chuàng)公司與投資人之間的矛盾?
熊友軍:要實現(xiàn)大規(guī)模商業(yè)化,技術(shù)和產(chǎn)品的成熟是關(guān)鍵。在技術(shù)發(fā)展的過程中,總會有一些細分場景和階段性的應(yīng)用,技術(shù)創(chuàng)新和場景落地也會不斷演進。
目前,我們主要在工業(yè)場景和一些商業(yè)服務(wù)領(lǐng)域進行探索。隨著技術(shù)和產(chǎn)品逐漸完善,人形機器人未來會深入到生產(chǎn)和生活的方方面面,比如工業(yè)應(yīng)用、家庭服務(wù)等。
我希望資本和公眾能對具身智能機器人和人形機器人的發(fā)展多一些耐心和包容,這樣才能更好地推動這個行業(yè)的長遠發(fā)展。
《智能涌現(xiàn)》:你之前也提到說人形機器人未來要“論斤賣”,在強人工智能時代到來的話,這個論斤賣是不是會成為可能呢?
熊友軍:“論斤賣”意思是,人形機器人的成本不會成為最大的擔(dān)憂。隨著技術(shù)成熟,商業(yè)化后的成本會大幅降低。
就像手機行業(yè)一樣,早期的大哥大既貴又重,只有“土豪”能用,但如今手機功能遠超大哥大,而且價格大大降低。一旦機器人實現(xiàn)規(guī)?;a(chǎn),家庭用戶也能負擔(dān)得起。
我們不希望出現(xiàn)價格戰(zhàn),因為那對所有人都沒有好處。
《智能涌現(xiàn)》:如果未來機器人行業(yè)真的出現(xiàn)價格戰(zhàn),創(chuàng)新中心作為在機器人行業(yè)有影響力的組織,是不是也能夠參與,改變一些市場化的問題?
熊友軍:如果真正到了那一天,說明機器人行業(yè)已經(jīng)繁榮發(fā)展,各項技術(shù)和行業(yè)問題都已得到解決,開始大規(guī)模產(chǎn)業(yè)化應(yīng)用。我認為,創(chuàng)新中心就已經(jīng)非常成功了,到那個時候,創(chuàng)新中心將開啟新的征程。
因為國家的目標(biāo)是希望創(chuàng)新中心能夠在具身智能時代引領(lǐng)機器人行業(yè)發(fā)展,就像現(xiàn)在的電動汽車,中國已經(jīng)在全球汽車行業(yè)中處于領(lǐng)先地位。一旦機器人產(chǎn)業(yè)能夠完全由市場主導(dǎo),創(chuàng)新中心可能就會有新的任務(wù)和使命了。
《智能涌現(xiàn)》:到那時候,你對機器人夢想也完成了嗎?
熊友軍:應(yīng)該是滿足了我現(xiàn)在的目標(biāo),但那時候我可能有新的目標(biāo),更遠的理想要實現(xiàn)。