做了40年機器人相關研究的張正友,罕見出現在了WAIC的騰訊論壇。
2018年初,騰訊創(chuàng)始人馬化騰做出了一個重要決定——成立騰訊Robotics X實驗室。自那之后,作為騰訊首席科學家的張正友便為實驗室定下了一個“十年規(guī)劃”,到現在,正好七年。
近日具身智能燃爆世界人工智能大會,作為AI應用大廠,這屆WAIC騰訊也有新動作——推出了具身智能開放平臺Tairos。但對于騰訊來說,其對于具身智能的布局并非僅僅是外界看到的Tairos這么簡單,騰訊在具身智能上的“野心”也隨之鋪開:
1. 騰訊戰(zhàn)略層面如何看待具身智能?
2. Tairos承擔了什么角色,為何此時推出?
3. 騰訊會做機器狗之類的具身智能硬件嗎?
借著WAIC的契機,張正友現場回應了騰訊戰(zhàn)略層面在具身智能上的諸多思考。
不做機器狗,但有原型機
“要不要做一個機器狗?從我的角度是不支持去做的,不值得去做的,我自己也不會做。因為還有更大的目標在支撐著我們?!睆堈衙鞔_表示。
他認為,騰訊在WAIC推出具身智能開放平臺Tairos就是向外界明確一個信號:騰訊的定位是具身智能平臺,而非本體競爭者。也就是說,騰訊不直接參與本體硬件的量產,不在本體硬件上鏖戰(zhàn),而是聚焦于軟件能力不斷進化和開放。
張正友指出,騰訊更傾向于將自身的能力以平臺的形式輸出,幫助其他企業(yè)在具身智能領域更好地發(fā)展。而現場演示互動的小五機器人,更多是作為一個研究原型,用于內部的技術驗證和探索,與真正面向市場的產品有著本質區(qū)別。
據了解,小五機器人目前探索的場景包括養(yǎng)老、家居等。之所以選擇養(yǎng)老等復雜場景作為具身智能技術牽引的方向,是因為養(yǎng)老場景對機器人的交互安全性和魯棒性要求極高,任何失誤都可能帶來嚴重后果。張正友提到,騰訊有著“十年規(guī)劃”的長期目標,希望通過在養(yǎng)老等復雜場景的應用,不斷打磨技術,使其更加成熟可靠。
“像調酒機器人,我們最終不會去做調酒機器人(的本體量產),但之所以有調酒機器人(的場景研發(fā)),是去展示技術的靈巧性和觸覺各方面的能力?!睆堈阎厣辍N磥?,騰訊Robotics X實驗室還會繼續(xù)做一些展示性的、研究性的硬件,“假如一開始停留在Max腿輪一體化機器狗的本體量產,那后面就沒精力去做其他東西了……我們踩了很多坑,這些都是很寶貴的經驗。”張正友說。
為什么現在開放“鈦螺絲”
在不斷積累和探索中,騰訊Robotics X實驗室走過了7年,沉淀了多模態(tài)感知、規(guī)劃、感知行動聯合三大核心模型,以及虛實融合仿真平臺。去年推出的原型機小五機器人正整合了其前四代機器人,四足機器人Jamoca、輪腿式機器人Ollie、靈巧手TRX-Hand等的核心技術積累。
而真正推動Tairos(中文名:鈦螺絲)開放的另一個原因,是在走訪六七十家企業(yè)后,騰訊看到了市場的真實需求?!霸诰呱碇悄苌戏e累的技術經驗,除了騰訊自己需要,他們(走訪企業(yè))很多都缺乏這些工具?!睆堈颜f。
從行業(yè)看,當前具身智能面臨核心技術瓶頸。首先是3D世界動態(tài)建模,機器人需要準確感知和理解3D環(huán)境的動態(tài)變化,這對傳感器和算法都提出很高要求。其次,觸覺傳感器標準化也是難題,不同觸覺傳感器在性能和數據格式上存在差異,難以實現統(tǒng)一應用和開發(fā)。此外,模型泛化能力不足,使得機器人在面對新場景和任務時表現往往不盡如人意。
除了核心技術瓶頸,具身智能行業(yè)還面臨共性挑戰(zhàn)。例如,數據量需求大,訓練高效具身智能模型需要大量數據支持;端到端模型的限制,使得模型可解釋性和可擴展性較差。
面對這些難題,沒有任何企業(yè)能完整打通端到端技術鏈條。加速具身智能的最快方法,就是開放。
“我們的目的不是要超越所有機器人、具身智能公司或研究機構。某公司感知行動做得很好,可能比我們還優(yōu)秀,那他們就不需要用我的,用感知大模型和規(guī)劃大模型即可?!睆哪K化角度看,傳統(tǒng)機器人平臺往往需要大量數據和復雜編程適配不同本體,而Tairos平臺采用模塊化設計,企業(yè)可根據需求選擇模塊,只需少量數據即可完成適配。
“具身智能對數據的需求量無法降低,很多都希望完全端到端訓練具身智能模型,但從感知到規(guī)劃很難完全端到端實現,需要的數據量太大,這也是開放平臺的價值?!?/span>
根據騰訊披露的信息,其將五代機器人技術積累封裝在Tairos平臺中,平臺具備模塊化功能,合作伙伴可各取所需。具身智能產業(yè)鏈上的軟件商如研發(fā)新模型,也可接入平臺,并利用平臺自有的仿真數據、真實數據等優(yōu)化模型,再賦能其他機器人廠商。
技術開放應用并非“開閘放水”般簡單。騰訊介紹,從今年初開始便與種子企業(yè)深度合作,對具身智能技術進行打磨,已探索出最佳應用模式。如今開放鈦螺絲,標志著平臺從“種子打磨”進入“標準化鋪量”階段?!斑@次展會和會場PPT都展示了當前合作情況,部分產品標準化后便可穩(wěn)步推進鋪量?!彬v訊表示。
以宇樹機器人為例,通過接入Tairos平臺,它能快速實現新功能開發(fā)和優(yōu)化。這得益于平臺虛實融合特性構建的仿真-真實閉環(huán):在虛擬環(huán)境完成測試訓練后,可直接將成果應用于真實機器人。現場接入Tairos的宇樹機器人G1在無操控狀態(tài)下,展示了多模態(tài)感知與規(guī)劃能力。
泡沫是必經之路,人形或許不是終極形態(tài)
WAIC具身智能場館的火爆,某種程度上折射出行業(yè)可能存在過熱現象。人們甚至對賽道產生困惑:在無法預知未來時,盲目探索價值何在?
“就像Blackberry或Pocket PC,難道那算是失敗嗎?沒有那個過程,后來怎會有iPhone、安卓手機?這是探索過程。本體的探索需要持續(xù)投入?!睆堈驯硎尽H纛惐韧ㄐ旁O備演化,具身智能似乎正處于大哥大時代前夜。
大哥大時代用戶相對富裕且形成規(guī)模。當前機器人尚未達到這種程度,人形機器人大多處于數據采集、科研、導覽階段。Tairos平臺希望助推行業(yè)進入大哥大時代。其標志是:無論養(yǎng)老或工業(yè)領域,場景足夠大、能量產、成本可控后,才能真正進入千家萬戶。
“我有生之年都會看到,你們更不用說?!睆堈驯硎尽=衲陚涫荜P注的機器人馬拉松仍存在人為操控,他預計明年“不需要后方遙控”,主要需提升感知能力。
不過他認為,行業(yè)不應被“仿生”限制對具身智能終極形態(tài)的想象。人類雙足人形是經過千萬年演化的復雜環(huán)境生存形態(tài),但現代人居環(huán)境已大變樣,雙足效率可能變低。在形態(tài)探索中,Robotics研發(fā)腿輪一體化(兼具輪與腿)機器人,不為仿生,而是探索更適合人居環(huán)境的具身智能形態(tài)。
張正友假設,除腿輪外,具身智能可更快進化出屏幕——
“若用語言與機器人交互,會被一分鐘百字的語速限制;但若機器人有屏幕展示文字信息,每分鐘閱讀三百字都不成問題。為什么不將現有技術整合到機器人上?為何必須雙足人形?為何必須語言對話?”