數(shù)字科技正在加速融入我們經(jīng)濟社會的方方面面,一個智能泛在、虛實共生的時空正逐漸展開。面對疫情沖擊、經(jīng)濟發(fā)展和大國博弈等多種不確定性,科技無疑是應對變化的一把鑰匙,有望為我們開啟未來的數(shù)字大門。
騰訊研究院聯(lián)合騰訊新聞、騰訊院士專家工作站、騰訊投資,騰訊可持續(xù)社會價值事業(yè)部和騰訊公司各大科技實驗室,聯(lián)合發(fā)起了《T3未來科技對話》,希望邀請科學家和行業(yè)專家,對話(Talk)科技(Technology)趨勢(Trends),捕捉走出實驗室的星辰大海。
2022年6月8日,第一期如約而至,主題是:人機協(xié)同的服務機器人離我們有多遠?
機器人被譽為制造業(yè)皇冠頂端的明珠。2021年全球服務機器人需求端銷售額達146億美元,增速32.2%,創(chuàng)造了2016年以來的最高峰值。今年,疫情期間的消毒機器人、配送機器人;冬奧會館內(nèi)的炒菜機器人、送餐機器人等服務機器人一躍成為新晉網(wǎng)紅。特斯拉、戴森等企業(yè)也紛紛投身到“人型”機器人的研發(fā)與制造中。
那么,什么是服務機器人?除了視覺和聽覺,哪些技術的突破和進展讓它們有了走進家庭生活的可能?它們還有哪些挑戰(zhàn)需要克服?
帶著這些疑問,騰訊研究院司曉院長邀請到中國科學院院士、華中科技大學機械科學與工程學院教授丁漢;清華大學長聘教授、清華未來實驗室主任徐迎慶;香港中文大學(深圳)機器人與智能制造研究院副院長,深圳市人工智能與機器人研究院特種機器人中心主任丁寧教授,以及騰訊首席科學家、RoboticsX實驗室及騰訊AI Lab 負責人張正友;騰訊投資董事總經(jīng)理余海洋,共同解讀服務機器人的發(fā)展密碼。
一、服務機器人的核心是“服務于人”
騰訊研究院司曉院長首先請各位嘉賓對服務機器人進行了定義,因為常見的家用掃地機器人,德國在農(nóng)業(yè)種植的、采摘、耕地的也叫機器人,還有外骨骼加強的設備也叫機器人,而且在疫情期間看到更多的消殺機器人和配送機器人走向街頭。他們有的是機械性的,有的是有自己的意識和判斷的,有很大的差異。
丁漢院士認為,總體看機器人有3大類,工業(yè)機器人、特種機器人和服務機器人。服務機器人一直對各方面的技術突破要求非常高。目前機器人的概念也在演進,機器人可以說是無處不在,包括機械臂,AGV,海陸空機器人,以及情感交流,陪護等人機交互的服務機器人。
騰訊首席科學家張正友理解,服務機器人要服務于人,所以它必須要能夠跟人互動。而工業(yè)機器人即流水線上的機械臂不需要跟人互動。因為環(huán)境的不定性,所以服務機器人的自主能力至關重要,以此可以來區(qū)分服務機器人和其他機器人。從這個角度來看,所謂的炒菜機器人就不歸納成服務機器人了,因為不需要跟人互動,更像是微波爐一樣的電器。
香港中文大學丁寧教授同樣認為自主性很重要,否則就是自動化的機器?,F(xiàn)在各行業(yè)的裝備,往后發(fā)展都會逐步具備機器人的屬性,具有感知、自主和移動的能力。從這個意義來講,所有的機器人都是為人類服務的,都應該是服務機器人,區(qū)別在于服務不同行業(yè)的場景。比如在極端的場所,水上水下、包括帶電作業(yè)和航天操作等專業(yè)服務。
清華大學徐迎慶教授認為,服務機器人要能夠幫助人們解決一些生活中的問題。從用戶體驗來講,機器人要具備溝通和交流能力,甚至要能聽出語言中不同情感的區(qū)別。而且要有基本的五感,能夠聽、能夠看、能夠撫摸、能夠幫扶,包括有嗅覺的能力,能夠感知到屋里的氣味并做出應對。此外,機器人形態(tài)可以是多樣的,并不一定要像個人形,只要能完成任務就可以。
騰訊投資董事總經(jīng)理余海洋認為,從投資的角度劃分機器人通??词莟o B還是toC的,對機器人的定義通常更寬泛一些,更關注在一個具體場景中解決了什么核心問題,能否產(chǎn)生比較大的價值。
二、機器人的五感中,視覺、聽覺領先,嗅覺和觸覺的探索取得了一定成績丁漢院士認為,機器人目前最主要的感知是視覺。機器人的工業(yè)界應用大多涉及到手眼怎么協(xié)同;其次是力覺和觸覺,觸覺需要柔性電子的相關技術。未來隨著機器人的發(fā)展,這些功能會慢慢隨著問題牽引走向成熟。
騰訊研究院司曉院長認為,類比人的五感(看、聽、嗅、嘗、觸),機器人不僅能和我們對話,也可以繞過障礙物行走,這是聽和看的能力,而其他感覺系統(tǒng)大眾了解較少。包括現(xiàn)在流行的元宇宙基于設備對五官的欺騙和模擬,現(xiàn)在也是視覺最成熟,比如給大家做VR眼鏡,因為人的五官作為信號輸入,眼是最有效率的,大腦皮層90%是處理視覺信號的。
清華大學徐迎慶教授表示:現(xiàn)在人工智能應用最好的兩個領域應該在計算機視覺和自然語言處理(NLP)。究其原因,第一,數(shù)據(jù)量大,因為人工智能說來說去還是基于大數(shù)據(jù)的處理。第二,跟應用場景很有關系。相比之下,人們對嗅覺和味覺的研究還遠遠不夠,人類可以分辨成千上萬種氣味,嗅覺對人的感官體驗、記憶的認知有重要的影響。例如在家庭的應用當中,比如有時候家里忘記關火,飯菜被燒糊,有了嗅覺就可以自動監(jiān)控燃氣,包括洗碗機,如果沒有及時清理會產(chǎn)生味道,可以使用嗅覺技術來檢測并提醒用戶。另外,現(xiàn)在機器狗可以用在智慧安防方面,在機場很多的安檢的地方,警犬仍然起著非常重要的作用,而利用機器狗的嗅覺,TNT的檢測效率可以達到5.0ppb以下,成為人類的好幫手。此外,在觸覺方面,全世界視力受損人群有2.53億,其中有3600萬是全盲患者,我們國家2019年的數(shù)據(jù)大概有1763萬,其中有很多是兒童或者是青少年,清華大學未來實驗室為盲人做了一臺盲人專用計算機,配有性價比最好的高分辨觸覺終端,可以顯示高精度的觸感盲文和觸覺圖像,這個項目也入選了騰訊的技術公益計劃。
香港中文大學丁寧教授認為,在人工智能領域,視覺研究是最多的,這里面也有很多有意思的問題,比如視覺、聽覺、觸覺有什么關系。觸覺是手指頭上感知的能力,視覺是對光的感知,視覺背后的視網(wǎng)膜實際上也是一種敏感的皮膚。視覺、聽覺、觸覺都是對于信號能量的一種感知,如果他們的機理都差不多,多模態(tài)的感知機理就有可能統(tǒng)一起來,用一套計算架構做支撐。當前視覺方面也還有一些問題,比如現(xiàn)在都是立體的兩個眼睛往前看,為什么腦袋后面不長眼睛,讓觀察范圍更廣,也是由生物界進化下來的機制,因為我們有脖子,聽到后面有問題以后,會把脖子扭到后面去看,多長一個眼睛處理問題的話,可能生物的代價更大??傊?,機器人到最后始終是要干活的,要跟作業(yè)對象接觸的,是對環(huán)境做了感知并且建模,之后要把事情做的好,包括精細的操作,都是需要力的感知和觸覺的感知,如果這部分能有巨大的突破,對產(chǎn)業(yè)影響是非常大的。
張正友博士認為:計算機視覺發(fā)展好,是因為傳感器,即攝像頭存在的比較久,而且可以標準化,分辨率越來越高,噪聲越來越低,積累了很多的數(shù)據(jù),尤其是互聯(lián)網(wǎng)把很多數(shù)據(jù)積累起來了,從而去訓練圖像識別等。但是像觸覺,目前傳感器還沒有一個標準,嗅覺也是一樣的,這方面?zhèn)鞲衅鞯母兄芰δ壳斑€是缺乏的,這個必須要往前推進。既要從研究的角度,也要從業(yè)界工業(yè)的角度,怎么讓觸覺傳感器和嗅覺傳感器越來越靈敏、效果越來越好,很多人會投入到AI技術加上新的傳感器的能力,這樣一結合以后,人機共生會往前推進。
騰訊投資董事總經(jīng)理余海洋認為,視覺行業(yè)基礎和應用,行業(yè)做的比較好。很大程度上也得益于半導體和手機產(chǎn)業(yè)鏈的帶動,這個產(chǎn)業(yè)鏈里面有大企業(yè),有大量的資金進入,在各方面的資源投入上,都很多,促進了視覺的進步。
三、人工智能技術與機器人的結合是本世紀的重要命題騰訊研究院司曉院長認為,服務機器人要在非結構化復雜環(huán)境中,執(zhí)行比工業(yè)機器人更復雜的操作,因此對交互性和自主性更為看重。人工智能在其中扮演了重要角色,例如MIT現(xiàn)在有四足機器人跑得很快,AI訓練起到了很大的作用;騰訊Jamoca走的梅花樁,顯然有AI驅動在里面的。
丁漢院士認為, 根據(jù)國際上技術走向,如何把AI和機器人結合,可能是本世紀重要的技術突破點。機器人在上世紀是跟汽車的結合,到本世紀是跟AI的結合。需要三個賦予,要賦予機器人新的功能,賦予機器人更高性能,賦予機器人實現(xiàn)以前不能實現(xiàn)的目標??偨Y起來,AI要能夠推動機器人與人共融、與機器人共融、與環(huán)境共融。AI是推動機器人技術進步的動力,要賦予機器人新的功能、新的指標,一定要落實到機器人本體上,推動行業(yè)進步,例如3C行業(yè),新能源汽車行業(yè)是當前非常好的應用點。此外,AI的賦能也不能僅僅僅停留在算法層面。比如機器人磨航空葉片,老師傅的經(jīng)驗能不能移植到機器人上,AI每一點進步對機器人是突破性的,當然也是非常困難的,需要業(yè)界共同持續(xù)努力。
張正友博士認為:過去二三十年,AI在機器人領域發(fā)揮了決定性的作用,無論是自動駕駛,還是機器狗還是掃地機器人,包括清掃機器人送餐機器人,最重要的是計算機視覺的推動,因為有了視覺才能夠讓機器人自動地對環(huán)境重建,避開障礙物等。總體上看,機器人的核心技術可以用A2G來概括,剛好七個方向和七個技術點:“A”是人工智能AI,因為機器人必須要能看能聽能說能思考,“B”是機器人的本體,不同的機器人的本體能夠實現(xiàn)不同的能力;“C”是控制control,ABC構成了機器人的基礎能力層。在基礎之上,要繼續(xù)往前探討新方向,比如說“D”是發(fā)育學習(英文developmental learning),機器人跟人不一樣,人從出生開始就不斷嘗試各種機械的、學習的、社交的、情感的等等能力,持續(xù)升級,服務機器人也希望有一個進階的過程。“E”是EQ,要理解人的情感并做出相應的反應。“F”是靈巧操控,如果沒有靈巧操控,到后面服務機器人很難進入到人機共生階段的。最后,機器人智能化以后,再加上學習、情感和操控能力,可以跟環(huán)境交互、跟互聯(lián)網(wǎng)交互、跟其他機器人交互、跟人交互,到最后,服務機器人就變成我們的守護天使(G,guardian angel),比如我們離父母很遠,如果有一個機器人的話,即使出現(xiàn)什么狀況,機器人有時自己可以救助老年人,如果不行可以用合適的方式通知社區(qū)的護工或者是醫(yī)院等。
同時,張正友博士認為,服務機器將從自動化往智能化發(fā)展,可以用“SLAP”來概括。“S”代表感知,“L”代表學習,“A”代表執(zhí)行,“P”代表規(guī)劃。機器人的感知和行動之間是緊密相連的,這樣就可以實現(xiàn)反應式的自主。整個系統(tǒng)都需要有學習的能力,通過跟環(huán)境的交互,能力要不斷地提高,從失敗中學習,也要從成功當中學習。當機器人可以實現(xiàn)自主或者智能以后,機器人的應用就非常多了,比如復雜工藝的操作,老年人的陪伴護理等。騰訊機器人實驗室進一步做了分解,是三個支柱,第一個是靈敏運動,在平整和不平整的路面上,機器人可以穩(wěn)定地從一個地方運動到另外一個地方。第二是靈巧操作,要能夠完成一些物理的任務,比如扶老年人走路、喂老年人吃飯的能力,否則機器人的用處不是很大。第三是智能體,機器人需要能夠學習到高效的運動和協(xié)作能力,包括怎么針對復雜任務分解。
四、機器人續(xù)航能力提升、常識的學習,以及瞄準用戶剛需打透,是解決落地最后一公里的關鍵丁漢院士以康復機器人為例,列舉了幾大挑戰(zhàn):康復機器人至今很難實用,難點就在于一個是材料很笨重,第二是傳感技術不完備,第三個是微小電機等基礎零部件還不過關。電機是最偉大的發(fā)明,但也笨重;而人沒有電機,但做的事都很靈巧。第四,要實現(xiàn)真正的智能也很難,現(xiàn)在餐館送餐機器人等的應用環(huán)境還是比較簡單的,非結構化環(huán)境的處理能力不強,基本上還是半自主的。此外,如果大規(guī)模使用,還需要嚴格保障安全性,解決能源續(xù)航能力的問題,特別是在野外作業(yè)的條件下。未來服務機器人很大的增長點,還是跟人相關的康復、老年人護理,以及醫(yī)療手術方面,服務機器人研究要么有趣,要么有用。
丁寧教授介紹了早年做過的輸電線路上的機器人,能夠借助電磁場從里面獲取能源,長期生存在輸電上,自己解決“吃飯”的問題。背后的原理是通過磁場,形成了一個機器人跟作業(yè)場景的共生關系,其實就是無線充電。
張正友博士認為,電池的發(fā)展沒有摩爾定理,相對比較慢。騰訊的Robotics X Max多模態(tài)四足機器人足輪一體的設計,很大程度上也是基于節(jié)能的考慮。Max在崎嶇路面可以走動,平坦路面可以切換到輪子跑得更快,經(jīng)測算可以省電40%。此外,我們周圍有很多的無線電波,盡管能量比較弱,但隨著技術的進步,也可能成為一種能量的來源。此外,人機要實現(xiàn)共生,還有一個是做到零部件的輕量化,目前的電機功率密度比以前高了很多了,如果把電機裝在機械臂上還是很笨重,怎么讓電機輕量化,這是工藝上面需要有突破。另外有沒有可能在設計新東西的時候,比如電機,有沒有可能跟機械臂整體思考,并不是說這邊有人做電機了這邊有機械臂加起來就變成機械臂了,如果可以在機械臂上加上一些電機的能力,說不定就可以輕量化了。此外還有問題是,從工業(yè)化和商業(yè)角度來看,目前機器人的量不夠大,就很少人愿意花成本做工藝的創(chuàng)新,但是這個工作必須要做,需要有創(chuàng)新性的硬件和軟件,以及軟硬結合的系統(tǒng)性的思考。
騰訊投資董事總經(jīng)理余海洋認為,從投資的角度來講,還是非常關注落地和商業(yè)化的,是一個需求和供給碰撞的過程。電池的發(fā)展很大程度上受益于電動車行業(yè)的發(fā)展,有很多的資金和人才在里面做研究。
丁寧教授認為,現(xiàn)在深度學習的算法效果已經(jīng)很好了,但是對于常識的表述、傳承、表達的方法,現(xiàn)在還有挑戰(zhàn)。人有很多常識的能力積累下來,比如學校里面貼一個標語“學校食堂開放歡迎新老師生前來就餐”,但是也可以用另外的斷句“歡迎新老師,生前來就餐”。但為什么大部分人,會很快把歧義過濾掉?因為人有常識。再舉一個例子,假設你們家有服務機器人,你跟他一起幫小孩洗澡,你跟機器人說“洗完澡以后記得把水倒了”。機器人的做法很可能是把小孩洗干凈,把盆端起來,連水帶里面的小孩一起倒了,因為你跟它溝通的時候漏掉一個重要的信息,把小孩洗完擦干以后,把小孩抱出來,再把水倒了,為什么把關鍵的信息跳過去?這是常識,默認你知道的。人可以理解小孩和水,以及倒水這個動作的衍生的所有內(nèi)容,所以會把這些關鍵信息跳過去,是為了加快效率。這些常識是人理解環(huán)境和自然整個運作機理很關鍵的內(nèi)容,但怎么讓機器理解,是一個挑戰(zhàn),不是簡單讓它背一個公式就可以的。
此外,服務機器人的落地,還需要解決最后一公里的問題。騰訊投資董事總經(jīng)理余海洋講到,優(yōu)秀的服務機器人公司,需要對特定的場景有比較深刻的理解。比如商務清潔,要打掃地下停車場的時候,要預設到有地下停車減速帶的停車場,機器人怎么通過這些減速帶。在廣場也好,在商超也好,在辦公室也好,在酒店也好,地面和空間的構造,以及需要清潔的污染物其也不一樣,這就需要提供不同的打掃的能力,還要跟商超、酒店、廣場也好整個管理體系和運營體系做好協(xié)作和配合,梳理形成好的流程。
此外,服務機器人的發(fā)展也還需要漸進式的優(yōu)化。比如老齡化是非常大的需求,但缺乏供給的解決方案,如果可以在供給方面有一點提升,就可以產(chǎn)生比較大的商業(yè)價值。要把大的需求切分成小需求,先一個一個解決小的需求,機器人可能沒有辦法一下代替保姆護工,但是能不能把東西拆分出來看一下,有沒有更好的方式實現(xiàn)。人形的設計本身是很有挑戰(zhàn)的事情,我們現(xiàn)在看到更多的是四輪的在各個地方跑,無論是在路上跑還是家里跑,在實際過程當中需要考慮需求是什么,需求有多大有多剛需,這個需求能否切出來,從標準化容易做的方面來做,同時要考慮供給方面方案是否對比其他的方案有優(yōu)勢,如果有優(yōu)勢能否形成正向化的產(chǎn)業(yè)和滾動,這樣可以慢慢在發(fā)展過程當中解決問題。我們在實際不同場景當中,看看可以優(yōu)先解決哪些問題,包括通過資金注入來支持創(chuàng)業(yè)者持續(xù)迭代優(yōu)化。
徐迎慶教授認為用戶體驗是非常重要的。業(yè)界總講一個笑話,某人手里拿了一把錘子,他看到處都是釘子。這個是不對的。因此,我們要看到用戶的剛需是什么。高科技不一定是新科技,某些新科技也不一定是現(xiàn)階段可以滿足我們剛需的東西。
最后,騰訊研究院司曉院長介紹,通過騰訊新聞做了一個調研,很多網(wǎng)友都關注隱私和就業(yè)替代問題。比如之前方倉醫(yī)院在上海日薪開到1800-2000都招不到人,不得以用了機器人,當服務機器人大范圍地進入到我們的生活場景當中時,也會有就業(yè)替代。機器人還可以從病人散發(fā)的氣味能夠識別病情,是非接觸式的,這在醫(yī)院場景做檢查是OK的,但如果是聯(lián)網(wǎng)的機器人,就會有隱私問題。這些都需要產(chǎn)業(yè)界共同探討,合理解決。
人機協(xié)同無疑是大勢所趨,讓機器服務于人,而非替代人,是初心和方向。面對人與機器人的多重互動關系,業(yè)界更需要堅持向善向上,讓技術變得更可解釋、更可信和更安全,讓技術去增強人的能力,服務人的需求,共同創(chuàng)造更多人機協(xié)作的美好未來。