人工智慧開(kāi)啟了新一代機(jī)器人技術(shù) Robotics 2.0,最大改變是從原先人工編寫(xiě)程式而來(lái)的自動(dòng)化,邁向了真正的自主學(xué)習(xí)。本文將嘗試揭開(kāi)人工智慧(AI)應(yīng)用的神秘面紗,協(xié)助讀者瞭解 AI 機(jī)器人將如何影響我們的未來(lái),并釐清我們常常聽(tīng)到,但卻著墨不多、甚至根本尚未全然理解的主題。
本文為「Robotics 2.0」系列文章的第一篇,講述機(jī)器人技術(shù)與 AI 對(duì)于各大產(chǎn)業(yè)和未來(lái)工作的影響。我們將討論 AI 將如何釋放機(jī)器人技術(shù)的潛力,這項(xiàng)新技術(shù)的挑戰(zhàn)和機(jī)會(huì),以及這一切將如何影響我們的生產(chǎn)力、就業(yè)狀況、甚至日常生活。在人工智慧被大肆宣傳的當(dāng)下,我們希望透過(guò)這些文章鼓勵(lì)更有建設(shè)性和全面性的探討。
重新定義機(jī)器人:揭開(kāi)次世代 AI 機(jī)器人 Robotics 2.0 的神秘面紗
提到機(jī)器人,我們總有各式各樣天馬行空的想像:從 Softbank(軟銀集團(tuán))的社交機(jī)器人 Pepper、能輕松后空翻的 Boston Dynamics 公司機(jī)器人 Atlas、《魔鬼終結(jié)者》(Terminator)系列電影的人造人殺手,到電視影集《西方極樂(lè)園》(West World)中隨處可見(jiàn)、栩栩如生的擬真機(jī)器人角色。
我們常常聽(tīng)到兩極化的觀點(diǎn);有些人傾向高估機(jī)器人模仿人類(lèi)的能力,認(rèn)為機(jī)器終將取代人類(lèi),有些人則對(duì)新研究和技術(shù)的潛力太過(guò)悲觀。
在過(guò)去一年之中,許多創(chuàng)業(yè)、科技、新創(chuàng)業(yè)界的朋友都曾問(wèn)過(guò)我,在 AI,尤其是深度強(qiáng)化學(xué)習(xí)和機(jī)器人技術(shù)的領(lǐng)域,究竟有哪些「實(shí)際」進(jìn)展?
令人最為好奇的是:
AI 機(jī)器人和傳統(tǒng)機(jī)器人有什么不一樣?AI 機(jī)器人是否真有顛覆各大產(chǎn)業(yè)的潛力?它的能力和限制又是什么?
看來(lái),想要瞭解現(xiàn)在的技術(shù)進(jìn)步和產(chǎn)業(yè)格局,是出乎意料的困難,更不用說(shuō)要對(duì)未來(lái)做出預(yù)測(cè)。藉由這篇文章,我嘗試揭開(kāi)人工智慧應(yīng)用于機(jī)器的神秘面紗,釐清這個(gè)我們常常聽(tīng)到,但卻著墨不多、或根本未全然理解的主題。
首先必須回答的基本問(wèn)題:什么是 AI 機(jī)器人(AI-enabled Robotics)?它們又有什么獨(dú)特之處?
機(jī)器人演進(jìn):從自動(dòng)化到自主化
「機(jī)器學(xué)習(xí)解決了以往『對(duì)電腦困難,對(duì)人來(lái)說(shuō)卻容易』的各種問(wèn)題,或以更容易理解的方式來(lái)說(shuō),就是解決了『人類(lèi)很難讓電腦也理解』的問(wèn)題?!?/div>
— — Benedict Evans,安霍創(chuàng)投(a16z)
AI 所造就的機(jī)器人技術(shù)領(lǐng)域,最大成果是從原先的「自動(dòng)化」(工程師藉由程式設(shè)計(jì)編寫(xiě)規(guī)則,讓機(jī)器人遵守)邁向了真正的「自主學(xué)習(xí)」。
如果機(jī)器人只需要處理一件事情,那么,它到底有沒(méi)有人工智慧,差別其實(shí)看不出來(lái);但是,如果機(jī)器人需要處理各式各樣的任務(wù)、或是回應(yīng)人類(lèi)與環(huán)境的變化,就需要一定程度的自主性才能勝任。
我們不妨借用下列不同等級(jí)的自駕車(chē)定義,一併解釋機(jī)器人的演變:
Level 0 — 無(wú)自動(dòng)化:由人類(lèi)操作機(jī)器,沒(méi)有機(jī)器人的參與。(機(jī)器人的普遍定義,是指有能力自行從事復(fù)雜動(dòng)作的可程式化擬人機(jī)械)。
Level 1 — 單一自動(dòng)化運(yùn)作:?jiǎn)我还δ芤炎詣?dòng)化,但不使用環(huán)境資訊。這是自動(dòng)化與制造業(yè)中傳統(tǒng)的機(jī)器人使用現(xiàn)況。透過(guò)程式編輯,機(jī)器人能夠以高精度與速度重復(fù)執(zhí)行特定工作;但直至目前為止,多數(shù)實(shí)際運(yùn)用的機(jī)器人都無(wú)法感知或應(yīng)變環(huán)境的變化。
Level 2 — 部分自動(dòng)化:透過(guò)環(huán)境感知所輸入的特定功能,協(xié)助機(jī)器進(jìn)行決策。例如某些機(jī)器人透過(guò)視覺(jué)感應(yīng)器,識(shí)別并應(yīng)付不同的對(duì)象:然而,傳統(tǒng)的電腦視覺(jué),需要對(duì)每個(gè)對(duì)象進(jìn)行預(yù)先登記和清楚的指示,且機(jī)器人還是缺乏處理變更、意外狀況、或是新對(duì)象的能力。
Level 3 — 條件式自主:機(jī)器控制了所有的環(huán)境監(jiān)控行為,但仍需要人為檢查關(guān)注與(即時(shí))介入。
Level 4 — 高度自主:在某些情況下、或是定義的區(qū)域內(nèi)完全自主。
Level 5 — 完全自主:在任何狀況下均可完全自主,不需人為介入。
我們現(xiàn)在處于哪一種自主等級(jí)呢?
現(xiàn)在,工廠里多數(shù)機(jī)器人都是透過(guò)開(kāi)放式迴路、或是非回饋方式予以控制。這意味著它們的運(yùn)作與感測(cè)器回饋各自獨(dú)立、彼此互不影響(level 1)。
少數(shù)在工廠中的機(jī)器人,會(huì)根據(jù)感測(cè)器回饋而調(diào)整操作(level 2);此外還有協(xié)作型機(jī)器人(cobot),他們的操做更加簡(jiǎn)單安全,因此能與人類(lèi)共同作業(yè)。然而,相較于產(chǎn)業(yè)用機(jī)器人,這種機(jī)器人的精確度和速度卻相形失色。另外,雖然協(xié)作型機(jī)器人的程式化相對(duì)簡(jiǎn)單,但它們?nèi)匀徊痪哂凶灾鲗W(xué)習(xí)性;每當(dāng)工作內(nèi)容或環(huán)境有所變動(dòng)時(shí),就需要由人類(lèi)手動(dòng)引導(dǎo)協(xié)作機(jī)器人進(jìn)行調(diào)整,或是重新編寫(xiě)程式,機(jī)器本身無(wú)法自主舉一反三,彈性應(yīng)變。
深度學(xué)習(xí)(Deep Learning)和強(qiáng)化學(xué)習(xí)(Reinforcement Learning)能幫助機(jī)器人自主處理各種物件,將人類(lèi)的介入程度降到最低。
我們已經(jīng)開(kāi)始看到一些使用 AI 機(jī)器人(level 3/4)的前導(dǎo)試行專(zhuān)案,例如「?jìng)}儲(chǔ)揀貨」就是一個(gè)很好的例子。在貨運(yùn)倉(cāng)庫(kù)中,員工需要根據(jù)客戶(hù)需求,將數(shù)百萬(wàn)種不同的產(chǎn)品放入箱子里。傳統(tǒng)的電腦視覺(jué)沒(méi)辦法處理如此廣泛的物品類(lèi)別,因?yàn)槊總€(gè)物品都需要事先登錄、并針對(duì)機(jī)器人需要採(cǎi)取的動(dòng)作,先進(jìn)行程式設(shè)計(jì)。
然而,現(xiàn)在由于深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)技術(shù),機(jī)器人能夠開(kāi)始自主學(xué)習(xí)處理各種物件,降低人類(lèi)的介入程度。在機(jī)器人的學(xué)習(xí)過(guò)程中,可能會(huì)出現(xiàn)它未曾遇過(guò)的某些貨品,而需要人類(lèi)的協(xié)助或示范(level 3)。但是,隨著機(jī)器人搜集更多的資料、從試驗(yàn)和錯(cuò)誤中學(xué)習(xí)(level 4),演算法也將日益改善,邁向完全自主。
就像自駕汽車(chē)產(chǎn)業(yè)一樣,機(jī)器人新創(chuàng)公司也採(cǎi)取了不同的策略:有些公司看好人類(lèi)和機(jī)器人之間的合作,專(zhuān)注于 level 3 的研發(fā);有些公司則相信,機(jī)器終將實(shí)現(xiàn)真正的完全自主,于是他們跳過(guò) level 3,直接著眼于 level 4、甚至到 level 5。
這也是為什么我們很難評(píng)估現(xiàn)在產(chǎn)業(yè)自主程度的原因之一。
新創(chuàng)公司有可能自稱(chēng)致力于研究 level 3/4 的自主系統(tǒng),但實(shí)際上卻是大量委外,以人工遠(yuǎn)端操控機(jī)器。在無(wú)法了解其內(nèi)部軟體及 AI 產(chǎn)品發(fā)展程度的前提下,光從機(jī)器外觀看不出遠(yuǎn)端操控和自主學(xué)習(xí)的差別。另一方面,目標(biāo)為 level 4/5 的新創(chuàng)公司,萬(wàn)一無(wú)法在短時(shí)間取得理想結(jié)果,可能反而降低了客戶(hù)的早期採(cǎi)用意愿、并導(dǎo)致早期階段的資料搜集更加困難。
在本文的后半部分,我將進(jìn)一步討論新創(chuàng)公司的不同的商業(yè)策略思考。
AI 機(jī)器人的崛起:運(yùn)用范圍不再侷限于倉(cāng)儲(chǔ)管理
有趣的是,機(jī)器人的人工智慧應(yīng)用潛能甚至高于無(wú)人車(chē),因?yàn)闄C(jī)器人有各式各樣的應(yīng)用與產(chǎn)業(yè),因此從某種意義上說(shuō),機(jī)器人理當(dāng)比汽車(chē)更容易實(shí)現(xiàn) level 4 目標(biāo)。
AI 機(jī)器手臂開(kāi)始在倉(cāng)庫(kù)中被採(cǎi)用,就是最好的例子。因?yàn)閭}(cāng)庫(kù)屬于「半受控」的環(huán)境,不確定性相對(duì)低。另外,揀貨作業(yè)雖然關(guān)鍵、但能容許錯(cuò)誤。
至于自主居家型或手術(shù)機(jī)器人,則要等到更遙遠(yuǎn)的未來(lái)才能實(shí)現(xiàn);畢竟相關(guān)環(huán)境的變數(shù)更多,且有些任務(wù)具備不可逆性,以及一定程度的危險(xiǎn)性。但是,可以預(yù)見(jiàn)的是,隨著技術(shù)精度、準(zhǔn)確性、可靠性的與時(shí)俱進(jìn),我們將看到更多產(chǎn)業(yè)採(cǎi)用 AI 機(jī)器人。
許多產(chǎn)業(yè)還沒(méi)有使用機(jī)械手臂,主要原因在于傳統(tǒng)機(jī)器人和電腦視覺(jué)的限制。
目前世界上只有大約 300 萬(wàn)臺(tái)機(jī)器手臂,其中大多數(shù)從事搬運(yùn)、焊接、裝配等任務(wù)。到目前為止,除了汽車(chē)業(yè)和電子業(yè)以外,倉(cāng)儲(chǔ)、農(nóng)業(yè)和其他產(chǎn)業(yè),幾乎都還沒(méi)有開(kāi)始使用機(jī)械手臂;主要原因,就在于上述傳統(tǒng)機(jī)器人和電腦視覺(jué)的限制。
在接下來(lái)的幾十年中,隨著深度學(xué)習(xí)(DL)、強(qiáng)化學(xué)習(xí)(RL)、以及云端技術(shù)釋放出的機(jī)器人潛力,我們將看到新一代機(jī)器人帶來(lái)的爆炸式增長(zhǎng)、并改變產(chǎn)業(yè)格局。其中,AI 機(jī)器人的成長(zhǎng)契機(jī)有哪些?新創(chuàng)公司和現(xiàn)有業(yè)者,又採(cǎi)取了哪些不同的方法和商業(yè)模式,來(lái)因應(yīng)新科技帶來(lái)的變化?
新世代 AI 機(jī)器人新創(chuàng)公司產(chǎn)業(yè)概況
接下來(lái),我會(huì)介紹不同市場(chǎng)區(qū)隔中的幾間范例公司。這樣的概略介紹,當(dāng)然無(wú)法涵蓋所有企業(yè)的狀況;歡迎你提供其他公司及應(yīng)用案例,一起讓內(nèi)容更加完備。

AI/Robotics 新創(chuàng)公司市場(chǎng)概況
研究新世代機(jī)器人新創(chuàng)產(chǎn)業(yè)結(jié)構(gòu),可以看到兩種截然不同的商業(yè)模式:垂直應(yīng)用與水平應(yīng)用。
1. 垂直應(yīng)用
第一種是垂直應(yīng)用:硅谷當(dāng)?shù)囟鄶?shù)的新創(chuàng)公司,專(zhuān)注于為特定的垂直市場(chǎng)開(kāi)發(fā)解決方案;如電子商務(wù)物流、制造業(yè)、農(nóng)業(yè)等等。
這種提供完整解決方案的作法相當(dāng)合理,畢竟相關(guān)技術(shù)還處于萌芽階段;公司不依賴(lài)他人提供關(guān)鍵模組或元件,而是建構(gòu)端對(duì)端的解決方案。這種垂直整合的解決方案能更快進(jìn)入市場(chǎng),也能確保公司更全面掌握終端使用者的案例與效能表現(xiàn)。
但是,要找到像「?jìng)}庫(kù)分揀」這樣相對(duì)容易實(shí)現(xiàn)的應(yīng)用案例,則沒(méi)有那么容易。倉(cāng)庫(kù)揀貨是相對(duì)簡(jiǎn)單的工作,客戶(hù)的投資意愿與技術(shù)可行性都較高,而且每個(gè)倉(cāng)庫(kù)幾乎都有相同的揀貨需求。
但在其他產(chǎn)業(yè)(如制造業(yè))中,裝配任務(wù)可能因工廠而各不相同;另外,在制造業(yè)中執(zhí)行的任務(wù),也需要更高的精度和速度,技術(shù)上相對(duì)困難。
目前具有學(xué)習(xí)能力的機(jī)器人,仍無(wú)法達(dá)到與封閉迴路機(jī)器人相同的精度。
盡管機(jī)器學(xué)習(xí)能讓機(jī)器人與時(shí)俱進(jìn),但目前透過(guò)機(jī)器學(xué)習(xí)運(yùn)作的機(jī)器人,仍無(wú)法達(dá)到與封閉迴路機(jī)器人相同的精度,因?yàn)樗枰鄯e嘗試錯(cuò)誤的經(jīng)驗(yàn),從錯(cuò)誤中學(xué)習(xí),逐漸進(jìn)步。
這點(diǎn)說(shuō)明了為什么 Mujin 和 CapSen 機(jī)器人這樣的新創(chuàng)公司,并未採(cǎi)用深度強(qiáng)化學(xué)習(xí),反而選擇使用傳統(tǒng)電腦視覺(jué)。
然而,傳統(tǒng)電腦視覺(jué)要求每個(gè)物件都要事先登錄,終究還是缺乏擴(kuò)充和適應(yīng)變化的能力。一旦深度強(qiáng)化學(xué)習(xí)(DRL)達(dá)到了效能門(mén)檻、逐步成為產(chǎn)業(yè)主流,這種傳統(tǒng)方法終究會(huì)變得無(wú)用武之地。
此外,這些新創(chuàng)公司的另一個(gè)問(wèn)題,在于它們的價(jià)值往往遭到高估。我們經(jīng)??吹?,新創(chuàng)公司在硅谷籌集了數(shù)千萬(wàn)美元資金,卻無(wú)法承諾創(chuàng)造出任何真正具體的收入流。
對(duì)于創(chuàng)業(yè)者來(lái)說(shuō),「描繪」深度強(qiáng)化學(xué)習(xí)的美好未來(lái),再容易也不過(guò)了;但現(xiàn)實(shí)則是,我們還需要數(shù)年的時(shí)間才能達(dá)到如此的成果。盡管這些公司離創(chuàng)造獲利還有一段距離,硅谷的創(chuàng)投仍愿意繼續(xù)押寶在這些人才優(yōu)秀、技術(shù)先進(jìn)的團(tuán)隊(duì)上。
2. 水平應(yīng)用
另一方面,水平應(yīng)用則是更實(shí)用、卻比較罕見(jiàn)的模式。我們可以簡(jiǎn)單將機(jī)器人技術(shù)簡(jiǎn)化為感測(cè)(輸入)、處理、驅(qū)動(dòng)(輸出)三個(gè)部分;除此之外,還有開(kāi)發(fā)工具。(這里使用的「處理」一詞,同時(shí)概略涵蓋了控制器、機(jī)器學(xué)習(xí)、作業(yè)系統(tǒng)和機(jī)器人模組等等,各種不屬于感測(cè)或驅(qū)動(dòng)的其他項(xiàng)目。)
我認(rèn)為未來(lái),這個(gè)領(lǐng)域?qū)⒆罹咴鲩L(zhǎng)潛力。對(duì)于機(jī)器人的用戶(hù)來(lái)說(shuō),破碎而零細(xì)的市場(chǎng)是棘手的問(wèn)題;因?yàn)樗械臋C(jī)器人制造商,都各自推展自家開(kāi)發(fā)的語(yǔ)言和介面,使得系統(tǒng)整合商與終端使用者,都很難將機(jī)器人與相關(guān)系統(tǒng)進(jìn)行整合。
隨著產(chǎn)業(yè)的逐漸成熟,有越來(lái)越多機(jī)器人應(yīng)用到了汽車(chē)和電子廠以外的領(lǐng)域;因此我們更加需要標(biāo)準(zhǔn)的作業(yè)系統(tǒng)、通訊協(xié)定、介面,從而提高效率、并縮短上市時(shí)間。
舉例來(lái)說(shuō),美國(guó)波士頓的幾家新創(chuàng)公司正在研究相關(guān)的模組;例如 Veo Robotics 公司開(kāi)發(fā)的安全模組,能讓工業(yè)機(jī)器人更安全地和人類(lèi)協(xié)同工作;Realtime Robotics 公司則提供加速了機(jī)械手臂路徑的解決方案。
更多>相關(guān)資訊
0 條相關(guān)評(píng)論