「健全的心靈寓于強(qiáng)健的體魄?!梗∕ens sana in corpore sano)
在極客公園 Rebuild 2018 科技商業(yè)峰會(huì)的現(xiàn)場(chǎng),兼任加州理工學(xué)院計(jì)算機(jī)與數(shù)學(xué)科學(xué)教授和亞馬遜 AWS 首席科學(xué)家的 Animashree Anandkumar 用這句拉丁諺語表達(dá)了她對(duì)人工智能行業(yè)未來的期待。
Anandkumar 教授所說的「心靈和體魄」,分別指的是人工智能的系統(tǒng)和機(jī)器硬件。
舉例來說,人工智能系統(tǒng)包括亞馬遜搭載在智能音箱平臺(tái)上的語音助手 Alexa,以及 Google Assistant 等等。而機(jī)器的硬件則包括無人車、機(jī)器人等等。只有當(dāng)兩者相互匹配時(shí),人工智能才能最大限度地發(fā)揮作用,體現(xiàn)真正的「智能」。
暢想中的未來足夠樂觀,但在達(dá)到那個(gè)理想目標(biāo)之前,人工智能行業(yè)還有著亟待補(bǔ)足的短板,而攻克這些前沿的技術(shù)問題,需要的是另外兩樣?xùn)|西的結(jié)合:學(xué)界和產(chǎn)業(yè)界。
而今天的焦點(diǎn),Animashree Anandkumar 教授本人的職業(yè)生涯,就是這兩者結(jié)合的最佳體現(xiàn)。
走進(jìn)產(chǎn)業(yè)的學(xué)界大牛
Anandkumar 教授先后以從康奈爾大學(xué)和麻省理工學(xué)院以博士和博士后的身份畢業(yè),隨后加入加州大學(xué)歐文分校任助理教授,在長(zhǎng)達(dá)數(shù)十年的學(xué)術(shù)生涯里,出身印度學(xué)術(shù)家庭、極具數(shù)學(xué)天分的她在學(xué)界贏得了無數(shù)榮譽(yù),成為了機(jī)器學(xué)習(xí)圈舉足輕重的人物。
或許正是因?yàn)樵趯W(xué)界的突出表現(xiàn)吸引到了亞馬遜的注意,2016 年 10 月,她從加州大學(xué)歐文分校休假,加入亞馬遜擔(dān)任亞馬遜云服務(wù) AWS 的首席科學(xué)家(Principle Scientist)。
這一消息在一向與產(chǎn)業(yè)界頗有分歧的學(xué)界引起了不小的振動(dòng),更有趣的是,在 Anandkumar 教授加入亞馬遜消息曝出的同時(shí),著名華裔人工智能學(xué)者李飛飛也宣布加入 Google Cloud 擔(dān)任首席科學(xué)家,兩位學(xué)界大牛突然宣布暫時(shí)離開學(xué)校加入科技公司,這一消息在 2016 年秋天將要結(jié)束的時(shí)候,點(diǎn)燃了人們對(duì)產(chǎn)業(yè)界人工智能的希望。
橋接產(chǎn)業(yè)和學(xué)界的鴻溝
「當(dāng)我還在學(xué)校念書的時(shí)候,我從沒想過人工智能能夠發(fā)展得如此之快,那時(shí)候我知道人工智能會(huì)是一個(gè)非常具有挑戰(zhàn)性的學(xué)科,我知道這會(huì)是我終身的事業(yè),正因如此,我才選擇了人工智能(作為職業(yè))?!笰nandkumar 在 Rebuild 2018 科技商業(yè)峰會(huì)接受極客公園的專訪時(shí)說道,「但除了基礎(chǔ)研究之外,我還希望這些技術(shù)能夠真正觸達(dá)外面的世界,融入人們?nèi)粘J褂玫漠a(chǎn)品之中。」在 AWS,她希望能夠?qū)崿F(xiàn)大規(guī)模的機(jī)器學(xué)習(xí)應(yīng)用,讓更多并非精通機(jī)器學(xué)習(xí)技術(shù)的人們能夠用上機(jī)器學(xué)習(xí)的工具。
在研究理論和使用機(jī)器學(xué)習(xí)技術(shù)真正產(chǎn)出產(chǎn)品之間,存在著巨大的鴻溝,學(xué)術(shù)研究時(shí)期,Anandkumar 發(fā)現(xiàn)了這點(diǎn),而加入亞馬遜,推動(dòng)機(jī)器學(xué)習(xí)在 AWS 上的應(yīng)用,正是她所認(rèn)為能夠縮小這條鴻溝的方法。
提到「縮小鴻溝」,Anandkumar 教授對(duì)極客公園表示,她在亞馬遜帶領(lǐng)團(tuán)隊(duì)從事的 AI 研究正是建立在她在學(xué)界的相關(guān)研究基礎(chǔ)上的,「這給我一種在現(xiàn)實(shí)世界里做 AI 研究的感覺,」她說道。
加入亞馬遜之后,Anandkumar 教授并沒有放棄她在學(xué)界的研究,相反,她在 2017 年接受了人工智能領(lǐng)域泰斗云集的頂級(jí)學(xué)府加州理工大學(xué)的邀請(qǐng),成為該校計(jì)算機(jī)與數(shù)學(xué)科學(xué)的教授。在加州理工,Anandkumar 教授以核心成員的身份參與了一個(gè)名為「CAST」的自動(dòng)化機(jī)器人開源項(xiàng)目,「我們用上了很多亞馬遜 AWS 的技術(shù),在研究中進(jìn)行基礎(chǔ)的 AI 訓(xùn)練,」她說道,反過來用人工智能加速 AI 的前沿研究,在 Anandkumar 教授看來,這是她橋接兩者之間鴻溝的方式,「所以對(duì)我而言,兩者不會(huì)有太多的區(qū)別?!?/p>
在極客公園 Rebuild 2018 科技商業(yè)峰會(huì)的現(xiàn)場(chǎng),Anandkumar 教授發(fā)表了題為《「云上的 AI」如何引爆創(chuàng)新突破點(diǎn)?》的主題演講。在演講中,學(xué)者身份的她聊起了許多時(shí)下最為熱門的機(jī)器學(xué)習(xí)技術(shù)的研究進(jìn)展,另一方面,作為 AWS「技術(shù)布道者」的她也介紹了人工智能目前在亞馬遜各條業(yè)務(wù)線中的應(yīng)用,以及在她眼里,未來真正智能的機(jī)器會(huì)有著怎樣的模樣。
以下是 Animashree Anandkumar 在極客公園 Rebuild 2018 科技商業(yè)峰會(huì)上的演講實(shí)錄(經(jīng)過極客公園編輯,略有刪減):
感謝大會(huì)主辦方為我們提供這么多的支持,包括成都市長(zhǎng)和副市長(zhǎng)也參與了今天的會(huì)議,參加了今天的的開幕式。我們可以看到成都對(duì)于 AI 的發(fā)展以及教育非常的重視。今天在這里,我想跟大家簡(jiǎn)單地介紹一下 AI 人工智能到底是什么,以及我在亞馬遜和加州理工學(xué)院分別從事的工作,以及未來人工智能的發(fā)展方向。
什么是真正的「智能」
我們都知道現(xiàn)在很多科技產(chǎn)品都會(huì)使用人工智能 AI 這個(gè)詞,但到底是什么智能?接下來我想要給大家播放兩個(gè)小的短片,大家可以看一下其中哪一個(gè)更符合「智能」的定義。
可能有一些人不知道,這個(gè)是波士頓動(dòng)力公司的機(jī)器人,他在做一個(gè)非常復(fù)雜的后空翻的動(dòng)作,我們可以看到做得非常的精彩。這個(gè)是智能嗎?
讓我們?cè)賮砜戳硗庖粋€(gè)短片,這是人類最好的朋友,一只小狗。這只狗也在試圖做一個(gè)后空翻,但是并沒有成功。
所以大家覺得這兩個(gè)視頻哪一個(gè)符合智能的定義?有多少人覺得機(jī)器人是更智能的?有多少人覺得狗是更智能的?
實(shí)際上,相比于機(jī)器人,小狗的行為更符合「智能」的定義。為什么呢?對(duì)于智能而言,智能所指的并不是要做一些非常復(fù)雜的動(dòng)作,相反,智能所指的是一種可以用于獲取知識(shí)和應(yīng)用技能的能力。我們可以去認(rèn)知周圍的環(huán)境和世界,然后會(huì)根據(jù)世界的變化去動(dòng)態(tài)地調(diào)整我們自己的行為。所以說小狗的行為更符合「智能」的定義,因?yàn)樗鼈儠?huì)了解人的一些情緒,然后成為了人最好的朋友。但是我們的機(jī)器人完全是靠程序驅(qū)動(dòng)的,哪怕是他做的那個(gè)非常復(fù)雜的后空翻,但是這個(gè)動(dòng)作本身是由程序控制的。而且這個(gè)程序是不可變的,除非我們改變程序,才能讓它做到一些其他的事情。所以從「智能」的概念出發(fā),即使它是一個(gè)非常復(fù)雜的機(jī)器人,但它始終不是智能。
當(dāng)我們?cè)谡務(wù)撊斯ぶ悄艿臅r(shí)候,我們所指的就是「對(duì)數(shù)據(jù)進(jìn)行學(xué)習(xí)」,且「基于這種學(xué)習(xí)來做出決策」的能力。這是「以任務(wù)為導(dǎo)向」的人工智能,它可以做一些比較復(fù)雜的任務(wù),比如說它可以識(shí)別一些物體或者是圖片,但是我們所說的通用人工智能,指的是人類等級(jí)的認(rèn)知以及智能水平。所以有的時(shí)候我們對(duì)「人工智能」以及「認(rèn)知導(dǎo)向的智能」這兩個(gè)概念上會(huì)產(chǎn)生一些疑惑,這里我會(huì)先厘清這兩者。
剛才我們說了什么是人工智能,那么人工智能包括什么?實(shí)際上人工智能有三大要素,第一個(gè)要素是 AI 的核心,也就是算法。我們需要合適的算法來進(jìn)行學(xué)習(xí)以及決策。另外兩個(gè)也很重要,那就是數(shù)據(jù)和基礎(chǔ)設(shè)施。
實(shí)際上在 80、90 年代的時(shí)候,我們當(dāng)時(shí)就經(jīng)歷過人工智能的風(fēng)潮,當(dāng)時(shí)大家都非常欣喜地看到人工智能的出現(xiàn),但是并沒有成功推廣開來。因?yàn)楫?dāng)時(shí)我們沒有互聯(lián)網(wǎng)設(shè)施,沒有足夠的數(shù)據(jù)來訓(xùn)練人工智能的模型。但是現(xiàn)在人工智能的浪潮變得更加的強(qiáng)勁了,而且我們現(xiàn)在有了很多的超級(jí)電腦,比過去要強(qiáng)很多。所以說我們的這些基礎(chǔ)設(shè)施對(duì)于人工智能的發(fā)展非常的重要。
我們現(xiàn)在在 AI 領(lǐng)域已經(jīng)有了很多的數(shù)據(jù)支持,所以開發(fā)者如果希望想要把 AI 帶到一個(gè)新的領(lǐng)域,首先要考慮的就是數(shù)據(jù),因?yàn)楹芏鄷r(shí)候,如果你想要開發(fā)一個(gè) AI 工具,就需要用很多的數(shù)據(jù)培養(yǎng)它。
亞馬遜在用 AI 做什么
剛才提到了我有兩份工作,一方面是產(chǎn)業(yè),一方面是學(xué)界。一方面我是亞馬遜的首席科學(xué)家,也是加州理工學(xué)院的教授,我也希望可以更好的將學(xué)界和產(chǎn)業(yè)之間的空缺嫁接起來。亞馬遜對(duì)于 AI 應(yīng)用有非常悠久的歷史,基本上都會(huì)有人工智能的使用,我們有個(gè)性化的推薦,大家可以在亞馬遜的軟件上使用這種個(gè)性的推薦,我們也會(huì)使用 AI 來進(jìn)行供應(yīng)鏈以及庫(kù)存的管理。我們會(huì)進(jìn)行一些預(yù)測(cè),哪些產(chǎn)品會(huì)成功,哪些不會(huì),而這個(gè)對(duì)于管理我們的供應(yīng)鏈?zhǔn)欠浅V匾摹?/p>
除此之外,我們也有更多新的計(jì)劃,比如智能音響(AI 助手),可能很多人家里都有 Echo 音箱了。這種個(gè)性化的助手在未來可能會(huì)變得非常的流行?,F(xiàn)在我們可以給出語音指令,與 AI 助手進(jìn)行無縫的互動(dòng)。
最近的一個(gè)項(xiàng)目就是 Amazon Go,這是一種跟在商店里「順手牽羊」差不多的體驗(yàn),你可以走進(jìn) Amazon Go,選取自己想要的商品,然后「直接走」就可以了。這給消費(fèi)者提供了一種無縫的購(gòu)物體驗(yàn),他們不再需要去排隊(duì)、結(jié)賬。我們利用計(jì)算機(jī)視覺技術(shù),使得我們的機(jī)器可以知道消費(fèi)者拿走了哪些商品,這個(gè)時(shí)候我們就不需要有收銀的過程了。
AI 殿堂:加州理工學(xué)院
加州理工學(xué)院也有著非常悠久的人工智能研究史,可能大家不知道。實(shí)際上包括神經(jīng)引擎在內(nèi)的一些相關(guān)理念,就是加州理工學(xué)院最早提出的。而且我們?cè)诩又堇砉W(xué)院還有很多非常著名的校友,比如說 John Hopfield 等等,我非常開心能夠成為學(xué)院的一份子,并且看到人工智能技術(shù)和其他的科學(xué)領(lǐng)域進(jìn)行連接與合作,并且看到人工智能技術(shù)進(jìn)一步推進(jìn)我們?cè)谄渌鱾€(gè)領(lǐng)域科學(xué)的發(fā)展。
現(xiàn)在人工智能最為流行的一個(gè)應(yīng)用場(chǎng)景就是計(jì)算機(jī)視覺,是指可以識(shí)別物體的能力。比如說我們的計(jì)算機(jī)視覺可以識(shí)別我們的游泳池以及其他的物體,我們的系統(tǒng)可以自動(dòng)的,可以進(jìn)行大規(guī)模的圖片標(biāo)記。而且它們可以快速的標(biāo)記幾百萬張圖片。對(duì)于人類,我們可以非常自然而準(zhǔn)確地認(rèn)識(shí)圖片中的內(nèi)容,但是對(duì)于電腦而言,這是很有挑戰(zhàn)性的。因?yàn)槲覀兊碾娔X很難去區(qū)分不同的圖片,區(qū)分不同的物體。比如說我們?cè)谟懻撚斡境氐臅r(shí)候,不一定都是同樣的形狀。對(duì)于我們來判斷一個(gè)池子到底是不是游泳池,就是判斷里面有沒有水,能不能游泳。對(duì)于人類而言很簡(jiǎn)單,但是對(duì)于計(jì)算機(jī)視覺和我們的人工智能系統(tǒng)來說,這個(gè)過程是很困難的,所以說我們需要幾百萬個(gè)類似的樣本,來訓(xùn)練我們的系統(tǒng),讓它們知道游泳池到底是什么樣子的。
這樣的物品識(shí)別的能力和人類是完全不同的,比如說對(duì)于人類而言,我們可以進(jìn)行實(shí)時(shí)的甚至是無意識(shí)中的學(xué)習(xí)。比如說我們可能沒有見過游泳池,但是我們已經(jīng)知道游泳池到底應(yīng)該是什么了,但是對(duì)于 AI 系統(tǒng)來說不是這樣的,所以說我們還有很長(zhǎng)的路要走。尤其是我們想要實(shí)現(xiàn)人類水平的認(rèn)知能力的話,我們還有很長(zhǎng)的路要走,但是現(xiàn)在我們已經(jīng)取得了很多的進(jìn)步。我們可以在很多的應(yīng)用都可以提供比較準(zhǔn)確的 AI 識(shí)別。
除了計(jì)算機(jī)視覺,以及其他的一些特定領(lǐng)域中的應(yīng)用以外,我們還有卷積深度神經(jīng)網(wǎng)絡(luò)。我們知道在 AI 系統(tǒng)提供答案之前,會(huì)進(jìn)行多層的處理,比如說我們的系統(tǒng)可以看到這張小狗的圖片,然后通過我們系統(tǒng)的處理,他們會(huì)提取相關(guān)的特征,從而最終的確定這張圖片是一只狗。到底我們會(huì)經(jīng)過哪些不同層級(jí)的處理?比如說我們可能在第一級(jí)的處理的時(shí)候,僅僅會(huì)提取出一些基礎(chǔ)的特征,比如說一些角度,那么這個(gè)時(shí)候通過比較簡(jiǎn)單的角度可以進(jìn)行比較簡(jiǎn)單的物體識(shí)別。但是可能有一些比較復(fù)雜的圖形,比如說一只小狗臉,這個(gè)時(shí)候我們需要更多層級(jí)的處理。我們需要把這些比較普通的、基礎(chǔ)的特征和更加復(fù)雜的特征加以整合,所以說我們才會(huì)使用深度學(xué)習(xí)這個(gè)詞,因?yàn)槲覀儠?huì)進(jìn)行很多層級(jí)的處理,而這個(gè)也使得現(xiàn)在的卷積深度學(xué)習(xí)網(wǎng)絡(luò)和 80 年代是完全不同的。
我們自己的研究希望可以更多的橫向拓展我們的機(jī)器學(xué)習(xí),并不僅僅是深度,還有它的廣度。比如說對(duì)于圖片而言可能有不同的信道、特征、顏色、但是在視頻里面,他的緯度可能會(huì)更多。比如說我們的一些字符,它可能是更高維度的。那么對(duì)于我們的視覺性的問答,它可能維度會(huì)更高。所以我們需要把這些不同維度的數(shù)據(jù)整合到一起來進(jìn)行處理,因?yàn)樽鳛槿祟惖奈覀兪强梢钥吹竭@些維度、可以理解這些數(shù)據(jù)的。而且我們知道還有其他的高維度,比如說在量子物理的領(lǐng)域,在愛因斯坦就提出的量子物理學(xué)相關(guān)理論中,他的維度就是非常高的。比如有作品塑造了一個(gè)二維的世界,受到三維世界的入侵。所以說在我的研究當(dāng)中,為了能夠更好的去進(jìn)行機(jī)器的學(xué)習(xí),我們就需要使用到張量,這樣才能夠幫我們分析到更多的維度。通過使用我們的張量,我們就可以更加自然的處理多維度的數(shù)據(jù)。
這里我們?cè)僬f回我再亞馬遜的工作,對(duì)于亞馬遜來說預(yù)測(cè)是非常重要的,比如說我們需要預(yù)測(cè)亞馬遜會(huì)出售什么樣的產(chǎn)品,市場(chǎng)會(huì)有什么樣的變化,這是非常重要的問題。但是預(yù)測(cè)也是非常難的,因?yàn)樗枰覀兊臄?shù)據(jù)有非常高的相關(guān)性,而且未來的變化是非常復(fù)雜的。我們使用了這種序列模型,我們使用的是張量訓(xùn)練下的序列模型來更好的進(jìn)行時(shí)間預(yù)測(cè)。比如說在這個(gè)圖片里面,藍(lán)色的這條線代表的是我們的張量長(zhǎng)短模型用于長(zhǎng)期預(yù)測(cè)的一個(gè)情況。如果說我們要進(jìn)行長(zhǎng)期預(yù)測(cè)的話,我們的張量以及我們比較復(fù)雜的數(shù)學(xué)計(jì)算,可以幫助我們提升預(yù)測(cè)的準(zhǔn)確度。而且我們需要在機(jī)器學(xué)習(xí)當(dāng)中,考慮到不同的數(shù)學(xué)以及物理的變量,這樣才能夠幫助我們開發(fā)出更好的算法。
人工智能的下一步:身體和心靈的結(jié)合
我們的未來在哪里,下階段在哪里,現(xiàn)階段已經(jīng)做得非常好了。拉丁語中有一個(gè)說法,(Mens sana in corpore sano)是說只有健康的身體才我能有健康的思維。所以我剛才講的都是關(guān)于思維的部分,我們?nèi)绾尾拍軇?chuàng)建一個(gè)具有智能意識(shí)的 AI 系統(tǒng)。但 AI 必須進(jìn)入到我們的物理世界當(dāng)中,剛才我給大家展示了機(jī)器人的一個(gè)形象。然而現(xiàn)階段,我們的意識(shí)和機(jī)體是分開的,接下來我們的目標(biāo)是將機(jī)體和 AI 意識(shí)結(jié)合起來。我們啟動(dòng)了這樣一個(gè)項(xiàng)目,希望能夠?qū)?AI 和機(jī)器人結(jié)合到一起。比如說目前在加州理工學(xué)院我們比較感興趣的是探索機(jī)器人,探索機(jī)器人可以去探索各個(gè)不同的地方,我們也一直在思考如何才能夠讓這些機(jī)器人變成自動(dòng)的機(jī)器人,并走出實(shí)驗(yàn)室去探索真實(shí)世界。
我們也開啟了一個(gè)新的項(xiàng)目,也是在全球僅有的一個(gè)項(xiàng)目。我們可以將這個(gè)機(jī)器人在不同的地區(qū)進(jìn)行使用,而且在整個(gè)過程當(dāng)中,我們都可以遠(yuǎn)程控制他們。這是我們的無人機(jī)測(cè)試過程,可以看到,我們可以在不同的條件下去測(cè)試這些無人機(jī),而且整個(gè)測(cè)試過程是非常高效的。通過這樣測(cè)試的方式,我們希望可以有不同的維度,來進(jìn)行自動(dòng)化的建設(shè)。所以當(dāng)我們談到機(jī)器人的時(shí)候,我們也需要去思考,我們的機(jī)器人需要具有什么樣的 AI 能力?我們需要不同種類的機(jī)器人,第一種叫探索機(jī)器人。探索機(jī)器人它們可以去探索地球,甚至說以后可以探索太陽系當(dāng)中的其他行星。第一種探索型需要將它進(jìn)行設(shè)計(jì),讓它可以在衛(wèi)星上面工作。希望我們的這些探索型機(jī)器人能夠去到新的環(huán)境,代替人類進(jìn)行探索,這就是我們 AI 的第一個(gè)應(yīng)用,我們把它叫做直覺型的機(jī)器人。即使它們放在一個(gè)全新的環(huán)境當(dāng)中,這些機(jī)器人也可以特別快的去學(xué)習(xí)到周圍的環(huán)境。
人類是這樣,那我們機(jī)器人是不是也能這樣呢?其次我們還可以用機(jī)器人來做交通工具,在亞馬遜一直都需要各式各樣的交通工具,讓機(jī)器人能夠進(jìn)行導(dǎo)航,完成我們?nèi)祟愐蟮娜蝿?wù),比如說駕駛汽車。此外還有一種類型的機(jī)器人,我們把它叫做是保護(hù)機(jī)器人。保護(hù)機(jī)器人所做的工作是拯救人類,當(dāng)自然災(zāi)害發(fā)生時(shí),比如說地震或者是火災(zāi)的情況下,它們可以迅速的拯救人類,也需要有該地區(qū)的地圖,這一點(diǎn)叫做協(xié)商型的人工智能。此外,我們還有另一種類型叫變形機(jī)器人,通過變形機(jī)器人,你在想象它的時(shí)候,可以想象出一個(gè)人需要去轉(zhuǎn)移一個(gè)貨品,但是地形非常的復(fù)雜。那這個(gè)時(shí)候我們需要的就是要這些變形機(jī)器人。到底它現(xiàn)在處于什么位置?在做什么?需要的是一個(gè)協(xié)作。所以我們?cè)谧鲎冃螜C(jī)器人的時(shí)候,不僅僅需要它能夠完成任務(wù),也需要它能夠迅速的適應(yīng)環(huán)境,這是我們面臨的一個(gè)挑戰(zhàn)。
另一種類型叫做生活伴侶,我覺得這對(duì)于我們現(xiàn)有的機(jī)器人,在智能方面是最具挑戰(zhàn)性的。因?yàn)樯畎閭H必須試著去了解我們的需求,然后再根據(jù)我們的需求,做出相應(yīng)的反應(yīng)。在今后,我們會(huì)有更加高級(jí)的生活伴侶,它會(huì)了解我們?nèi)祟惖男枨?,成為我們的朋友。這對(duì)于我來說就是最后的一個(gè)階段了。