如今,人工智能的勁風(fēng)勢(shì)不可擋,甚至在政府報(bào)告上都劃為重點(diǎn)?;仡?016年人工智能界的頂級(jí)盛事,人機(jī)圍棋大戰(zhàn)絕對(duì)榜上有名。面對(duì)人類棋手的失利,機(jī)器人 AlphaGo 乘勝追擊、再下戰(zhàn)書,挑戰(zhàn)圍棋頂級(jí)選手柯潔的消息一夜間走進(jìn)世界的聚光燈下。然而懶人族表示:機(jī)器人都玩轉(zhuǎn)圍棋了!做家務(wù)可比下圍棋簡(jiǎn)單多了,你們?cè)趺催€沒造出一款能解放人類的全能家務(wù)機(jī)器人呢?

其實(shí),人工智能的發(fā)展還要打敗很多大小怪獸。即便是戰(zhàn)勝了人類圍棋高手的AlphaGo目前也僅具備弱人工智能水平!雖然科幻電影里被機(jī)器人接管的世界距離我們還有些遙遠(yuǎn),但科研人員們正在努力“打怪升級(jí)”,爭(zhēng)取讓能為人類提供服務(wù)的機(jī)器人早日來到我們身邊。
假如你說:“機(jī)器人,把桌上的蘋果拿去洗洗,給大家吃吧!”為了聽懂并服從這個(gè)命令,機(jī)器人到底要具備哪些本領(lǐng)呢?
首先,機(jī)器人要理解這句話的含義。這就涉及到語音識(shí)別和自然語言處理兩個(gè)研究領(lǐng)域。語言識(shí)別,就是把機(jī)器人聽到的聲波轉(zhuǎn)成文字。自然語言處理,就是把一句按人類習(xí)慣說的話,解析成計(jì)算機(jī)能理解的信息。這一過程并不容易——Amazon近期發(fā)布的智能音箱Echo,重點(diǎn)攻關(guān)了遠(yuǎn)距離以及有噪音情況下的語音識(shí)別這一難題,但也只能進(jìn)行有限的對(duì)話,更不用說像人類一樣理解對(duì)話中復(fù)雜的情境和上下文了。
假設(shè)機(jī)器人已經(jīng)正確識(shí)別出這句話。接下來的難題是:什么叫“桌子”?“蘋果”是什么?什么叫“洗洗”?誰是“大家”?什么叫“吃”?這些都屬于人類知識(shí)庫里的常識(shí)問題。 人和人的溝通大量依賴常識(shí),而這些都是機(jī)器不具備的。這種常識(shí)的學(xué)習(xí)對(duì)機(jī)器人而言是挑戰(zhàn),因?yàn)檫@些知識(shí)既無法預(yù)測(cè),也無法泛化,更無法預(yù)先植入。機(jī)器人必須具備某種持續(xù)的自主學(xué)習(xí)能力,才能推理出用戶的命令究竟是什么意思。
自然語言處理過程中的上下文問題,個(gè)人常識(shí)的搜集、表達(dá)和存儲(chǔ),以及如何利用這些常識(shí)實(shí)現(xiàn)人機(jī)自然交流——這些都是英特爾中國(guó)研究院的小伙伴們目前正在努力研究的課題。其中最大的挑戰(zhàn)在于發(fā)現(xiàn)信息之間的相關(guān)性,并在適當(dāng)時(shí)機(jī),激活最可能相關(guān)的信息,為人機(jī)交流補(bǔ)足上下文。相信不久后就有更會(huì)聊天的機(jī)器人來陪伴你啦!
假設(shè)機(jī)器人能正確識(shí)別出桌子和蘋果,下一步就是找到蘋果。這就涉及到計(jì)算機(jī)視覺難題——就是讓計(jì)算機(jī)長(zhǎng)出一雙人類的眼睛,能分辨出人可以看到的景象,提取出人能提取的信息。假設(shè)機(jī)器人能夠完美捕捉三維信息,接下來就是如何理解“看到”的圖像。
AlphaGo 與柯潔華山論劍,人工智能一手遮天指日可待?
人類輕松識(shí)別出來圖中是“幾個(gè)蘋果放在桌子上”
AlphaGo 與柯潔華山論劍,人工智能一手遮天指日可待?
對(duì)計(jì)算機(jī)來說,“幾個(gè)蘋果在桌子上”的畫面只是很多0或1的數(shù)字流
現(xiàn)在需要回答:這些0或1到底代表什么?計(jì)算機(jī)用像素來代表一張圖片, 每個(gè)像素都有一組數(shù)據(jù)代表該像素的顏色和光照信息,可以用下面的數(shù)學(xué)表達(dá)式來代表計(jì)算機(jī)圖像識(shí)別的工作原理:
I=P(O,W)
其中I表示圖像,O表示包含多個(gè)不同類別的物體集合,W表示影響因素
一張圖像首先包含多個(gè)不同類別的物體集合。同一類的物體本身就存在差異,物體自身也是五顏六色。即使是同一個(gè)物體在圖像中的像素值也會(huì)受到很多因素的影響,包括光照強(qiáng)度和方向、相對(duì)攝像機(jī)的位置和姿態(tài)、物體之間的遮擋關(guān)系、物體自身的運(yùn)動(dòng)、攝像機(jī)參數(shù)等。在數(shù)學(xué)分析中,從圖像(I)中感知物體集合(O)就必須同時(shí)恢復(fù)這些相關(guān)參數(shù)(W)。這是一個(gè)高維度數(shù)學(xué)問題,而答案的不唯一極大地增加了計(jì)算難度。與之相比,“棋圣”AlphaGo需要求解的未知參數(shù)僅僅是下一步棋子的坐標(biāo),參數(shù)維度大大降低。這是機(jī)器人下圍棋比做家務(wù)更為簡(jiǎn)單的原因之一。
現(xiàn)在我們的機(jī)器人已經(jīng)成功拿到了蘋果,接下來它該怎樣走到人的正面并送出蘋果呢?“送蘋果”涉及很多技術(shù),比“找蘋果”更加復(fù)雜。機(jī)器人要有房間地圖,要能定位自己的坐標(biāo),還要判別靜態(tài)和動(dòng)態(tài)障礙物,之后才能規(guī)劃運(yùn)動(dòng)路徑,搜索所有的區(qū)域。在搜索過程中利用“眼睛”找到大家——各種姿態(tài)、各種朝向、各種運(yùn)動(dòng)狀態(tài)的人。然后運(yùn)動(dòng)到每個(gè)人面前,向大家打招呼,把蘋果遞過去。讓機(jī)器人順利完成“找人”一直是英特爾的研究重點(diǎn)。目前,我們的機(jī)器人已經(jīng)可以在實(shí)驗(yàn)環(huán)境中找到人,并識(shí)別出人的正面、背面和側(cè)面。研究員們正在努力讓機(jī)器人變得更聰明,更穩(wěn)定,在幫人類“偷懶”的道路上走得更遠(yuǎn)。
蘋果終于被送出去了,機(jī)器人總算松了一口氣。別忙,它還有一件重要的任務(wù)——學(xué)習(xí)記憶。通過這次經(jīng)歷學(xué)到了什么?當(dāng)然要牢記學(xué)習(xí)成果,犯過的錯(cuò)可不能重蹈覆轍。那么,機(jī)器人應(yīng)該如何記憶呢?
AlphaGo 與柯潔華山論劍,人工智能一手遮天指日可待?
記憶分類
記憶是人類的高級(jí)行為,記憶的內(nèi)容某種程度上相當(dāng)于形色各異的知識(shí)。將觀察所得轉(zhuǎn)換為知識(shí)還有很長(zhǎng)的路要走,因此在機(jī)器人身上模擬人類記憶難度極大。受限于現(xiàn)階段傳感器的技術(shù)水平、人類行為和動(dòng)機(jī)的理解局限,以及對(duì)人類大腦工作原理的未知,讓機(jī)器人具備有效的記憶功能充滿了挑戰(zhàn)。我們目前正在重點(diǎn)探索如何為機(jī)器人構(gòu)建可學(xué)習(xí)、可推理、可搜索的記憶。
機(jī)器人領(lǐng)域的研究任重道遠(yuǎn),但又潛力無限,科研人員們正在上下求索。也許在未來的某一天,你我身邊也會(huì)出現(xiàn)像電影里大白那樣的智能型知心好伙伴。