
你是否能想得到,有一天,當(dāng)一個你不想接的電話打進(jìn)來時,只要對著手機(jī)皺眉就能立即拒聽這個電話,或者抬一下眉毛就能給來電者發(fā)送一條信息,問“什么事?”
還有,那只“會說話的湯姆貓“,不需要你說一句,他重復(fù)一句,現(xiàn)在,你可以不說一個字,只要一個鬼臉,它就能做出反應(yīng)。
一對印度夫妻他們的創(chuàng)業(yè)事業(yè)正在朝這個方向努力,不,應(yīng)該說,他們成功了。
他們是,阿什維尼·阿索肯和阿南德·錢德拉塞卡蘭,兩個孩子的父母。
阿索肯曾在英特爾公司的交互體驗(yàn)實(shí)驗(yàn)室(IXR)帶領(lǐng)著一支移動創(chuàng)新團(tuán)隊(duì)。這個團(tuán)隊(duì)里的設(shè)計(jì)師、人類學(xué)家和工程師正在探索移動技術(shù)的未來。而剛剛完成斯坦福大學(xué)神經(jīng)形態(tài)工程(建造模擬人類大腦的計(jì)算機(jī)芯片)博士后研究的錢德拉塞卡蘭,是基于神經(jīng)系統(tǒng)科學(xué)的項(xiàng)目的咨詢顧問。斯坦福的三年正是他沉浸于人工智能的時候。他是創(chuàng)建了神經(jīng)網(wǎng)格——實(shí)時模仿一百萬個神經(jīng)元的一個系統(tǒng)——團(tuán)隊(duì)的一員。他還設(shè)計(jì)和模擬了一個可以映射大腦可塑性(根據(jù)經(jīng)驗(yàn)發(fā)生改變)的一個芯片。
在回到印度之前,他們都在硅谷工作,那里是科技創(chuàng)業(yè)的天堂。但是他們覺得在那里生活成本太高,而且他們有兩個孩子,一個正咿咿學(xué)語,還有一個正在蹣跚學(xué)步。所以經(jīng)過無數(shù)的思想斗爭后,這對夫妻決定打道回府,回到家鄉(xiāng)印度金奈,在那里開創(chuàng)自己的公司。
在他們創(chuàng)業(yè)之前,夫妻倆相信有足夠的能力與智力來實(shí)現(xiàn)這個夢想。在硅谷的時候,他們估計(jì)將要花一到兩年的時間來建立這個技術(shù)。
回到印度不到一年,夫妻倆的初創(chuàng)公司Mad Street Den就在基于云技術(shù)的一個平臺上開始上馬運(yùn)行了。這個平臺利用人工智能,使裝有攝像頭的智能手機(jī)能識別人臉,檢測面部表情和情緒,并對面部和頭部動作作出反應(yīng)。而這個人工智能攝像頭有什么“特異功能”呢?就如文章開篇所說的那樣,可以通過表情發(fā)送信息、接聽或者掐斷電話。
據(jù)亞洲科技報(bào)道,這個影像識別平臺叫做MAD Stack,應(yīng)用軟件開發(fā)者和公司能利用它來開創(chuàng)一種未來的移動用戶體驗(yàn)。“這個想法就是希望讓機(jī)器更人性化從而讓它們更有用,有趣、智能。我們利用計(jì)算機(jī)視覺來達(dá)到這個目的。”阿索肯告訴亞洲科技。
對人腦來說,識別人臉并對一個姿勢作出反應(yīng)是輕而易舉的,但對一個智能手機(jī)攝像頭來說,數(shù)字化處理這個過程就非常復(fù)雜了。人工智能讓攝像頭做到了這一點(diǎn)。此外,通過機(jī)器學(xué)習(xí)算法,這個應(yīng)用變得越來越智能。
這是一項(xiàng)爭議頗多的技術(shù)
計(jì)算機(jī)視覺是一項(xiàng)爭議頗多的技術(shù)。不管是科幻小說還是科幻電影,這樣的技術(shù)總是既讓人感到恐懼但同時也備受稱贊——從無處不在窺探市民的“老大哥”(來自喬治奧威爾小說《1984》)監(jiān)視屏, 到外星人偽裝成機(jī)器的“變形金剛”。
“這項(xiàng)技術(shù)有無數(shù)有趣的地方,為什么外行人聽到的老是消極的一面呢?阿南德和我想要改變?nèi)藗兊目捶ǎ?rdquo;阿肯索說。“我們的目標(biāo)就是讓圍繞在計(jì)算機(jī)視覺的談?wù)撨h(yuǎn)離監(jiān)督、安全,還有所有聳人聽聞的東西,我們要讓它變得有趣。”
但事實(shí)上,在計(jì)算機(jī)視覺應(yīng)用領(lǐng)域,競爭早已開始。
阿肯索列舉了一大堆關(guān)于這項(xiàng)技術(shù)的應(yīng)用,有的已經(jīng)做出來了:亞馬遜新開發(fā)的Fire Phone智能手機(jī)能識別條形碼、盒子藝術(shù),甚至電視音頻,并幫助你發(fā)現(xiàn)你想要的東西。如果一臺手機(jī)能識別條形碼,為什么不能識別一張孩子的臉呢?這如果用在一款好玩的游戲里又會怎樣呢?
在商業(yè)用途上,這樣一種能力可以把客戶分析提升到一個新水平。亞馬遜標(biāo)榜為“類固醇的可視化搜索”的Firefly,也僅僅只是一個開始。Mad Street Den承諾將為智能手機(jī)帶來更多類似的視覺搜索技術(shù)。它的物體識別功能將成為印度電商Flipkart、Snapdeal等與亞馬遜競爭的一個巧妙的手段。
全球的技術(shù)專家都在計(jì)算機(jī)視覺上做著努力。像亞馬遜的Fire Phone智能手機(jī)、Facebook的Oculus Rift虛擬現(xiàn)實(shí)眼鏡和其中國的競爭對手ANTVR,這些“一體化通用虛擬現(xiàn)實(shí)裝備”新發(fā)明現(xiàn)在正霸占著各家新聞頭條。甚至有一家叫Blue River的初創(chuàng)公司,用計(jì)算機(jī)視覺來識別有機(jī)作物田地里的野草,然后篩選出來將其鏟除。這些需要昂貴的硬件裝備,到目前為止,只限于少數(shù)能支付得起它們的人。
Eye Tribe是一家位于哥本哈根的創(chuàng)業(yè)公司,其在眼睛控制移動設(shè)備和電腦上享有專屬軟件。這家公司聲稱,這款軟件能對網(wǎng)頁和應(yīng)用實(shí)現(xiàn)免手動導(dǎo)航,可以實(shí)現(xiàn)眼睛激活登陸,提高游戲體驗(yàn),和云端用戶使用分析。但該款軟件還需要硬件組件來運(yùn)行。公司的計(jì)劃是和希望整合這些性能的硬件制造商合作。三星的Galaxy S4手機(jī)內(nèi)置了一項(xiàng)眼球追蹤功能,利用前置攝像頭來跟蹤用戶的眼球移動。如果你看向別處,它就會暫停正在播放的視頻,當(dāng)你看向屏幕時,它就會繼續(xù)播放。它會根據(jù)你的眼睛在屏幕上的動作來上下滾動網(wǎng)頁和郵件,讓手機(jī)屏幕處于睡眠或啟動狀態(tài)。
位于紐約的IMSRV公司是這個領(lǐng)域的另一個競爭者。IMSRV開發(fā)了使用網(wǎng)絡(luò)攝像頭來測量人們情緒的技術(shù)。公司可以利用這項(xiàng)技術(shù)來分析面部表情,再利用這些信息提高他們的業(yè)務(wù)操作和精準(zhǔn)數(shù)字廣告的投放。
讓人工智能帶給人類的是快樂
讓我們回到Mad Street Den的這對夫妻倆上來吧。
這是他們在開始計(jì)算機(jī)視覺應(yīng)用之前所能看到的:錢德拉塞卡蘭曾經(jīng)在人工智能硬件方面工作過,在硅谷設(shè)計(jì)類似大腦的芯片。但對人工智能的世界觀(或者說人工智能更柔軟的一面)讓這對夫妻在那些夜晚促膝長談。讓阿肯索煩心的是那些關(guān)于機(jī)器人殺手、飛車警察、還有占領(lǐng)世界的機(jī)器之類的偏見之談。這些數(shù)十年前就出現(xiàn)在科幻小說或電影里的預(yù)言沒有一個成為現(xiàn)實(shí)。人工智能的另一面——有用的、在日常生活中的偉大應(yīng)用又是怎樣的呢?
因?yàn)殡x這項(xiàng)技術(shù)是如此的接近,阿索肯和錢德拉塞卡蘭深知什么才是可能的。不僅如此,身為父母的他們更清醒地注意到對孩子們進(jìn)行狂轟濫炸的漫畫書、電影和電腦游戲中關(guān)于科技的錯誤敘述。阿肯索特別希望能改變這種現(xiàn)象。“我曾經(jīng)和阿南德說,‘你在人工智能硬件領(lǐng)域工作,這很棒,但這不能讓那些說法變得更積極、更真實(shí)、和更有趣。除了監(jiān)視你,除了恐嚇你,除了要?dú)⒛?,還有其他的東西,不是嗎?’”
所以,除了潛在的電商用途外,MAD Stack還可以用來開發(fā)更多沉浸式游戲,提供更好的社交媒體體驗(yàn),和幫助移動數(shù)據(jù)分析。
比如說很受歡迎的兒童游戲,會說話的湯姆貓,孩子對這一只叫湯姆的貓說話,這只貓就會用一種傻乎乎的聲音重復(fù)孩子的話。Mad Street Den可以在這款游戲中加上另外一種功能,讓這個軟件能識別孩子的表情。然后湯姆貓就能用做鬼臉來回應(yīng)。“孩子玩這個游戲玩的不亦樂乎,”阿肯索說。她的女兒在Mad Street Den網(wǎng)站上做演示,她對著攝像頭做各種各樣的表情,攝像頭識別了這些表情并能模仿它們。
MAD Stack同樣也能讓學(xué)習(xí)變得有趣。阿索肯和錢德拉塞卡蘭正在和一位兒童教育材料開發(fā)商洽談。這位開發(fā)商從這項(xiàng)技術(shù)上看到了許多機(jī)會。
Mad Street Den的計(jì)算機(jī)視覺平臺只是將人工智能應(yīng)用到日常生活,并給普通人帶來歡樂的第一步。現(xiàn)在它擁有一款能讓其他開發(fā)者插入的軟件開發(fā)工具包。所以我們期待著這樣一個未來——那時候?qū)⒂懈鞣N各樣令人愉快的人工智能設(shè)備——這正是“瘋狂”的真正所在。