許多人將2015年稱為中國的人工智能元年。而微軟在去年的第三代微軟小冰發(fā)布會(huì)上也做了一件非常有意思的事情,他們賦予微軟人工智能機(jī)器人小冰以視覺,小冰除了能看懂用戶發(fā)來的照片外,還會(huì)給予個(gè)性化的機(jī)智評(píng)論。
而昨天,微軟對(duì)小冰的視覺感官進(jìn)行了全新升級(jí),賦予了小冰對(duì)動(dòng)態(tài)視頻的識(shí)別能力。也就是說,從明天開始用戶只要在微信上給小冰發(fā)送一段“小視頻”,小冰就能進(jìn)行識(shí)別,并給予犀利的評(píng)價(jià)。這項(xiàng)技能的發(fā)布也標(biāo)志著,微軟計(jì)算機(jī)視覺技術(shù)的一項(xiàng)飛躍,從靜態(tài)的圖像識(shí)別,進(jìn)步成為動(dòng)態(tài)的視頻識(shí)別。

圖1:左為電影中小李子出場(chǎng)的情節(jié)(看來小冰是鐵粉),右為煙花
如果你問一個(gè)普通人,人工智能應(yīng)該長什么樣。他大概會(huì)這樣描述“兩個(gè)眼睛、兩條腿”。人類總是依照自己的樣子,想象人工智能。而此次進(jìn)化,也使微軟小冰這個(gè)機(jī)器人女孩,從根本上實(shí)現(xiàn)了類似人類的視覺。對(duì)于整個(gè)計(jì)算機(jī)視覺與人工智能領(lǐng)域而言,這不僅是一項(xiàng)技術(shù)突破,更是首個(gè)讓普通用戶能真正體驗(yàn)到的計(jì)算機(jī)視覺黑科技的人工智能產(chǎn)品。
看來微軟此次也是拿出看家的技術(shù)了。微軟在計(jì)算視覺領(lǐng)域及圖像識(shí)別領(lǐng)域,一直具有巨大的優(yōu)勢(shì),不僅連續(xù)多年稱霸ImageNet這項(xiàng)全球頂級(jí)的計(jì)算機(jī)視覺挑戰(zhàn)賽,而是率先將這些技術(shù)應(yīng)用在How Old、小冰及微軟的盲人工程師Shaikh開發(fā)的Seeing AI上(盲人只要按下讀取鍵,它能把眼前畫面描述給佩戴者)。
此次小冰從圖像識(shí)別到視頻識(shí)別,看似簡單的進(jìn)步,卻標(biāo)志著微軟小冰這個(gè)人工智能機(jī)器人,去年一年的進(jìn)步與發(fā)展,以及微軟在人工智能領(lǐng)域的積累與野心。從閑來無事,用來聊天的機(jī)器人,到How Old 2.0、視頻識(shí)別黑科技。小冰除了情感外,身上的黑科技越來越多。在與人類建立強(qiáng)烈情感聯(lián)系的基礎(chǔ)上,也正變的更有用。

圖2:微軟的盲人工程師Shaikh開發(fā)了這款Seeing AI太陽鏡,按下讀取鍵,它能把眼前畫面描述給佩戴者
微軟在人工智能領(lǐng)域的野心也是顯而易見的。從最早在中國發(fā)布的微軟小冰,再到日本版的小冰“Rinna”,再到不太成功的聊天機(jī)器人Tay,都讓我們期待微軟在人工智能領(lǐng)域還有什么大舉措。特別是按照微軟小冰一年一升級(jí)的慣例,小冰馬上就會(huì)迎來再一次升級(jí)。這個(gè)曾經(jīng)火遍朋友群的人工智能萌妹子,還能折騰出什么新花樣,也十分讓我們期待。