導(dǎo)讀: 作為一個一直從事nlp技術(shù)和相關(guān)產(chǎn)品的工程師,這里寫點個人的想法和收獲。主要分三部分:第一部分是人工智能擅長什么、不擅長什么;第二部介紹下參會大神們在機器學(xué)習(xí)、視覺等領(lǐng)域的工作;第三部分寫了個人在如何做人工智能產(chǎn)品的思考。


AI擅長什么,不擅長什么
牛津大學(xué)計算機科學(xué)系主任、DeepMind-Oxford Partnership負責(zé)人Michael Wooldridge教授做了題為《Routesto Artificial Intelligence》的大會報告,這個演講引起了筆者長時間的思考,總結(jié)出以下一點點感想。
人工智能(Artificial Intelligence)簡稱AI,在1955年達特茅斯特會議上被提出,約翰·麥卡錫將其定義為“制造智能機器的科學(xué)與工程”(science and engineering of making intelligent machines)。

上世紀70年AI泡沫破滅后,這個概念沉寂了一段,相關(guān)研究者和工程師都不好意說自己是研究人工智能,而是變成機器學(xué)習(xí)、數(shù)據(jù)挖掘、自然語言處理、語音識別、圖像識別等各個領(lǐng)域。機器學(xué)習(xí)是方法,數(shù)據(jù)挖掘、自然語言的理解、語音識別和圖像識別是目標和具體應(yīng)用。目前為止,AI的進步主要是機器學(xué)習(xí)的進步。近年計算能力的提高、互聯(lián)網(wǎng)大數(shù)據(jù)的積累,深度學(xué)習(xí)被應(yīng)用在語音識別、圖像處理等領(lǐng)域并取得非常大的突破。人工智能的概念再度被學(xué)術(shù)、產(chǎn)業(yè)、投資人甚至普通民眾關(guān)心,特別是今年AlphaGo戰(zhàn)勝李世石,更是將AI推向了歷史的最高點,各具體領(lǐng)域的人又紛紛回歸人工智能的懷抱,筆者才能厚著臉皮說自己是人工智能從業(yè)者。
先不糾結(jié)人工智能的各種定義,目前學(xué)者們將AI分成強AI和弱AI。強AI是通用型的、有自我意識的,是自主的,簡單說就是一個跟人一樣的智能,星球大戰(zhàn)中的R2-D2、多啦A夢都是強人工智能,有自己的意識、能做自己做決定,強AI目前仍然是科幻片里的人工智能。
弱AI目標沒有那么高遠,專注在一些原來只有人或者動物的大腦能做的具體任務(wù)上,目前的突破仍是各個弱人工智能做得更好。語音識別、圖像分類、AlphaGo等為解決某一特定任務(wù)的系統(tǒng)都是弱人工智能。

弱人工智能需要有明確的優(yōu)化目標:語音識別的優(yōu)化目標是字符識別的準確率,圖像分類的優(yōu)化目標是圖像識別的準確率。目前的AI幾乎都是弱AI,當有明確的可以量化的優(yōu)化目標時,可以通過機器學(xué)習(xí)實現(xiàn)逐步迭代接近優(yōu)化目標,在很多這樣的領(lǐng)域,AI可以接近甚至超過了人類的水平。說完AI適合解決什么樣的問題后,再看看AI目前做不好什么。
1)處理定義不清晰的問題:計算機可以按照精準的指令進行運算,并且執(zhí)行非???,但是需要指令是清楚明確的;
2)感知:人可以感知周圍的環(huán)境,同樣的會議室大家都不說話,一個新進入的人可以感覺到里面之前是經(jīng)歷了激烈地爭吵還是愉快的討論,盡管機器可以通過不同的傳感器捕捉到溫度、光線、濕度的具體數(shù)字,這些人也無法做到如此精確,但還不能將這些各種信息真正的結(jié)合起來達到人的水平。
3)決策:很多決策是沒有精確的規(guī)則,要涉及判斷者的直覺、心態(tài)、猜想,這些對于計算機來講是非常復(fù)雜的。而這些是強AI的必要條件,所以個人認為強AI可能在可見的未來不會實現(xiàn)。
目前的各種所謂智能機器人更多的是一些弱AI的整合,可以集成一個系統(tǒng),可以實現(xiàn)語音識別、圖像識別、語音合成、下棋等具體任務(wù),但這些組合到一起只能解決每個具體的任務(wù),并不能構(gòu)成自我意識,并進行真正的思考。
下面舉幾個簡單的例子:
當在地鐵上,你站在門口,后面的人問“您下車么”,潛臺詞是“如果不下,請給我讓下路”。這時如果下車,需要回答“下”;不下車時不需要回答,只需要把路讓開。
當男生跟女生說咱們分手吧時,女生更多的會說“她是誰?”
上面介紹過當我們做弱人工智能時,需要對于每一個任務(wù)定義優(yōu)化目標,這些優(yōu)化目標都是人的一個基本功能,有些功能,甚至動物也可以實現(xiàn),有可能比人做得更好。而一個智慧的人的優(yōu)化目標是什么,這更加復(fù)雜,可能是個哲學(xué)和社會學(xué)問題。權(quán)利、金錢、異性、被認可、世界大同,甚至宗教里面的“空”、“道”、“涅槃”等等都是人追求的目標。
首先我們不能知道自己到底有多少目標,可以列出目標的并集,并不是人所有追求的總和。
其次這些目標只有一部分可以用一個優(yōu)化函數(shù)來描述,進而化解成各種指令,這種可以認為是一個弱AI系統(tǒng)——
比如在準備英語考試時,考試的結(jié)果可以用分數(shù)衡量,背更多的單詞,掌握更多的語法,書寫更流利的文本,發(fā)更正確的讀音,能得到更高分。
這樣我們可以以獲取高分為目標,做一個英語考試的系統(tǒng),讓這個系統(tǒng)參加考試,會取得不錯的成績,而且在未來的幾年內(nèi),考試的水平會超過人類的最好水平。
而回歸這些目標本身,一個人可能同時追求這些目標;在人生的不同階段,或者具體到不同時刻,這些目標也會發(fā)生變化:對于大多數(shù)人年輕時追求權(quán)力、金錢,年紀稍長追求家庭和睦,年老時追求健康長壽。對于具體的每一個人,教育、周圍的人、社會變化都會導(dǎo)致人生目標的動態(tài)變化,但每一件事對具體優(yōu)化目標影響究竟有多大,可能自己也不知道。
這里插句題外話,雖然我們無法確定每一本好讀書,交一個更牛的朋友,更積極的看待社會,這些會給我們帶來多大的改變,但持續(xù)做下去,人肯定會更好。不能把人的各種追求量化并窮盡并整合,不是所有的優(yōu)化目標都可以被量化,這些都是目前的AI框架無法解決的問題。
從AI概念提出到現(xiàn)在,AI的發(fā)展基本都是量變,科學(xué)家們并沒有跳出現(xiàn)在的整體框架。所以個人認為強人工智能在幾十年內(nèi),不會實現(xiàn),大家尚可不必擔(dān)心強AI誕生并取代人類。很多大小公司、某些專家出于各種考慮,提出自己的“AI相當于幾歲小孩的智商”,有失偏頗。在各個弱AI領(lǐng)域,可以超過人類最好的水平;在感知決策等方面,AI不如初生的嬰兒,所以現(xiàn)在一切以人類年齡宣稱自己AI產(chǎn)品智能水平的行為,都是耍流氓。
各領(lǐng)域的具體技術(shù)進展
上面務(wù)虛的侃了自己一點粗略的想法,再介紹一些大神們的干貨。
香港科技大學(xué)教授楊強:AI成功的五個必要條件
香港科技大學(xué)楊強老師做了《人工智能成功的幾個必要條件》的主題演講。楊強老師認為深度學(xué)習(xí)之后的算法模型有三層結(jié)構(gòu):
第一層就是遞歸的深度學(xué)習(xí)(RNN);
在這之上的第二層是一個強化學(xué)習(xí)的學(xué)習(xí)器(RL);
而第三層是遷移學(xué)習(xí)(TL),它能把一個已有的模型遷移到一個新的領(lǐng)域。
深度學(xué)習(xí)訓(xùn)練需要大量的數(shù)據(jù),強化學(xué)習(xí)也需要大量數(shù)據(jù)進行反饋。利用遷移學(xué)習(xí),可以有效的減少對數(shù)據(jù)量的需求。
比如人騎自行車的經(jīng)驗有助于學(xué)習(xí)騎摩托車,一個會打羽毛球的人學(xué)習(xí)網(wǎng)球也會更快一些。目前已經(jīng)將該模型應(yīng)用在對話系統(tǒng)和股票預(yù)測等領(lǐng)域上。
楊強老師認為目前成功的人工智能的應(yīng)用還是在機器學(xué)習(xí),從數(shù)據(jù)中找到規(guī)律,把重復(fù)的工作替代掉。最后給出了他認為的AI成功的五個必要條件:
清晰的商業(yè)模式
高質(zhì)量的大數(shù)據(jù)
清晰的問題定義和領(lǐng)域邊界
懂人工智能的跨界人才
擅長應(yīng)用和算法
計算能力。
微軟亞洲研究院常務(wù)副院長芮勇:計算機視覺從感知到認知的長征
在演講中,芮勇老師提到現(xiàn)在可以根據(jù)輸入圖像的內(nèi)容給出描述,如生成“小河旁邊停了一輛自行車”,并將繼續(xù)研究根據(jù)視頻內(nèi)容生成描述文字。更令人興奮的是可以回答關(guān)于圖像內(nèi)容的自然語言問題。
例如:在一片泥濘的土路上,什么東西在拖著馬車?答案是馬在拖著馬車。方法是同時用一個問題的文本的深度學(xué)習(xí)模型,一個圖像的深度學(xué)習(xí)模型,最后將兩個模型融合。
筆者想到今年一次聽合唱時,不同人唱不同聲部,可以很快的根據(jù)口型動作和聲音確定聲音的發(fā)出者,從直觀感受來講,這應(yīng)該是大腦將連續(xù)的圖像和聲音一起作為輸入,做了一個聯(lián)合模型的識別。隨著研究的深入,未來語音、文字、圖像等輸入源的聯(lián)合輸入,一定會做出更加有趣和實用的產(chǎn)品。同樣,最后芮勇老師也給出了計算機視覺進一步發(fā)展的三個關(guān)鍵因素:機器學(xué)習(xí)算法的進步、各個垂直領(lǐng)域的科學(xué)家和從業(yè)者合作、高質(zhì)量的海量數(shù)據(jù)。
滑鐵盧大學(xué)教授李明院士、前Google seniorstaff科學(xué)家林德康老師也分別介紹了用深度學(xué)習(xí)做自然語言處理和自動問答技術(shù)的主題演講,這里不過多介紹。
如何做好AI產(chǎn)品?
目前做AI的創(chuàng)業(yè)公司很多,各種語音助手、各種功能的機器人公司風(fēng)起云涌,各個團隊都有很強的學(xué)術(shù)背景和技術(shù)能力。好技術(shù)不意味著能夠做出好產(chǎn)品,做好產(chǎn)品仍需很多其他因素。
小米聯(lián)合創(chuàng)始人黃江吉先生在演講中表示小米對于人工智能的觀點是:產(chǎn)品+大數(shù)據(jù)+機器學(xué)習(xí)。制造各種智能硬件的產(chǎn)品,生成高質(zhì)量的大數(shù)據(jù),利用機器學(xué)習(xí)創(chuàng)造人工智能,進而應(yīng)用在各個產(chǎn)品上,使產(chǎn)品更加智能。
搜狗CTO楊洪濤先生認為好的產(chǎn)品要滿足三個條件:叫好、賣座、賺錢。并提出“只有使用AI技術(shù)的好產(chǎn)品才能創(chuàng)造價值,一個是給用戶提供一個好的辦法,第二個是真正能生產(chǎn)數(shù)據(jù),從而使自己迭代。”
這點跟小米黃江吉先生的看法一致。“欲望先于手段”。用產(chǎn)品和功能來滿足用戶在特定場景下的欲望,而并非用已有技術(shù)手段去尋找用戶的需求,欲望在手段之前,反過來“拿著錘子看哪里都是釘子”就是走錯了方向。
個人認為好的人工智能產(chǎn)品要能落地,有載體,能切實改善人們的生活。
拿筆者所在的出門問問為例,我們一直致力于做場景化的語音搜索,有獨立的語音識別、語義分析、垂直搜索、智能推送技術(shù)。14年底發(fā)布了自主的智能手表系統(tǒng)Ticwear,并提供Androidwear在中國的語音搜索技術(shù)。我們自己的硬件產(chǎn)品Ticwatch和將要上市的智能車載產(chǎn)品問問魔鏡,就是希望人工智能技術(shù)落地,方便用戶使用人工智能技術(shù)提高生活品質(zhì)。這次大會上也給問問頒發(fā)了人工智能&機器人Top25企業(yè)獎杯。
可能誰也無法預(yù)測AI的未來,作為一個從業(yè)者,我們能做的是腳踏實地做好AI技術(shù)和產(chǎn)品,一點點地提高全社會的生產(chǎn)效率,并將人們從單調(diào)可重復(fù)的工作中解放出來。
希望AI能讓生活更美好。