2019年7月14日,由中國新一代IT產(chǎn)業(yè)推進聯(lián)盟指導,CIO時代學院、中國電子科技集團公司第十五研究所計算機質(zhì)檢中心主辦,全國高校大數(shù)據(jù)教育聯(lián)盟、章魚大數(shù)據(jù)、萬山數(shù)據(jù)協(xié)辦的“第八屆中國大數(shù)據(jù)應用論壇暨中國電科15所大數(shù)據(jù)應用論壇”在京隆重開幕。中國科學院自動化所研究員王金橋先生帶來演講“人工智能帶來的場景變革”,以下為演講實錄:

中國科學院自動化所研究員王金橋
王金橋:很高興參加這次論壇。在第四次科技革命中數(shù)據(jù)是非常重要的。在第一次科技革命里面,數(shù)據(jù)沒有起到太大作用,直到現(xiàn)在我們所處的年代。中國現(xiàn)在發(fā)展這么快,主要是數(shù)據(jù)加入到生產(chǎn)資料里面,驅(qū)動整個行業(yè)變革。所以簡單給大家分享一下“人工智能帶來的場景變革”
人工智能,最近這兩年大家在媒體上聽說了很多了。AI就是讓機器像人一樣有像人一樣的動作、行為、思考。人工智能被稱為第四次工業(yè)革命。在1780年以前,在“科技是第一生產(chǎn)力”提出之前,發(fā)展都是比較平緩的。從農(nóng)耕到發(fā)明蒸汽機需要幾千年,從使用蒸汽機到發(fā)明電兩三百年,從用電到信息一百多年,從信息到移動互聯(lián)幾十年,從移動互聯(lián)網(wǎng)到智能互聯(lián)可能就一二十年。我們把所有的東西都連接起來,所有的都變成可編輯可計算,這是第四次工業(yè)革命所帶來的變化??萍妓鼤淖兯械囊磺?,包括政治、經(jīng)濟等等,所以科技被稱為顛覆性的技術,就是因為它可以顛覆你的思考、生活方式。
我們這個年代會被稱為大數(shù)據(jù)時代的AI。以前各種傳感器、各種各樣的數(shù)據(jù)都是浪費的,那我們?nèi)祟悗浊陝?chuàng)造最有價值的是什么?語言和文字?,F(xiàn)在除了文字之外更多的是圖像、視頻、語音、互聯(lián)網(wǎng)。從互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)產(chǎn)生了非常多的數(shù)據(jù),沒有利用它,沒有標簽的數(shù)據(jù)都是沒有價值的。
第二就是計算資源。曾經(jīng)我們進行石油勘探找到的概率大概是60%,后來用國外的技術,計算資源?,F(xiàn)在我們運用Gpu和云計算把大量數(shù)據(jù)進行計算。
第三就是神經(jīng)網(wǎng)絡的復興,深度學習。大家都學過BP,但是現(xiàn)在用了幾十年時間把原來的兩層變成了幾百上千層,效率比原來提升了幾十倍。
當前基于深度學習和神經(jīng)網(wǎng)絡,必然有一些問題。人工智能的特點,表現(xiàn)突出的是感知,比如說視覺、聽覺。所以機器在條件不匹配的情況下是不行的。另外是認知,語義的理解。讓計算機創(chuàng)造微積分,發(fā)明一個登陸火星的東西,沒有數(shù)據(jù)沒有信息,計算機無法進行計算。所以現(xiàn)在創(chuàng)造性方面還是處于比較弱的階段。
所以在當前限定邊界AI條件下,感知和限定條件的認知有四個要素:第一是大數(shù)據(jù)和標簽。大數(shù)據(jù)其實并不是最重要的,最重要的是要確定性的標簽。第二是算法和工程,就是需要有大量的科研人員來設計算法,同時需要一批程序員來工程化;第三是通訊和功耗。5G使得信息傳輸成本降得特別低,另一方面是AI芯片就可以把神經(jīng)網(wǎng)絡放到前端去。第四是場景適配與邊界條件,比如下圍棋必須按照規(guī)則?,F(xiàn)在人臉識別也需要限定距離和場景。要用傳統(tǒng)行業(yè)知識加上AI,AI就是在數(shù)據(jù)基礎上進行賦能。

這是當前AI主流計算框架:端、邊、云融合一體化計算。端就是獲取數(shù)據(jù),做一些簡單的計算,在邊上去做算法、數(shù)據(jù)的結合,然后在云端做業(yè)務和AI場景結合的計算。數(shù)據(jù)和場景的閉環(huán)是這個端云融合的優(yōu)勢,比如AlphaGo和AlphaGo zero,因為他知道游戲規(guī)則,所以它們可以自己訓練。我們在數(shù)據(jù)端把邊緣數(shù)據(jù)進行模型學習,在端、邊、云數(shù)據(jù)回流過程當中讓機器自動發(fā)現(xiàn)一些新的東西,并進行自我迭代,同時結合人的知識輔助,這是人機耦合重要形式,是機器自主進化的一個發(fā)展趨勢。
2019年被稱為人工智能落地的關鍵期。所謂關鍵期就是百花齊放,因為之前由于標簽缺失、算力不足、芯片、GPU等等,大眾對AI的期望過高。機器人受到邊界條件限制,現(xiàn)在深耕場景,所以2019年之后每個行業(yè)都可以用到人工智能。這是行業(yè)變化的特點。
今年大家都收到了一條短信,那就是所有停車收費納入個人征信體系。人臉識別,人臉識別仍然是近場的小規(guī)模識別,對中青年人群精度很高。遠距離的識別和應用還是存在許多困難和挑戰(zhàn),它取決于攝像機的成像質(zhì)量和AI芯片算力相關,基本上5米-10米,5萬以下現(xiàn)在應用的比較成熟。在商品識別方面,目前可以識別一萬種商品,小樣本和少樣本的識別已經(jīng)成為主流的研究方向。
未來思考。智能產(chǎn)業(yè)不斷地滲透到生活的各行各業(yè)。從理論發(fā)展上講,從感知信息獲取到認知智能,從狹隘的認知一直到高級認知。另外從深度學習到量子計算,它的功耗越來越低。從情感計算到倫理思考,AI既能干好事也能干壞事。從倫理上如何讓AI向善也是重要的課題。從產(chǎn)業(yè)發(fā)展上講,從人臉識別滲透到非常多的行業(yè),百花齊放。另外,軟件+算法+芯片+5G幾大條件要相互融合和滲透。最后,人機耦合會長期存在。在很長的時間階段里機器能代替很多重復性的勞動,但是人機耦合將會更好的取長補短,更好的推進落地。謝謝大家!