美國(guó)權(quán)威調(diào)研機(jī)構(gòu)Gartner發(fā)布了一份中國(guó)企業(yè)AI案例研究報(bào)告。報(bào)告指出中國(guó)企業(yè)追求AI實(shí)戰(zhàn)性,產(chǎn)業(yè)AI頗具土壤。
Gartner得出結(jié)論,中國(guó)企業(yè)對(duì)AI具備強(qiáng)烈需求,并且熱衷用AI來提高生產(chǎn)率、改善客戶體驗(yàn)和促進(jìn)業(yè)務(wù)增長(zhǎng)。這一市場(chǎng)需求決定了中國(guó)具有產(chǎn)業(yè)AI的肥沃土壤。
在阿里龐雜的AI業(yè)務(wù)、產(chǎn)品、生態(tài)的背后,也有一個(gè)關(guān)鍵詞“產(chǎn)業(yè)AI”。產(chǎn)業(yè)AI究竟是什么,有哪些關(guān)鍵要素,有哪些應(yīng)用場(chǎng)景?3月27日,阿里云數(shù)據(jù)智能總經(jīng)理曾震宇先生發(fā)表了題為《產(chǎn)業(yè)AI驅(qū)動(dòng)數(shù)據(jù)與業(yè)務(wù)的飛輪》的演講,回答了這些問題。
演講中,曾震宇用“三駕馬車”和“一個(gè)飛輪”解釋產(chǎn)業(yè)AI。人工智能技術(shù)體系有“三駕馬車”:數(shù)據(jù)、算法和計(jì)算力,產(chǎn)業(yè)當(dāng)中通過業(yè)務(wù)積累數(shù)據(jù),即 “一切業(yè)務(wù)數(shù)據(jù)化”。數(shù)據(jù)要用于業(yè)務(wù)中,讓數(shù)據(jù)創(chuàng)造價(jià)值、推動(dòng)業(yè)務(wù)的發(fā)展,即 “一切數(shù)據(jù)業(yè)務(wù)化”。產(chǎn)業(yè)AI作為核心引擎,驅(qū)動(dòng)數(shù)據(jù)和業(yè)務(wù)發(fā)展的飛輪,推動(dòng)業(yè)務(wù)價(jià)值快速增長(zhǎng)。
以下是曾震宇《產(chǎn)業(yè)AI驅(qū)動(dòng)數(shù)據(jù)與業(yè)務(wù)的飛輪》演講實(shí)錄。
AI技術(shù)的三駕馬車:數(shù)據(jù)、算法、算力
當(dāng)人們談到人工智能技術(shù)的時(shí)候,往往會(huì)想到深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、人臉識(shí)別、視頻語(yǔ)音等等各種技術(shù)。其實(shí)我們覺得,這些技術(shù)只是人工智能中的一個(gè)側(cè)面而已。人工智能技術(shù)體系從整體來看包含著三大支柱,或者我們稱之為 “三駕馬車”:
第一駕馬車就是數(shù)據(jù),我們把數(shù)據(jù)當(dāng)成一種戰(zhàn)略資源看待,沒有數(shù)據(jù),所有的人工智能根本就沒有基礎(chǔ)。
第二駕馬車就是算法,從上個(gè)世紀(jì)以神經(jīng)網(wǎng)絡(luò)為代表的算法興起之后一直到現(xiàn)在,算法有了非常大的發(fā)展,算法給人工智能帶來了相應(yīng)的智能。
有了數(shù)據(jù)和算法,我們就需要計(jì)算能力,因?yàn)閿?shù)據(jù)量非常大,計(jì)算能力也變成了非常重要的事情。
今天我不會(huì)過多地講算法,而是講數(shù)據(jù)和計(jì)算能力,這是兩點(diǎn)可能平常大家不會(huì)太關(guān)注,但是對(duì)整個(gè)AI而言非常重要的因素。
首先來講數(shù)據(jù)。數(shù)據(jù)是所有人工智能的基礎(chǔ)。從以往各種各樣的項(xiàng)目當(dāng)中我們發(fā)現(xiàn),數(shù)據(jù)的質(zhì)量、數(shù)據(jù)的好壞其實(shí)對(duì)整個(gè)項(xiàng)目結(jié)果的影響超過算法層面的調(diào)優(yōu),所以一定要非常認(rèn)真地對(duì)待數(shù)據(jù)層面。做各種各樣項(xiàng)目的過程當(dāng)中,數(shù)據(jù)會(huì)有各種各樣的來源,我們需要把各種各樣的數(shù)據(jù)進(jìn)行匯聚,然后對(duì)數(shù)據(jù)進(jìn)行相應(yīng)的建模。比如各種各樣的實(shí)體可能來自不同的業(yè)務(wù)系統(tǒng),需要把各種不同業(yè)務(wù)系統(tǒng)當(dāng)中的數(shù)據(jù)關(guān)聯(lián)在一起,變成能夠刻畫一個(gè)實(shí)體的全方位的數(shù)據(jù)。
對(duì)數(shù)據(jù)進(jìn)行建模以后,我們需要進(jìn)行相應(yīng)的數(shù)據(jù)治理。數(shù)據(jù)如果不治理,就像熱力學(xué)第二定理所說,隨著時(shí)間的推移無(wú)序度會(huì)逐漸增加,數(shù)據(jù)其實(shí)也是一樣。對(duì)數(shù)據(jù)進(jìn)行加工和建模之后,還需要從數(shù)據(jù)質(zhì)量、生產(chǎn)監(jiān)控等各個(gè)層面,對(duì)數(shù)據(jù)進(jìn)行相應(yīng)的治理,需要花不少人力來做這些事情。
下面我們來看一個(gè)例子,比如交通行業(yè)。交通行業(yè)的數(shù)據(jù)可以做什么事情呢?站在政府的角度,交通數(shù)據(jù)非常多、非常雜,來自各個(gè)不同的部門。政府可以把這些交通的數(shù)據(jù)進(jìn)行相應(yīng)的匯聚,匯聚以后就可以得到交通相關(guān)的各個(gè)側(cè)面的深刻了解。數(shù)據(jù)可能來自于政府,比如交警、卡口、攝像頭各種線圈的感知數(shù)據(jù),這些數(shù)據(jù)匯聚以后進(jìn)行建模加工,然后得到一些實(shí)體。
比如對(duì)交通而言,最重要的實(shí)體就是交通工具——車,可以得到車的各個(gè)側(cè)面的刻畫,甚至可以得到每一輛車在城市當(dāng)中行動(dòng)的軌跡和特征。有了這樣的數(shù)據(jù)以后,我們可以構(gòu)建一個(gè)關(guān)于交通的數(shù)據(jù)資源平臺(tái),在此之上可以做各種各樣的智能化應(yīng)用,讓數(shù)據(jù)為城市的交通發(fā)力。
除了數(shù)據(jù)之外,計(jì)算是另外一個(gè)非常重要的因素,但這一點(diǎn)往往會(huì)被一般人所忽視。過去一段時(shí)間,隨著云計(jì)算的發(fā)展,計(jì)算變得越來越便宜、越來越方便,也更容易獲得。計(jì)算的發(fā)展有宏觀和微觀兩個(gè)趨勢(shì):
宏觀趨勢(shì)就是計(jì)算越來越從原本單機(jī)的計(jì)算往集群的計(jì)算發(fā)展,就是用大量普通的服務(wù)器共同構(gòu)建一臺(tái)超級(jí)計(jì)算機(jī),讓這臺(tái)超級(jí)計(jì)算機(jī)完成一些復(fù)雜的任務(wù)。這個(gè)過程當(dāng)中對(duì)計(jì)算的調(diào)度能力有非常高的要求,也需要有大量的沉淀以后才可能操縱上千臺(tái)、上萬(wàn)臺(tái)計(jì)算機(jī)規(guī)模。
微觀層面:在每一個(gè)計(jì)算節(jié)點(diǎn)上面,現(xiàn)在越來越多的趨勢(shì)就是通用的芯片逐漸往專用的芯片發(fā)展,我們看到 Google、阿里巴巴等公司都在自研相應(yīng)的芯片,就是希望在單個(gè)計(jì)算節(jié)點(diǎn)讓每一分錢的投資產(chǎn)生最大的回報(bào)。
產(chǎn)業(yè)+智能:產(chǎn)業(yè)AI的飛輪
有了人工智能技術(shù)的 “三駕馬車” 之后,AI要走出實(shí)驗(yàn)室,必須要跟產(chǎn)業(yè)相結(jié)合。
產(chǎn)業(yè)當(dāng)中通過業(yè)務(wù)相應(yīng)地沉淀數(shù)據(jù)、積累數(shù)據(jù),或者是養(yǎng)數(shù)據(jù),我們稱之為 “一切業(yè)務(wù)數(shù)據(jù)化”。業(yè)務(wù)過程當(dāng)中各種核心的指標(biāo)、跟核心的業(yè)務(wù)價(jià)值相關(guān)聯(lián)的部分都可以數(shù)據(jù)化沉淀下來。數(shù)據(jù)沉淀之后要把數(shù)據(jù)用于業(yè)務(wù)當(dāng)中,讓數(shù)據(jù)創(chuàng)造價(jià)值、推動(dòng)業(yè)務(wù)的發(fā)展,我們又稱之為 “一切數(shù)據(jù)業(yè)務(wù)化”。有了數(shù)據(jù)和業(yè)務(wù)形成的飛輪就能夠推動(dòng)業(yè)務(wù)快速發(fā)展,中間的核心引擎就是AI。
互聯(lián)網(wǎng)行業(yè)對(duì)數(shù)據(jù)和人工智能應(yīng)用非常多,除了互聯(lián)網(wǎng)行業(yè),外部的各個(gè)行業(yè)都有非常大的前景。這些行業(yè)當(dāng)中有非常多的數(shù)據(jù)量,但是因?yàn)槿狈τ?jì)算能力,或者沒有把這些數(shù)據(jù)相應(yīng)地保存和利用起來。我們發(fā)現(xiàn)這些行業(yè)當(dāng)中人工智能有非常大的前景,可以用數(shù)據(jù)和算法提升業(yè)務(wù)的價(jià)值。
產(chǎn)業(yè)AI應(yīng)用場(chǎng)景
接下來我會(huì)挑一些具體場(chǎng)景,看看產(chǎn)業(yè)AI在現(xiàn)實(shí)當(dāng)中能夠產(chǎn)生怎樣的價(jià)值。
首先來看交通領(lǐng)域,交通可能是每一個(gè)老百姓都能自己感受到的,而且是很多城市的領(lǐng)導(dǎo)者非常頭痛的一個(gè)問題。解決交通擁堵問題之前,其實(shí)管理者更感興趣,也更加頭大的事情就是弄清楚這個(gè)城市到底有多少輛車,比如此時(shí)此刻在北京有多少輛車在跑,有多少輛車是停在車庫(kù)里面。
這些數(shù)據(jù)其實(shí)在很多城市是是很難拿到的,統(tǒng)計(jì)這些數(shù)據(jù)并不像大家想像的那么簡(jiǎn)單。我們要想弄清楚一個(gè)城市當(dāng)中實(shí)時(shí)有多少輛車,一定要把城市里與交通相關(guān)的數(shù)據(jù)相應(yīng)地進(jìn)行匯聚、融合、加工和相應(yīng)的計(jì)算,才能建立模型,得到此時(shí)此刻在北京有多少輛車在跑。這些數(shù)據(jù)對(duì)于交通的決策者而言,可以作為重要的參考因素,去安排警力以及相應(yīng)的城市建設(shè)規(guī)劃。
有了整個(gè)城市交通數(shù)據(jù)以后,另外一個(gè)非常有趣的點(diǎn)就是交通的效率。其實(shí)交通效率是直接被紅綠燈所指揮的,現(xiàn)在中國(guó)很多城市的紅綠燈基本上都是由每一個(gè)路口前面埋的地感線圈和感應(yīng)器控制的。但是大家也知道,中國(guó)很多城市,地感線圈可能會(huì)被工程車輛、重型車輛壓壞,損壞之后這些感應(yīng)器就不靈了。中國(guó)其實(shí)有很多紅綠燈基本上處于一種半盲狀態(tài),這種半盲的狀態(tài)如何指揮中國(guó)這么復(fù)雜的混合交通,讓交通的效率達(dá)到最高?其實(shí)這是很難做到的。
如果城市管理者把整個(gè)城市的數(shù)據(jù)進(jìn)行匯聚,就會(huì)知道城市有多少車,而且知道這些車相應(yīng)的運(yùn)動(dòng)軌跡,所有的模式特點(diǎn),那么就可以利用這些數(shù)據(jù),以及攝像頭實(shí)時(shí)看到的數(shù)據(jù)去實(shí)時(shí)地驅(qū)動(dòng)信號(hào)燈,從點(diǎn)到線到面,從地面道路的紅綠燈到高架的紅綠燈可以形成聯(lián)動(dòng),用實(shí)時(shí)融合數(shù)據(jù)從全局層面指揮紅綠燈,讓整個(gè)城市的交通形成一個(gè)有機(jī)體。
這是我們覺得更加激動(dòng)人心,也更加有意思的一個(gè)場(chǎng)景,整個(gè)城市當(dāng)中有了所有這些數(shù)據(jù)和交通工具運(yùn)行相應(yīng)的特征,還有過去各種歷史行為,我們可以利用這些數(shù)據(jù)幫助城市管理者以及城市建設(shè)者作出一些重要的決策。
例如有的地方要修路或者建地鐵站,或者有大型活動(dòng),我們?nèi)绾吾槍?duì)這樣的異常行為對(duì)交通進(jìn)行相應(yīng)的指揮?以往的做法可能就是決策者到現(xiàn)場(chǎng)去做調(diào)研,大致根據(jù)經(jīng)驗(yàn)制定一個(gè)方案,這其實(shí)很大程度上是靠經(jīng)驗(yàn)出來的。有了數(shù)據(jù)之后,我們完全可以在數(shù)據(jù)的層面進(jìn)行實(shí)時(shí)的推演,因?yàn)榭梢园丫€下這些實(shí)際的交通狀況在線上獲得。有了這樣的數(shù)據(jù)之后,我們可以實(shí)時(shí)推演,比如這條道路由雙行道變成三行道的話對(duì)周邊的交通會(huì)產(chǎn)生什么影響,這個(gè)地方如果要舉行大型演唱會(huì),有多少萬(wàn)人需要疏散的話,對(duì)交通會(huì)產(chǎn)生什么影響。我們可以對(duì)城市進(jìn)行實(shí)時(shí)計(jì)算,利用這些鮮活的數(shù)據(jù)幫助我們制定各種各樣的城市方案。
機(jī)場(chǎng)交通樞紐、軌道交通樞紐、高鐵交通樞紐都是人流的主動(dòng)脈,這些點(diǎn)上面其實(shí)交通效率和交通安全都是非常大的問題,同時(shí)又會(huì)有多種交通工具,比如地鐵、公交、網(wǎng)約車甚至航空航班都在這樣的交通樞紐相連。其實(shí)這些點(diǎn)都有非常大的潛力,我們可以把數(shù)據(jù)關(guān)聯(lián)在一起。對(duì)于城市的管理者而言,他們可能覺得非常頭大的問題就是,在這些交通點(diǎn)上他們一方面要關(guān)注交通效率,另一方面要關(guān)注交通安全,一旦發(fā)生重大事件要如何及時(shí)處理,需要他們把這些點(diǎn)上的數(shù)據(jù)處理好,把乘客人數(shù)弄清楚。其實(shí)光是把人數(shù)清楚對(duì)這樣的交通樞紐就是巨大的挑戰(zhàn),需要把各種感知類的攝像頭數(shù)據(jù)實(shí)時(shí)處理,然后進(jìn)行大客流的預(yù)測(cè),給出相應(yīng)的預(yù)警,避免重大事情的發(fā)生,以及讓乘客的交通體驗(yàn)更佳。
再來看一看航空。從數(shù)據(jù)層面,航空有三大塊:航空公司、機(jī)場(chǎng)和空管,各自手里都有自己的數(shù)據(jù)。航空產(chǎn)業(yè)在數(shù)據(jù)層面有非常大的潛力,可以把數(shù)據(jù)進(jìn)行融合,也能夠給乘客產(chǎn)生更大的效率、提供更大的價(jià)值。航空當(dāng)中有大量的計(jì)算運(yùn)籌學(xué)的場(chǎng)景,比如對(duì)停機(jī)位的優(yōu)化,每一架飛機(jī)到底應(yīng)該停在停機(jī)位上還是停在停機(jī)坪上,我們可以通過算法盡量?jī)?yōu)化,讓停機(jī)位的使用率變得更高。
城市規(guī)劃這個(gè)行業(yè)現(xiàn)在做的都是一些傳統(tǒng)的、基于各種圖紙的規(guī)劃,其實(shí)這個(gè)行業(yè)完全可以進(jìn)行數(shù)字化的城市規(guī)劃。有了數(shù)字化的城市規(guī)劃之后,可以把城市當(dāng)中各種各樣的數(shù)據(jù)進(jìn)行匯聚和融合,從地下的各種管網(wǎng)一直到地面上的各種建筑數(shù)據(jù),我們可以對(duì)這些數(shù)據(jù)進(jìn)行相應(yīng)的融合和全時(shí)空的感知,構(gòu)建整個(gè)城市的模型。
有了城市的模型以后,我們可以通過計(jì)算判斷地下管網(wǎng)是否能夠支撐上層的這些建筑,地面上的建筑和周邊的交通的存量是否能夠匹配,這些都是可以通過計(jì)算實(shí)現(xiàn)的,而且城市的整個(gè)生命周期和運(yùn)營(yíng)過程當(dāng)中,如果城市的使用過程當(dāng)中有一些點(diǎn)出現(xiàn)阻塞和資源不匹配,我們可以通過數(shù)據(jù)的方式進(jìn)行計(jì)算,發(fā)現(xiàn)其中的問題,進(jìn)而給出建議,然后對(duì)整個(gè)城市進(jìn)行相應(yīng)的優(yōu)化。
工業(yè)是另外一個(gè)非常有趣的場(chǎng)景,涉及的數(shù)據(jù)是非常之多,有大量工業(yè)制造設(shè)備產(chǎn)生大量感知類的數(shù)據(jù)。工業(yè)場(chǎng)景當(dāng)中很多重要的工業(yè)參數(shù)主要還是由工人師傅基于經(jīng)驗(yàn)進(jìn)行設(shè)置的,我們發(fā)現(xiàn)這個(gè)場(chǎng)景當(dāng)中有巨大的機(jī)會(huì),可以用數(shù)據(jù)幫助工人師傅進(jìn)行加工生產(chǎn)的優(yōu)化和提高。
比如關(guān)于循環(huán)流化床鍋爐,這就是我們通常理解的鍋爐,電力、化工等行業(yè)使用得非常多,我們可以對(duì)整個(gè)鍋爐的燃燒過程建模,通過周邊采集的各種感知類的數(shù)據(jù)發(fā)現(xiàn)這個(gè)鍋爐當(dāng)中是否燃燒均勻、是否充分燃燒、燃料和進(jìn)氣量是否匹配,等等,然后給出優(yōu)化的參數(shù)。工程師會(huì)基于這些參數(shù)優(yōu)化設(shè)備。我們發(fā)現(xiàn)在工業(yè)場(chǎng)景當(dāng)中,生產(chǎn)效率、良品率或者能耗的一兩個(gè)百分點(diǎn)的改動(dòng)對(duì)整個(gè)成本和效益會(huì)產(chǎn)生巨大的推動(dòng)。
再看金融場(chǎng)景。金融場(chǎng)景因?yàn)樽陨順I(yè)務(wù)的發(fā)展,數(shù)據(jù)密度是非常之高的,場(chǎng)景包括保險(xiǎn)、金融、銀行等等各種各樣的企業(yè),這些企業(yè)面臨著非常多的挑戰(zhàn)。例如金融體系化的風(fēng)險(xiǎn),常規(guī)的監(jiān)管過程當(dāng)中是基于一些規(guī)則進(jìn)行監(jiān)控的,在風(fēng)險(xiǎn)產(chǎn)生早期的時(shí)候,這些風(fēng)險(xiǎn)其實(shí)不為人所知。這個(gè)過程當(dāng)中完全可以把金融的數(shù)據(jù)進(jìn)行打通。
金融數(shù)據(jù)在我們看來其實(shí)是一種非常典型的關(guān)系網(wǎng)絡(luò)數(shù)據(jù),這種關(guān)系網(wǎng)絡(luò)當(dāng)中我們可以把異常的特征在早期階段發(fā)現(xiàn),能夠提升整個(gè)行業(yè)風(fēng)險(xiǎn)的防范能力,在早期發(fā)現(xiàn)系統(tǒng)性的風(fēng)險(xiǎn)。此外金融行業(yè)當(dāng)中有非常多的盜用帳號(hào)的黑灰產(chǎn)行業(yè),通過各種手段非法獲得用戶的登錄信息,因?yàn)檫@些黑灰產(chǎn)規(guī)模相對(duì)較大,行為當(dāng)中也會(huì)表現(xiàn)出一定的特征,也是可以利用關(guān)系網(wǎng)絡(luò)和大規(guī)模計(jì)算提前防范風(fēng)險(xiǎn)的。金融行業(yè)還有非常多的案例,比如新客的推薦等等,都是可以利用數(shù)據(jù)針對(duì)業(yè)務(wù)價(jià)值進(jìn)行相應(yīng)的提升。
剛才介紹的是我們?cè)谛袠I(yè)當(dāng)中看到的產(chǎn)業(yè)AI能夠帶來的價(jià)值,這些其實(shí)都只是我們所看到的冰山一角,非常多的行業(yè)都有巨大的潛力。我們提出產(chǎn)業(yè)AI的價(jià)值就是以這種人工智能技術(shù)為核心,將技術(shù)和數(shù)據(jù)以及行業(yè)相結(jié)合,讓人工智能技術(shù)深扎于行業(yè)當(dāng)中,也讓產(chǎn)業(yè)AI為整個(gè)行業(yè)創(chuàng)造價(jià)值。