如今,機器學習已經(jīng)真正成為商業(yè)詞匯中的重要組成部分,并為眾多企業(yè)帶來了廣泛且可觀的潛在發(fā)展空間。2017年,在經(jīng)歷了此前的一系列本可避免的挫折之后,我們預計機器學習生態(tài)系統(tǒng)將最終開始向正確的方向推進。

“分析時代”目前仍處于起步階段,它為我們帶來眾多值得期待且為之興奮的構(gòu)想與承諾。在今天的文章中,BigML公司副總裁AtakanCetinsoy將披露2017年中他眼中的機器學習技術(shù)及相關(guān)生態(tài)系統(tǒng)發(fā)展趨勢。
每一年結(jié)束時,技術(shù)專家們總會著眼于新的十二個月,思考其熟知的技術(shù)方案將在下一階段迎來怎樣的變化趨勢。在BigML公司,我們結(jié)合2016年中機器學習技術(shù)的發(fā)展與演變,嘗試解析其在新一年內(nèi)的未來前景。
首先需要強調(diào)的是,企業(yè)需要吹散圍繞在機器學習概念周遭的炒作迷霧,探索將其切實引入自身業(yè)務體系的有效途徑。更具體地講,企業(yè)需要通過嚴謹決策立足內(nèi)部環(huán)境選定平臺,并逐步建立規(guī)模較小且易于實現(xiàn)的機器學習項目,從而嘗試利用自有數(shù)據(jù)集。隨著時間推移,此類增量型項目將帶來積極的反饋,并最終實現(xiàn)決策自動化,甚至幫助敏捷性機器學習團隊徹底改變其所在行業(yè)的運營常態(tài)。
按照慣例,我們首先回顧機器學習技術(shù)在實際應用層面的發(fā)展歷程:
機器學習已經(jīng)形成一種不可逆轉(zhuǎn)的歷史性趨勢,我們需要立足于此考量如何進行跨部門日常事務處理并將自身業(yè)務與市場整體經(jīng)濟狀況加以結(jié)合。
在36年的發(fā)展歷程中,眾多企業(yè)一直在努力消化、采用并從機器學習技術(shù)的發(fā)展進步與相關(guān)最佳實踐中獲益。然而,鮮有企業(yè)能夠真正將其轉(zhuǎn)化為自身業(yè)務優(yōu)勢。
出現(xiàn)了一大批所謂“新晉專家”,他們只讀過幾本相關(guān)書籍或者參加了幾堂網(wǎng)絡課程,就開始堂而皇之地借助廉價資本“改變”世界。與此同時,眾多頂級科技企業(yè)則在盡可能“招募”真正了解機器學習技能的人才,希望借此為蓬勃發(fā)展的AI經(jīng)濟儲備能量。
另外,相當一部分立足機器學習領域誕生的初創(chuàng)企業(yè)則胸懷“獨角獸”雄心踏上征程,然而必須承認,他們自認為能夠利用神奇的新型機器學習算法實現(xiàn)的通用型、低成本、可擴展解決方案往往只是種一廂情愿。
2017年,在經(jīng)歷了此前的一系列本可避免的挫折之后,我們預計機器學習生態(tài)系統(tǒng)將最終開始向正確的方向推進。
在開始討論具體預測之前,還需要強調(diào)點:2016年是極為重要的一年,因為在這一年中全球最具價值的五家企業(yè)史無前例地全部由科技企業(yè)充當。這五家公司皆擁有幾項共通性特征,其中包括大規(guī)模網(wǎng)絡效應、以數(shù)據(jù)為中心的企業(yè)文化以及建立在尖端分析模式之上的新型增值服務經(jīng)濟思路。
更重要的是,這些企業(yè)一直在宣傳其理念與意圖,并將機器學習視為其未來進化的重要支點。隨著優(yōu)步及Airbnb等獨角獸企業(yè)的加入,科技行業(yè)在世界經(jīng)濟中的主導地位很可能在未來幾年中繼續(xù)保持,而這也將受到世界經(jīng)濟大規(guī)模數(shù)字化轉(zhuǎn)型浪潮的強勢推動。
不過,這又提出了一個可能決定數(shù)萬億美元走向的新問題:傳統(tǒng)企業(yè)(例如掌握著大量數(shù)據(jù)的非技術(shù)企業(yè)以及由大型企業(yè)部分解散并轉(zhuǎn)化而成的小型技術(shù)廠商)該如何適應并成為這一新興價值鏈中的組成部分?它們又該如何在生存之余,在新的時代下茁壯成長?
就目前來看,相當一部分企業(yè)都堅持以僵化且經(jīng)驗指導性思路理解商業(yè)智能系統(tǒng)、繼續(xù)采用陳舊的工作站類傳統(tǒng)基礎、利用簡單的回歸模式統(tǒng)計系統(tǒng)運行狀態(tài),這意味著其無法捕捉到現(xiàn)實生活中反映出的具體趨勢,更遑論準確預測用例的復雜性。
與此同時,這些企業(yè)面對著大量專有數(shù)據(jù)得不到充分利用的困境。根據(jù)麥肯錫全球研究院發(fā)布的《分析時代:數(shù)據(jù)驅(qū)動型世界下的競爭》報告所言,其曾在2011年報告中提到的現(xiàn)代分析技術(shù)至今僅實現(xiàn)了不足30%,這還不算過去五年來涌現(xiàn)的各種新型技術(shù)方案。
更糟糕的是,各行業(yè)間的數(shù)據(jù)技術(shù)發(fā)展態(tài)勢呈現(xiàn)出嚴重的失衡現(xiàn)象(著眼于美國,醫(yī)療衛(wèi)生行業(yè)的數(shù)字化技術(shù)采納度低至10%,而智能手機領域則高達60%),這意味著已經(jīng)出現(xiàn)了前所未有的分析能力與競爭水平分化態(tài)勢。
盡管實際情況還達不到各大供應商及研究企業(yè)的宣傳水平(例如‘認知計算’、‘機器智能’甚至是‘智能機器’等炒作性概念),但機器學習已經(jīng)真正成為商業(yè)詞匯中的重要組成部分,并為眾多企業(yè)帶來了廣泛且可觀的潛在發(fā)展空間。這種巨大的機遇意味著將有更多傳統(tǒng)及初創(chuàng)企業(yè)在2017年開始自己的機器學習探索之旅。睿智的企業(yè)會努力從失敗案例中汲取經(jīng)驗教訓,并利用新型技術(shù)成果擴大自身競爭優(yōu)勢。然而考慮到人類在面對新興事物時表現(xiàn)出的一貫愚蠢與保守態(tài)度,我們將以較為悲觀的態(tài)度探討以下十項發(fā)展趨勢:
預測一:機器學習將成為實現(xiàn)“大數(shù)據(jù)”的重要途徑
大數(shù)據(jù)運動中的種種教訓還將反復重演,而技術(shù)專家們也將從中意識到只有將多種具備實用性的“大數(shù)據(jù)”解決方案加以結(jié)合方能實際其既定目標。
總體而言,“大數(shù)據(jù)”代表的是能夠昭示未來的數(shù)據(jù),就這么簡單。Gartner公司最近已經(jīng)在其炒作周期報告中將“大數(shù)據(jù)”條目剔除,這意味著其已經(jīng)正式步入實施階段。這一切都將高度強調(diào)分析能力的重要意義,特別是機器學習在引導客戶利用智能化應用涉及數(shù)據(jù)技術(shù)相關(guān)項目中扮演的重要角色。另外,以往飽受詬病的樣本分析方案將成為一類重要工具,幫助企業(yè)探索出此類應用場景下的新型預測性用例。
預測二:風險投資公司仍將積極為基于算法的初創(chuàng)企業(yè)提供資助
風險投資公司仍將繼續(xù)處于摸索與學習狀態(tài),且整個學習過程相緩慢而艱難。風投將繼續(xù)為具備亮相學術(shù)沉淀的算法類初創(chuàng)企業(yè)提供資助,而無視由其帶來的種種誤導性甚至幻想性言論。例如將機器學習作為深度學習的代名詞,而完全無視機器學習算法與機器學習模型乃至模型訓練與已訓練模型預測結(jié)果之間的巨大差別。對于相關(guān)學科的深入理解將作為一項歷史性難題存在,且整體投資行業(yè)對此的重視程度依然不夠。不過值得肯定的是,已經(jīng)有一小部分風投類企業(yè)開始意識到機器學習發(fā)展所將帶來的巨大發(fā)展平臺。
預測三:機器學習人才仍將成為炙手可熱的稀缺資源
媒體對于AI及機器學習技術(shù)的鼓吹與渲染,將使得相關(guān)技術(shù)人才繼續(xù)成為市場的寵兒,而相關(guān)投資將被大量集中在年輕學者手中。不過殘酷的現(xiàn)實告訴我們,絕大多數(shù)算法并不具備廣泛適用性,而且其中相當一部分僅僅是在原有基礎上做出了少許改進。作為直接結(jié)果,大多數(shù)機器學習算法都將僅被視為噱頭以及瘋狂招募相關(guān)技術(shù)人才的理由。在部分最糟糕的場景下,買方甚至不具備明確的分析技術(shù)發(fā)展思路,而僅僅是像追隨任何一種時代潮流那樣關(guān)注AI/機器學習技術(shù)。
預測四:大多數(shù)機器學習相關(guān)項目僅停留在PPT演示階段,而無法帶來理想結(jié)果
傳統(tǒng)企業(yè)的高管層將積極雇用咨詢公司以幫助自身建立起自上而下的分析戰(zhàn)略以及/或者制定復雜的“大數(shù)據(jù)”技術(shù)組件構(gòu)成方案,然而他們對于洞察結(jié)論的可行性以及確切的投資回報水平并沒有正確的認識。其中部分原因在于實施數(shù)據(jù)分析技術(shù)的正確數(shù)據(jù)結(jié)構(gòu)及靈活的計算基礎設施當下并不難獲取,而且經(jīng)過36年的持續(xù)積累,如今機器學習在廉價計算資源的支持下已經(jīng)不再是高不可攀的實驗室產(chǎn)物。
預測五:深度學習在商業(yè)領域的成功范例將寥寥可數(shù)
深度學習的各類知名研究成果,例如AlphaGo將繼續(xù)吸引媒體關(guān)注。然而,以語音識別與圖像認知為代表的實際應用方案才是真正的發(fā)展驅(qū)動力,其將幫助這一技術(shù)在企業(yè)環(huán)境下機器學習場景中發(fā)揮切實作用。難于解釋、高水平技術(shù)專家稀缺、高度依賴大規(guī)模訓練數(shù)據(jù)集以及極高的計算資源配置需求都將制約深度學習在2017年年內(nèi)的發(fā)展態(tài)勢。
就目前的情況看,機器學習技術(shù)與馬球運動頗有幾分相似,其能夠為您帶來與富豪及名人交流的機會,亦能夠讓您的企業(yè)瞬間逼格爆棚,但隨之而來的還有昂貴的馬術(shù)訓練服務、保養(yǎng)成本、設備購置開銷以及昂貴的俱樂部會費。因此相較于缺少顯著研究突破上與獨特優(yōu)勢的深度學習,企業(yè)通常能夠通過關(guān)注增強學習及機器學習技術(shù)獲得更快且更具現(xiàn)實意義的結(jié)果。
預測六:基于不確定性的原因與規(guī)劃性探索將推動機器學習走向新高度
機器學習本身只是AI的一小部分。相當一部分初創(chuàng)企業(yè)開始立足不確定性為相關(guān)原因與規(guī)劃性探索工作提供研究應用,而這將切實幫助我們在模式認知之外找到新的技術(shù)拓展空間。Facebook公司的MarkZuckerberg就在損害一年的AI/機器學習研究工作之后,拿出了他自己的個人智能化助手“Jarvis”——其基本特性與《鋼鐵俠》電影中的虛構(gòu)智能管家大體類似。
預測七:盡管機器學習的部署范圍持續(xù)擴大,但人類仍將在決策工作中扮演核心角色
部分企業(yè)將初步部署速度更快且采取循證性決策方式的機器學習方案,但人類仍將在決策工作中扮演核心角色。智能化應用的早期落伍將集中在特定行業(yè)內(nèi),但差異化監(jiān)管框架的存在以及嚴格失衡的分析能力狀況將在經(jīng)濟層面給創(chuàng)新性管理方法、競爭壓力、復雜性客戶需求、高質(zhì)量體驗及其它一些價值鏈因素帶來相互矛盾的指引意見。
盡管如今機器學習乃至人工智能改變未來的言論甚囂塵上,但冷靜的技術(shù)領導者非常清楚,真正的智能系統(tǒng)還需要很長時間才會真正出現(xiàn)。與此同時,企業(yè)將慢慢學會信任自己的模型及其預測結(jié)論,并意識到此類方案確實能夠在多種任務領域帶來超越人類的表現(xiàn)。
預測八:敏捷性機器學習將悄然成為AI營銷中的主力軍
更具現(xiàn)實意義且更為敏捷的機器學習采用方式將悄然在新的一年中占據(jù)主導地位。實施團隊樂于親自動手并充分利用豐富的企業(yè)數(shù)據(jù)儲備,同時亦能夠完全繞過“大數(shù)據(jù)”相關(guān)炒作宣傳。他們更為務實,希望利用最具針對性與適用性的預測性手段通過成熟的算法配合小規(guī)模采樣數(shù)據(jù)解決問題。
在這一過程中,他們將逐步建立對自身分析能力的信心,在實際產(chǎn)品中部署相關(guān)方案,同時添加更多可行用例。由于不再受到數(shù)據(jù)訪問問題與部署工具復雜性的制約,他們能夠真正利用數(shù)據(jù)技術(shù)提升核心業(yè)務,同時積極嘗試風險與回報更高的實驗性手段,考慮以預測性用例作為全新品牌營收來源的實現(xiàn)途徑。
預測九:MLaaS平臺將成為傳統(tǒng)企業(yè)中機器學習采用工作的“AI主干”
MLaaS平臺將在加速敏捷性機器學習實踐領域成為“AI主干”。以此為基礎,以MLaaS基礎設施為根基的新一波應用浪潮將令商業(yè)性機器學習方案的實現(xiàn)成本進一步降低,特別是通過以下幾種方式實現(xiàn)機器學習“民主化”:
通過消除供應商合約復雜性或者前期投入額度顯著降低成本。
提供囊括大量高效算法的預配置框架。
以抽象化方式幫助最終用戶擺脫由基礎設施設置及管理帶來的復雜性因素。
通過RESTAPI及捆綁包提供輕松易行的集成、工作流自動化與部署選項。
預測十:無論是否擁有充足的數(shù)據(jù)科學家,開發(fā)者都將不斷向所在企業(yè)引入更多機器學習因素
在新的一年中,開發(fā)者們將積極投向至機器學習陣營當中——無論企業(yè)是否已經(jīng)具備充足的數(shù)據(jù)科學家及其他相關(guān)人才儲備。開發(fā)者們將立足于MLaaS平臺快速構(gòu)建并擴展此類應用,并借此對高難度細節(jié)問題進行抽象及剝離(例如集群配置與管理、任務隊列以及監(jiān)控與分發(fā)等)。“即服務”類方案的普及將允許開發(fā)者僅通過精心設計與良好記錄的API即可實現(xiàn)機器學習技術(shù)應用,而不再需要了解LR(1)解析器以編譯并執(zhí)行其Java代碼,或者掌握信息增益或威爾遜評級機制以實現(xiàn)基于決策樹的預測性用例。
目前,我們?nèi)蕴幱?ldquo;分析時代”的早期發(fā)展階段,因此大家應當對光明的未來保持振奮的心態(tài),而非被過去的一些小挫折所打倒。雖然我們在本篇文章中提出了不少相當悲觀的預測觀點,但這純粹是為了幫助被興奮沖昏頭腦的朋友們冷靜下來,意識到業(yè)務成功、數(shù)學奧秘、軟件與管理最佳實踐以及數(shù)據(jù)科學實現(xiàn)能力之間尚待跨越的鴻溝。