人工智能起步于搜索。最簡單的人工智能機器就是搜索引擎。人們每天在各類搜索引擎上搜東西,得到的結果都與人工智能機器學習的能力相關。搜索的演進同樣促進著人工智能的發(fā)展。從標題搜索,到分詞搜索,再到如今的知識圖譜,搜索一直在試圖從海量信息中篩選出最符合人們需求、最有價值的那部分信息。數(shù)據(jù)、計算、交互的相互促進,使搜索技術日臻成熟。而這些成熟技術在更大范圍內的應用則將人們帶入離人工智能更近的地方。

目前,人工智能已進入深度學習的發(fā)展階段。人們?yōu)闄C器建立了能模擬人腦進行分析、學習的神經網絡,以模仿人腦的機制來解釋圖像、聲音和文本等數(shù)據(jù)。人工智能的深度學習能力促使其不斷修正對人們真實需求的判斷,從而提升搜索的精準程度。用深度學習的方法,智能機器的語音識別能力和圖像處理能力迅速提升。以人臉識別為例:每個人的長相,用程序去描述非常困難,而采用深度學習的方法,在建立數(shù)學模型后,只要把人臉照片放進去,告訴智能機器這張照片對應的名字是什么,在大量數(shù)據(jù)的基礎上,它就能自動提取特征,把復雜的物理圖片抽象成機器智能能懂的特征。

深度學習在語音上的應用已非常精準。語音識別系統(tǒng)能將輸入的聲頻信號解碼為自然語言。這種識別不是簡單的關鍵詞搜索和匹配,而是能夠對一些口語化的表達進行理解。通過深度學習,人工智能可對語法、語義、語境進行判斷和推理,并利用大數(shù)據(jù)進行驗證。而基于高級語音識別的語音搜索系統(tǒng),還集成了多輪理解、信息匹配、語言生成、語音合成、情感表達等功能,具備了初級的溝通能力。如果少量詞語沒聽清楚,語音搜索還能夠在大數(shù)據(jù)的支持下“猜”出人們的原意并進行補充,具備了“類人”的智慧。
人工智能的圖像識別能力也今非昔比。對人們用手機隨便拍攝的普通照片,人工智能不僅能說出照片中的顏色,還能以“多輪交互”方式像人一樣基于之前的語境接受追問。新型的人工智能系統(tǒng)能快速識別照片是在哪里拍攝的。它基于深度學習系統(tǒng),學習了海量的帶地理位置標簽的照片,可以基于記憶庫進行位置識別。其表現(xiàn)甚至已經稍好于人類,相較于人腦記憶容量有限,其能力還有提升空間?;谌斯ぶ悄艿乃阉鳎陔娚虉D片搜索領域也能大顯身手。傳統(tǒng)的商品搜索方式主要是通過品牌貨號進行文字搜索?,F(xiàn)在,人們上傳一張服裝的圖片即可搜索出多個類似款式的服裝。隨著人工智能的迭代發(fā)展,通過圖片搜索服裝、鞋子、包包、家具等商品將更直接和快捷。
人工智能給搜索帶來質的飛躍,實現(xiàn)語音識別、圖像識別等方面的人機智能交互?;谌斯ぶ悄艿男滦退阉饕?,綜合了語音、圖像、自然語言處理等多種技術,能與人進行多輪智能交流,能針對移動場景將搜索結果進行有機聚合,繼而結構化呈現(xiàn)精準的信息內容,提升人們的信息獲取效率,并能通過大數(shù)據(jù)技術描繪人的個體特征,在準確判斷人的需求的基礎上提供個性化信息服務?;谌斯ぶ悄艿男滦退阉魇菍ΜF(xiàn)有搜索服務的升級,能為人們提供各類與搜索相關的信息服務,并能構建人的動態(tài)模型,綜合人的屬性、興趣、位置和時間等要素,深度理解人的動態(tài)場景需求。
信息的海量供給與人們的個性化信息需求之間的匹配始終是一大難題。過去,搜索引擎解決的是信息泛濫的問題,讓人獲得知識和答案。作為一種初級的形態(tài),人需要給搜索引擎關健詞,然后搜索引擎從數(shù)百億網頁中找出相關的搜索結果示人。而基于人工智能的搜索引擎具有概念理解的能力,知道人實際需要什么,然后通過計算給人似乎更相關的回應,而不是單純的若干條鏈接。如今,隨著人與互聯(lián)網越來越密不可分,搜索的功能大大延展。搜索引擎過去解決了信息爆炸的問題,現(xiàn)在可望通過人工智能解決服務爆炸的問題。未來隨著連接范圍的擴大,互聯(lián)網和傳統(tǒng)行業(yè)深度融合,各類數(shù)據(jù)被廣泛連接到互聯(lián)網上,在搜索技術的驅動下將催生出更豐富多彩的應用。人工智能與搜索結合的想象空間巨大。未來,智能機器的語音識別一定會比人類好,哪怕是在噪音環(huán)境下。其視覺識別能力也會逐漸超越人類。
人工智能將開啟互聯(lián)網的下一幕,“互聯(lián)網+”向“人工智能+”轉型已漸成趨勢。人讓機器更聰明,機器使人更高效。使用人工智能搜索感覺更像是與人類進行交流,不僅是搜索,更可能帶來深入交流。相信在未來人工智能大普及的時代,讓機器像人一樣聽得懂人的語言不是難事。聽得懂,還能流暢回答交流,甚至能夠根據(jù)人的語氣、面部表情體會到人的情感,并能組織語言與人流暢交流,也不是難事!(