2017 年 11 月 28 日,以 Made With AI 為主題,Google 在日本東京舉行了一場關于人工智能的媒體溝通會。
更好用的 Google 產(chǎn)品
首先,Google 資深研究員 Jeff Dean 首先登臺。他用一個通過 Google Translation 進行實時識別翻譯的案例,來介紹了人工智能與機器學習的區(qū)別。他表示,機器學習其實是人工智能的一部分;本質上,機器學習是一個創(chuàng)造問題解決系統(tǒng)的新方式。

Jeff Dean 提到,正如 Google CEO Sundar Pichai 在 2016 年 10 月所言,在接下來的 10 年間,Google 將會成為一個 AI First 的公司;而 Google 在人工智能領域的愿景是:
在演講中,Jeff Dean 著重提到了 TensorFlow。據(jù)雷鋒網(wǎng)了解,TensorFlow 于 2015 年 11 月在 GitHub 上正式開源;與 MXNet、Caffe 等其他的機器學習框架相比,TensorFlow 頗受歡迎,用戶量的增長速度也比較快。而根據(jù) Google 方面提供的數(shù)據(jù),到目前為止,TensorFlow 已經(jīng)成為用戶數(shù)量排名第一的機器學習框架。
Jeff Dean 表示,在近 20 年的發(fā)展中,神經(jīng)網(wǎng)絡(Neural Networks)在數(shù)據(jù)量和結算模型上已經(jīng)超越其他的計算方案;總結來說,一個計算的新時代已經(jīng)到來。
實際上,作為最早開始研究人工智能和機器學習的科技公司之一,人工功能和機器學習的元素實際上已經(jīng)出現(xiàn)在 Google 多項產(chǎn)品中。在溝通會現(xiàn)場,Jeff Dean 列出了一些較為典型的產(chǎn)品,并對它們的人工智能元素進行了簡單介紹:
軟硬件與 AI 的一體化
不過,除了 AI 和軟件產(chǎn)品,Google 在產(chǎn)品層面也已經(jīng)延伸到了硬件;也就是說,Google 已經(jīng)形成了 AI + 軟件 + 硬件三位一體的布局。一個最簡單的例子是:在與 Google Pixel 相連接的情況下,Pixel Buds 耳機可以實時翻譯。
不過,Pixel Buds 當然不是全部。在溝通會現(xiàn)場,Google 產(chǎn)品經(jīng)理 Isaac Reynolds 登臺介紹了 AI And Hardware 的關系;這里說的 Hardware,主要指的是 Google Home 系列和 Pixel 手機。
第一款著重提到的產(chǎn)品是 2016 年發(fā)布的 Google Home。Isaac Reynolds 表示,Google Home 內置了語音配對(Voice Match)功能,其本質在于用機器學習來幫助識別不同的語音,可以讓最多 6 位用戶連接到同一臺 Google Home;無論這六位用戶說話的聲音大小,Google Home 都能夠聽見并給出回應,這就是硬軟件與機器學習相結合的最好案例。
與之相比,今年 10 月最新發(fā)布的 Google Home Max 的音質更好;它可以通過機器學習在數(shù)千種房間中進行聲音模型訓練,對不同音質的效果進行衡量,最后提供一個適合所在房間的聲音模型。
關于 Pixel 2 XL,Isaac Reynolds 主要提到了 Pixel 2 的人像模式。實際上 Pixel 2 只有一個攝像頭,但它能夠通過機器學習對圖像進行結構化的識別,從而區(qū)分出背景和人像,并給出相應的深度圖(Depth Maps);在形成 Segmentation Mask 之后,對背景進行虛化,最終實現(xiàn)人像效果。
在溝通會現(xiàn)場,雷鋒網(wǎng)(公眾號:雷鋒網(wǎng))就 Pixel 2 內置的 Pixel Visual Core 輔助芯片進行了提問。Isaac reyonld 表示,Pixel Visual Core 實際上已經(jīng)在數(shù)年前就開始研發(fā)了,目前可以用于 HDR+ 照片的拍攝; 隨著 Android 8.1 的推出,第三方應用開發(fā)者也可以應用 Pixel 2/XL 的這一芯片來拍攝 HDR+ 照片。
不過在未來,Pixel Visual Core 也能夠被開發(fā)者應用于機器學習。
人類語言問題的解決
接下來,Google 負責機器學習的一個項目總監(jiān) Linne Ha 登臺介紹了 Google 的機器學習在人類語言方面的成績。
Linne Ha 表示,當今世界上,有 6000 多種語言(算上方言可能會更復雜),其中只有 400 多種擁有超過 100 萬的使用人口。然而在互聯(lián)網(wǎng)上,有 50% 的內容都是英文的,而世界使用人口數(shù)量排名第四的印度語,其內容量在網(wǎng)上的排名不到前 30。這種人類語言上的不平衡,正是 Google 試圖通過人工智能解決的問題。
Google 在語言方面所做的努力包括對多種語言字體進行 Unicode 編碼,使其不僅僅能夠用在桌面電腦上,還能用在移動設備上。不僅如此,Google 還開發(fā)了幾乎可以支持任何語言的 Noto 字體;而針對字符數(shù)量比較多的語言,Google Keyboard 能夠利用機器學習在用戶輸入時進行預測,從而讓用戶輸入效率大大增加。
利用深度神經(jīng)網(wǎng)絡,Google 推出了 Voice Search 功能,即使是在嘈雜環(huán)境中,用戶也可以與手機對話;目前該功能已經(jīng)支持 119 種語言,其中包括 11 中印度語言和 3 種印度尼西亞語言。另外一個值得一提的是 Google 的 Project Unison 項目,它可以利用機器學習實現(xiàn)文本向語音的轉換,主要針對語料并不豐富的語種,比如孟加拉語、高棉語和爪哇語。而機器學習模型可以減少構建文本到語音模型所需的數(shù)據(jù)量。
在說完語言之后,Google Asssitant 工程總監(jiān) Pravia Gupta 上臺對 Google Assistant 進行了簡單介紹。除了眾所周知的功能,Pravia Gupta 再次強調稱 Google Assistant 已經(jīng)擁有 Voice、Type、Tap、Lens 等四種輸入方式;而且可以覆蓋 iPhone & Android 智能手機、Chromebook 筆記本、電視機、汽車、智能手表等多種設備。
當然在現(xiàn)場,Pravia Gupta 也少不了對 Google Assistant 進行了一番 Demo。
用 AI 來賦能行業(yè)、應對人類挑戰(zhàn)
當然,除了致力于自身產(chǎn)品的發(fā)展,Google 也不忘記強調它對其他企業(yè)和開發(fā)者創(chuàng)新的影響。Google 表示,目前它為企業(yè)及開發(fā)者提供了三種創(chuàng)新工具,分別為 TensorFlow、云機器學習 API 以及 TPU 電腦芯片。在溝通會現(xiàn)場,來自日本的丘比公司,就登臺介紹了它如何使用 TensorFlow 來提高食品材料的質量和安全性。
在行業(yè)創(chuàng)新之外,Google 表示機器學習也可以幫助我們解決人類的一些重大挑戰(zhàn),比如說醫(yī)療保健、能源和環(huán)境問題。比如說機器學習目前已經(jīng)用于診斷糖尿病引起的眼部疾病、乳腺癌等疾??;實際上雷鋒網(wǎng)已經(jīng)報道過,就在 11 月 26 日,Google 旗下的 DeepMind 團隊正式宣布將利用 AI 來對抗乳腺癌。
不過,來自新西蘭維多利亞大學的博士生 Victor Anton 則試圖通過人工智能來識別鳥叫聲,以便來保護鳥類。
在溝通會的結尾,Jeff Dean 展望了 Google 人工智能的未來。
他表示,未來要面臨的主要困難是如何想方設法讓機器學習模型的創(chuàng)作更加觸手可及;為此,Google 明年將在互聯(lián)網(wǎng)上免費提供機器學習課程,而且 Google 相關團隊也在研究如果使用 Auto ML 自動創(chuàng)建機器學習模型。
最后,Jeff Dean 補充稱,目前 Google 已經(jīng)啟動了 People + AI Research(PAIR)計劃,這個計劃旨在研究并重新設計人與人工智能系統(tǒng)的交互方式,其最終目的是讓機器學習模型具有包容性,并能夠真正地為每個人可用。