又到周末。
休息之余,為大家奉上過(guò)去一周引發(fā) AI 開發(fā)者圈子關(guān)注的那些事兒。大伙兒泡杯茶,坐在搖椅上,一起來(lái)看看在埋頭工作的這個(gè)星期,外面的世界又有哪些變化。
█ 微軟發(fā)起 Minecraft AI 挑戰(zhàn)賽
本周,基于 Minecraft 上的知名 AI 技術(shù)研究測(cè)試平臺(tái) Project Malmo,微軟發(fā)起了一項(xiàng) AI 協(xié)作挑戰(zhàn)賽:The Malmo Collaborative AI Challenge,目前已經(jīng)開始注冊(cè)報(bào)名。
比賽要求每支參賽隊(duì)伍(最多 3 名隊(duì)員)開發(fā)并訓(xùn)練一個(gè) AI 軟件產(chǎn)品。然后通過(guò)該軟件產(chǎn)品參加一個(gè)名為 Pig Chase (小豬快跑)的小游戲。該游戲在 Minecraft 環(huán)境中展開,每局游戲有兩名參賽者,一方為參賽隊(duì)伍開發(fā)的 AI 軟件產(chǎn)品,另一方為系統(tǒng)隨機(jī)分配的隊(duì)友,有可能是人類選手,也有可能是另一個(gè)隊(duì)伍開發(fā)的 AI 軟件。游戲一開始,參賽雙方都有 25 分的原始積分,比賽要求雙方在 25 步之內(nèi)將一只小豬抓住,每走一步會(huì)減掉 1 分,最終抓住小豬雙方各得 25 分,每輪比賽 10 局,最終累計(jì)得分高者獲勝。
目前,關(guān)于 Pig Chase 的樣例代碼和詳細(xì)說(shuō)明已經(jīng)公開在 GitHub 上:
█ Keras 2 發(fā)布,無(wú)縫支持 TensorFlow
在本次版本更新中,最重要的一項(xiàng)內(nèi)容就是增強(qiáng)了 Keras 與 TensorFlow 的邏輯一致性。按照 Keras 在博客中的說(shuō)法:“這是將 Keras API 整合到 TensorFlow 核心的一個(gè)重要的準(zhǔn)備步驟”。
實(shí)際上,從 2015 年 12 月的版本開始,Keras 就已經(jīng)支持用戶將 TensorFlow 作為運(yùn)行后端(runtime backend),但此前,Keras 的 API 與 TensorFlow 的代碼庫(kù)尚處于相互隔離的狀態(tài)。未來(lái),從 TensorFlow 1.2 版本開始,Keras 2 API 將作為 TensorFlow 框架的一部分直接向用戶提供支持,Keras 在博客中表示:“這是 TensorFlow 實(shí)現(xiàn)下一個(gè)百萬(wàn)用戶級(jí)目標(biāo)的關(guān)鍵”。
█ 谷歌升級(jí)語(yǔ)義理解框架 SyntaxNet
這是 SyntaxNet 自誕生以來(lái)的最重大升級(jí)。這建立在谷歌對(duì)各語(yǔ)言的語(yǔ)義理解研究基礎(chǔ)之上。此次升級(jí)的核心是一項(xiàng)新技術(shù):能對(duì)輸入語(yǔ)句的多層表示進(jìn)行很好的學(xué)習(xí)。具體來(lái)講,它延伸了 TensorFlow,能對(duì)多層語(yǔ)言結(jié)構(gòu)進(jìn)行合成建模,還能夠在語(yǔ)句或文件處理過(guò)程中,動(dòng)態(tài)地生成神經(jīng)網(wǎng)絡(luò)架構(gòu)。
谷歌同時(shí)發(fā)布了新的預(yù)訓(xùn)練過(guò)的模型 ParseySaurus。它使用了基于字母的輸入表示,因此極大提升了預(yù)測(cè)新詞語(yǔ)含義的能力。這是基于兩個(gè)方面來(lái)實(shí)現(xiàn):詞匯的拼寫和在語(yǔ)境中的使用方式。雷鋒網(wǎng)了解到,ParseySaurus 的準(zhǔn)確率遠(yuǎn)遠(yuǎn)超出 Parsey's Cousins,錯(cuò)誤率降低了 25%。由于語(yǔ)言的形態(tài)特性和其他屬性,新模型在俄語(yǔ)、土耳其語(yǔ)、匈牙利語(yǔ)上的效果尤其好——這些語(yǔ)言中,同一個(gè)詞匯有多種不同形態(tài),其中許多形態(tài)從未在訓(xùn)練階段出現(xiàn)過(guò)(即便是大型語(yǔ)料庫(kù))。
█ Cloudera 發(fā)布自助式數(shù)據(jù)開發(fā)工具
在圣何塞舉行的 Strata+Hadoop World 大會(huì)上,美國(guó)大數(shù)據(jù)服務(wù)商 Cloudera 發(fā)布了 Cloudera Data Science Workbench —— 一個(gè)運(yùn)行于 Cloudera Enterprise,自助式的數(shù)據(jù)科學(xué)開發(fā)環(huán)境。目前該全新研發(fā)的軟件尚在 beta 內(nèi)測(cè)階段。
其相關(guān)技術(shù)來(lái)自于 Cloudera 去年收購(gòu)的數(shù)據(jù)科學(xué)初創(chuàng)公司 Sense.io。該產(chǎn)品的最大特點(diǎn)是原生支持 Apache Spark、Hadoop 和 R、Python、Scala 等開發(fā)語(yǔ)言。 開發(fā)者能在 Cloudera 的企業(yè)平臺(tái)上同時(shí)使用這些工具和語(yǔ)言,這將加速數(shù)據(jù)分析項(xiàng)目從研發(fā)到最終產(chǎn)品的過(guò)程。
推薦深度閱讀
█ 用數(shù)據(jù)說(shuō)話:把自拍照變成畢加索名畫 哪種算法最高效?
有位外國(guó)開發(fā)者根據(jù) fast.ai 平臺(tái)開設(shè)的深度學(xué)習(xí)代碼實(shí)踐課程,親手實(shí)現(xiàn)了一個(gè)照片風(fēng)格轉(zhuǎn)換器,并對(duì)幾種常見(jiàn)的優(yōu)化算法的性能進(jìn)行了綜合對(duì)比,最終以圖表加博客的方式記錄下來(lái)。
作者比較了基于 CNN 的六種優(yōu)化算法:梯度下降、Adadel、RMSProp、Adam、L-BFGS 和 Adagrad。