7月12日,全球AI界最具影響力的學(xué)術(shù)會(huì)議——第25屆國際人工智能聯(lián)合會(huì)(IJCAI-16)正式進(jìn)入主會(huì)時(shí)間。小i機(jī)器人受邀出席并將在發(fā)表主題演講,而由小i機(jī)器人和復(fù)旦大學(xué)計(jì)算機(jī)學(xué)院合作完成的兩篇AI學(xué)術(shù)論文,也同時(shí)被IJCAI-16錄用。IJCAI自創(chuàng)辦以來始終保持著極高的學(xué)術(shù)水平和影響力,學(xué)術(shù)論文被錄用,意味著論文成果受到國際同行認(rèn)可,在相關(guān)問題上的研究水平國際領(lǐng)先。
中國技術(shù)突破大規(guī)模知識(shí)庫構(gòu)建與問答挑戰(zhàn)
今年IJCAI-16從全球眾多AI學(xué)術(shù)論文中,共篩選并錄用了551篇最頂級技術(shù)論文,小i機(jī)器人和復(fù)旦大學(xué)合作的兩篇論文位列其中,分別針對大規(guī)模自動(dòng)化知識(shí)庫構(gòu)建以及面向海量知識(shí)庫自然語言問答展開了研究,解決了其中的眾多挑戰(zhàn)。
據(jù)了解,大規(guī)模知識(shí)庫是實(shí)現(xiàn)智能信息處理和機(jī)器智腦的關(guān)鍵所在。自動(dòng)化構(gòu)建大規(guī)模、高質(zhì)量知識(shí)庫因而成為了人工智能領(lǐng)域競爭的核心問題。富含屬性信息的概念分類體系是知識(shí)庫的重要類型,是實(shí)現(xiàn)機(jī)器認(rèn)知實(shí)體的前提,但現(xiàn)有研究卻鮮有提及。比如“香港歌星”這個(gè)概念是由其屬性“出生地=香港”和“職業(yè)=歌手”所決定的。當(dāng)機(jī)器擁有任意概念的特征屬性,機(jī)器就可以將現(xiàn)實(shí)世界符合條件的實(shí)體加以準(zhǔn)確歸類,從而實(shí)現(xiàn)實(shí)體認(rèn)知。此次的IJCAI論文,研究團(tuán)隊(duì)在國際上首次提出這一問題,并利用大數(shù)據(jù)方法自動(dòng)從大規(guī)模在線實(shí)體庫上展開挖掘以抽取概念的特征屬性。最終為6萬多常見概念找到了相應(yīng)的特征屬性,為下一步機(jī)器實(shí)體認(rèn)知奠定了基礎(chǔ)。
自然語言問答是人機(jī)交互的重要形式之一。近年來,隨著結(jié)構(gòu)化知識(shí)庫的規(guī)模與質(zhì)量的不斷提升,面向大規(guī)模知識(shí)庫的自然語言問答日益流行。但實(shí)現(xiàn)這一目標(biāo)仍然面臨眾多挑戰(zhàn),其中之一在于同一意圖的問題通常具有較多不同的語言形式。之前的研究工作,包括基于規(guī)則的、基于關(guān)鍵詞的、基于同義詞的方法,都受限于傳統(tǒng)的表示形式,只能回答一小部分問題,而不能完整理解整個(gè)問題。在此次IJCAI論文中,研究團(tuán)隊(duì)提出一種新型問題語義表示方法:問題模板,以及相應(yīng)的基于大數(shù)據(jù)的自動(dòng)提煉方法;實(shí)現(xiàn)了基于語義模板面向知識(shí)庫的自然語言問答系統(tǒng)——KBQA系統(tǒng)。大規(guī)模測試表明這一系統(tǒng)對問題理解的準(zhǔn)確率達(dá)到90%以上,且無論是在性能還是效率上,都擊敗了QALD測評數(shù)據(jù)集上的其他系統(tǒng),穩(wěn)居全球前列。這一工作代表了知識(shí)庫上自然語言問答的最新發(fā)展。
多領(lǐng)域合作加速學(xué)術(shù)成果應(yīng)用轉(zhuǎn)換
在構(gòu)建大規(guī)模知識(shí)庫方面,小i機(jī)器人與復(fù)旦大學(xué)計(jì)算機(jī)學(xué)院已經(jīng)共同研發(fā)了最大的中文結(jié)構(gòu)化百科CN-DBpedia、完成了深度學(xué)習(xí)算法在自然語言處理中的研究,以及建立了面向十億規(guī)模知識(shí)圖譜的在線自然語言問答系統(tǒng)。
小i與華東師范大學(xué)共同組建了語義大數(shù)據(jù)聯(lián)合實(shí)驗(yàn)室,并成功推出“醫(yī)療AI知識(shí)助手”,為醫(yī)生提供疾病統(tǒng)計(jì)數(shù)據(jù)查詢、學(xué)術(shù)專業(yè)搜索和潛在疾病分析、進(jìn)行相關(guān)醫(yī)生的推薦,幫助提升國內(nèi)醫(yī)療領(lǐng)域的技術(shù)和經(jīng)驗(yàn),連續(xù)獲得了2015 CLEFeHealth“臨床醫(yī)療癥狀信息檢索”第一名和TREC“臨床診斷支持信息檢索”第一名。同時(shí),雙方還針對電商領(lǐng)域推出CEQA智能問答系統(tǒng),現(xiàn)已隨著電子商務(wù)的豐富被廣泛應(yīng)用于電商客服。
除此之外,小i機(jī)器人與中科院軟件所、聲學(xué)所、北京大學(xué)語言所、清華大學(xué)等高校和科研機(jī)構(gòu)也建立了合作。通過這樣的合作,小i機(jī)器人搭建了一座以企業(yè)大規(guī)模的商業(yè)數(shù)據(jù)支持學(xué)術(shù)研究,以技術(shù)突破反哺產(chǎn)業(yè)應(yīng)用落地的良性循環(huán)平臺(tái),形成企業(yè)與科技機(jī)構(gòu)優(yōu)勢互補(bǔ)的局面,不但在學(xué)術(shù)研究方面形成突破,而且在經(jīng)濟(jì)效益上取得成效,讓小i機(jī)器人始終保持技術(shù)的領(lǐng)先性,并推動(dòng)更加深入的產(chǎn)業(yè)化應(yīng)用,最終走上了全球頂尖的人工智能學(xué)術(shù)會(huì)議IJCAI的舞臺(tái)。
從IJCAI官方公布的參會(huì)信息看,小i機(jī)器人是唯一一家受邀在IJCAI上演講的中國公司,小i機(jī)器人朱頻頻博士將在當(dāng)?shù)貢r(shí)間7月15日IJCAI-16會(huì)議壓軸的Industry Day(工業(yè)日)上發(fā)表演講,并與谷歌研究主管Peter Norvig、COGITAI創(chuàng)始人兼總裁Peter Stone等頂級專家就AI當(dāng)前最核心的發(fā)展與挑戰(zhàn)問題展開探討。據(jù)悉:首次在美國展出的小i機(jī)器人成熟的商業(yè)應(yīng)用受到了來自全球AI專家及大學(xué)研究院的關(guān)注。