5月6日,第十二屆吳文俊人工智能科學(xué)技術(shù)獎(jiǎng)?lì)C獎(jiǎng)典禮在京舉行,旨在獎(jiǎng)勵(lì)在智能科學(xué)技術(shù)領(lǐng)域作出貢獻(xiàn)的科技工作者和管理者,此次共有60個(gè)項(xiàng)目及個(gè)人受到表彰獎(jiǎng)勵(lì)。
“當(dāng)前人工智能技術(shù)創(chuàng)新產(chǎn)業(yè)應(yīng)用迅猛發(fā)展,人工智能的應(yīng)用讓經(jīng)濟(jì)社會(huì)各領(lǐng)域從數(shù)字化、網(wǎng)絡(luò)化向智能化加速躍升。”科技部戰(zhàn)略規(guī)劃司副司長(zhǎng)邢懷濱表示,目前我國(guó)人工智能全場(chǎng)景的智能應(yīng)用仍面臨很多挑戰(zhàn),要強(qiáng)化人工智能技術(shù)創(chuàng)新和產(chǎn)業(yè)應(yīng)用雙向促進(jìn),充分激發(fā)學(xué)術(shù)界、產(chǎn)業(yè)界的智慧和創(chuàng)造力,積極培育人工智能新興業(yè)態(tài),匯聚社會(huì)強(qiáng)大的發(fā)展動(dòng)能。
此次,京東云言犀團(tuán)隊(duì)?wèi){借“任務(wù)型智能對(duì)話交互關(guān)鍵技術(shù)及大規(guī)模產(chǎn)業(yè)應(yīng)用”,獲得吳文俊人工智能科學(xué)技術(shù)獎(jiǎng)科技進(jìn)步獎(jiǎng),京東集團(tuán)副總裁、京東科技智能服務(wù)與產(chǎn)品部負(fù)責(zé)人何曉冬因在人工智能領(lǐng)域取得的成就榮獲吳文俊人工智能科學(xué)技術(shù)獎(jiǎng)杰出貢獻(xiàn)獎(jiǎng)。
他告訴科技日?qǐng)?bào)記者,幾年前,和機(jī)器人聊天,要忍受它們的“詞不達(dá)意”。而現(xiàn)在,人工智能技術(shù)的不斷創(chuàng)新,不僅讓機(jī)器人能夠輕松理解你的表達(dá)內(nèi)容,甚至還能讀懂你的猶豫、焦急等。
率先提出關(guān)鍵模型框架
“我們一直努力讓機(jī)器人有‘捧哏’的天分。”何曉冬說,“基于我們?cè)诎ǜ弑憩F(xiàn)力的對(duì)話生成、在復(fù)雜場(chǎng)景下進(jìn)行對(duì)話決策等方面的研究創(chuàng)新,此次獲獎(jiǎng)項(xiàng)目讓機(jī)器人在等待、接續(xù)對(duì)話的時(shí)機(jī),對(duì)話內(nèi)容的選擇等方面都達(dá)到了令人類滿意的程度。”
“過去的技術(shù)是給機(jī)器人規(guī)定一個(gè)時(shí)間,比如無聲期超過0.5秒,就要‘接話’。”何曉冬說,任務(wù)型對(duì)話是以解決真實(shí)世界復(fù)雜任務(wù)為目的,對(duì)話中的人類也可能會(huì)出現(xiàn)猶豫、沉吟不決等情況,因此往往就會(huì)出現(xiàn)人類還在思考,AI就急著插話的情況。
“對(duì)此,我們提出了一個(gè)多模態(tài)的話語決策模型,在評(píng)價(jià)語音信號(hào)時(shí),不僅考量停頓時(shí)間,更重要是計(jì)算評(píng)估語義完整度、語氣、助詞等,綜合多模態(tài)信號(hào)作出動(dòng)態(tài)決策。”何曉冬解釋,這個(gè)模型可以讓AI來判斷對(duì)話者是說完了還是在思考。
“會(huì)傾聽”是人類重要的交流能力之一。應(yīng)用“任務(wù)型智能對(duì)話交互關(guān)鍵技術(shù)及大規(guī)模產(chǎn)業(yè)應(yīng)用”,使京東云言犀平臺(tái)實(shí)現(xiàn)了對(duì)機(jī)器人“傾聽”能力的塑造。例如,在語音合成時(shí)給予機(jī)器人多維度的信息,在建模時(shí)讓機(jī)器人能夠掌握篇章、句子、字詞,多輪對(duì)話時(shí)使機(jī)器人精確捕捉用戶意圖、流暢對(duì)答。
規(guī)模化落地服務(wù)千家萬戶
何曉冬坦言,AI實(shí)踐應(yīng)用不僅能創(chuàng)造價(jià)值,還是技術(shù)創(chuàng)新的“試金石”,不斷反哺研究人員,完善相關(guān)理論。
“例如AI可以在短時(shí)間內(nèi)撥出2600萬通電話,以了解一座城市內(nèi)居民的健康情況。”何曉冬說,如果沒有這類AI應(yīng)用,完成相同的工作至少需要1萬名社區(qū)人員不停地打好幾個(gè)月的電話。
如今,在北京、大同、蕪湖等地,任務(wù)型智能對(duì)話交互關(guān)鍵技術(shù)正在幫助政府更好地進(jìn)行政務(wù)管理與服務(wù)。AI不僅可以實(shí)現(xiàn)高效率撥打電話,節(jié)約了大量人力資源以及時(shí)間成本,還可以同時(shí)自動(dòng)錄入數(shù)據(jù),作好分析,預(yù)判潛在問題。
京東云言犀平臺(tái)率先將此次獲獎(jiǎng)技術(shù)應(yīng)用于客戶服務(wù)中,囊括了4層知識(shí)體系、40多個(gè)獨(dú)立子系統(tǒng)、3000多個(gè)意圖以及3000萬個(gè)高質(zhì)量問答知識(shí)點(diǎn),覆蓋超過1000萬種自營(yíng)商品的電商知識(shí)圖譜,在為用戶提供服務(wù)時(shí)不僅能解決用戶需求,還能考慮用戶情緒、運(yùn)用對(duì)話技術(shù),提供可用、可控、可信的智能對(duì)話服務(wù)。
除了語言,該平臺(tái)還在畫面、形象、儀態(tài)等方面實(shí)現(xiàn)了惟妙惟肖的呈現(xiàn)。“數(shù)字人等3D人像的應(yīng)用目前很多,我們的優(yōu)勢(shì)不僅在于更像,還在于從理論和方法上進(jìn)一步降低了技術(shù)復(fù)雜度,降低了產(chǎn)業(yè)應(yīng)用的門檻和企業(yè)的投入產(chǎn)出比。”何曉冬說。
未來,人工智能大模型技術(shù)或在短期內(nèi)將虛擬數(shù)字人的交互能力大幅提高,結(jié)合對(duì)話式AI、生成AI等技術(shù),很多新業(yè)態(tài)將帶來更多全新應(yīng)用場(chǎng)景,難以辨別的“人類分身”或許就會(huì)出現(xiàn)在人群之中。