5月6日,第十二屆吳文俊人工智能科學技術獎頒獎典禮在京舉行,旨在獎勵在智能科學技術領域作出貢獻的科技工作者和管理者,此次共有60個項目及個人受到表彰獎勵。

“當前人工智能技術創(chuàng)新產業(yè)應用迅猛發(fā)展,人工智能的應用讓經濟社會各領域從數字化、網絡化向智能化加速躍升。”科技部戰(zhàn)略規(guī)劃司副司長邢懷濱表示,目前我國人工智能全場景的智能應用仍面臨很多挑戰(zhàn),要強化人工智能技術創(chuàng)新和產業(yè)應用雙向促進,充分激發(fā)學術界、產業(yè)界的智慧和創(chuàng)造力,積極培育人工智能新興業(yè)態(tài),匯聚社會強大的發(fā)展動能。
此次,京東云言犀團隊憑借“任務型智能對話交互關鍵技術及大規(guī)模產業(yè)應用”,獲得吳文俊人工智能科學技術獎科技進步獎,京東集團副總裁、京東科技智能服務與產品部負責人何曉冬因在人工智能領域取得的成就榮獲吳文俊人工智能科學技術獎杰出貢獻獎。
他告訴科技日報記者,幾年前,和機器人聊天,要忍受它們的“詞不達意”。而現在,人工智能技術的不斷創(chuàng)新,不僅讓機器人能夠輕松理解你的表達內容,甚至還能讀懂你的猶豫、焦急等。
率先提出關鍵模型框架
“我們一直努力讓機器人有‘捧哏’的天分。”何曉冬說,“基于我們在包括高表現力的對話生成、在復雜場景下進行對話決策等方面的研究創(chuàng)新,此次獲獎項目讓機器人在等待、接續(xù)對話的時機,對話內容的選擇等方面都達到了令人類滿意的程度。”
“過去的技術是給機器人規(guī)定一個時間,比如無聲期超過0.5秒,就要‘接話’。”何曉冬說,任務型對話是以解決真實世界復雜任務為目的,對話中的人類也可能會出現猶豫、沉吟不決等情況,因此往往就會出現人類還在思考,AI就急著插話的情況。
“對此,我們提出了一個多模態(tài)的話語決策模型,在評價語音信號時,不僅考量停頓時間,更重要是計算評估語義完整度、語氣、助詞等,綜合多模態(tài)信號作出動態(tài)決策。”何曉冬解釋,這個模型可以讓AI來判斷對話者是說完了還是在思考。
“會傾聽”是人類重要的交流能力之一。應用“任務型智能對話交互關鍵技術及大規(guī)模產業(yè)應用”,使京東云言犀平臺實現了對機器人“傾聽”能力的塑造。例如,在語音合成時給予機器人多維度的信息,在建模時讓機器人能夠掌握篇章、句子、字詞,多輪對話時使機器人精確捕捉用戶意圖、流暢對答。
規(guī)?;涞胤涨Ъ胰f戶
何曉冬坦言,AI實踐應用不僅能創(chuàng)造價值,還是技術創(chuàng)新的“試金石”,不斷反哺研究人員,完善相關理論。
“例如AI可以在短時間內撥出2600萬通電話,以了解一座城市內居民的健康情況。”何曉冬說,如果沒有這類AI應用,完成相同的工作至少需要1萬名社區(qū)人員不停地打好幾個月的電話。
如今,在北京、大同、蕪湖等地,任務型智能對話交互關鍵技術正在幫助政府更好地進行政務管理與服務。AI不僅可以實現高效率撥打電話,節(jié)約了大量人力資源以及時間成本,還可以同時自動錄入數據,作好分析,預判潛在問題。
京東云言犀平臺率先將此次獲獎技術應用于客戶服務中,囊括了4層知識體系、40多個獨立子系統(tǒng)、3000多個意圖以及3000萬個高質量問答知識點,覆蓋超過1000萬種自營商品的電商知識圖譜,在為用戶提供服務時不僅能解決用戶需求,還能考慮用戶情緒、運用對話技術,提供可用、可控、可信的智能對話服務。
除了語言,該平臺還在畫面、形象、儀態(tài)等方面實現了惟妙惟肖的呈現。“數字人等3D人像的應用目前很多,我們的優(yōu)勢不僅在于更像,還在于從理論和方法上進一步降低了技術復雜度,降低了產業(yè)應用的門檻和企業(yè)的投入產出比。”何曉冬說。
未來,人工智能大模型技術或在短期內將虛擬數字人的交互能力大幅提高,結合對話式AI、生成AI等技術,很多新業(yè)態(tài)將帶來更多全新應用場景,難以辨別的“人類分身”或許就會出現在人群之中。