6月28日,由清華大學計算機教授、智能技術與系統(tǒng)實驗室副主任黃民烈發(fā)起,聯(lián)合了十余家科研機構、二十多位知名學者共同制定的全球首個《AI對話系統(tǒng)分級定義》(以下簡稱《分級定義》)正式發(fā)布,《分級定義》將推動AI對話系統(tǒng)在虛擬個人助理、智能家居、智能汽車(車載語音)、情感陪護和心理健康等領域的應用有據(jù)可依,并將加速下一代AI對話系統(tǒng)的研發(fā)與應用。

《AI對話系統(tǒng)分級定義》
起源于圖靈測試的AI對話系統(tǒng),是人工智能領域最重要的研究方向之一。如果說自然語言處理是人工智能“皇冠上的明珠”,那么AI對話系統(tǒng)則是自然語言處理中最難、最核心的任務之一,是“明珠中最亮的那顆”。因此,AI對話系統(tǒng)被認為是衡量人工智能發(fā)展水平的重要因素,代表了人工智能的發(fā)展方向。在工業(yè)應用領域,AI對話系統(tǒng)呈現(xiàn)出“爆炸式”增長的態(tài)勢,如以“小度”“小愛”為代表的智能助理,廣泛應用于個人助理、智能家居、智能汽車中,還有以谷歌對話機器人Meena、Facebook聊天機器人Blender為代表的開放域閑聊產(chǎn)品中,與大眾日常生活緊密相關。
近年來,隨著深度學習技術的不斷發(fā)展,AI對話系統(tǒng)已經(jīng)從基于規(guī)則的第一代和以傳統(tǒng)機器學習為核心的第二代,發(fā)展到以大數(shù)據(jù)和大模型為顯著特征的第三代,對話能力產(chǎn)生了革命性變化,在開放話題上展現(xiàn)了驚人的對話能力,對進一步推動人工智能產(chǎn)業(yè)發(fā)展、實現(xiàn)智能化具有巨大意義和價值。

AI對話系統(tǒng)發(fā)展歷程
然而,作為前沿技術,當前AI對話系統(tǒng)標準缺失,造成其在應用中呈現(xiàn)出水平參差不齊、評價體系不一的現(xiàn)狀,導致了業(yè)界因認知不統(tǒng)一而對人工智能交互水平出現(xiàn)誤解,也引起了社會上關于意識、倫理、道德等方面的廣泛討論。因此,為了更好地評估AI對話系統(tǒng)的能力水平,清華大學智能技術與系統(tǒng)實驗室副主任黃民烈聯(lián)合學界和業(yè)界科研機構制定了全球首個《AI對話系統(tǒng)分級定義》,旨在衡量AI對話系統(tǒng)的能力水平,從而促進AI對話系統(tǒng)的進一步研究,同時為工業(yè)界應用提供參考。
參與本次《分級定義》的研究機構和研究者包括(以姓氏拼音排序),科大訊飛AI研究院副院長陳志剛,京東集團副總裁、IEEEFellow何曉冬,清華大學長聘副教授黃民烈,阿里達摩院總監(jiān)、資深算法專家李永彬,華為諾亞方舟語音語義首席科學家、ACLFellow劉群,華為諾亞方舟實驗室高級研究員糜飛,百度主任架構師牛正雨,騰訊AILab總監(jiān)史樹明,中國人民大學副教授宋睿華,阿里達摩院總監(jiān)孫健,小米技術委員會主席、AI實驗室主任王斌,百度技術委員會主席吳華,美團自然語言處理中心總監(jiān)武威,中國人民大學副教授嚴睿,中國科學院深圳先進技術研究院副研究員楊敏,OPPO高級技術總監(jiān)楊振宇,哥倫比亞大學助理教授俞舟,北京師范大學新聞傳播學院院長張洪忠,哈爾濱工業(yè)大學副教授張偉男,北京聆心智能總監(jiān)鄭銀河,三星電子中國研究院語言技術部技術總監(jiān)朱璇。

黃民烈教授詳細介紹《分級定義》
黃民烈教授詳細介紹了《分級定義》的制定情況。他表示,考慮到AI對話系統(tǒng)任務繁多、評價維度多樣、技術路線豐富,撰寫小組在制定《分級定義》時僅關注完全由機器主導的對話系統(tǒng),人機混合的對話系統(tǒng)不在考慮范圍內(nèi)。同時,為了在實際應用中發(fā)揮價值,《分級定義》的制定是從用戶可感知,以及可觀察、可測量、可度量的角度出發(fā),不考慮系統(tǒng)的具體技術實現(xiàn)方式,也不區(qū)分助理類任務、閑聊、知識對話等,均以“場景”進行表述。
在上述原則之下,《分級定義》從自動對話能力、對話質量高低、單一/多個場景、跨場景的上下文依賴和自然切換能力、擬人化程度、主動和持續(xù)學習能力、多模態(tài)感知與表達能力等角度出發(fā),將AI對話系統(tǒng)劃分為從L0~L5的六個等級,等級越高,AI對話系統(tǒng)水平越高。
在此《分級定義》的標準之下,當前AI對話系統(tǒng)水平最高已發(fā)展至L2~L3之間,常見的如“小愛同學”等AI智能助理。
發(fā)布現(xiàn)場,各位參加制定的專家學者,就《分級定義》的發(fā)布、AI對話系統(tǒng)的發(fā)展等話題與媒體進行了交流。華為諾亞方舟語音語義首席科學家、ACLFellow劉群表示,本次《分級定義》的制定在行業(yè)內(nèi)是一次大膽的嘗試,能夠引發(fā)AI對話系統(tǒng)研究領域的思考和討論,幫助研究人員更好地發(fā)現(xiàn)系統(tǒng)的問題并明確研究方向。
小米技術委員會主席、AI實驗室主任王斌表示,在從事AI智能助理的研發(fā)過程中,時常感到難以評判所開發(fā)AI對話系統(tǒng)的水平,因此《分級定義》的制定非常必要?!斗旨壎x》發(fā)布后,AI對話系統(tǒng)能力水平的衡量將有據(jù)可依,對于用戶來說,能夠更多地關注、更清晰地理解AI對話系統(tǒng);對行業(yè)來說,有助于企業(yè)明確研發(fā)方向,也能夠促進行業(yè)更規(guī)范地發(fā)展。
北京師范大學新聞傳播學院院長張洪忠一直非常關注社交機器人所帶來的倫理挑戰(zhàn),他認為《分級定義》的發(fā)布有助于社會對AI對話系統(tǒng)的發(fā)展階段形成更清晰地認知,對于思考、討論、制定法律規(guī)范形成有力參考,以規(guī)避AI對話可能產(chǎn)生的倫理問題。
AI對話系統(tǒng)最高級別的應用為復雜情感任務,該《分級定義》的發(fā)布將促進AI對話系統(tǒng)在情感任務中體現(xiàn)更高水平,從而促進人工智能未來在情感陪伴、心理健康、虛擬人、元宇宙等方面的應用,大大釋放人力和物力成本,促進前沿科技走進大眾日常生活。
此次《分級定義》的發(fā)布,是AI對話系統(tǒng)走向規(guī)范化、系統(tǒng)化發(fā)展的第一步。接下來,黃民烈教授將聯(lián)合該領域相關研究機構及研究者開展白皮書的編纂,聚焦AI對話系統(tǒng)的發(fā)展歷程,詳細闡釋《分級定義》的制定目的和標準。