2022年12月30日,由中國計算機學會語音對話與聽覺專委會、中國中文信息學會語音專委會主辦,得意音通與聲紋圈聯(lián)合承辦的第3屆聲紋識別產業(yè)發(fā)展與創(chuàng)新研討會在京召開,多位業(yè)內人士出席并以“讓聲紋成為生產力”為主題共同探討了聲紋識別產業(yè)現(xiàn)狀及未來發(fā)展趨勢。中國科學院院士、清華大學人工智能研究院創(chuàng)始院長、名譽院長張鈸在會上致辭,他指出,人工智能產業(yè)如何做大做強,是目前所有人工智能產業(yè)創(chuàng)業(yè)者在創(chuàng)業(yè)過程中遇到的最大問題。


張鈸表示,跟信息產業(yè)相比,人工智能產業(yè)的發(fā)展速度和發(fā)展過程更加曲折。信息產業(yè)是在信息科學技術的理論完全建立完成的基礎上發(fā)展,在產業(yè)發(fā)展之前,基礎理論就已經非常完善,只需沿著理論指引的方向發(fā)展產業(yè)。因此,信息產業(yè)建立的硬件和軟件都是通用的,跟應用領域和應用場景沒有關系。所以它的市場很大,不存在如何做大做強的問題。他認為,人工智能產業(yè)的曲折發(fā)展主要有以下兩個原因:
一是目前人工智能的軟硬件與應用場景和應用領域密切相關。比如,人工智能的“智能芯片”與計算機的芯片完全不同,是為特定的算法和特定的領域服務,是專用的,所以它不具備計算機硬件那樣的通用性,因此會遇到如何擴大市場的問題。
二是人工智能缺乏理論基礎,所以算法也好,模型也好,都具有很大的缺陷和局限性,這也對它的應用領域產生了很大的限制。而由于它的方法本身的限制,比如安全性、隱私保護等問題,使得人工智能的應用領域也受到限制。
對此,張鈸也提出了兩點意見。
首先,人工智能要往各種維度上去發(fā)展。以聲紋或語音信息處理(speech informationprocessing)為例,語音本身就是一個很廣的應用環(huán)境,因為不僅嗓子能發(fā)出聲波,人在呼吸時或機器在工作過程中都會發(fā)出聲波。從這個維度看,語音信息處理就不僅是語音或說話人識別,完全可以擴展到很多其他的應用領域。不僅可以用來做人的身份鑒別,也可以用來診斷人的疾病,診斷機器的毛病或者觀察機器的運行過程等。
其次,人工智能要有維度上的擴展,這是針對算法本身局限性而提出的。機器學習的方法是運用大數(shù)據(jù)處理。而大數(shù)據(jù)的處理方法雖然有很多的優(yōu)點也很實用,但它本身是不安全的,是跟數(shù)據(jù)密切相關的。“我們需要通過算法上缺陷的改進,也就是我們現(xiàn)在提出的發(fā)展第三代人工智能的思路來擴展它的應用范圍。”張鈸稱,這包括數(shù)據(jù)與知識的結合、多特征的融合,多種模態(tài)的結合,軟件和硬件的結合等等,目的都是針對目前算法本身的局限性。
張鈸表示,人工智能的算法,特別是基于深度學習或者機器學習的算法,本身存在著不安全和不可解釋等缺點。這些缺點如果不加以克服,它應用的場景就會受到很大限制,所以今天的討論非常重要,也有很普遍的意義。在跟應用場景密切結合的基礎上,去改進人工智能的算法,這樣才有可能把人工智能的產業(yè)做大做強。
本次研討會由中國計算機學會語音對話與聽覺專委會、中國中文信息學會語音專委會主辦,得意音通與聲紋圈聯(lián)合承辦。