在黨和政府以及全社會的共同努力下,我國新冠肺炎疫情防控取得了階段性的勝利,各地陸續(xù)復(fù)工復(fù)產(chǎn),人工智能技術(shù)持續(xù)賦能,為各行各業(yè)的安全復(fù)工復(fù)產(chǎn)發(fā)揮了重要作用。聲音作為人類溝通最自然的工具,既有語言屬性又有身份屬性,聲紋識別在這場與病毒較量的戰(zhàn)“疫”中充分發(fā)揮了其技術(shù)優(yōu)越性,北京遠(yuǎn)鑒信息技術(shù)有限公司(以下簡稱“遠(yuǎn)鑒”)的聲紋考勤,就是其中的典型代表,公司利用“聲紋+應(yīng)用”,筑起一道新防線,助力企業(yè)復(fù)工復(fù)產(chǎn)。
那么,聲紋到底是如何工作的,它能為社會帶來怎樣的價(jià)值,落地應(yīng)用在哪些場景呢?我們今天請到了遠(yuǎn)鑒副總裁沈思成先生,以下是本網(wǎng)記者對沈總的采訪內(nèi)容。
中國安防行業(yè)網(wǎng):遠(yuǎn)鑒這次推出的無接觸考勤應(yīng)用了聲紋技術(shù),能簡單給我們介紹下該技術(shù)么?
沈思成:聲紋是由波長、頻率以及強(qiáng)度等百余種特征維度組成的生物特征,具有穩(wěn)定性、可測量性、唯一性等特點(diǎn)。與其他生物特征相比,聲紋識別技術(shù)有一些非常突出的優(yōu)勢:比如蘊(yùn)含聲紋特征的語音獲取方便、自然,聲紋提取可在不知不覺中完成,因此使用者的接受程度也高;再比如獲取語音的識別成本低廉,使用簡單,一個(gè)麥克風(fēng)即可,在使用通訊設(shè)備時(shí)更無需額外的錄音設(shè)備。而且聲紋是非常適合遠(yuǎn)程身份確認(rèn),即使是傳統(tǒng)的電話也可以通過聲音信息傳遞實(shí)現(xiàn)遠(yuǎn)程驗(yàn)證。比如我們的“無接觸式”聲紋考勤系統(tǒng)只需要員工使用本人手機(jī),讀出幾位隨機(jī)數(shù)字一兩秒鐘就可以完成打卡,既不需要摘下口罩,更不需要在指紋打卡機(jī)前聚集排隊(duì),靈活便捷。
中國安防行業(yè)網(wǎng):聲紋的優(yōu)點(diǎn)顯而易見,那么它的應(yīng)用價(jià)值主要體現(xiàn)在哪里呢?
沈思成:進(jìn)入互聯(lián)網(wǎng)時(shí)代,數(shù)字身份的概念就在不斷變換,但本質(zhì)上都是用戶向遠(yuǎn)程的服務(wù)端證明“你是你”。聲紋作為一種生物特征,固有的價(jià)值在于能證明或識別人的身份。主要體現(xiàn)在兩個(gè)方面:一是證明人的身份,也叫身份確認(rèn),很多場合需要證明“我是我”和“只有我”才能做,尤其在遠(yuǎn)程證明身份的場合,聲紋的優(yōu)勢尤其突出。二是識別人的身份,也叫身份辨認(rèn),主要應(yīng)用在公共安全和國家安全方面,需要辨認(rèn)“ta是誰”,比如電信詐騙分子、恐怖分子等。從這兩個(gè)方面可以看出,聲紋識別在網(wǎng)絡(luò)空間具有特殊的意義:一方面眾多的互聯(lián)網(wǎng)應(yīng)用場景需要用戶證明身份,聲紋識別非常便捷,對隱私的侵?jǐn)_小于人臉識別;另一方面,聲紋識別對于揭開網(wǎng)絡(luò)空間匿名身份的真實(shí)面目具有獨(dú)特的優(yōu)勢。遠(yuǎn)鑒希望能夠讓聲音成為堅(jiān)實(shí)的盾牌,為國家公共安全、網(wǎng)絡(luò)安全解決身份識別與認(rèn)證問題,為未來網(wǎng)絡(luò)可信身份國家行動(dòng)戰(zhàn)略推廣和實(shí)施奠定應(yīng)用基礎(chǔ)。
中國安防行業(yè)網(wǎng):據(jù)了解遠(yuǎn)鑒從一開始就選擇了聲紋技術(shù)作為“招牌”,那在聲紋領(lǐng)域遠(yuǎn)鑒都做了哪些探索呢?
沈思成:遠(yuǎn)鑒一直以來非常重視身份認(rèn)證領(lǐng)域,從2013年開始,我們敏銳的發(fā)現(xiàn)了聲紋識別的行業(yè)應(yīng)用機(jī)會,加大了對聲紋識別等人工智能技術(shù)的研發(fā)和行業(yè)開拓,引入國內(nèi)頂級聲紋技術(shù)團(tuán)隊(duì)。
在不斷組建、擴(kuò)充團(tuán)隊(duì)的過程中,遠(yuǎn)鑒創(chuàng)造性地將聲紋識別與人臉識別深度融合,在國際上首創(chuàng)“人臉+聲紋+X”多維身份識別算法,并推出多維認(rèn)證系統(tǒng),受到公安部門青睞,已經(jīng)在全國20多個(gè)省、市公安機(jī)關(guān)落地。當(dāng)然,該產(chǎn)品同樣適合任何重視數(shù)據(jù)安全的行業(yè)。
后來,遠(yuǎn)鑒參與國家的重大工程項(xiàng)目,經(jīng)過技術(shù)測評后以第一名的成績勝出,因此得以接觸到真實(shí)場景下的數(shù)據(jù)和實(shí)戰(zhàn)需求。在國家需求的牽引下,2018年我們突破了聲紋識別跨信道這一業(yè)界難題,也打通了聲紋識別大規(guī)模應(yīng)用的最后一公里。2019年,遠(yuǎn)鑒又面向破解聲音深度偽造進(jìn)軍,突破性解決聲紋活體檢測難題,能夠?qū)φZ音產(chǎn)生的真實(shí)性、來源真實(shí)性進(jìn)行鑒別。
在2019年中國人工智能多媒體信息識別技術(shù)競賽中,遠(yuǎn)鑒獲得聲紋識別冠軍,獲評最高等級的A級單位。同年的中國創(chuàng)新挑戰(zhàn)賽暨中關(guān)村新興領(lǐng)域?qū)n}賽中,遠(yuǎn)鑒再次獲得聲紋競賽冠軍-優(yōu)勝獎(jiǎng)。遠(yuǎn)鑒相繼承擔(dān)了國家十二五、十三五科技支撐計(jì)劃中相關(guān)聲紋識別課題的研究任務(wù),主導(dǎo)起草了多項(xiàng)公共安全行業(yè)標(biāo)準(zhǔn)和國家標(biāo)準(zhǔn)等,更成為多維身份識別與可信認(rèn)證技術(shù)國家工程實(shí)驗(yàn)室的承建單位之一。
中國安防行業(yè)網(wǎng):技術(shù)上的前置條件已經(jīng)達(dá)成了,那么聲紋的實(shí)際應(yīng)用體現(xiàn)在了哪些方面呢?
沈思成:近兩年來,遠(yuǎn)鑒一直在努力讓技術(shù)走向應(yīng)用。天道酬勤,隨著我們技術(shù)的逐步成熟,聲紋識別已經(jīng)可以從研究領(lǐng)域走進(jìn)了工業(yè)界和民用視野,成為進(jìn)行身份識別和保障身份安全的“黑科技”。遠(yuǎn)鑒在多維身份識別、生物特征庫、嵌入式應(yīng)用等三個(gè)方向推動(dòng)聲紋技術(shù)應(yīng)用落地。多維身份識別的應(yīng)用在前面已經(jīng)介紹,我再以生物特征庫為例分析一下聲紋識別技術(shù)的應(yīng)用前景。
美國在2003年911事件之后即開始了大規(guī)模的聲紋識別應(yīng)用。我國公安部門也早已建立包含指紋、掌紋、DNA等生物特征的數(shù)據(jù)庫。隨著我國聲紋技術(shù)的突破性進(jìn)展,我國公安機(jī)關(guān)也啟動(dòng)了刑事聲紋庫的建設(shè)。聲紋具有非接觸式采集的優(yōu)點(diǎn),可以和已有DNA庫、指紋庫相結(jié)合,形成立體生物特征庫,建成后直接為多行業(yè)領(lǐng)域服務(wù),形成身份與實(shí)人的強(qiáng)綁定關(guān)系,有效保護(hù)公共安全,提升社會治理效率和綜合管理能力,是落實(shí)科技強(qiáng)國的重要實(shí)踐之一。目前,公安部已在聲紋庫建設(shè)方面進(jìn)行了重點(diǎn)布局,遠(yuǎn)鑒是為數(shù)不多通過公安部標(biāo)準(zhǔn)檢測的廠商,為有關(guān)部門提供聲紋采集儀、諦聽聲紋庫、多維生物特征認(rèn)證等技術(shù)支持服務(wù),全方位保護(hù)國家公共安全。
當(dāng)然,并不局限于國家公共安全,遠(yuǎn)鑒也在積極探索AI如何服務(wù)“互聯(lián)網(wǎng)+政務(wù)服務(wù)”“社會治理”和“民生服務(wù)”,比如疫情期間,遠(yuǎn)鑒推出了“無接觸式”聲紋考勤,科技助力安全復(fù)工。未來,遠(yuǎn)鑒希望能夠通過聲紋和語音識別技術(shù),推動(dòng)城市逐步實(shí)現(xiàn)精細(xì)化管理,為百姓提供更人性化的服務(wù),讓智慧城市更安全。
中國安防行業(yè)網(wǎng):聲紋的市場未來可期,那么遠(yuǎn)鑒對聲紋未來發(fā)展有什么展望么?
沈思成:隨著我國對于“新基建”的部署的逐步深入,特別是進(jìn)入2020年首次國務(wù)院常務(wù)會議就提出,出臺信息網(wǎng)絡(luò)等新型基礎(chǔ)設(shè)施投資支持政策,聲紋識別等領(lǐng)先技術(shù)正在深度融入數(shù)字中國、網(wǎng)絡(luò)強(qiáng)國和智慧社會建設(shè)中。如今的聲紋識別,已經(jīng)走出實(shí)驗(yàn)室,邁向產(chǎn)業(yè)化,能夠支撐大體量生物特征庫的建立,為保護(hù)國家安全、金融安全等提供重要的技術(shù)支撐。未來,聲紋識別和聲紋大數(shù)據(jù)技術(shù)將持續(xù)助力構(gòu)建和強(qiáng)化安全的社會公眾環(huán)境。
遠(yuǎn)鑒作為一家技術(shù)驅(qū)動(dòng)型公司,深厚的自主研發(fā)能力、領(lǐng)跑業(yè)內(nèi)的技術(shù)實(shí)力,都已經(jīng)讓我們從試水者變成了如今的引領(lǐng)者。我們希望能依托現(xiàn)有聲紋識別的行業(yè)應(yīng)用優(yōu)勢、應(yīng)用數(shù)據(jù)優(yōu)勢和核心技術(shù)優(yōu)勢,打造獨(dú)有的聲紋生態(tài),并融合更多人工智能技術(shù),形成“新聲紋”模式。同時(shí)基于互聯(lián)網(wǎng)可信身份認(rèn)證服務(wù),我們會著力發(fā)展行業(yè)智能業(yè)務(wù),并探索發(fā)展個(gè)人智能業(yè)務(wù)。我們希望把遠(yuǎn)鑒打造成為“數(shù)字中國”重要的技術(shù)基石,有力支撐“數(shù)字中國”新型信息基礎(chǔ)設(shè)施建設(shè),為中國的網(wǎng)信事業(yè)做出更大貢獻(xiàn)。