近日,哥倫比亞大學工程研究所推出一款新型認知助聽器,其中研究人員利用聽覺注意力解碼(AAD)技術(shù)和AI(深度學習),實現(xiàn)了用大腦的認知信號來控制助聽器對外界聲音的主觀選擇。
據(jù)悉,該研究由哥倫比亞大學電機工程副教授Nima Mesgarani領(lǐng)導,哥倫比亞大學醫(yī)學中心的神經(jīng)外科和Hofstra-Northwell醫(yī)學院以及費恩斯坦醫(yī)學研究所合作完成。

目前,在一片噪雜的環(huán)境中,現(xiàn)有的數(shù)字助聽器已經(jīng)可以有效地抑制背景噪聲,但是它們不能幫助使用者選擇放大他們想要聽到的聲音,這也一直是數(shù)字助聽器的研究難點。
而此款認知助聽器就解決了這一問題,它可以實時監(jiān)測使用者的大腦活動,以保證使用者即使在嘈雜環(huán)境下,也可以與自已想要交流的對象輕松交談。
對此,Mesgarani解釋道:“這項工作結(jié)合了兩門學科的最新技術(shù):聲學工程和聽覺注意力解碼。我們只要加入深層神經(jīng)網(wǎng)絡(luò)模型來幫助自動分離語音信號,整個系統(tǒng)就可以運用起來。”

早前,團隊就有利用人的認知意識來控制助聽器的想法,直到2012年,他們通過侵入式方式記錄了神經(jīng)信號,隨后實現(xiàn)對神經(jīng)信號的解碼,獲取被測試者注意力的目標。后來,在2015年,他們表示可以通過非侵入性方法實現(xiàn)AAD技術(shù)。
不過整個研發(fā)過程并非易事,對此,與Mesgarani一起工作的博士后科學家James O'Sullivan指出,將科學上的發(fā)現(xiàn)轉(zhuǎn)化為現(xiàn)實世界的可操作技術(shù)需要歷經(jīng)數(shù)次實驗。
在聽覺注意力解碼的實際操作中,研究人員就面臨揚聲器種類選擇問題。于是他們通過將受試者腦部的神經(jīng)反應(yīng)記錄與不同種類揚聲器發(fā)出的語音信號進行比較,得出與神經(jīng)數(shù)據(jù)最大相似性的揚聲器。事實證明,該系統(tǒng)只能采用全頻揚聲器,而非單頻揚聲器。
最終,Mesgarani的團隊開發(fā)了一個端對端系統(tǒng),這個系統(tǒng)會根據(jù)使用者神經(jīng)信號的解碼信號選定到特定的音頻接收通道,其中每個通道都包含一個全頻揚聲器。隨后該系統(tǒng)會自動分離全頻揚聲器中的聲音信號,確定使用者關(guān)注的聲音信號,然后放大該信號,確保使用者能夠清晰聽見。
該團隊使用癲癇手術(shù)的神經(jīng)學受試者的侵入性電皮質(zhì)記錄測試了該系統(tǒng)的功效。
在測試中,他們確定了對AAD有貢獻的聽覺皮質(zhì)區(qū)域,發(fā)現(xiàn)該系統(tǒng)僅使用混頻就可以解碼使用者的注意力方向,并能夠放大他或她想要聽的聲音。并且值得注意的是,整個過程的執(zhí)行最多只要十秒。

此處,基于腦波信號來處理大量的音頻數(shù)據(jù)和神經(jīng)解碼信號是該助聽器系統(tǒng)的重要功能。無疑,實時進行這樣的操作需要超強的計算能力,而將強大的處理器縮小到標準助聽器的大小是十分艱難的。
幸運的是,材料科學的進步使得這樣的微型計算機成為可能。對此,Mesgarani表示,目前正在進行大量的研究,以制造小型專用芯片,滿足所需的計算。
此外,他還表示,因為使用了深層神經(jīng)網(wǎng)絡(luò),且有硬件的支持,最新的助聽器數(shù)據(jù)可同步到手機等設(shè)備上,這將有助于在這種小型設(shè)備中進行大量計算。
據(jù)了解,該技術(shù)目前還處于早期的概念驗證階段,但Mesgarani說,如果一切順利,五年內(nèi),系統(tǒng)將開始出現(xiàn)在商業(yè)助聽器中。