據(jù)著名科技網(wǎng)站The Verge報(bào)道,OpenAI公司3月29日最新推出了一項(xiàng)名為“語(yǔ)音引擎”(Voice Engine)的人工智能工具,其僅憑一段15秒的聲音樣本,便能夠精準(zhǔn)模仿出該人的聲音。
OpenAI稱,該引擎自2022年底以來(lái)一直在開發(fā)中,實(shí)際已在ChatGPT應(yīng)用程序的“大聲朗讀”功能中應(yīng)用,該功能顧名思義會(huì)向用戶朗讀相關(guān)內(nèi)容。
用戶只需利用15秒的樣本來(lái)訓(xùn)練聲音,就可讓它以一種“情感和現(xiàn)實(shí)”的方式讀出喜歡的任何文本。OpenAI表示,它可用于教育目的,將播客翻譯成新語(yǔ)言。OpenAI發(fā)布的剪輯聽起來(lái)令人印象深刻,盡管它們有輕微生硬的機(jī)器人痕跡。
“語(yǔ)音引擎”展示了一些已經(jīng)開始應(yīng)用的例子。如生成更自然、更富有情感的聲音;將視頻內(nèi)容翻譯成多種語(yǔ)言,以拓寬其全球受眾范圍。這項(xiàng)技術(shù)的一大特色是,在翻譯過(guò)程中能夠保留演講者原有的口音特征,為翻譯增添了更多真實(shí)感和個(gè)性化色彩。
“語(yǔ)音引擎”還可為語(yǔ)言障礙者提供支持,例如開發(fā)針對(duì)語(yǔ)言障礙者的治療應(yīng)用,為有特殊學(xué)習(xí)需求的人提供教育輔助,使用戶能選擇最能體現(xiàn)其個(gè)性的聲音,并且對(duì)那些使用多種語(yǔ)言的用戶,保持在各種語(yǔ)言中聲音的一致性。“語(yǔ)音引擎”使用一位年輕患者之前為學(xué)校項(xiàng)目錄制的視頻音頻,成功恢復(fù)了她因血管性腦瘤而失去的流暢語(yǔ)言能力。
OpenAI目前并未立即向市場(chǎng)全面推廣,而是選擇與少數(shù)早期測(cè)試者謹(jǐn)慎地合作,共同探索“語(yǔ)音引擎”的應(yīng)用可能和潛在風(fēng)險(xiǎn)。
“語(yǔ)音引擎”目前僅處于有限測(cè)試階段,主要原因是擔(dān)心被濫用。OpenAI指出,“語(yǔ)音引擎”可能導(dǎo)致語(yǔ)音身份驗(yàn)證措施出現(xiàn)問(wèn)題,以及讓大眾在誤以為自己與熟人通話的情況下涉入騙局。
OpenAI表示希望進(jìn)行更多研究,以確保此類工具無(wú)法在未經(jīng)同意的情況下用于傳播錯(cuò)誤信息和復(fù)制聲音。