微軟表示伴隨著生成式AI風(fēng)靡全球,在用戶和AI聊天過程中,也對(duì)文本轉(zhuǎn)語(yǔ)音的自然性和表現(xiàn)力提出了更高的要求。

微軟今天宣布推出en-US-AndrewNeural、en-US-BrianNeural、en-US-EmmaNerual和zh-CN-YunjieNeural四款TTS語(yǔ)音,目前在美國(guó)東部、東南亞和西歐三個(gè)市場(chǎng)提供公共預(yù)覽版。

微軟官方表示四款TTS語(yǔ)音可以提供自然的語(yǔ)音交互,讓聊天聲音變得更貼近現(xiàn)實(shí)、更加自然,且更有吸引力。
微軟在新聞稿中還展示了四款TTS語(yǔ)音的對(duì)比效果,并演示了不同的語(yǔ)氣風(fēng)格,IT之家在此附上鏈接,感興趣的用戶可以深入點(diǎn)擊體驗(yàn)。
微軟表示開發(fā)者使用Azure Speech SDK,REST API,通過Azure OpenAI將語(yǔ)音集成到現(xiàn)有的應(yīng)用程序中。