
用戶在微軟 Teams 通話中的音頻內(nèi)容是通過本質(zhì)上是 " 數(shù)據(jù)包 " 的方式發(fā)送。而這些數(shù)據(jù)包可能由于網(wǎng)絡(luò)連接不暢而丟失,導(dǎo)致音頻失真。
雖然微軟不能真正解決用戶的互聯(lián)網(wǎng)連接問題,但該公司在 Teams 中利用 " 數(shù)據(jù)包丟失隱藏 "(PLC)的技術(shù),人為讓用戶的聲音在具有挑戰(zhàn)性的網(wǎng)絡(luò)環(huán)境中聽起來更好。在非常高的水平上,PLC 使用人工智能模型來識別音頻傳輸中丟失的數(shù)據(jù)包,然后通過預(yù)測來填補任何空白。
微軟表示,使用了深度學(xué)習(xí)技術(shù)來完成這一改進。該公司聲稱,傳統(tǒng)的模型可以填補 20-40 毫秒的空白,但其 PLC 模型對 Teams 來說明顯更好,因為這可以填補高達 80 毫秒的音頻空白。
IT 之家獲悉,盡管微軟在 600 小時的開源數(shù)據(jù)上訓(xùn)練了 PLC 模型,但引人注意的是,還收集了 " 數(shù)以百萬計的匿名網(wǎng)絡(luò)樣本 ",或者是來自真實 Teams 呼叫的 " 痕跡 ",以測試其模型。在 PLC 模型發(fā)布后,網(wǎng)絡(luò)條件差的參與者報告說,其性能提高了約 15%。
微軟強調(diào),其 Teams PLC 模型完全在本地運行,而且只在網(wǎng)絡(luò)質(zhì)量不佳的情況下運行。最近,Teams PLC 模型已經(jīng)適用于 Windows 客戶,目前正在 Mac 上進行測試,而且將很快就會進入移動端領(lǐng)域。