在近期舉辦的2023世界人工智能大會(huì)上,騰訊多媒體實(shí)驗(yàn)室展出了自研AI通用作曲框架XMusic。

▲圖源世界人工智能大會(huì)官網(wǎng)

▲圖源世界人工智能大會(huì)官網(wǎng)
據(jù)騰訊官方宣稱(chēng),這套作曲框架適用于視頻剪輯配樂(lè)、商超會(huì)場(chǎng)環(huán)境音樂(lè)的選擇以及互動(dòng)娛樂(lè)、輔助創(chuàng)作、音樂(lè)教育、互動(dòng)娛樂(lè)、音樂(lè)治療等諸多場(chǎng)景。
XMusic號(hào)稱(chēng)個(gè)人專(zhuān)屬的“行走的音樂(lè)庫(kù)”,用戶(hù)利用圖片、文字、視頻乃至哼唱,都可使XMusic生成對(duì)應(yīng)的樂(lè)曲。比如輸入“逗趣橫生,讓人捧腹大笑”的描述,XMusic就會(huì)生成一段節(jié)奏俏皮、旋律歡快的音樂(lè)。
騰訊還展示了XMusic的另一個(gè)使用場(chǎng)景:音樂(lè)課的老師可使用XMusic生成多樣的節(jié)拍、節(jié)奏、音高練習(xí)曲目,并結(jié)合實(shí)際教學(xué)場(chǎng)景、發(fā)揮AI生成音樂(lè)的教學(xué)輔助能力。
IT之家從騰訊方面注意到,該作曲框架基于自研的多模態(tài)和序列建模技術(shù),可以將提示詞內(nèi)容解析至符號(hào)音樂(lè)要素空間,并以此為控制條件引導(dǎo)模型生成豐富、精準(zhǔn)、動(dòng)聽(tīng)的音樂(lè),可以“達(dá)到商用級(jí)的音樂(lè)生成能力要求”。