熱搜： 佳士科技 irobot 工業(yè)機器人機器人 ABB 機器人產(chǎn)業(yè)聯(lián)盟發(fā)那科機械手庫卡碼垛機器人

AI都會寫靈魂Rap了？Transformer跨界說唱，節(jié)奏、流暢度都不在話下

日期：2021-07-15 來源：機器人網(wǎng) 作者：emma 評論：0

標簽： AI Rap

　　Rapper 要醞釀一整天的歌詞，AI 或許幾分鐘就能寫出來。

　　給你一段 Rap，你能看出這是 AI 寫的嗎？

　　仔細品味，也能發(fā)現(xiàn)這段詞中的美中不足之處，但這作詞水平可以說是不錯的。

　　同樣的第一句，可以迅速生成完全不同的段落：

　　人類Rapper的雙押，還是更厲害一點：

　　只需要給定一句輸入，AI 就能生成整首歌詞。從押韻、流暢度、節(jié)奏方面，基本不遜于人類 Rapper。

　　這項研究來自港科大、清華、復(fù)旦等機構(gòu)，在這篇論文中，研究者提出了一個基于 Transformer 的 Rap 生成系統(tǒng)「DeepRapper」，該系統(tǒng)可以同時模擬 Rap 的韻律和節(jié)奏。

　　論文鏈接：https://arxiv.org/pdf/2107.01875.pdf

　　由于沒有現(xiàn)成可用的節(jié)奏對齊的 Rap 數(shù)據(jù)集，為了構(gòu)建這個系統(tǒng)，研究者設(shè)計了一個數(shù)據(jù)挖掘 pipeline，并收集了一個大規(guī)模的 Rap 數(shù)據(jù)集進行韻律建模。

　　一開始，研究者先從網(wǎng)上抓取了許多包含歌詞和音頻的說唱歌曲，并對每一首抓取的說唱歌曲進行一系列數(shù)據(jù)預(yù)處理步驟。為了更好地建模，研究者以自回歸的方式從右到左生成每一句 Rap，這樣就可以很容易地識別出一個句子的最后幾個單詞 (即反向句子的第一個單詞) 來押韻。

　　此外，為了進一步提高 Rap 的押韻質(zhì)量，研究者在語言模型中加入了一些押韻表征，并在推理過程中通過押韻約束來提高生成的 Rap 中的 N-gram 韻律。

　　研究者使用一個特殊的標記 [ BEAT ] 來表示有節(jié)奏的節(jié)拍，并將其插入到相應(yīng)的詞之前的歌詞中。通過這種方式，可以在訓(xùn)練和生成方面按照歌詞的順序來模擬節(jié)拍。

　　受到預(yù)訓(xùn)練語言模型的成功啟發(fā)，研究者將預(yù)訓(xùn)練納入系統(tǒng)。為了獲得大規(guī)模的預(yù)訓(xùn)練數(shù)據(jù)，研究者還使用了數(shù)據(jù)挖掘 pipeline 收集了另外兩個數(shù)據(jù)集:

　　1)節(jié)拍對齊的非說唱歌曲，它可以比說唱數(shù)據(jù)集更大，因為非說唱歌曲比說唱歌曲更通用; 2)純歌詞，同樣比非說唱歌曲數(shù)據(jù)集更大。

　　在預(yù)訓(xùn)練階段，研究者基于上述兩個數(shù)據(jù)集對 DeepRapper 模型進行了預(yù)訓(xùn)練，然后調(diào)整模型在說唱歌曲與調(diào)整節(jié)拍上的性能，微調(diào)模型即用于最終的說唱產(chǎn)生?？陀^評估和主觀評估的實驗結(jié)果都證實了 DeepRapper 在生成押韻和節(jié)奏的說唱歌詞方面的優(yōu)勢。

　　Rap 數(shù)據(jù)集

　　以前用于 rap 生成的作品（Potash 等人，2015 年；Liang 等人，2018 年；Nikolov 等人，2020 年）通常使用只有歌詞的說唱數(shù)據(jù)集，而不考慮節(jié)奏節(jié)拍信息。為了在 rap 生成中建模節(jié)奏，說唱數(shù)據(jù)集應(yīng)該包含具有對齊節(jié)奏節(jié)拍的歌詞。然而，節(jié)拍對齊很難實現(xiàn)，因為它們的注釋需要專業(yè)音樂家來識別說唱歌曲中的重讀音節(jié)。

　　因此，為了解決這個問題，研究者設(shè)計了一個數(shù)據(jù)挖掘 pipeline 來自動提取 beatlyric 對齊。

　　數(shù)據(jù)挖掘 pipeline

　　下圖 1 展示了數(shù)據(jù)挖掘 pipeline 的整體框架，包含 5 個步驟：數(shù)據(jù)抓取、人聲（vocal）與伴奏分離、人聲與歌詞對齊、節(jié)拍檢測以及歌詞與節(jié)拍對齊。

　　挖掘數(shù)據(jù)集

　　基于上圖數(shù)據(jù)挖掘 pipeline，研究者得到了一個具有對齊節(jié)拍的說唱歌詞（rap lyric）數(shù)據(jù)集，并命名為 D-RAP。該數(shù)據(jù)集滿足了構(gòu)建具有韻律和節(jié)奏的 rap 生成系統(tǒng)的要求。他們以 4:1 的比例將 D-RAP 數(shù)據(jù)集劃分為訓(xùn)練和驗證集。

　　與一般歌曲相比，說唱風格的歌曲數(shù)量往往較少，因此研究者挖掘了另外兩個數(shù)據(jù)集，以使用相同的挖掘 pipeline 對 DeepRapper 模型進行預(yù)訓(xùn)練，它們分別是具有對齊節(jié)拍的非說唱歌曲數(shù)據(jù)集 D-SONG 和沒有對齊節(jié)拍的純歌詞數(shù)據(jù)集 D-LYRIC。

　　研究者在下表 1 中對這三個數(shù)據(jù)集包含的歌曲數(shù)量和歌詞句子數(shù)量進行了統(tǒng)計。

　　下圖 2 展示了 D-RAP 數(shù)據(jù)集中具有對齊節(jié)拍的說唱歌曲示例。

　　Rap 生成模型

　　如下圖 3 所示，研究者展示了 rap 生成模型的整體架構(gòu)以及韻律和節(jié)奏建模的細節(jié)。

　　具體地，研究者使用 Transformer 構(gòu)建了一個用于 rap 生成的自回歸語言模型，并引入了以下一些新的對齊：

　　1）為了更好地建模韻律，該模型從左到右生成歌詞句子，這是因為押韻字通常位于句子結(jié)尾；

　　2）如前所述，節(jié)奏對于 rap 效果至關(guān)重要，因而插入了一個特殊的 token [BEAT]來進行顯式節(jié)拍建模；

　　3）與僅有詞嵌入和位置嵌入的原始 Transformer 不同，研究者添加了多個額外嵌入以更好地建模韻律和節(jié)奏。

　　實驗評估

　　下表 2 展示了 DeepRapper 的客觀與主觀評估結(jié)果，并與兩個 baseline 進行了比較。baseline 模型是一個標準的自回歸語言模型，與 DeepRapper 的模型配置相同，但沒有本文提出的韻律模型（+PT 的意思是采用了預(yù)訓(xùn)練）?？陀^評估結(jié)果的維度包括 perplexity、韻律準確性和韻密度；主觀評估維度包括主題、流暢度、押韻質(zhì)量和押韻多樣性。

　　為了突出 DeepRapper 在建模 N-gram 韻律中的優(yōu)勢，研究者使用 Combo-N 來度量 DeepRapper 中每個設(shè)計建模 N-gram 韻律的能力。結(jié)果如下表 4 所示：

　　為了更好地度量節(jié)拍質(zhì)量，研究者分別使用 DeepRapper 和具有節(jié)拍頻率控制的 DeepRapper 隨機生成了大約 5000 個樣本。他們提出了一階分布（First Order Distribution, FOD）和二階分布（Second Order Distribution, SOD），并度量了生成樣本與 DRAP 數(shù)據(jù)集之間分布的距離。

　　研究者將當前 [BEAT] 的間隔定義為當前 [BEAT] 與下個 [BEAT] 之間的歌詞數(shù)量。因此，F(xiàn)OD 被定義為當前 [BEAT]間隔的分布，SOD 被定義為當前 [BEAT]與下個 [BEAT]之間間隔差的分布。間隔的數(shù)值區(qū)間為[0, 1]，具體結(jié)果如下表 5 所示：

　　下圖 6 中，研究者展示了生成的 rap 歌曲示例，可以看出 DeepRapper 的生成效果還不錯。

聲明：凡資訊來源注明為其他媒體來源的信息，均為轉(zhuǎn)載自其他媒體，并不代表本網(wǎng)站贊同其觀點，也不代表本網(wǎng)站對其真實性負責。您若對該文章內(nèi)容有任何疑問或質(zhì)疑，請立即與中國機器人網(wǎng)(www.baoxianwx.cn)聯(lián)系，本網(wǎng)站將迅速給您回應(yīng)并做處理。
電話：021-39553798-8007

更多>相關(guān)資訊

0 條相關(guān)評論

推薦圖文

機器人賦能產(chǎn)業(yè)，智贏	機器人也會創(chuàng)造英國
2018年中國智慧機場行	智能工廠全面解讀！
艾貓早教機器人亮相20	360智能硬件助力美國

推薦資訊

點擊排行

?

• 機器人學(xué)走路很難嗎？英偉達聯(lián)手瑞士大學(xué)利用虛	• 為期三天！廣東智博會今日炫酷開幕
• 央視新聞直播：跟著中智衛(wèi)安AI機器人逛航展	• “AI”來襲 2021人工智能年會在衡陽舉行
• 醫(yī)學(xué)AI部署探索，“推理效率”將成為下一個角斗	• 用AI點亮“華夏之光” 優(yōu)必選機器人正式亮相迪
• 能看家能照顧老人：亞馬遜發(fā)布家用AI機器人	• 破局AI技術(shù)落地應(yīng)用難飛算全自動數(shù)據(jù)建模平臺A
• 英媒：AI普及驅(qū)動中國醫(yī)療進步	• AI技術(shù)已崛起，中國電科攜新機器人亮相

恰佩克獎	機器人高峰論壇	北大機器人	金屬加工在線	AI中國網(wǎng)	埃森焊接展	機氣林
工博會	趕考網(wǎng)	中國機床網(wǎng)	ITES深圳工業(yè)展	電氣自動化網(wǎng)	高壓電氣網(wǎng)	人工智能機器人
亞洲工業(yè)網(wǎng)	二手設(shè)備網(wǎng)	中國（南京）國際應(yīng)急產(chǎn)業(yè)博覽會	庫卡機器人	2022SSE職業(yè)技術(shù)教育現(xiàn)代化博覽會	海南教育裝備展覽會	VLAI未來四足機器人官網(wǎng)
中國傳動網(wǎng)	華北機床網(wǎng)	數(shù)控機床市場網(wǎng)	國家標準化委員會

国产精品久久久久久久小说,国产国产裸模裸模私拍视频,国产精品免费看久久久无码,风流少妇又紧又爽又丰满,国产精品,午夜福利

AI都會寫靈魂Rap了？Transformer跨界說唱，節(jié)奏、流暢度都不在話下

AI都會寫靈魂Rap了？Transformer跨界說唱，節(jié)奏、流暢度都不在話下