研究人員正在嘗試使用 AI 來(lái)解讀狗的叫聲是在玩耍還是在生氣。

圖源 Pixabay
與此同時(shí),研究人員還嘗試使用 AI 識(shí)別狗的年齡、性別和品種。
密歇根大學(xué)的研究人員與位于普埃布拉的墨西哥國(guó)家天體物理、光學(xué)和電子研究所(INAOE)合作開展了這一研究,發(fā)現(xiàn)最初用于訓(xùn)練人類語(yǔ)音的 AI 模型可以作為訓(xùn)練動(dòng)物交流模型的起點(diǎn)。

圖源 Pixabay
密歇根大學(xué)人工智能實(shí)驗(yàn)室負(fù)責(zé)人 Rada Mihalcea 表示,人工智能在理解語(yǔ)音的微妙之處方面有了顯著進(jìn)步,可以區(qū)分音調(diào)、音調(diào)和口音的細(xì)微差別,可憑借這些研究基礎(chǔ)來(lái)理解狗吠。
開發(fā)這種分析動(dòng)物發(fā)聲 AI 模型的主要障礙之一,是缺乏公開可用的數(shù)據(jù)。雖然有許多資源和機(jī)會(huì)來(lái)記錄人類的語(yǔ)音,但從動(dòng)物身上收集數(shù)據(jù)更加困難。
團(tuán)隊(duì)嘗試使用采集人類語(yǔ)音數(shù)據(jù)的方式來(lái)采集狗的叫聲信息,各種情況下收集了 74 只不同品種、年齡和性別狗狗的吠叫、咆哮和嗚嗚聲。
團(tuán)隊(duì)將采集到的這些聲音信息用于分析人類語(yǔ)音的機(jī)器模型中,模型可以很好地理解狗之間的交流,模型在各種測(cè)試中準(zhǔn)確率達(dá)到 70%。
Rada Mihalcea 表示,“來(lái)自人類語(yǔ)音的聲音和模式可以作為分析和理解其他聲音(如動(dòng)物發(fā)聲)的聲學(xué)模式的基礎(chǔ)”。團(tuán)隊(duì)其他研究人員也表示,更好地了解動(dòng)物發(fā)出各種聲音的細(xì)微差別,可以改善人類對(duì)其情感和身體需求的解釋和反應(yīng)。
據(jù)悉實(shí)驗(yàn)結(jié)果在 2024 年計(jì)算語(yǔ)言學(xué)、語(yǔ)言資源與評(píng)估國(guó)際聯(lián)合會(huì)議進(jìn)行了展示。IT之家附論文鏈接:
https://arxiv.org/pdf/2404.18739