據(jù)新華社,芬蘭圖爾庫(kù)大學(xué)的一項(xiàng)新研究表明,GPT-4V 能夠像人類一樣,從圖像和視頻中識(shí)別并解讀人與人之間的復(fù)雜社交信息,其準(zhǔn)確性幾乎可與人類相媲美。
圖源:圖爾庫(kù)大學(xué)
IT之家查詢發(fā)現(xiàn),相關(guān)研究成果已于 9 月 2 日發(fā)表在國(guó)際學(xué)術(shù)期刊《成像神經(jīng)科學(xué)》上。AI 的這一能力有望幫助科學(xué)家更高效地進(jìn)行腦科學(xué)實(shí)驗(yàn),并在醫(yī)療、安保和市場(chǎng)分析等領(lǐng)域展現(xiàn)應(yīng)用潛力。
研究人員在圖爾庫(kù) PET 中心測(cè)試了 ChatGPT 對(duì)社交互動(dòng)的評(píng)估能力。他們要求模型對(duì) 138 項(xiàng)不同的社交特征進(jìn)行判斷,這些特征涵蓋面部表情、身體動(dòng)作以及互動(dòng)特性(如合作或敵意)。隨后,研究團(tuán)隊(duì)將 AI 的評(píng)估結(jié)果與超過(guò) 2000 名人類參與者的評(píng)估進(jìn)行了對(duì)比。
結(jié)果顯示,ChatGPT 給出的判斷與人類結(jié)果高度接近,且其一致性甚至高于單個(gè)人的評(píng)估。圖爾庫(kù)大學(xué)博士后研究員塞韋里?桑塔維爾塔(Severi Santavirta)指出:“由于 ChatGPT 對(duì)社交特征的評(píng)估平均上比單個(gè)參與者更為一致,因此其結(jié)果甚至比個(gè)人判斷更值得信賴。然而,多人共同的評(píng)估仍然比人工智能更準(zhǔn)確?!?/span>
在研究的第二階段,科研團(tuán)隊(duì)分別基于 AI 和人類參與者作出的社交情境評(píng)估結(jié)果,利用功能性腦成像技術(shù)來(lái)模擬社交感知的腦網(wǎng)絡(luò)。結(jié)果顯示,兩者得出的腦網(wǎng)絡(luò)圖譜“驚人地相似”。
研究人員指出,收集人類的評(píng)估結(jié)果需要 2000 多名參與者,共耗時(shí)逾 1 萬(wàn)小時(shí),而 ChatGPT 僅在數(shù)小時(shí)內(nèi)就完成了相同工作量的評(píng)估,這一差距凸顯了 AI 在科研效率上的巨大優(yōu)勢(shì)。
雖然該研究主要關(guān)注神經(jīng)科學(xué)中的應(yīng)用,但研究人員認(rèn)為 AI 的社交情境自動(dòng)評(píng)估功能在多個(gè)領(lǐng)域均具有潛在價(jià)值。例如,醫(yī)療場(chǎng)景中可輔助醫(yī)生和護(hù)士監(jiān)測(cè)患者狀態(tài);在市場(chǎng)營(yíng)銷中可預(yù)測(cè)視聽內(nèi)容的受眾反饋;在安防領(lǐng)域則可幫助識(shí)別監(jiān)控視頻中的異常情況。
桑塔維爾塔補(bǔ)充道:“人工智能不像人類一樣會(huì)疲勞,它能夠全天候監(jiān)測(cè)。在未來(lái),對(duì)越來(lái)越復(fù)雜情境的觀察可能可以交給 AI,而人類則專注于確認(rèn)其中最重要的發(fā)現(xiàn)?!?/span>