據(jù)日本《朝日新聞》報(bào)道,美國堪薩斯大學(xué)的研究團(tuán)隊(duì)近期發(fā)現(xiàn)了一種新的檢驗(yàn)辦法,可以準(zhǔn)確判斷一篇論文是否由ChatGPT創(chuàng)作,其準(zhǔn)確率可達(dá)到99%。

目前,用戶只需要輸入一組數(shù)據(jù),并附言“請使用這些數(shù)據(jù)寫一份學(xué)術(shù)論文”,ChatGPT就能在幾十秒內(nèi)創(chuàng)作一篇可以假亂真的論文,這使得許多論文作者已經(jīng)部分甚至全部使用ChatGPT來寫論文。
不過,一些學(xué)術(shù)期刊和研究機(jī)構(gòu)已經(jīng)警告稱,如果這些作者在提交時沒有明確說明自己使用了ChatGPT,則構(gòu)成抄襲或其他欺詐行為。

出于這個原因,檢測文章是否是由AI生成的相關(guān)工具研發(fā)已經(jīng)取得了進(jìn)展,但到目前為止,還沒有專門用于學(xué)術(shù)論文的檢測工具。
堪薩斯大學(xué)的研究團(tuán)隊(duì)則專注于從“段落復(fù)雜性”和“常用短語”著手,訓(xùn)練一個新的AI來檢驗(yàn)一篇論文是否由ChatGPT生成。
報(bào)道稱,研究團(tuán)隊(duì)在截至2023年3月的半年內(nèi),從美國學(xué)術(shù)期刊《科學(xué)》雜志上選取了64篇論文,并讓ChatGPT為論文生成300-400個字左右的摘要,最終生成了128篇由ChatGPT創(chuàng)作的文章,并被用于訓(xùn)練這個新的檢測AI模型。
經(jīng)過訓(xùn)練,該模型可以從AI生成的文章中100%識別出人工創(chuàng)作的部分,對文本中特定段落的識別準(zhǔn)確率為92%,綜合準(zhǔn)確率達(dá)99%。相關(guān)成果已經(jīng)發(fā)布在了《Cell Reports Physical Science》雜志上。
研究團(tuán)隊(duì)發(fā)現(xiàn),ChatGPT很少使用“雖然……但是……(but、however、although)”這類表述。相反,它很喜歡使用“他人(others)、研究者(researchers)”等詞語。
另一方面,人類更習(xí)慣將長句和短句交錯使用,并且在句式上也與ChatGPT的慣用寫法有所差異。
IT之家此前報(bào)道,美國得克薩斯農(nóng)工大學(xué)的一位教授,曾通過向ChatGPT輸入學(xué)生論文的方式來反向驗(yàn)證這些論文是否也是由ChatGPT生成,同樣取得了不錯的效果,直接導(dǎo)致半個班的學(xué)生掛科。