IT之家12月11日消息,一項(xiàng)新的研究顯示,ChatGPT可能并不適合用來獲取醫(yī)療信息。

長島大學(xué)的研究人員向ChatGPT詢問了39個(gè)與藥物相關(guān)的問題,這些問題都是來自該大學(xué)藥學(xué)院藥物信息服務(wù)中心的真實(shí)問題。隨后,他們將ChatGPT的回答與經(jīng)過培訓(xùn)的藥劑師編寫的答案進(jìn)行比較。

研究發(fā)現(xiàn),ChatGPT只有大約10個(gè)問題的回答是準(zhǔn)確的,占總數(shù)的四分之一。對于其他29個(gè)問題,ChatGPT的回答要么不完整,要么不準(zhǔn)確,要么沒有解決問題。
IT之家注意到,該研究結(jié)果于周二在美國加州阿納海姆舉行的美國衛(wèi)生系統(tǒng)藥劑師協(xié)會(huì)年會(huì)上公布。
長島大學(xué)藥學(xué)實(shí)踐副教授、該研究作者之一Sara Grossman表示,考慮到ChatGPT的普及率,研究人員之所以對其進(jìn)行研究,是因?yàn)閾?dān)心他們的學(xué)生、其他藥劑師和普通消費(fèi)者會(huì)使用它來尋找有關(guān)健康和用藥計(jì)劃的答案。
然而研究人員發(fā)現(xiàn),這些查詢往往會(huì)得到不準(zhǔn)確甚至危險(xiǎn)的答案。例如,在一個(gè)問題中,研究人員詢問ChatGPT新冠病毒抗病毒藥物Paxlovid和降血壓藥物維拉帕米在體內(nèi)是否會(huì)相互作用。ChatGPT回答說,同時(shí)服用這兩種藥物不會(huì)產(chǎn)生任何副作用。
事實(shí)上,同時(shí)服用這兩種藥物的人可能會(huì)出現(xiàn)血壓大幅下降,從而導(dǎo)致頭暈和暈厥。Grossman說,對于同時(shí)服用這兩種藥物的患者,臨床醫(yī)生通常會(huì)制定針對患者的計(jì)劃,包括降低維拉帕米劑量或提醒患者從坐姿緩慢起身。她補(bǔ)充說,ChatGPT的指導(dǎo)會(huì)將人們置于危險(xiǎn)之中。
當(dāng)研究人員要求ChatGPT提供支持其每個(gè)回復(fù)的科學(xué)參考資料時(shí),他們發(fā)現(xiàn)該軟件只能為他們詢問的8個(gè)問題提供參考資料,而且所有參考資料都是ChatGPT編造的。
Grossman之前很少使用過該軟件,她驚訝于ChatGPT能夠幾乎立即合成信息,而這些信息需要經(jīng)過培訓(xùn)的專業(yè)人員花費(fèi)數(shù)小時(shí)才能編譯。她說:“ChatGPT的回答措辭非常專業(yè)和復(fù)雜,似乎可以增加人們對該工具準(zhǔn)確性的信心,用戶、消費(fèi)者或其他無法辨別的人可能會(huì)被權(quán)威的表象所迷惑。”
ChatGPT的開發(fā)機(jī)構(gòu)OpenAI的一位發(fā)言人表示,他們建議用戶不要將ChatGPT的回答作為專業(yè)醫(yī)療建議或治療的替代方案。這位發(fā)言人指出了ChatGPT的使用政策,該政策指出“OpenAI的模型沒有經(jīng)過微調(diào)以提供醫(yī)療信息”。該政策還規(guī)定,這些模型絕不應(yīng)該用于“嚴(yán)重疾病的診斷或治療服務(wù)”。
Grossman雖然不確定有多少人使用ChatGPT來解決藥物問題,但她擔(dān)心他們可能會(huì)像使用搜索引擎搜索醫(yī)療建議一樣使用它。Grossman說:“人們總是希望立即獲得答案,當(dāng)他們手頭有這樣的工具時(shí),他們就會(huì)這樣做。我認(rèn)為這只是另一種使用‘Dr.Google’和其他看似易于獲取信息的工具的方法。”
對于在線醫(yī)療信息,她建議消費(fèi)者使用政府網(wǎng)站提供可靠的信息。不過,Grossman并不認(rèn)為網(wǎng)上答案可以代替醫(yī)療專業(yè)人員的建議,這些信息可能并不適用于患者本人,因?yàn)槊總€(gè)患者都是不同的。