據(jù)彭博社報(bào)道,谷歌的人工智能聊天機(jī)器人Bard是由數(shù)千名合同工(Contractor)在壓力下訓(xùn)練的,他們只有3分鐘的時(shí)間來(lái)審核Bard生成的回答。


據(jù)報(bào)道,這些合同工來(lái)自Appen和埃森哲等公司,他們只接受了最低限度的培訓(xùn),時(shí)薪只有14美元(IT之家備注:當(dāng)前約100元人民幣)。他們的工作是評(píng)估Bard的回答是否可靠和準(zhǔn)確。
雖然像Bard和ChatGPT這樣的聊天機(jī)器人依賴(lài)于底層的大型語(yǔ)言模型來(lái)生成回答,但是人類(lèi)也參與了回答的審核過(guò)程,以確保它們是可靠和準(zhǔn)確的。然而據(jù)彭博社報(bào)道,根據(jù)內(nèi)部文件和六名合同工的說(shuō)法,審核Bard回答的人類(lèi)工作量變得越來(lái)越大和復(fù)雜。
一名合同工稱(chēng),“就目前情況而言,人們感到害怕、壓力大、工資低,不知道發(fā)生了什么。這種恐懼文化不利于我們提高質(zhì)量和團(tuán)隊(duì)合作。”
合同工的任務(wù)之一就是根據(jù)回答來(lái)評(píng)價(jià)其“有用性”,并在“一點(diǎn)也沒(méi)有用”到“非常有用”的范圍內(nèi)打分。
谷歌發(fā)言人在一份聲明中稱(chēng):“讓人們獲得高質(zhì)量的信息是我們使命的核心。我們進(jìn)行了大量的工作來(lái)負(fù)責(zé)任地構(gòu)建我們的人工智能產(chǎn)品,包括多年來(lái)我們不斷完善的嚴(yán)格測(cè)試、培訓(xùn)和反饋過(guò)程,以強(qiáng)調(diào)事實(shí)性和減少偏見(jiàn)。人工評(píng)估,包括來(lái)自谷歌內(nèi)部和外部的個(gè)人,是我們用來(lái)改進(jìn)產(chǎn)品的眾多方法之一。”
該發(fā)言人還稱(chēng),“評(píng)分并不直接影響我們模型的輸出,它們也絕不是我們提高準(zhǔn)確性的唯一方式。”