熱搜： 佳士科技 irobot 工業(yè)機(jī)器人機(jī)器人機(jī)器人產(chǎn)業(yè)聯(lián)盟 ABB 發(fā)那科機(jī)械手碼垛機(jī)器人機(jī)器人展覽

AI 打敗 AI：谷歌研究團(tuán)隊(duì)利用 GPT-4 擊敗 AI-Guardian 審核系統(tǒng)

日期：2023-08-03 來源：IT之家評(píng)論：0

　　谷歌研究團(tuán)隊(duì)正在進(jìn)行一項(xiàng)實(shí)驗(yàn)，他們使用OpenAI的GPT-4來攻破其他AI模型的安全防護(hù)措施，該團(tuán)隊(duì)目前已經(jīng)攻破AI-Guardian審核系統(tǒng)，并分享了相關(guān)技術(shù)細(xì)節(jié)。

　　IT之家經(jīng)過查詢得知，AI-Guardian是一種AI審核系統(tǒng)，能夠檢測(cè)圖片中是否存在不當(dāng)內(nèi)容，及圖片本身是否被其他AI修改過，若檢測(cè)到圖片存在上述跡象，便會(huì)提示管理員前來處理。

　　谷歌Deep Mind的研究人員Nicholas Carlini在一篇題為“AI-Guardian的LLM輔助開發(fā)”的論文中，探討了使用GPT-4“設(shè)計(jì)攻擊方法、撰寫攻擊原理”的方案，并將這些方案用于欺騙AI-Guardian的防御機(jī)制。

▲圖源谷歌研究團(tuán)隊(duì)

　　據(jù)悉，GPT-4會(huì)發(fā)出一系列錯(cuò)誤的腳本和解釋來欺騙AI-Guardian，論文中提到，GPT-4可以讓AI-Guardian認(rèn)為“某人拿著槍的照片”是“某人拿著無害蘋果的照片”，從而讓AI-Guardian直接放行相關(guān)圖片輸入源。谷歌研究團(tuán)隊(duì)表示，通過GPT-4的幫助，他們成功地“破解”了AI-Guardian的防御，使該模型的精確值從98%的降低到僅8%。

　　目前相關(guān)技術(shù)文檔已經(jīng)發(fā)布在ArXiv中，有興趣的小伙伴們可以前往了解，不過AI-Guardian的開發(fā)者也同時(shí)指出，谷歌研究團(tuán)隊(duì)的這種攻擊方法將在未來的AI-Guardian版本中不再可用，考慮到別的模型也會(huì)隨之跟進(jìn)，因此當(dāng)下谷歌的這套攻擊方案更多在日后只能用于參考性質(zhì)。

聲明：凡資訊來源注明為其他媒體來源的信息，均為轉(zhuǎn)載自其他媒體，并不代表本網(wǎng)站贊同其觀點(diǎn)，也不代表本網(wǎng)站對(duì)其真實(shí)性負(fù)責(zé)。您若對(duì)該文章內(nèi)容有任何疑問或質(zhì)疑，請(qǐng)立即與中國機(jī)器人網(wǎng)(www.baoxianwx.cn)聯(lián)系，本網(wǎng)站將迅速給您回應(yīng)并做處理。
電話：021-39553798-8007

更多>相關(guān)資訊

0 條相關(guān)評(píng)論

推薦圖文

加州大學(xué)科學(xué)家發(fā)明了	深圳又一制造業(yè)總部基
水下機(jī)器人在漁業(yè)中的	哈工程水下機(jī)器人再奪
里程碑！荊州市首臺(tái)機(jī)	超維科技精彩亮相電力

推薦資訊

點(diǎn)擊排行

?

• 報(bào)告稱 Meta 的 Llama 2 和 OpenAI 的 ChatGPT	• YouTube 測(cè)試新功能：用 AI 總結(jié)視頻
• 郵儲(chǔ)銀行“智能權(quán)證管理機(jī)器人”案例獲全國“第	• Uber 加緊開發(fā) AI 聊天機(jī)器人，細(xì)分賽道卷起來
• 谷歌語音助手轉(zhuǎn)型：開發(fā) AI 新版，部分員工被裁	• 英偉達(dá)發(fā)布 “最小”Perfusion AI 文生圖模型，
• 亞馬遜指派 Alexa 高管領(lǐng)導(dǎo)通用人工智能團(tuán)隊(duì)	• 消息稱 OpenAI 正測(cè)試 DALL-E 3 模型，有望推動(dòng)
• 專訪以色列智能機(jī)器人中心聯(lián)合主席Yosi Lahad：	• OpenAI：安卓版 ChatGPT 現(xiàn)已全面上線

恰佩克獎(jiǎng)	機(jī)器人高峰論壇	機(jī)氣林	ITES深圳工業(yè)展	機(jī)器人研究院	API數(shù)據(jù)	庫卡機(jī)器人
中國傳動(dòng)網(wǎng)	索比光伏網(wǎng)	數(shù)控機(jī)床市場(chǎng)網(wǎng)	國家標(biāo)準(zhǔn)化委員會(huì)

国产精品久久久久久久小说,国产国产裸模裸模私拍视频,国产精品免费看久久久无码,风流少妇又紧又爽又丰满,国产精品,午夜福利

AI 打敗 AI：谷歌研究團(tuán)隊(duì)利用 GPT-4 擊敗 AI-Guardian 審核系統(tǒng)