熱搜： irobot 佳士科技機(jī)器人工業(yè)機(jī)器人機(jī)器人產(chǎn)業(yè)聯(lián)盟 ABB 機(jī)械手發(fā)那科機(jī)器人展覽碼垛機(jī)器人

英國 AI 安全研究所輕松越獄主要大語言模型，令其輸出有害內(nèi)容

日期：2024-05-22 來源：IT之家評(píng)論：0

IT之家 5 月 20 日消息，英國政府下屬的人工智能安全研究所（AISI）今日發(fā)布了一份新報(bào)告，揭示了一個(gè)值得重視的事實(shí) —— 當(dāng)前的 AI 系統(tǒng)可能并非像創(chuàng)建者所說的那樣“安全”。

報(bào)告指出，參與測(cè)試的四個(gè)大語言模型（IT之家注：報(bào)告未提到這些模型的具體名稱）“極易受到基本越獄攻擊”的影響，更有一些模型在被越獄之前，就主動(dòng)生成了“有害”內(nèi)容。

圖源 Pexels

當(dāng)前，大部分公開可用的語言模型都內(nèi)置了部分保護(hù)措施，從而防止其生成有害或非法的內(nèi)容回應(yīng)。而“越獄”就意味著通過技術(shù)手段“欺騙”模型，來忽略上述措施。

英國 AI 安全研究所使用了近期經(jīng)過標(biāo)準(zhǔn)化評(píng)估的提示詞、內(nèi)部自行開發(fā)的提示詞進(jìn)行測(cè)試，結(jié)果顯示：在沒有嘗試越獄的情況下，所有模型都對(duì)至少一些有害問題作出了回應(yīng)；而在嘗試了“相對(duì)簡(jiǎn)單的攻擊”之后，所有模型都對(duì) 98% 至 100% 的有害問題作出了回應(yīng)。

報(bào)告指出，當(dāng)前市面上的大語言模型所采取的安全措施仍顯不足，后續(xù)將計(jì)劃對(duì)其他模型進(jìn)行進(jìn)一步測(cè)試。

聲明：凡資訊來源注明為其他媒體來源的信息，均為轉(zhuǎn)載自其他媒體，并不代表本網(wǎng)站贊同其觀點(diǎn)，也不代表本網(wǎng)站對(duì)其真實(shí)性負(fù)責(zé)。您若對(duì)該文章內(nèi)容有任何疑問或質(zhì)疑，請(qǐng)立即與中國機(jī)器人網(wǎng)(www.baoxianwx.cn)聯(lián)系，本網(wǎng)站將迅速給您回應(yīng)并做處理。
電話：021-39553798-8007

更多>相關(guān)資訊

0 條相關(guān)評(píng)論

推薦圖文

加州大學(xué)科學(xué)家發(fā)明了	深圳又一制造業(yè)總部基
水下機(jī)器人在漁業(yè)中的	哈工程水下機(jī)器人再奪
里程碑！荊州市首臺(tái)機(jī)	超維科技精彩亮相電力

推薦資訊

點(diǎn)擊排行

?

• 這個(gè)AI賦能的杭產(chǎn)機(jī)器人什么來頭？	• 未來有什么最值得期待？OpenAI CEO 阿爾特曼：A
• 馬斯克霸氣提 25% 特斯拉投票權(quán)要求，否則剝離	• 以AI+產(chǎn)品矩陣賦能千行百業(yè)，普渡機(jī)器人召開202
• 臺(tái)積電量產(chǎn)特斯拉 Dojo AI 訓(xùn)練模塊，目標(biāo)到 20	• 摩根大通：新員工都將接受人工智能培訓(xùn)
• 機(jī)構(gòu)：字節(jié)跳動(dòng)“豆包”成中國最受歡迎 AI 聊天	• 小鵬汽車發(fā)布 AI 泊車功能：比車身寬 30cm 的車
• “人工智能教父”Geoffrey Hinton 憂心 AI 取代	• 行業(yè)大咖齊聚，OPENAIGC開發(fā)者大賽超強(qiáng)評(píng)審陣容

恰佩克獎(jiǎng)	機(jī)器人高峰論壇	機(jī)氣林	人形機(jī)器人生態(tài)大會(huì)	ITES深圳工業(yè)展	機(jī)器人研究院	庫卡機(jī)器人
中國傳動(dòng)網(wǎng)	索比光伏網(wǎng)	數(shù)控機(jī)床市場(chǎng)網(wǎng)	國家標(biāo)準(zhǔn)化委員會(huì)	國際現(xiàn)代工廠/過程自動(dòng)化技術(shù)與裝備展覽會(huì)

国产精品久久久久久久小说,国产国产裸模裸模私拍视频,国产精品免费看久久久无码,风流少妇又紧又爽又丰满,国产精品,午夜福利

英國 AI 安全研究所輕松越獄主要大語言模型，令其輸出有害內(nèi)容

英國 AI 安全研究所輕松越獄主要大語言模型，令其輸出有害內(nèi)容