人工智能發(fā)展到未來(lái),會(huì)欺騙造出它的人類嗎?會(huì)對(duì)人類造成什么樣的影響?我們?cè)撛试S機(jī)器人學(xué)會(huì)欺詐嗎?

以下是報(bào)告全部?jī)?nèi)容:
一、為什么要有欺騙?
我們?yōu)槭裁匆衅垓_,希望讓設(shè)備自己撒謊?欺騙為什么這樣重要呢?因?yàn)橛械臅r(shí)候欺騙不僅僅是人類關(guān)系的體系。在自然界中有很多的物種,生存的前提條件就需要有欺騙。為了存活,希望能夠捕獲到你的獵物,找到很好的配偶或者說(shuō)其他的需求,你必須有欺騙的能力。在特定的情況下,欺騙的需求是必要的,它不是最好的方式,但是一個(gè)層面。
有的時(shí)候在很多的層級(jí)上必須非常的智能,我們有圖靈測(cè)試,實(shí)際上它自己就是一個(gè)欺騙,一個(gè)設(shè)備被使用或者說(shuō)設(shè)備來(lái)欺騙你——人,作為對(duì)方來(lái)講,讓你受到欺騙,認(rèn)為他也是一個(gè)欺騙,這就是圖靈測(cè)試的目的。
1、欺騙對(duì)自己有利
這個(gè)是自然界的情況。首先是一個(gè)斷翅的展示,這個(gè)鳥(niǎo)兒會(huì)假裝它的翅膀斷了,讓捕獵者朝著它去,不會(huì)打擾到它的鳥(niǎo)窩;猩猩像人類一樣,開(kāi)始給它的媽媽梳理毛發(fā),就像兒子孝順母親。媽媽也利用了這一點(diǎn),然后把它的工具給偷走,偷來(lái)之后把堅(jiān)果敲開(kāi)了。
有的時(shí)候這些動(dòng)物確實(shí)有欺詐的行為,有我們?nèi)祟惖囊恍┘賱?dòng)作。通過(guò)欺騙的方式來(lái)愚弄你的對(duì)手,像橄欖球或者美式足球都會(huì)這樣來(lái)誤導(dǎo)別人,假動(dòng)作你成功了,作為團(tuán)隊(duì)成員的話,你會(huì)歡呼,因?yàn)樽詈竽阙A得了比賽,但是你的對(duì)手不高興。
2、欺騙對(duì)對(duì)手有利
還有另外一個(gè)例子,欺騙對(duì)我們的對(duì)手有利。你要哄你的小孩子吃蔬菜,你通過(guò)欺騙的方式讓你的小孩子能夠吃蔬菜,這也是通過(guò)欺騙來(lái)幫助你的對(duì)象,并不是說(shuō)通過(guò)欺騙來(lái)迷惑你的對(duì)象。從社會(huì)的角度來(lái)說(shuō),我們是需要這種欺詐的,讓別人也會(huì)喜歡你,這是一個(gè)很好的社會(huì)的智能。我們的機(jī)器人是不是也要和人一樣有社交的欺詐呢?
二、機(jī)器人是否需要欺騙?
1、社交中的欺騙
這個(gè)機(jī)器人也是非常酷的,就像一個(gè)大大的雞蛋,轉(zhuǎn)來(lái)轉(zhuǎn)去。他問(wèn)這個(gè)機(jī)器人“你的誠(chéng)實(shí)參數(shù)是多少”,“我的誠(chéng)實(shí)參數(shù)是90%”。絕對(duì)的誠(chéng)實(shí)在外交上是不正確的,在整個(gè)的溝通上也不是安全的。我們可以來(lái)調(diào)整一下我們關(guān)于誠(chéng)實(shí)的一個(gè)定義注解或者說(shuō)不誠(chéng)實(shí)的注解。
另外研究機(jī)器人欺詐也是一項(xiàng)非常有意思的工作,演進(jìn)的算法出現(xiàn)了這樣的欺詐,能夠誘開(kāi)這個(gè)食物源,像石頭、剪刀、布這樣的機(jī)器人欺騙。如果說(shuō)這個(gè)機(jī)器人智商高的話,它就會(huì)用欺詐。
2、軍事中的欺騙
所有的戰(zhàn)爭(zhēng)就是通過(guò)欺詐完成的,從政治角度來(lái)說(shuō),這種欺詐令人討厭。但是戰(zhàn)爭(zhēng)當(dāng)中我們要有這樣的欺詐,這是光榮的事情。
還有回到歷史的記錄,這是我們宣言,歷史當(dāng)中的宣言。比如說(shuō)猶太教或者基督教或者其他的,比如特洛伊木馬的傳說(shuō)都是一些欺詐,有各種各樣欺詐的工作,各種宗教都有。美國(guó)他們會(huì)有戰(zhàn)場(chǎng)的欺詐條令,就是教會(huì)他們所有的士兵都必須知道這樣的欺詐條令。而在中國(guó)也會(huì)有中國(guó)軍隊(duì)也有這樣欺詐的訓(xùn)練,兵不厭詐。
三、欺詐模型與理論、算法
像這樣一個(gè)假的溝通對(duì)整個(gè)欺詐者會(huì)有利的。那為什么我們是這樣的呢?為什么要欺詐呢?
一開(kāi)始我也進(jìn)行了這樣的研究,還有我的畢業(yè)生,我們進(jìn)行思考,如何讓我們的機(jī)器人能夠相信人?如何讓他相信這個(gè)司令官?司令官不僅僅要讓機(jī)器人做正確的事情,還會(huì)告訴機(jī)器人做不正確的事,然后我們就有這樣的模型。我們識(shí)別到,其實(shí)欺詐,也是信任的另一面。如果是一個(gè)很好的指導(dǎo)官,他會(huì)告訴你,你要做的第一件事就是要獲得信任才能獲得欺騙。
這里有一個(gè)說(shuō)法,這是人類心理學(xué)家的算法,比如說(shuō)相互依賴,就是一個(gè)前提。一個(gè)欺騙者,他有假的溝通,他的對(duì)象或者是他所要欺騙的機(jī)器人或者人,他們必須要能夠解釋這樣的信息。那么當(dāng)然也有各種不同的欺詐,比如像松鼠,作為我們研究欺詐的一個(gè)模型。
在我們整個(gè)研究方法里,這叫做互相依賴的理論,這里當(dāng)然有其他好多的維度,我們用了沖突和依賴。我們這里有一對(duì)這樣的代表,一旦出現(xiàn)了這樣的沖突,你有了我想要的東西,或者我這里有你想要的東西,這就是一個(gè)沖突,有了這樣的沖突,然后有這樣的依賴,我們都依賴這樣的資源。那么,欺詐就發(fā)生了一個(gè)作用了。
我們所發(fā)生的作用,我們要做兩件事,一個(gè)是我們決定什么時(shí)候欺騙,然后要決定如何去欺騙。你不可能就是隨機(jī)地做,我們必須要找定一個(gè)時(shí)機(jī)?;ハ嘁蕾嚨睦碚摚覀冞M(jìn)行這樣的影射,有這樣一個(gè)區(qū)域,這里有一個(gè)非常強(qiáng)大的依賴的結(jié)果,還有一個(gè)高度沖突的結(jié)果。還有一個(gè)半圈,這是一個(gè)三角形,這里是一個(gè)參數(shù)。這是一個(gè)誠(chéng)實(shí)的參數(shù),這是一個(gè)影片當(dāng)中真實(shí)的參數(shù)。
當(dāng)然如果這個(gè)區(qū)域非常小的話,不會(huì)欺詐。如果這個(gè)區(qū)域很大的話,就會(huì)有更多的欺詐。所以我們有調(diào)解的能力讓機(jī)器人或者相應(yīng)的代理做到這里,有這樣的沖突和依賴性。我不是談技術(shù)的東西,只拋磚引玉,有很多的論文都可以讀一下,還有相應(yīng)的影射以及游戲的理論各種各樣的東西。
底部這條線,等會(huì)兒給大家看一下,我們必須要有這樣的能力能夠影射,我們是用這樣的模型,并不一定重復(fù)的,我們必須要使用我們的代理信任模型,你建立了這樣的理解,其他的代理思維必須要有這樣的信任,這是我們的理論。還有伙伴的模型,在這個(gè)過(guò)程當(dāng)中也非常重要,結(jié)成伙伴關(guān)系,如果我們做這件事情,我們要欺騙你,我們必須先做什么,比如我的模型是畫的話,這樣不會(huì)有效。如果是很好的毛性就有機(jī)會(huì)奏效了,所以要有一個(gè)非常好的模型,有了這個(gè)模型之后我們才能出其不意,這是一個(gè)建模。
我們這里有一個(gè)理論,這個(gè)理論非常重要,我可以相信你,其實(shí)我要知道你是可信任的,我們才能信任。我獲得你信任之后,我才可以欺騙你,非常有意思。在整個(gè)領(lǐng)域過(guò)程當(dāng)中這是一個(gè)前提,我們所做的方法就是我們有需要傳統(tǒng)游戲的模型,這里有相應(yīng)的結(jié)果,我們有一系列的行動(dòng),如果是正確的話,那么就一定有這樣的行動(dòng),然后人們跟我們一起合作。
我們有這些矩陣,在這些對(duì)象當(dāng)中,我們可以看一下具體有哪些不一樣,我們看到裝死,這是一個(gè)非常好的回報(bào),如果你是裝死的話有很好的回報(bào)。你很快就能夠判斷它在裝死,或者是假裝的,他要逃走等等,像類似的場(chǎng)景等等。等會(huì)兒跟大家介紹一下我們所做的實(shí)驗(yàn)。
這是另外一個(gè)算法,我們所做的就是我們理解一下具體的場(chǎng)景,我們理解它的結(jié)果,然后你要理解我們的一個(gè)對(duì)象的本質(zhì)。如果你知道了之后,你就意識(shí)到這是正確的場(chǎng)景,然后你產(chǎn)生了一個(gè)行動(dòng)。這個(gè)行動(dòng)改變了他們的信任系統(tǒng),有利于你自己想要的,違反了對(duì)方想要的,最后你采取行動(dòng)。你的勝利沒(méi)有保證,但是有這樣的機(jī)會(huì)可能你最后會(huì)得勝。
我們做了一些研究,機(jī)器人其實(shí)也有這樣的傳感,如果沒(méi)有傳感,我們無(wú)法欺騙。我們其實(shí)會(huì)有更多的機(jī)會(huì),比如說(shuō)互相的傳感器之間有不同的吻合度,有的時(shí)候,他們互相不一致的話也會(huì)帶來(lái)一些問(wèn)題,還有關(guān)于你的合作伙伴有更多信息的獲得,如果你的合作伙伴模型更好,那么成功機(jī)率更高,你的欺騙機(jī)率更高。
這是捉迷藏的實(shí)驗(yàn),我們使用小的機(jī)器人,我給大家看一個(gè)非常短的片子,這并不是非常漂亮的片子,但是會(huì)告訴我們?cè)趺醋?。機(jī)器人有點(diǎn)像星球大戰(zhàn)第四季或者星球大戰(zhàn)第一季。他們藏起來(lái)了,要避免其他軍團(tuán)的襲擊。機(jī)器人來(lái)了,他要做出決定了,他如何留下假的足跡,然后藏起來(lái),藏在中間,這是就像一個(gè)風(fēng)暴軍團(tuán)一樣,足跡在什么地方,這個(gè)機(jī)器人來(lái)了,來(lái)查找這個(gè)足跡了。有的時(shí)候會(huì)查找一下,他朝這個(gè)方向走了,另外一個(gè)機(jī)器人過(guò)來(lái)了,然后他可以逃脫假的足跡,有兩個(gè)對(duì)象已經(jīng)踩到了,這是不可預(yù)見(jiàn)的。那么你可以看到我們是哪撞了,哪個(gè)逃避了。
五、該擔(dān)心機(jī)器人會(huì)欺騙嗎?
我們?cè)趪?guó)際機(jī)器人雜志上發(fā)表了這樣的論文,關(guān)于這個(gè)實(shí)驗(yàn)的設(shè)置也是非常有意思。這是2010年,這個(gè)結(jié)果其實(shí)并不代表機(jī)器人欺詐的最后判斷。這其實(shí)是一個(gè)初期的指針,相應(yīng)的技術(shù)和算法能夠使用,幫助我們解決機(jī)器人的欺詐。另外我們需要更多心理學(xué)上的研究或者更多的證據(jù)才能驗(yàn)證這個(gè)假設(shè),這個(gè)結(jié)果并不是所有人都同意。
后來(lái)有一個(gè)相關(guān)的媒體報(bào)道,真是非常大肆宣揚(yáng)的報(bào)道:他們教會(huì)機(jī)器人如何欺詐,機(jī)器人開(kāi)始起義了,然后是機(jī)器人的世界末日來(lái)了。他們最后把這個(gè)點(diǎn)子藏起來(lái),不要告訴我們,好像世界末日了。另外一篇論文說(shuō),一些人告訴機(jī)器人如何欺詐,會(huì)讓我們蒙受羞辱。他們描述了這個(gè)實(shí)驗(yàn),告訴機(jī)器人如何捉迷藏,他們也不高興,記者也不高興。下面的記者說(shuō),機(jī)器人是能夠欺詐的,有一些瘋子研究者,其實(shí)就是有點(diǎn)瘋狂,人們也擔(dān)心,你們是不是擔(dān)心呢?
我們這樣實(shí)驗(yàn),我們告訴機(jī)器人怎么欺詐,你們是不是擔(dān)心?是,也許不是。并不是所有人都認(rèn)為這是一個(gè)好的點(diǎn)子。
《時(shí)代》雜志給我們一個(gè)年度最佳50個(gè)創(chuàng)造發(fā)明,從我的角度來(lái)說(shuō),這僅僅是一個(gè)實(shí)驗(yàn),不是發(fā)明,但是我們得了年度第50佳發(fā)明。還有新的《科學(xué)》雜志,他們探索了機(jī)器人的思維,然后告訴人類自己的思維。所有的這些理論能夠補(bǔ)充人的欺詐思維的研究。
最后機(jī)器人能夠補(bǔ)充人對(duì)大腦的理解。有說(shuō)這個(gè)可能會(huì)把人類毀滅等等各種各樣的報(bào)道,但其中還是會(huì)有真理的。我們繼續(xù)研究像這樣的欺詐,哪怕有人說(shuō)會(huì)怕人類毀滅。
六、欺騙的實(shí)用性
有的時(shí)候?yàn)榱俗约?,典型一個(gè)例子,我經(jīng)常使用的就是我妻子問(wèn)我她今天晚上看上去怎么樣,我說(shuō)看上去很好,有的時(shí)候我知道她長(zhǎng)得怎么樣,我還是要善意地欺騙一下。還有一個(gè),我們結(jié)束之后大家說(shuō)你講得很好。其實(shí)有的時(shí)候這樣的講話很糟糕的,特別是亞洲有很多這樣的,說(shuō)你講得很好就是恭維你。我們?cè)趺词褂闷渌钠垓_,在機(jī)器人系統(tǒng)當(dāng)中推動(dòng)他們社交的活動(dòng),我們所說(shuō)的這里用的就是犯罪學(xué)的法則。
所以我們希望能夠把它擴(kuò)大成三個(gè)元素,所謂的動(dòng)機(jī)、方法、機(jī)遇。機(jī)遇已經(jīng)講過(guò)了,包括怎么樣做,什么時(shí)候做,我們現(xiàn)在必須要有為什么做,為什么做這樣做,特別情況下動(dòng)機(jī)是什么,還有做這樣目的的方式。比方說(shuō)欺騙。你可以通過(guò)說(shuō)委托或者說(shuō)投入來(lái)去欺騙某人,所以它的方式也不同,當(dāng)然最典型的例子就是我們可以用一些內(nèi)部的表情,或者一些距離的轉(zhuǎn)換層進(jìn)行這樣的做法。
我之前就機(jī)器人的一些動(dòng)態(tài)和索尼有一些合作,跟三星合作,在十年、十五年之前有專利,當(dāng)然會(huì)有不同的事項(xiàng),我們有不同的方法顯示了出去,基本上顯示了一些錯(cuò)誤的信號(hào),在人的主題當(dāng)中我們研究了它的起作用方式。我們的目的是希望推動(dòng)我們學(xué)習(xí)、推動(dòng)機(jī)器的表現(xiàn)。有的時(shí)候有人會(huì)說(shuō),那確實(shí),你做得很糟糕,或者恭維你兩句,在教育當(dāng)中經(jīng)常出現(xiàn)這樣的情況,可能大家都是天才。但是我們是要不斷地能夠在這里面取得成就。
七、機(jī)器人的道德倫理
最后一點(diǎn)就是機(jī)器人的道德,對(duì)于機(jī)器人的道德倫理我自己做了很長(zhǎng)時(shí)間的研究,超過(guò)十年了,所以我們從這樣一個(gè)所謂的大規(guī)模殺傷性,特別是大規(guī)模殺傷性武器的機(jī)器人使用角度,我們?cè)试S機(jī)器人撒謊嗎?
我們有一個(gè)理論,這是一個(gè)框架理論,我們看到理論就是永遠(yuǎn)不應(yīng)該撒謊。如果從功利角度,如果能夠最大化我們的幸福度,我們有的時(shí)候也能夠接受機(jī)器人撒謊了。所以我們要界定什么是正確,什么是不正確的?
我們可能對(duì)于這個(gè)欺詐來(lái)講,機(jī)器人根據(jù)不同的理論框架有不同的判斷。但是,我們的問(wèn)題最終還是我們是否允許機(jī)器人撒謊。我們是否可以允許,我們可以做到這一點(diǎn),我們也可以想象現(xiàn)場(chǎng)的一個(gè)專家來(lái)講,和過(guò)去相比,對(duì)于未來(lái)來(lái)講是否因?yàn)槠垓_形成,導(dǎo)致人類末日的到來(lái)?;蛘吣軌蜃寵C(jī)器人成為社會(huì)的一份子,成為我們社會(huì)當(dāng)中一個(gè)社交好伙伴。實(shí)際上每一個(gè)環(huán)節(jié)都需要非常坦誠(chéng)對(duì)白的,有的時(shí)候并不是很好的社交方面的朋友或者伙伴。所以很多的時(shí)候,我們也是需要能夠界定你所需要的對(duì)機(jī)器的坦誠(chéng)度高低。