據(jù)英國《獨(dú)立報》近日報道,人工智能研究團(tuán)隊(duì)OpenAI最新公布的報告指出,機(jī)器人已經(jīng)學(xué)會了使用自創(chuàng)的新語言彼此交流并協(xié)同完成任務(wù)。
OpenAI的專家進(jìn)行了一個實(shí)驗(yàn),他們讓一些軟件機(jī)器人完成一系列任務(wù),如移動到簡單二維虛擬世界中某個特定的位置。而且,他們使用增強(qiáng)學(xué)習(xí)技術(shù)讓軟件機(jī)器人以合作而非競爭的形式來完成挑戰(zhàn),并向那些完成任務(wù)的機(jī)器人提供獎勵。
OpenAI團(tuán)隊(duì)在博客上寫道:“在實(shí)驗(yàn)中,我們將人工智能機(jī)器人放入一個簡單的世界中,教它們創(chuàng)造一種語言,賦予它們交流能力,接著讓它們通過與其他機(jī)器人交流來完成任務(wù)。如果它們完成某個任務(wù),會獲得獎勵。”
研究結(jié)果表明,機(jī)器人會通過不斷試錯,記住那些能幫助它們完成某一任務(wù)的符號、單詞和信號,并將這些信息存儲在自己的循環(huán)神經(jīng)網(wǎng)絡(luò)中,從而學(xué)會了彼此合作和交流。
研究人員指出:“如果某個機(jī)器人意識到,第二個機(jī)器人發(fā)送其他信息,可以幫它更好地完成任務(wù),那么這個機(jī)器人會準(zhǔn)確地告訴第二個機(jī)器人如何修改信息來使得這些信息盡可能有用。”換句話說,這些機(jī)器人是在問,怎樣改進(jìn)自己的“語言”才能得到最多的集體獎勵。
隨著研究人員提出的任務(wù)不斷加碼,語言也不斷進(jìn)化,最終,機(jī)器人學(xué)會了通過用不同的單詞組成句子彼此交流,從而協(xié)同工作。
由于語言持續(xù)不斷地發(fā)展并變得越來越復(fù)雜,研究人員希望建造出一臺翻譯機(jī)器人,向人類翻譯它們彼此之間的交流。