国产精品久久久久久久小说,国产国产裸模裸模私拍视频,国产精品免费看久久久无码,风流少妇又紧又爽又丰满,国产精品,午夜福利

熱搜: 佳士科技  irobot  工業(yè)機(jī)器人  機(jī)器人  ABB  機(jī)器人產(chǎn)業(yè)聯(lián)盟  發(fā)那科  庫卡  碼垛機(jī)器人  機(jī)械手 

在難一點(diǎn)的圖靈測試面前,聊天機(jī)器人就開始自我暴露了

   日期:2016-07-20     來源:雷鋒網(wǎng)    作者:lx     評論:0    
標(biāo)簽:

   用戶: Siri,幫我叫救護(hù)車。
 
  Siri: 好的,從現(xiàn)在開始我會(huì)叫你“救護(hù)車”。
 
  在2011年Siri初次面世的時(shí)候,蘋果公司很快修復(fù)了這個(gè)錯(cuò)誤。但是一個(gè)新的競賽顯示出,計(jì)算機(jī)仍然缺乏基本的常識(shí)來避免這種令人尷尬的混淆。
 
  這個(gè)競賽名為“威諾格拉德模式挑戰(zhàn)賽”(Winograd Schema Challenge),是圖靈測試的一個(gè)變種,由加拿大多倫多大學(xué)的計(jì)算機(jī)科學(xué)家赫克托·萊維斯克(Hector Levesque)發(fā)起,挑戰(zhàn)賽的名字是為了向特里·威諾格拉德(Terry Winograd)教授致敬,他是斯坦福大學(xué)的一位教授,人工智能領(lǐng)域的開拓者。
 
左圖為:赫克托·萊維斯克,右圖為:特里·威諾格拉德
 
  60多年來,研究人員一直使用圖靈測試來評估機(jī)器仿人思考的能力,但是這個(gè)針對人工智能的評判標(biāo)準(zhǔn)太老舊了,很多舊版圖靈測試的題目太過簡單,而不能真正測試出計(jì)算機(jī)的智能水平,急需更新?lián)Q代。始于2014年的“威諾格拉德模式挑戰(zhàn)賽”針對圖靈測試進(jìn)行改進(jìn),要求人工智能回答關(guān)于語句理解的一些常識(shí)性問題。
 
  比如挑戰(zhàn)賽中,有這么一道測試題“市議員們拒絕示威者的游行許可,因?yàn)樗麄兒ε卤┝?rdquo;,普通人類一眼望去,就會(huì)根據(jù)上下文判斷出這句話清晰的邏輯,然而對于計(jì)算機(jī)來說,就很難弄清楚這里的“他們”指的是誰,是市議員們呢?還是示威者呢?
 
 
  一個(gè)典型的“威諾格拉德模式挑戰(zhàn)賽”的題面包括以下幾個(gè)關(guān)鍵部分:
 
  首先,具有同類語義的兩個(gè)名詞(本題里指的是:市議員們和示威者 )
 
  第二,有一個(gè)指代以上兩個(gè)名詞的模糊代詞(本題里指的是:他們)
 
  第三,有一個(gè)特別的單詞,當(dāng)這個(gè)單詞被換成另外一個(gè)單詞時(shí),那么模糊代詞的意義就會(huì)改變(本題里,如果把“害怕”換成“主張”,那么句子里的“他們”的意思就會(huì)發(fā)生改變)
 
  然后,計(jì)算機(jī)需要回答的問題就是:這個(gè)具有模糊含義的代詞指的是什么,并給出兩個(gè)選項(xiàng)讓計(jì)算機(jī)選擇。所以計(jì)算機(jī)面臨的就是一個(gè)二選一的問題。
 
  按統(tǒng)計(jì)過的概率來說,就算胡亂選擇,答對題目的準(zhǔn)確率是45%,然而這次計(jì)算機(jī)真實(shí)的比賽結(jié)果是:最好的成績是48%。所以,計(jì)算機(jī)經(jīng)過謹(jǐn)慎的“思考”得出的準(zhǔn)確率,比人蒙著眼睛隨便選的準(zhǔn)確率才高出那么一點(diǎn)點(diǎn),這不得不令人唏噓。
 
  成績最好的兩支隊(duì)伍,一個(gè)由來自中國科學(xué)技術(shù)大學(xué)的劉權(quán)帶領(lǐng),另一支隊(duì)伍由塞浦路斯開放大學(xué)的Nicos Issak帶領(lǐng)。
 
  這個(gè)挑戰(zhàn)賽的獎(jiǎng)金高達(dá)25,000美金,但是要拿到這個(gè)獎(jiǎng)金,準(zhǔn)確率必須要達(dá)到90%以上。所以就算是成績最好的兩個(gè)隊(duì)伍也與獎(jiǎng)金無緣了。
 
 
  本次競賽的顧問之一,紐約大學(xué)的心理學(xué)家 Gary Marcus說:“機(jī)器的成績只比隨機(jī)選擇好一點(diǎn)點(diǎn),這并不出乎我的預(yù)料。”那是因?yàn)椋x予計(jì)算機(jī)以常識(shí)極其困難。手動(dòng)編碼輸入這些知識(shí)需要花費(fèi)的時(shí)間不可想象,而且用數(shù)據(jù)統(tǒng)計(jì)的方法來學(xué)習(xí)真實(shí)世界的知識(shí)對于計(jì)算機(jī)來說也十分困難。這次挑戰(zhàn)賽的很多計(jì)算機(jī),都是試圖將手動(dòng)編碼的語法理解與基本的現(xiàn)實(shí)知識(shí)相結(jié)合。
 
  另外,人們明顯發(fā)現(xiàn),谷歌和Facebook并沒有參加這次的活動(dòng),而這些公司的研究人員已經(jīng)多次暗示了他們在自然語言理解方面已經(jīng)取得了非常大的進(jìn)展。“這兩家公司本可以隨意跳著華爾茲進(jìn)場,并取得100%正確率的成績,再得意地向世人炫耀。但如果是那樣的結(jié)果的話,我也會(huì)非常震驚的。”Marcus說道。
 
  谷歌、Facebook、亞馬遜和微軟這些大公司的研究人員正在將他們的注意力轉(zhuǎn)向自然語言理解。他們使用最新的機(jī)器學(xué)習(xí)方法,尤其是“深度學(xué)習(xí)”神經(jīng)網(wǎng)絡(luò)來開發(fā)更加聰明、更加敏銳的聊天機(jī)器人和個(gè)人助手。實(shí)際上,隨著聊天機(jī)器人和語音助理變得越來越普遍,伴隨著在圖像和語言識(shí)別領(lǐng)域取得的巨大進(jìn)展,人們很容易產(chǎn)生機(jī)器在理解語言方面已經(jīng)十分厲害的錯(cuò)覺。然而真實(shí)的情況并不令人樂觀,至少這次比賽的結(jié)果并不令人滿意。
 
  本次競賽最優(yōu)秀的兩支隊(duì)伍都使用了最前沿的機(jī)器學(xué)習(xí)方法。劉權(quán)的隊(duì)伍,囊括了來自多倫多紐約大學(xué)和加拿大國家研究院諸多的研究人員,使用深度學(xué)習(xí)來訓(xùn)練計(jì)算機(jī)識(shí)別兩次事件之間的關(guān)系,例如,從幾千篇文章里學(xué)習(xí)“打籃球”、“游泳”和“受傷”之間的關(guān)系。賽后,劉權(quán)的隊(duì)伍聲稱在修補(bǔ)系統(tǒng)解析競賽問題的一個(gè)漏洞之后,準(zhǔn)確率可以達(dá)到60%,而來自主辦方的 Leora Morgenstern表示,就算這一結(jié)果被證實(shí),仍然比人類的準(zhǔn)確率低很多。
 
  這次競賽結(jié)果透露出來的訊息非常重要。“當(dāng)人工智能開始支持對話的時(shí)候,這些問題就會(huì)暴露出來。比如,如果購物的時(shí)候我說,‘我想要給我的吉他買一個(gè)箱子,所以它必須得很結(jié)實(shí)’,那這里的‘它’指的是箱子呢,還是吉他呢?”,Charlie Ortiz說道,他是Nuance公司的高級研究員,這家公司專門從事語音識(shí)別軟件、圖像處理軟件的研發(fā)和銷售工作。
 
  隨著智能家居設(shè)備和可穿戴產(chǎn)品會(huì)變得越來越普遍,常識(shí)推理將會(huì)變得越來越重要。Marcus說道:”當(dāng)你詢問自己的手表時(shí),你不希望這時(shí)它提供50個(gè)選項(xiàng),讓你滑動(dòng)屏幕進(jìn)行選擇。而當(dāng)你開始與你的車和手表展開對話時(shí),你希望免去打字的繁瑣,得到一系列有內(nèi)在聯(lián)系的交流對話,人們會(huì)很自然地反復(fù)提及之前說到的內(nèi)容,就會(huì)經(jīng)常出現(xiàn)模糊指代,而這就是計(jì)算機(jī)亟待解決的問題。“
 
  讓計(jì)算機(jī)理解我們,還有很長的一段路要走。
 
 
更多>相關(guān)資訊
0相關(guān)評論

推薦圖文
推薦資訊
點(diǎn)擊排行