国产精品久久久久久久小说,国产国产裸模裸模私拍视频,国产精品免费看久久久无码,风流少妇又紧又爽又丰满,国产精品,午夜福利

熱搜: 發(fā)那科機器人  工業(yè)  機器人  上海  ABB機器人  自動化  工業(yè)機器人  工業(yè)機器人展  機器  展會 

假如讓人工智能去寫武俠小說、網(wǎng)絡(luò)小說、乃至唐詩宋詞…那會如何?

   日期:2017-07-06     來源:搜狐    作者:DC136     評論:0    
    當下,最熱的科技概念無疑就是「人工智能」。人們對于人工智能的態(tài)度從最初的懷疑,到后來的震驚,再到現(xiàn)在的嘆服。我們不僅在議論「人工智能能干些什么」,更在心里嘀咕:我們的職業(yè)還能存在多久?
 
  不過,在熱議之外,人工智能到底是什么,大多數(shù)人如同盲人摸象,僅僅只有一知半解。至于其內(nèi)部的工作原理,一般公眾更是一無所知。由于巨大的技術(shù)障礙,輿論對于人工智能僅僅停留于「高深、前沿、無所不能」的印象,而無法對之進行深入解析。公眾的懷疑、震驚、嘆服等等心態(tài),說到底都是無知的體現(xiàn)。
 
  知己知彼,方能百戰(zhàn)不殆。在打響自己的「職業(yè)保衛(wèi)戰(zhàn)」之前,讓我們解剖一只麻雀,看看人工智能到底是如何思考的,它到底有什么能耐,又有什么缺陷。
 
  我選取的麻雀是寫作。
 
  機器人寫作思路
 
  語言是人類的關(guān)鍵特征,它不僅是人類區(qū)別于動物,也是人類區(qū)別于機器的獨特能力。鑒別機器是否具備人類智能的「圖靈測試」,就是以語言為考察指標的。
假如讓人工智能去寫武俠小說、網(wǎng)絡(luò)小說、乃至唐詩宋詞…那會如何?
  NLP
 
  NLP(Natural LanguageProcessing,自然語言處理)是一門研究如何讓機器理解人類語言、寫出人類文字的學(xué)科。這門學(xué)科有兩種主要思路。一種是「符號法」,由人工建立語言的模型,提煉出語言的語法、詞法,標注每個單詞的含義、詞性,然后教會機器這套原理,并讓它根據(jù)語法去寫文章——這種方法你一定很熟悉:不就是背單詞、學(xué)語法、然后寫作文嗎?對,這就是我們在學(xué)校里學(xué)英語的方法。
 
  另一種思路是「統(tǒng)計法」。與傳統(tǒng)的老師教學(xué)生不同,這種方法更注重「自學(xué)」:扔一大批文字給機器,讓它自己去尋找語言的規(guī)律,自己去嘗試寫作。
 
  這種方法其實我們更熟悉。每個孩子不都是這樣學(xué)習(xí)母語的嗎?沒有哪個父母會告訴孩子什么是名詞、什么是動詞、什么是疑問句強調(diào)句,孩子只是天天聽、天天說,自然而然就掌握了一門語言。
 
  當然,「符號法」與「統(tǒng)計法」并不是完全對立的,大多數(shù) NLP 算法都同時包含兩種思路。只不過在計算機發(fā)展的初級階段,無力提供「統(tǒng)計法」所需要的大量計算資源,一直都是「符號法」更占上風(fēng)。直到近十年以來,隨著計算能力的大幅提高,尤其是深度學(xué)習(xí)理論的崛起,「統(tǒng)計法」才得到越來越廣泛的應(yīng)用。
 
  一般認為,深度學(xué)習(xí)是通往真正人工智能的重要一步,如今聲名鵲起的 AlphaGo,即是基于深度學(xué)習(xí)理論而設(shè)計的。它并不理解圍棋中諸如「勢」「厚薄」等種類繁多的術(shù)語,它只是學(xué)習(xí)了大量棋譜,從中總結(jié)出了圍棋的規(guī)律,最終擊敗了眾多高手。AlphaGo 取勝后,聶衛(wèi)平一度苦思而不得其解,AlphaGo 團隊中沒有一個圍棋高手,為什么能打敗世界冠軍呢?其實,這就是聶衛(wèi)平還停留在老師帶學(xué)生的思路上。老師帶學(xué)生,學(xué)生很難超過老師的高度,而 AlphaGo 是自學(xué)成材,不僅超越了頂尖的人類高手,還自創(chuàng)了許多精彩的招式。在人機大戰(zhàn)后的春蘭杯、圍甲聯(lián)賽中,人類棋手也開始應(yīng)用 AlphaGo 所創(chuàng)造的定勢,「AlphaGo 流」迅速被圍棋界所承認、吸收、并發(fā)揚光大。
 
  卡帕西模型
 
  在自然語言處理方面,也有一個著名的深度學(xué)習(xí)模型:卡帕西模型。
 
  斯坦福大學(xué)的安德烈·卡帕西(AndrejKarpathy)是深度學(xué)習(xí)領(lǐng)域的知名人物。2015 年 5 月,他設(shè)計了一個基于遞歸神經(jīng)網(wǎng)絡(luò)的 NLP 模型,并將代碼公布在 GitHub 上。
 
  這個模型非常精煉,只有幾千行的代碼量,任何一個具備基本編程功底的工程師,都可以看懂代碼并且下載運行。但模型的功能卻非常強大,它沒有設(shè)定什么語法,也沒有什么單詞庫,更沒有指定只能處理英文、法文、或某一種特定語言。它唯一的要求,只是文字輸入。你喂給它大量的文字段落,它就會用遞歸神經(jīng)網(wǎng)絡(luò)分析段落,尋找出字與字之間的關(guān)系。
 
  所有文章說到底,不過是文字的排列組合,從數(shù)學(xué)角度而言,也就是一種文字的序列。如果計算機能夠破解這個序列,掌握其規(guī)律,那么從理論上來說,它也能夠生成這樣的序列,寫出一篇類似的作文。
 
  理論非常簡單,實戰(zhàn)效果如何?現(xiàn)在,讓我們假設(shè)有一個機器人,裝備了卡帕西模型,他立志要成為一名中文小說家,他的表現(xiàn)會怎么樣呢?
 
  機器人的小說家之路 「全庸」學(xué)金庸
 
  首先,要找一個學(xué)習(xí)范本。機器人找來的是中文世界最成功的流行小說:金庸的《射雕英雄傳》。
 
  機器人學(xué)習(xí)了一遍教材?!渡涞裼⑿蹅鳌分挥邪耸f字,學(xué)起來不費多少時間,一臺普通的臺式機,只要五六秒鐘就可以學(xué)完。然后,機器人寫出了如下文字:
 
假如讓人工智能去寫武俠小說、網(wǎng)絡(luò)小說、乃至唐詩宋詞…那會如何?
  呃,完全不知所云,是吧?
 
  機器人所生成的文字,只是一些單字的隨機組合。顯然,他還沒有找出任何文字的規(guī)律。此刻的機器人,如同一個初生嬰兒,只會發(fā)出一些毫無意義的音調(diào),完全不知語言為何物。
 
  幸好,機器人有的是時間,他最擅長的就是重復(fù)性勞動。不過一分鐘時間,他又學(xué)習(xí)了十遍,再次交出一篇作文:
 
假如讓人工智能去寫武俠小說、網(wǎng)絡(luò)小說、乃至唐詩宋詞…那會如何?
  還是看不懂。不過,比起上一篇也有進步,機器人寫出的字不再是隨機的,而是教材中出現(xiàn)頻率較高的文字,如靖、黃、鋒、全真等,都是書中主要人物的名號。可見那位嬰兒正在注意聆聽周圍的語言,開始牙牙學(xué)語了。
 
  機器人繼續(xù)成長。十多分鐘后,他已學(xué)習(xí)到一百遍:
 
假如讓人工智能去寫武俠小說、網(wǎng)絡(luò)小說、乃至唐詩宋詞…那會如何?
  這篇作文里的標點符號大幅增多。雖然其用法一塌糊涂,比如引號放在冒號之前,還常常會連用兩個標點符號。但看來機器人已經(jīng)意識到句子的存在,試圖用句子來組織文字了。
 
  當機器人學(xué)習(xí)到一千遍:
假如讓人工智能去寫武俠小說、網(wǎng)絡(luò)小說、乃至唐詩宋詞…那會如何?
  這篇作文簡直是令人驚喜,就好像不知什么時候小孩子突然學(xué)會了說話,機器人對語言的領(lǐng)悟也突然有了一個飛躍。
 
  最明顯的變化是,他識別出了常用詞匯,人物名字全部寫對,連《九陰真經(jīng)》也認識了。
 
  更了不起的進步,則是機器人學(xué)會了句法,他會用標點符號了!每句話用逗號分隔,用句號結(jié)尾,雙引號一一對應(yīng),而且全都位于冒號之后。
 
  同樣,他領(lǐng)會了「主謂賓」的句法結(jié)構(gòu),每句話都是以主語開頭,后接人物動作。他也識別出了許多詞匯的詞性,并把它們放在正確的位置,形容詞位于名詞之前,副詞位于動詞之前。
 
  總體而言,這篇文字還是看不懂,但是已經(jīng)順眼很多,開始像一片真正的人類文字了。可以說,現(xiàn)在機器人的語言水平相當于一歲多的孩子,能夠磕磕碰碰說幾句話了。
 
  這充分顯示了機器學(xué)習(xí)的威力。在沒有預(yù)設(shè)任何語法庫、詞匯庫的情況下,機器人愣是通過反復(fù)學(xué)習(xí),掌握了人類語言的規(guī)律!
 
  再接再厲,機器人學(xué)習(xí)到一萬遍:
 
假如讓人工智能去寫武俠小說、網(wǎng)絡(luò)小說、乃至唐詩宋詞…那會如何?
  很遺憾,一萬遍的學(xué)習(xí)并沒有帶來明顯進步,這次寫出來的作文跟上一篇區(qū)別不大,仍然不太通順,也仍然是詞法、語法基本正確,而句子的含義還是讓人無法理解。
 
  機器人不知道什么叫挫折和放棄,他繼續(xù)埋頭苦干,又學(xué)習(xí)到十萬遍。但這一次,他的文字依舊沒有起色。新的一份作業(yè),通順程度還是跟一萬遍的一樣。
 
  堅持一天一夜,當機器人學(xué)習(xí)到上百萬遍,又交出若干份類似的作業(yè),我們不得不失望地發(fā)現(xiàn),機器人的金庸之路到此為止,他的《射雕英雄傳》沒法寫得更好了。
 
  「吉龍」學(xué)古龍
 
  不過,世界很大,中文作家除了金庸,還有很多。機器人又踏上古龍之路,學(xué)習(xí)了數(shù)萬遍《古龍全集》之后,他拿出一份習(xí)作:
假如讓人工智能去寫武俠小說、網(wǎng)絡(luò)小說、乃至唐詩宋詞…那會如何?
  新的學(xué)習(xí)結(jié)果很有趣。熟悉武俠小說的朋友都知道,同為武俠大師,金庸、古龍的風(fēng)格卻是迥然不同。實際上,他們二人只不過恰好都寫了武俠題材而已,從文學(xué)理論來看,金庸是一個古典作家,而古龍是一個現(xiàn)代作家。
 
  而機器人的模仿之作,也明顯能看出兩位老師的風(fēng)格差異:
 
  古龍的段落更短,一般一段就一句話,而金庸的一個自然段通常包含許多動作和對話;古龍有更多心理描寫,他的語言更現(xiàn)代,而金庸就顯得古汁古味;古龍喜歡裝逼,人物語言總是酷斃,恨不得不用動手,一開口就把人噎死。
 
  作為人類,我們可以評論,機器人的作文還不是很通順。然而神奇的是,他一不懂詞匯,二不懂語法,更不了解句子含義,不認識金庸古龍是誰,但他卻照樣表現(xiàn)出了人類作家的細微差異。他所寫出的作文,同樣具備段落短、語言酷、深入人物心理這些典型的古龍式文風(fēng)。
 
  這就是機器學(xué)習(xí)的威力所在,他不再需要人類專家去煞費苦心地提煉模型,他自己就能從材料中總結(jié)出模型。這是人類認識世界的一個重大進步。以往,科學(xué)發(fā)展的典型流程是,開普勒這樣的科學(xué)家觀測、實驗、收集數(shù)據(jù),牛頓這樣的科學(xué)大師研究、發(fā)明科學(xué)體系。而今后,我們或許不需要、至少是不那么依賴牛頓級別的天才,只要有一批開普勒提供數(shù)據(jù),計算機就能幫我們完成最后的臨門一腳,挖掘出人類想象不到的科學(xué)規(guī)律。
 
  再審視一遍作文,我們還可以看出,同樣是模仿之作,「吉龍」也比「全庸」寫得更加通順一些。結(jié)合機器學(xué)習(xí)的特點,我們不難找到原因。首先,機器人學(xué)習(xí)的兩份材料樣本,一個是《射雕英雄傳》,八十萬字,另一個是《古龍全集》,高達一千七百萬字,是前者的二十倍。這方面機器和人是一樣的,都是學(xué)得越多,寫得越好。
 
  另一方面,古龍的語言也比金庸簡單,他的句子短,段落短,語法結(jié)構(gòu)也較為簡單?!渡涞裼⑿蹅鳌菲婚L,卻用到三千多個單字,而厚厚的《古龍全集》,才用到兩千多個。可以說,金庸小說的復(fù)雜性較高,更有利于人類審美,而古龍小說的規(guī)律性較強,更有利于機器人學(xué)習(xí)。
 
  機器詩人
 
  為了驗證這個設(shè)想,機器人第三次踏上學(xué)習(xí)之路。這一次,他學(xué)習(xí)的是規(guī)律性要求最高的中文作品:《全唐詩》。
 
假如讓人工智能去寫武俠小說、網(wǎng)絡(luò)小說、乃至唐詩宋詞…那會如何?
  果然,機器人寫出了一手漂亮的唐詩。以第一首詩為例,遣字造句像模像樣,「花開」對「風(fēng)吹」,人類詩人也不過如此。格律按古聲為:平仄平平仄,平平仄仄平,平平仄仄仄,仄仄仄平平,算是相當工整。唯一的缺憾,就是還沒有押韻。
 
  從意境而言,這首詩生動形象,淺白明晰,自然流露出的那份性情,也頗有幾分唐詩的風(fēng)流味道。
 
  其他幾首詩,或是五言,或是七言,格式也都整整齊齊。雖然不全通順,但奇妙的是,卻大都能夠讀出一種獨特的詩味。
 
  這大概要歸功于詩歌的藝術(shù)特色:重視語言的獨創(chuàng)性、多義性。越是不符合慣例的詩歌,越是具有獨創(chuàng)性,越是具備想象的空間。
 
  前面我們已經(jīng)總結(jié)出,機器學(xué)習(xí)的長處,在于從大量數(shù)據(jù)中尋找特征,總結(jié)模型。短處則是他并沒有真正理解數(shù)據(jù),他只是按照自己找出來的規(guī)律,似是而非地寫作。這里,寫作唐詩宋詞,正好可以揚長避短。
 
  古詩詞有明確的規(guī)律,只要讀得夠多,機器人可以準確地提煉出平仄、韻腳等規(guī)則;另一方面,古詩詞強調(diào)意境,強調(diào)聯(lián)想,看似不合道理的漢字組合,被機器人放到一起,反而別具一番風(fēng)味。
 
  如今網(wǎng)上有許多寫詩軟件,或許就是這么來的。
 
  機器人寫網(wǎng)文
 
  經(jīng)過三次考試,機器人的寫作水平大致暴露在我們眼前。看起來,除了唐詩宋詞,他似乎寫不出什么像樣的東西。那么,只要你是寫現(xiàn)代文的,是不是就可以松一口氣呢?
 
  不一定。
 
  也許,寫作正經(jīng)文章,機器人還差一口氣。但是,不那么正經(jīng)的文章,機器人還是有用武之地的。
 
  以最著名的網(wǎng)絡(luò)小說之一《斗破蒼穹》為例:
 
假如讓人工智能去寫武俠小說、網(wǎng)絡(luò)小說、乃至唐詩宋詞…那會如何?
  這篇作文讀起來仍然不太流暢,但相對金庸古龍的模仿之作而言,卻算得上大體通順,至少,大部分句子都讀得懂了。似乎機器人一旦學(xué)習(xí)網(wǎng)絡(luò)小說,就突然悟性大增了。
 
  為什么呢?難道網(wǎng)絡(luò)小說就特別適合機器寫作嗎?
 
  答案是 YES。從語言文字而言,古龍比金庸單薄,而網(wǎng)絡(luò)小說又比古龍大大地單薄。前面提到,《古龍全集》用到兩千多個單字,這已經(jīng)比《射雕英雄傳》少了許多,而《斗破蒼穹》用到的單字,只有可憐的一千多個。
 
  簡單的對比就知道,古龍寫作二十多年,也才寫到一千七百萬字,而《斗破蒼穹》只花了兩年,就寫到六百萬字,其中灌水的程度也就可想而知了。
 
  簡單、稀薄的文字,或許會被真正的作家所鄙視,但這卻是機器人最喜歡的。越是單調(diào)重復(fù),他越是能找出規(guī)律,模仿出類似的作品。也許,用不了多久,網(wǎng)絡(luò)寫手就會發(fā)現(xiàn)他們多出一個高產(chǎn)、全能、永不疲倦的競爭對手。
 
  機器人局限與人類訓(xùn)練師
 
  好了,現(xiàn)在我們大致知道,當機器人談?wù)搶懽鲿r,他們在談些什么。就卡帕西模型而言,他有一個天花板。他能夠描繪出一種外表類似的文字風(fēng)格,但卻無法寫出真正讓人理解、讓人心動的文章。
 
  只要你不寫唐詩宋詞、不寫網(wǎng)絡(luò)小說,暫時可以放心了。目前機器人的語言能力,也就跟一兩歲孩子相當。
 
  但這并不意味著,人工智能永遠追不上正常人類的智力。如前所述,卡帕西模型非常簡單,只有幾千行代碼,也沒有語義庫、詞匯庫的定義,是一個純粹的「統(tǒng)計法」模型。它主要是用來展示遞歸神經(jīng)網(wǎng)絡(luò)的工作原理,教學(xué)意義更甚于實用意義。實際應(yīng)用中的商業(yè)化語言機器人,遠遠比它復(fù)雜和強大得多。
 
  另一方面,也許你已經(jīng)注意到,卡帕西模型的語言能力之所以上不去,是因為跟真正的孩子學(xué)說話相比,他還缺乏最重要的一環(huán)——外部反饋。
 
  孩子學(xué)說話不僅僅是聽,更重要的是說。語言學(xué)家指出,嬰兒需要在母親懷里親密互動,需要與父母一起玩耍游戲。孩子每一句有意無意的吚吚唔唔,都能得到父母的回應(yīng)與反饋,這種情境對于學(xué)習(xí)語言是最有利的。讓孩子每天看電視,雖然他也聽到了大量的對話,但由于缺乏雙向溝通,孩子仍然無法習(xí)得正常的人類語言。
 
  2015 年 3 月,微軟推出對話機器人 Tay。她能夠?qū)W習(xí)、模仿用戶的言論,采取用戶喜歡的語言風(fēng)格進行對話。Tay 立即引起了用戶的興趣,大量用戶蜂擁而上,用各種出位言論訓(xùn)練她,試圖誘導(dǎo)機器人突破下限。結(jié)果,在無數(shù)粗俗對話的刺激下,只花了一天功夫,Tay 就變成了一個滿口臟話、辱罵用戶、鼓吹納粹的不良少女。
 
假如讓人工智能去寫武俠小說、網(wǎng)絡(luò)小說、乃至唐詩宋詞…那會如何?
 
  微軟不得不將 Tay 緊急關(guān)閉。但從另一方面來看,這也說明了對話在語言學(xué)習(xí)中的威力。如果機器人能夠與人類頻繁互動,從人類的反饋中得知什么樣的句子是好的,什么樣的表達方式是對的,什么樣的文字是美的,那么,他離真正掌握人類語言就不遠了。
 
  這樣的工作,谷歌、臉書等科技巨頭已在開展。他們不僅有最先進的人工智能技術(shù),還擁有世界上規(guī)模最大的用戶,能夠為機器人找到足夠多的人類老師,進行足夠多的訓(xùn)練。也許,谷歌和臉書的許多服務(wù),已經(jīng)是機器人在提供,只是用戶并不知曉而已。我們在不知不覺之中,已經(jīng)在充當訓(xùn)練機器人的人肉材料。
 
  變革正在發(fā)生,未來無從知曉。對于文字工作者而言,人工智能仍然是一把懸在頭頂?shù)睦麆Α?/div>
 
 
聲明:凡資訊來源注明為其他媒體來源的信息,均為轉(zhuǎn)載自其他媒體,并不代表本網(wǎng)站贊同其觀點,也不代表本網(wǎng)站對其真實性負責。您若對該文章內(nèi)容有任何疑問或質(zhì)疑,請立即與中國機器人網(wǎng)(www.baoxianwx.cn)聯(lián)系,本網(wǎng)站將迅速給您回應(yīng)并做處理。
電話:021-39553798-8007
更多>相關(guān)專題
0相關(guān)評論

?