一大撥“作家”機器人正在靠近我們?
近日,科幻作家劉慈欣設計的寫詩軟件“計算機詩人”引起了媒體的廣泛關注。其實“電腦寫作”、“自動化寫作”的話題并不新鮮,類似的寫詩軟件在數(shù)年前就已出現(xiàn),而相關的討論仍在老調重彈——不外乎是對現(xiàn)代中文詩歌沒落的悲嘆,對上世紀80年代詩歌黃金時期的追懷,以及對當代詩人生存境況的無力關注。
而就在一個月之前,豆瓣網上一篇名為《你們以為網絡小說1天2萬字怎么寫的?》的帖子被4000多人推薦,成為一時間的熱帖。此文詳細介紹了一家專門輔助網絡小說創(chuàng)作的網站“玄派網”,它可以輔助生成多種玄幻小說中的必要元素:人名、門派勢力名稱、地名、招式、榮譽頭銜等等,甚至可以在作者進行簡單設定后,自動完成外貌和對話的描寫。
本期文化觀察,回到文學創(chuàng)作與人工智能這兩個領域的交叉點——未來,文學創(chuàng)作能被機器取代嗎?
寫詩軟件不下十種可以自動生成多種風格
昨日,記者在體驗劉慈欣設計的寫詩軟件“計算機詩人”后發(fā)現(xiàn),這款軟件設計得非常簡單,只需設置是否分段、段數(shù)、行數(shù)、是否押韻及韻母,點擊“開始創(chuàng)作”鍵,即可馬上生成出一首詩。
將設定輸入為3段,每段2行,韻腳為a,不到一秒鐘,就出現(xiàn)了一首看起來還挺像詩的詩——“你是我的想自殺的水洼,你是我的廣大的群馬。你是我的嘩嘩啦啦的灰鯊,你是我的無限大的油畫。你是我的大大的風沙,你是我的低下的百合花。”
在進行過數(shù)十次實驗后,記者發(fā)現(xiàn)這款軟件所生成的詩歌,在風格上帶有劉慈欣小說中的科幻色彩,在詞語組合上,幾乎句句都打破了日常用語的習慣,而且經常出現(xiàn)呼喊式的以感嘆號結尾的句子。
實際上,網絡上類似的寫詩軟件有至少不下10種,而且風格各異,不僅可以寫出朦朧詩、小清新的感覺,還可以寫出政治抒情詩、古詩詞。
在一個名為“獵戶星免費詩歌自動制作機”的網站上,網站制作者置頂了這樣一段話:“讀多了詩壇上那哼哼唧唧不知所云的詩歌,我們才知道讀不懂就是現(xiàn)代詩的本質,胡亂搭配是現(xiàn)代詩的法寶。在沒有大師的年代,我們,讓所謂的詩人滾開!現(xiàn)在,我們自己也會寫詩。”
這段話中的諷刺與戲謔無疑也是大多數(shù)人對現(xiàn)代詩的普遍印象,而說到這次寫詩軟件又令媒體矚目的起因,原來是復旦大學中文系教授嚴鋒在微博上轉發(fā)馮唐于11月2日所寫的一首新詩時所配的評論——“推薦大家下載一個劉慈欣編程的寫詩軟件,比較一下電腦寫的詩比馮唐的如何。”并在后面附上了下載地址。有網友隨后留言說:“哈哈馮唐又默默地被高端黑了。”
■人工智能
計算機目前仍無法做到的事:創(chuàng)新
暫不討論寫詩軟件對現(xiàn)代詩歌的反諷,從技術層面而言,計算機到底能不能進行文學創(chuàng)作?這個問題在今年6月由唐茶字節(jié)社制作出版的電子書《與機器賽跑》中,可以得到一種解答:“如今的數(shù)碼機器盡管力量強、速度快,但尚未表現(xiàn)出太多的創(chuàng)新能力。它們不能寫出非常好聽的歌曲和了不起的小說,或是為新業(yè)務提出優(yōu)秀的設想。”
其后,作者舉了兩個有趣的反例,不過它們卻恰好證明了上述規(guī)律:一次是某個愛惡作劇的人,利用“在線計算機科學論文摘要生成器”創(chuàng)作了一篇論文,竟然獲得了某技術大會的接受,而且這個大會的組織者甚至邀請“作者”來主持評審團。但“這份摘要其實只是一連串似是而非的技術術語,用若干標準口語連詞串在一起罷了。”
而另一個反例,則指向看似最不可能被取代的職業(yè)——記者(主要是體育記者)。作者說,目前已出現(xiàn)專門為棒球比賽賽況自動生成概要的軟件,而這種軟件得以順利運行,是因為“大部分體育賽事文章都是高度程式化的寫作,適合進行模式匹配和較簡單的溝通。”但是緊接著,作者補充道:“自動生成公式化文章和真正的洞見之間仍有著明顯的區(qū)別。”
在已有60年歷史之久的圖靈實驗中,計算機能否像人腦一樣思考被圖靈視作“毫無意義,不值得討論”的爭論,而要證明機器能跟人有多像,只需要讓人類測試組同時跟人和計算機在線聊天——如果測試組的成員基本無法判斷哪一方是機器,則機器通過了測試。
圖靈預測在2000年時,計算機在測試中與人無法區(qū)別的概率是70%。聯(lián)想到目前蘋果手機上的人工智能應用Siri,它的出現(xiàn)證實了人工智能將像科幻電影中所描述的那樣,滲入我們的日常生活,改變社會的經濟生產,甚至有一天將替代人類去完成目前大部分尚依賴人力的工作。
■聲音
文學創(chuàng)作的“非物理”單位,如節(jié)奏、氣氛,無法被電腦“量化”
為了得到專業(yè)人士的意見,記者專訪了本報專欄作家、曾出版《斷鼠》的小說家陳夢雅(筆名8439),她目前還是中山大學科學哲學專業(yè)的在讀博士。
在讀到有關“玄派網”的帖子后,陳夢雅說,“這個程序針對的是武俠小說。但是從小說創(chuàng)作的技術層面來說,主要涉及自上而下的幾方面:故事、章節(jié)、句子、詞語。而該程序所針對的僅僅是最基礎的元素:詞語。”“開發(fā)者的編程方法一目了然,按照基本分類,收集頻度較高的字詞,建造數(shù)據(jù)庫,然后用戶選擇分類,即可得到組合形式的輸出。”
她還設想說,如果進一步完善此程序,令它可以生成完整的故事脈絡,這也并非不可能。“開發(fā)者可以收集目標小說門類的高頻事件,如結仇、復仇、決斗、中毒等等。不過這些高頻事件的組合顯然更靈活。”這種靈活主要涉及到結構與敘事技巧,也就是講故事的方式:既可以是單線推進的,也可以是雙線或多線并進,還可以是分層的。“但無論多么復雜,在理想情況中,只要開發(fā)者收集到足夠多的事件和結構規(guī)則,也可以實現(xiàn)一套整體情節(jié)編排的輸出。”
然而文學創(chuàng)作真的可以以計算機軟件批量生產嗎?陳夢雅又補充說,“任何一個對語言有著基本尊重的作者,恐怕都不能認同造詞就比造句子、編故事更容易。對于文學創(chuàng)作而言,想一個好名字、造一個好的比喻句有多難,所耗費智力和精力的多少與體量的長短無關。”
“再者,詞語、句子、章節(jié)、故事是寫小說的‘物理’單位。而小說還存在著無法被量化的‘非物理’單位,如節(jié)奏,氛圍等。計算機能否處理這些‘非物理’的元素?有兩種可能性。其一,‘非物理’的標準可以被還原到‘物理’單位上,也就是從原則上說,節(jié)奏、氛圍的需求類別以及實現(xiàn)它們的手段是可以窮盡的。其二,在文學創(chuàng)作這個問題上,咱們人類的肉腦子總是處于待開發(fā)狀態(tài)。肉腦子發(fā)明的硅腦子總是處于已完成狀態(tài)。”