寫財(cái)報(bào)是一件有點(diǎn)無(wú)聊、又壓力山大的工作。既要保證數(shù)據(jù)的準(zhǔn)確性,又要求在第一時(shí)間迅速報(bào)道。對(duì)于想寫深入報(bào)道的記者來(lái)說(shuō),速度和角度往往不可兼得。而數(shù)據(jù)上的重大失誤更有可能讓他們丟掉飯碗。
幾天前,蘋果發(fā)出 2015 Q1 財(cái)報(bào)的幾分鐘后,美聯(lián)社就發(fā)布了一篇名為《蘋果 Q1 收入超華爾街預(yù)測(cè)》的報(bào)道,不同的是,這篇報(bào)道沒(méi)有作者,看到最后,你才會(huì)發(fā)現(xiàn)文末有 “這篇報(bào)道由 Automated Insights 生成” 的字樣。
這不是第一篇由機(jī)器寫成的報(bào)道。美聯(lián)社從去年 7 月就開始嘗試財(cái)報(bào)的自動(dòng)化報(bào)道。合作伙伴是一家叫做 Automated Insights 的公司,他們的自動(dòng)化寫作平臺(tái) Wordsmith 與 Allstate、Comcast、雅虎、美聯(lián)社等數(shù)家大公司合作,每周能生產(chǎn)出幾百萬(wàn)篇文章。AI 的公關(guān)總監(jiān) James Kotecki 說(shuō),需要的時(shí)候,這一平臺(tái)可以每秒生產(chǎn) 2000 篇文章。
shutter stock
但對(duì)于記者來(lái)說(shuō),速度和數(shù)量并不是一切。美聯(lián)社的商業(yè)編輯助理 Philana Patterson 說(shuō),好記者自然會(huì)懷疑算法的可靠性。最初的時(shí)候,所有機(jī)器生產(chǎn)的文章都會(huì)經(jīng)過(guò)人工審核,并把錯(cuò)誤記錄下來(lái)發(fā)給 Automated Insights 以改進(jìn)算法。十月開始,達(dá)成了全面自動(dòng)化,所有機(jī)器生成的文章都不再經(jīng)過(guò)人工干預(yù)。經(jīng)過(guò)大半年,自動(dòng)寫作系統(tǒng)記錄下的錯(cuò)誤已經(jīng)比記者所寫文章中的錯(cuò)誤要少了。
許多人可能會(huì)問(wèn),機(jī)器人會(huì)不會(huì)搶了記者的飯碗呢?答案是否定的。美聯(lián)社和 Automated Insights 都表示,沒(méi)有一位記者因機(jī)器自動(dòng)化寫作丟掉工作。實(shí)際上,機(jī)器寫作分擔(dān)了記者的壓力,在確保時(shí)效性和報(bào)道全面性的同時(shí),讓他們能更好地發(fā)揮所長(zhǎng)。
此前,美聯(lián)社只對(duì) 300 個(gè)公司發(fā)布的財(cái)報(bào)做報(bào)道?,F(xiàn)在它每季能自動(dòng)生成 3000 個(gè)公司的財(cái)報(bào)報(bào)道,而對(duì)其中的 120 個(gè)進(jìn)行人工跟進(jìn),包括更新故事的原始和跟蹤報(bào)道。比如蘋果公司的財(cái)報(bào)由記者 Brandon Bailey 跟進(jìn)。由于機(jī)器報(bào)道已經(jīng)在第一時(shí)間公布了主要數(shù)據(jù),所以他能夠?qū)W⒂谝粋€(gè)角度,并把財(cái)報(bào)數(shù)據(jù)放在庫(kù)克講話的背景下分析。
進(jìn)行人工跟進(jìn)的公司名單上還有 Google、可口可樂(lè)、美國(guó)航空等等。美聯(lián)社對(duì)剩下的 180 家公司進(jìn)行監(jiān)控,視情況而定需不需要報(bào)道。另有包括花旗銀行、富國(guó)銀行等在內(nèi)的十家公司的財(cái)報(bào)不易被機(jī)器讀取,必須由人工報(bào)道。美聯(lián)社每季度都會(huì)對(duì)人工或機(jī)器報(bào)道的公司名單進(jìn)行更新。總的來(lái)說(shuō),機(jī)器大大減輕了記者的壓力。
讓機(jī)器人寫報(bào)道并不難。只要知道正確的數(shù)據(jù)來(lái)源,要從中提取哪些有效信息,剩下的難題就是如何讓機(jī)器人寫出符合語(yǔ)法的句子。美聯(lián)社的語(yǔ)言風(fēng)格指導(dǎo)手冊(cè) AP Style 為語(yǔ)法的規(guī)范性奠定了很好的基礎(chǔ)。有了以上內(nèi)容后,成文時(shí)只需要按重要性給信息的先后順序排序,這本質(zhì)上與 Google Search 或者 Facebook News Feed 中的排序技術(shù)類似。
除了可以生成財(cái)報(bào),雅虎上的體育報(bào)道有相當(dāng)一部分新聞是由這個(gè)平臺(tái)自動(dòng)生成的。機(jī)器自動(dòng)寫作的范圍和用途還在不斷拓展中。
讓機(jī)器人和記者打配合,前者負(fù)責(zé)快速、全面、準(zhǔn)確地發(fā)消息,后者負(fù)責(zé)后續(xù)跟進(jìn)和深入分析,不失為一種理想的新聞報(bào)道方式。