8月12日消息,奧運會開幕后,眾多用戶都通過新聞客戶端第一時間了解比賽的賽況。比如,你可能看到了這樣一條有關(guān)乒乓球女單比賽的新聞:
“丁寧本輪的對手是現(xiàn)世界排名第7的韓英,實力不俗。但經(jīng)過4場大戰(zhàn)的激烈較量,最終,丁寧還是以總比分4:0戰(zhàn)勝對手,笑到了最后,為中國延續(xù)了在這個系列賽事中最終奪冠的機會。”

值得注意的是,這條超過5.4萬閱讀量的新聞并不是出自記者、編輯之手,而是由機器人寫成。這個機器人名叫“張小明”,由今日頭條實驗室推出,其“寫稿”模塊是由頭條實驗室與北京大學(xué)計算所(萬小軍團隊)聯(lián)合研發(fā)而成??梢酝ㄟ^兩種文本生成技術(shù)產(chǎn)出新聞:一是針對數(shù)據(jù)庫中表格數(shù)據(jù)和知識庫生成自然語言的比賽結(jié)果報道,即簡訊;二是利用體育比賽文字直播精煉合成比賽過程的總結(jié)報道,即資訊。
據(jù)了解,張小明主要報道乒乓球、網(wǎng)球、羽毛球和女足的比賽,以2秒種的生成時間,發(fā)布著每一場賽事的新聞稿,6天共生成超200篇簡訊和資訊。
此前,國內(nèi)也有了一些機器人寫稿的嘗試,張小明的寫稿技術(shù)已經(jīng)進入是第二代寫稿水平。與第一代機器人相比 ,張小明特征包括:速度快、樣式多、自適應(yīng)、自動配圖等。
今日頭條相關(guān)人士對TechWeb表示,張小明最大的意義在于,面對奧運會這樣同時舉行上百場比賽的綜合賽事,記者很難關(guān)注到每一場比賽,而機器人可以任勞任怨的為每一場比賽報道,無論這場比賽多么冷門和不重要。“傳統(tǒng)新聞理論并不認為這些冷門比賽或者熱門比賽(比如乒乓球)的前幾輪小組賽有新聞價值,可是通過我們的平臺測試,我們發(fā)現(xiàn)對冷門場次的報道任然有可觀的閱讀量,這個閱讀量非常長尾,而新聞機器人可以彌補對這種長尾的新聞需求。”