11月19日下午,在北京大學(xué)科技成果發(fā)布會上,記者了解到,由該校王選計(jì)算機(jī)研究所萬小軍團(tuán)隊(duì)研發(fā)的AI寫作機(jī)器人,既能寫新聞、做綜述,又能發(fā)評論、對詩詞,他們與多家媒體合作打造的小明、小南、小柯等寫作機(jī)器人已經(jīng)陸續(xù)上崗。
機(jī)器人記者寫稿更多依賴數(shù)據(jù)
今天下午的成果發(fā)布會,也是北京市科技成果轉(zhuǎn)化統(tǒng)籌協(xié)調(diào)與服務(wù)平臺系列項(xiàng)目路演之一,來自北大王選計(jì)算機(jī)研究所的四個科研項(xiàng)目參與路演。其中,萬小軍帶來的“AI寫作機(jī)器人及其應(yīng)用”項(xiàng)目人氣最高。萬小軍先從AI在自然語言處理方面的實(shí)際應(yīng)用說起,對于AI來講,寫新聞?wù)?、生成詩歌、智能對話、寫商品簡介甚至是寫書、?chuàng)作小說、語言辯論等統(tǒng)統(tǒng)不在話下。AI寫作的流程,主要包括題目篩選、素材推薦、內(nèi)容生成、質(zhì)量控制、稿件發(fā)布和效果監(jiān)測,其他們團(tuán)隊(duì)主要研究內(nèi)容生成。

萬小軍說,目前AI內(nèi)容生成的主要方式包括內(nèi)容擴(kuò)充、內(nèi)容壓縮以及內(nèi)容改寫,其團(tuán)隊(duì)從2005年開始已系統(tǒng)研究了面向機(jī)器人的人工智能與自然語言處理技術(shù),特別是自動文摘與文本生成技術(shù),能夠?qū)崿F(xiàn)內(nèi)容可控、長短可控、情感可控、風(fēng)格可控的多類文本稿件,即自動寫作短摘要、新聞、綜述、評論、詩歌等。


他還通過PPT現(xiàn)場展示了AI機(jī)器人寫的體育賽事簡訊、報(bào)道以及棋類比賽解說詞等。記者注意到,機(jī)器人寫的體育簡訊,集中在出場陣容、隊(duì)員名稱、比分、時(shí)間等要素;篇幅較長的體育賽事報(bào)道,仍以數(shù)據(jù)信息為主,并加入一些描寫,比如“攔截能力值得期待”“坐鎮(zhèn)左翼”“構(gòu)建中場屏障”等。

部分媒體已啟用機(jī)器人記者
萬小軍介紹,目前團(tuán)隊(duì)技術(shù)成果已經(jīng)應(yīng)用于多家媒體,該團(tuán)隊(duì)與字節(jié)跳動合作推出了小明寫作機(jī)器人;與日本三菱合作推出日本財(cái)經(jīng)寫作機(jī)器人;還與南都合作推出了小南寫作機(jī)器人,主要撰寫民生新聞;與科學(xué)網(wǎng)合作的小柯機(jī)器人,用于撰寫科學(xué)新聞。此外,還包括,妙筆寫作機(jī)器人以及游戲?qū)懽鳈C(jī)器人等。

機(jī)器人會代替人類記者嗎?
機(jī)器人會替代人類記者嗎?萬小軍認(rèn)為,記者仍有自身優(yōu)勢。機(jī)器寫作應(yīng)用高度依賴于輸入數(shù)據(jù)與素材,所以,數(shù)據(jù)與素材的獲取必須首先解決。也就是說,機(jī)器人記者還沒學(xué)會實(shí)地“采訪”。

目前,寫作機(jī)器人多用于體育比賽快訊,科技信息快訊等領(lǐng)域,更多依賴數(shù)據(jù)、素材。其他領(lǐng)域,數(shù)據(jù)格式與類型不一樣,語言表達(dá)也不同,因此,寫作機(jī)器人一般不具有遷移性,針對新領(lǐng)域需要二次開發(fā)甚至重新開發(fā)產(chǎn)品。

機(jī)器寫作適用于長期頻繁的寫稿需求,研發(fā)過程中也需要應(yīng)用方的參與,需要借助于數(shù)據(jù)、編輯人員的語言表達(dá)總結(jié)等。