一名21歲的計算機科學(xué)專業(yè)學(xué)生在一次全球競賽中獲勝,讀出了古羅馬城市赫庫蘭尼姆碳化卷軸中的第一段文字,該卷軸自公元79年火山爆發(fā)以來一直無法被讀取,而那次火山爆發(fā)也掩埋了附近的龐貝古城。這一突破可能會打開希臘羅馬古代唯一保存完好的圖書館中的數(shù)百個文本。

內(nèi)布拉斯加大學(xué)林肯分校的盧克-法里托爾(Luke Farritor)開發(fā)了一種機器學(xué)習(xí)算法,在卷起的紙莎草紙上檢測到了幾行希臘字母,其中包括πορjυρας(porphyras),意為"紫色"。Farritor利用表面紋理的細(xì)微差別來訓(xùn)練神經(jīng)網(wǎng)絡(luò),并突出墨跡。
意大利那不勒斯大學(xué)的紙莎草學(xué)家、審查Farritor研究成果的學(xué)術(shù)委員會成員Federica Nicolardi說:"當(dāng)我看到第一張圖片時,我震驚了。這簡直是一場夢。現(xiàn)在,我真的可以從卷軸內(nèi)部看到一些東西"。
公元79年10月,維蘇威火山爆發(fā),赫庫蘭尼姆被20米高的火山灰掩埋,數(shù)以百計的卷軸被掩埋。早期打開紙莎草紙的嘗試失敗,產(chǎn)生了一堆碎片,學(xué)者們擔(dān)心其余的紙莎草紙永遠(yuǎn)無法展開或閱讀。
維蘇威火山挑戰(zhàn)賽設(shè)立了一系列獎項,從卷軸中讀出四個或更多段落將獲得70萬美元的主獎金。10月12日,主辦方宣布,法里托爾因在4平方厘米的紙莎草紙上讀出10個以上的字符而贏得了4萬美元的"第一封信"獎。柏林自由大學(xué)研究生優(yōu)素福-納德(Youssef Nader)獲得第二名,獎金為1萬美元。
意大利威尼斯卡福斯卡里大學(xué)(Ca'Foscari University of Venice)古希臘和古羅馬歷史學(xué)家西婭-薩默希爾德(Thea Sommerschield)說,最終看到卷軸中的字母和文字"非常令人激動"。這些卷軸是在十八世紀(jì)發(fā)現(xiàn)的,當(dāng)時工人們發(fā)現(xiàn)了一座豪華別墅的遺跡,這座別墅可能屬于凱撒大帝岳父的家族。薩默希爾德說,破譯這些紙莎草紙可能"徹底改變我們對古代歷史和文學(xué)的認(rèn)識"。今天已知的大多數(shù)古典文本都是抄寫員幾個世紀(jì)以來反復(fù)抄寫的結(jié)果。相比之下,赫庫蘭尼姆圖書館收藏的作品則沒有任何其他來源,直接來自作者。
到目前為止,研究人員只能研究已打開的片段。已經(jīng)發(fā)現(xiàn)了一些拉丁文作品,但其中大部分是與伊壁鳩魯哲學(xué)流派有關(guān)的希臘文。其中有伊壁鳩魯本人撰寫的《論自然》的部分內(nèi)容,還有一位鮮為人知的哲學(xué)家Philodemus關(guān)于惡習(xí)、音樂、修辭和死亡等主題的作品。有人認(rèn)為,這個圖書館可能曾經(jīng)是他的工作藏書。但是,600多卷紙莎草紙--大部分保存在那不勒斯國家圖書館,少數(shù)保存在英國和法國--仍然完好無損,沒有被打開過。而在別墅尚未發(fā)掘的底層,還可能發(fā)現(xiàn)更多的紙莎草紙。
布倫特-西爾斯(Brent Seales)是一名計算機科學(xué)家,曾幫助設(shè)立維蘇威火山挑戰(zhàn)賽,他和他的團隊花了數(shù)年時間,開發(fā)出利用X射線計算機斷層掃描(CT)"虛擬揭開"薄如蟬翼的紙莎草紙層的方法,并將其可視化為一系列平面圖像。2016年,萊克星頓肯塔基大學(xué)的Seales報告1使用該技術(shù)讀取了以色列En-Gedi的燒焦卷軸,揭示了《利未記》(猶太教《托拉》和基督教《舊約》的一部分)中寫于公元三、四世紀(jì)的部分內(nèi)容。但恩蓋迪卷軸上的墨水含有金屬,因此在CT掃描中會發(fā)出耀眼的光芒。赫庫蘭尼姆古卷上的墨水是碳基的,本質(zhì)上是木炭和水,在掃描中的密度與紙莎草紙的密度相同,所以根本不會顯示出來。
西爾斯意識到,即使亮度沒有差異,CT掃描也可能捕捉到紋理上的微小差異,從而區(qū)分出涂有墨水的紙莎草紙區(qū)域。為了證明這一點,他訓(xùn)練了一個人工神經(jīng)網(wǎng)絡(luò)來讀取打開的赫庫蘭尼姆碎片的X射線圖像中的字母。然后,在2019年,他從巴黎法蘭西學(xué)院攜帶了兩個完整的卷軸到英國牛津附近的同步輻射X射線設(shè)施鉆石光源,以目前最高的分辨率(每個三維圖像元素或體素4-8微米)對其進行掃描。
然而,閱讀完整的卷軸仍然是一項艱巨的任務(wù),因此該團隊向公眾公布了所有掃描結(jié)果和代碼,并發(fā)起了維蘇威火山挑戰(zhàn)賽。西爾斯說:"我們一致認(rèn)為,與其試圖囤積所有東西,不如盡早讀取里面的內(nèi)容。"
大約1500個團隊很快就通過玩家聊天平臺Discord進行了討論和合作。獎品是分階段設(shè)計的,每達(dá)到一個里程碑,就會發(fā)布獲獎代碼,供大家在此基礎(chǔ)上繼續(xù)開發(fā)。Farritor一直對歷史感興趣,他從小就自學(xué)拉丁語,因此很早就參與其中。
與此同時,Seales的團隊還致力于虛擬解包,發(fā)布扁平碎片的圖像供參賽者分析。關(guān)鍵時刻出現(xiàn)在6月下旬,一位參賽者指出,在一些圖像上,肉眼偶爾能看到墨水的細(xì)微紋理,這種紋理被稱為"裂紋"。法里托立即將注意力集中在尋找更多字母的蛛絲馬跡。
八月的一個晚上,他正在參加一個聚會,突然收到一條提示,說有一個新的片段發(fā)布了,其中的裂紋特別明顯。通過手機連接,他在新圖像上運行了算法。一小時后,他走在回家的路上,掏出手機,看到屏幕上出現(xiàn)了五個字母。"我當(dāng)時上躥下跳,天哪,這真的行得通。"從那以后,他只花了幾天時間就完善了模型,并確定了獲獎所需的十個字母。
掃描顯示黑色的紙莎草紙碎片,白色的希臘字母清晰可見。維蘇威挑戰(zhàn)賽破譯的第一個單詞是希臘文πορφ?ρας,意為"紫色"。
古文字學(xué)家們也很興奮。在打開的赫庫蘭尼姆卷軸中還沒有讀到過"紫色"一詞。紫色染料在古羅馬非常搶手,是用海螺的腺體制成的,因此這個詞可以指紫色、長袍、買得起染料的人的等級,甚至是軟體動物。尼古拉迪說,但比單個詞更重要的是讀出任何東西。這一進展"使我們有可能恢復(fù)整個卷軸的文字",包括標(biāo)題和作者,這樣就可以確定作品的身份和年代。
亞尼斯-阿薩埃爾(Yannis Assael)是倫敦GoogleDeepMind公司的一名研究科學(xué)家,他認(rèn)為維蘇威火山挑戰(zhàn)賽是"獨一無二和鼓舞人心的"。他指出,人工智能(AI)正越來越多地幫助古文獻研究,但這只是更廣泛轉(zhuǎn)變的一部分。例如,去年阿薩埃爾和薩默希爾德發(fā)布了一款名為"伊薩卡"(Ithaca)的人工智能工具,旨在幫助學(xué)者收集不明古希臘碑文的日期和來源,并提出文本建議以填補空白2?,F(xiàn)在,該工具每周都會收到數(shù)百條詢問,類似的工作也正在應(yīng)用于從韓語到古代美索不達(dá)米亞使用的阿卡德語等各種語言。
Seales希望機器學(xué)習(xí)能打開他所謂的"隱形圖書館"。所謂"隱形圖書館",指的是實際存在但無人能見的文本,包括中世紀(jì)書籍裝幀中使用的羊皮紙、后來的文字遮蓋了下面一層的"重寫本"(palimpsests),以及用來制作古埃及木乃伊盒和面具的紙莎草紙(cartonnage)。
不過,現(xiàn)在所有的目光都集中在維蘇威火山挑戰(zhàn)賽上。獲得大獎的截止日期是12月31日,Seales將人們的情緒描述為"無法抑制的樂觀"。法里托已經(jīng)在畫卷的其他部分制作了自己的模型,并看到了更多的角色出現(xiàn)。