全球 AI 競賽再添新參與者,這次是一整個(gè)國家。瑞士正式發(fā)布了國家級開源大語言模型(LLM)Apertus,希望其能成為 OpenAI 等企業(yè)所提供模型的替代選擇。“Apertus”源自拉丁語,意為“開放”,該模型由瑞士洛桑聯(lián)邦理工學(xué)院(EPFL)、蘇黎世聯(lián)邦理工學(xué)院(ETH Zurich)以及瑞士國家超級計(jì)算中心(CSCS)聯(lián)合研發(fā),這三家機(jī)構(gòu)均為公共機(jī)構(gòu)。
“當(dāng)前,Apertus 是領(lǐng)先的公共 AI 模型:由公立機(jī)構(gòu)打造,服務(wù)于公共利益。這是我們迄今為止最有力的證明 ——AI 完全可以成為像公路、供水、供電一樣的公共基礎(chǔ)設(shè)施?!蓖苿?AI 成為公共基礎(chǔ)設(shè)施的核心倡導(dǎo)者約書亞?譚(Joshua Tan)表示。
瑞士研發(fā)團(tuán)隊(duì)將 Apertus 設(shè)計(jì)為完全開源模式,用戶可查看其訓(xùn)練過程的各個(gè)環(huán)節(jié)。除模型本身外,團(tuán)隊(duì)還同步公開了訓(xùn)練過程的完整文檔、源代碼,以及所使用的數(shù)據(jù)集。Apertus 的研發(fā)嚴(yán)格遵循瑞士數(shù)據(jù)保護(hù)法與版權(quán)法,對于希望遵守歐洲相關(guān)法規(guī)的企業(yè)而言,它或許是更優(yōu)選擇之一。瑞士銀行家協(xié)會此前曾指出,本土研發(fā)的大語言模型具有“巨大的長期潛力”,因?yàn)檫@類模型能更好地契合瑞士嚴(yán)格的本地?cái)?shù)據(jù)保護(hù)法規(guī)與銀行保密制度。目前,瑞士各銀行已在使用其他 AI 模型滿足業(yè)務(wù)需求,未來是否會轉(zhuǎn)向 Apertus,仍有待觀察。
據(jù)IT之家了解,Apertus 向所有用戶開放使用:科研人員、AI 愛好者,乃至企業(yè)均可基于該模型進(jìn)行二次開發(fā),根據(jù)自身需求定制功能。例如,用戶可借助它開發(fā)聊天機(jī)器人、翻譯工具,甚至是教育或培訓(xùn)類應(yīng)用。Apertus 的訓(xùn)練數(shù)據(jù)涵蓋 1000 多種語言,總 token 量達(dá) 15 萬億,其中非英語數(shù)據(jù)占比 40%,包括瑞士德語、羅曼什語等瑞士本土語言。瑞士官方的聲明稱,該模型的訓(xùn)練僅使用公開可獲取的數(shù)據(jù),且其數(shù)據(jù)爬蟲在網(wǎng)站上遇到機(jī)器可讀的“拒絕爬取”請求時(shí),會予以尊重。需注意的是,此前已有 Perplexity 等 AI 企業(yè)被指控爬取網(wǎng)站數(shù)據(jù),并繞過用于阻止爬蟲的協(xié)議;部分 AI 企業(yè)還因未經(jīng)許可使用新聞機(jī)構(gòu)及創(chuàng)作者的內(nèi)容訓(xùn)練模型,面臨法律訴訟。
目前,Apertus 提供兩種參數(shù)規(guī)模的版本,分別為 80 億參數(shù)與 700 億參數(shù)。用戶可通過瑞士電信(Swisscom,瑞士信息通信技術(shù)企業(yè))或 AI 平臺 Hugging Face 獲取該模型。