Nvidia今天推出了一系列新產(chǎn)品,讓企業(yè)能夠更輕松地構(gòu)建先進(jìn)的自然語言處理模型。

BioNeMo
第一款產(chǎn)品是BioNeMo,一個開發(fā)自然語言處理模型的框架,可以幫助科學(xué)家進(jìn)行生物學(xué)和化學(xué)研究。除了該框架之外,Nvidia還推出了兩項基于云的AI服務(wù),第一個服務(wù)將簡化使用BioNeMo開發(fā)AI模型,另一項服務(wù)則專注于加快把神經(jīng)網(wǎng)絡(luò)應(yīng)用于文本處理例如總結(jié)研究論文等。

BioNeMo
AI處理數(shù)據(jù)和做出決策的方式受配置設(shè)置(稱為參數(shù))的影響,AI模型的參數(shù)越多,處理數(shù)據(jù)的準(zhǔn)確性就越高。
近年來,研究人員開發(fā)了多種包含數(shù)十億參數(shù)的自然語言處理模型,這種神經(jīng)網(wǎng)絡(luò)被稱為大型語言模型(LLM),最先進(jìn)的LLM不僅可以應(yīng)用于傳統(tǒng)的文本處理,例如總結(jié)研究論文,還可以用于編寫軟件代碼和執(zhí)行其他各種任務(wù)。
科學(xué)家們發(fā)現(xiàn),LLM的處理能力非常適合生物分子研究。這次Nvidia推出的BioNeMo框架專門用于訓(xùn)練能夠支持生物學(xué)和化學(xué)領(lǐng)域研究的LLM,此外還包含了多項功能可簡化在生產(chǎn)中部署此類神經(jīng)網(wǎng)絡(luò)的任務(wù)。
Nvidia方面表示,科學(xué)家可以使用該框架來訓(xùn)練具有數(shù)十億個參數(shù)的LLM。此外,BioNeMo包含了四個預(yù)訓(xùn)練的語言模型,相比從零開始開發(fā)神經(jīng)網(wǎng)絡(luò)來說,能夠更快速地應(yīng)用于研究任務(wù)中。
首批兩個預(yù)訓(xùn)練的語言模型ESM-1和OpenFold已經(jīng)針對預(yù)測蛋白質(zhì)的特性進(jìn)行了優(yōu)化。BioNeMo支持ProtT5,一種可用于生成新蛋白質(zhì)序列的神經(jīng)網(wǎng)絡(luò),另外一個神經(jīng)網(wǎng)絡(luò)是MegaMolBART,可用于預(yù)測分子如何相互作用等任務(wù)。
新的云服務(wù)
除了BioNeMo,Nvidia今天還推出了兩項新的云服務(wù),旨在簡化構(gòu)建AI應(yīng)用的任務(wù),并且都提供了一組預(yù)打包的語言模型。
第一個云服務(wù)BioNeMoService支持使用NvidiaBioNeMo框架創(chuàng)建的兩種語言模型,這兩個神經(jīng)網(wǎng)絡(luò)經(jīng)過優(yōu)化可以支持生物學(xué)和化學(xué)方面的研究,據(jù)稱可以配置多達(dá)數(shù)十億個參數(shù)。
Nvidia設(shè)想生物技術(shù)和制藥公司可以利用BioNeMo服務(wù)來加速藥物的發(fā)現(xiàn),稱該服務(wù)可以幫助科學(xué)家生成用于治療用途的新生物分子,以及執(zhí)行與醫(yī)學(xué)研究相關(guān)的其他任務(wù)。
Nvidia創(chuàng)始人、首席執(zhí)行官黃仁勛表示:“大型語言模型具有變革每個行業(yè)的潛力,調(diào)優(yōu)基礎(chǔ)模型的能力讓數(shù)百萬開發(fā)人員可以利用LLM,讓他們?nèi)缃窨梢源蛟旄鞣N語言服務(wù)并推動科學(xué)發(fā)現(xiàn),而無需從頭開始構(gòu)建龐大的模型。”
Nvidia此次推出的第二項云服務(wù)名為NeMoLLMService,它提供了包含30億到5300億個參數(shù)的預(yù)訓(xùn)練語言模型集合,這些語言模型可用于生成文本摘要、支持聊天機(jī)器人和編寫軟件代碼等任務(wù)。
NeMoLLM服務(wù)中的神經(jīng)網(wǎng)絡(luò)已經(jīng)經(jīng)過了Nvidia的預(yù)先訓(xùn)練,但企業(yè)可以選擇在自己自定義的數(shù)據(jù)集上做進(jìn)一步的訓(xùn)練。讓神經(jīng)網(wǎng)絡(luò)熟悉和了解某個企業(yè)的數(shù)據(jù),使其能夠更準(zhǔn)確地處理這些數(shù)據(jù)。
企業(yè)組織可以使用一種“提示學(xué)習(xí)”(promptLearning)的方法在NeMoLLM服務(wù)中訓(xùn)練AI模型。“提示學(xué)習(xí)”包括為神經(jīng)網(wǎng)絡(luò)提供部分句子,例如“Nvidia為…開發(fā)芯片”,并指示它來完成文本,通過多次重復(fù)這個過程,開發(fā)人員就可以教會神經(jīng)網(wǎng)絡(luò)執(zhí)行某些計算任務(wù)。
與傳統(tǒng)的AI訓(xùn)練方法相比,提示學(xué)習(xí)的主要好處是,在某些類型的機(jī)器學(xué)習(xí)項目中使用該技術(shù)可以大大加快速度。據(jù)Nvidia稱,客戶可以在幾分鐘或者是幾小時內(nèi)訓(xùn)練NeMoLLM服務(wù)提供的神經(jīng)網(wǎng)絡(luò),而不是長達(dá)數(shù)月時間。訓(xùn)練完成之后,就可以把這個神經(jīng)網(wǎng)絡(luò)部署到云環(huán)境或者企業(yè)的本地基礎(chǔ)設(shè)施中。
NeMoLLM服務(wù)和BioNeMoLLM服務(wù)將于提供早期訪問,BioNeMo框架將提供測試版。