在本周一的 SIGGRAPH 大會(huì)上,英偉達(dá)推出了一系列面向機(jī)器人開發(fā)者的全新世界 AI 模型、庫及其他基礎(chǔ)設(shè)施,其中最為引人注目的是 Cosmos Reason。這是一款擁有 70 億參數(shù)的“推理”視覺語言模型,專為物理 AI 應(yīng)用和機(jī)器人設(shè)計(jì)。
IT之家注意到,除了 Cosmos Reason,現(xiàn)有的 Cosmos 世界模型系列還新增了 Cosmos Transfer-2。該模型能夠加速?gòu)?3D 模擬場(chǎng)景或空間控制輸入中生成合成數(shù)據(jù),同時(shí)還有一個(gè)精簡(jiǎn)版,在速度優(yōu)化方面表現(xiàn)更為出色。
英偉達(dá)在發(fā)布會(huì)上強(qiáng)調(diào),這些模型的主要用途是創(chuàng)建用于訓(xùn)練機(jī)器人和 AI 智能體的合成文本、圖像和視頻數(shù)據(jù)集。Cosmos Reason 依托其記憶和對(duì)物理原理的理解,賦予機(jī)器人和 AI 智能體“推理”能力,使其能夠“作為規(guī)劃模型,推斷具身智能體接下來可能采取的步驟”。該公司表示,該模型可用于數(shù)據(jù)策劃、機(jī)器人規(guī)劃和視頻分析。
此外,英偉達(dá)還發(fā)布了新的神經(jīng)重建庫,其中包含一種渲染技術(shù),開發(fā)者可借此利用傳感器數(shù)據(jù)以 3D 形式模擬現(xiàn)實(shí)世界。這一渲染能力也被整合進(jìn)了開源模擬器 CARLA,該平臺(tái)在開發(fā)者中廣受歡迎。同時(shí),Omniverse 軟件開發(fā)工具包也迎來了更新。
在機(jī)器人工作流程方面,英偉達(dá)推出了新的服務(wù)器。Nvidia RTX Pro Blackwell Server 為機(jī)器人開發(fā)工作負(fù)載提供了單一架構(gòu),而 Nvidia DGX Cloud 則是一個(gè)基于云的管理平臺(tái)。
隨著半導(dǎo)體巨頭英偉達(dá)不斷深入機(jī)器人領(lǐng)域,這些新發(fā)布的產(chǎn)品標(biāo)志著其在尋找 AI GPU 的下一個(gè)重大應(yīng)用場(chǎng)景方面邁出了重要一步,超越了現(xiàn)有的 AI 數(shù)據(jù)中心應(yīng)用。