英偉達(dá)CEO黃仁勛受邀參加今年的CES展會(huì),他在今天的開幕主題演講中強(qiáng)調(diào)了兩個(gè)核心:新顯卡和AI,信息量極大。
CES開幕之前,英偉達(dá)市值創(chuàng)下近期新高,股價(jià)達(dá)到149.43美元,市值沖至3.66萬億美元。
黃仁勛表示:得益于AI對(duì)紋理和壓縮算法的學(xué)習(xí),英偉達(dá)新一代顯卡RTX Blackwell 5090的性能是此前4090的兩倍。
新推出的Blackwell超級(jí)芯片與英偉達(dá)上一代相比,每瓦性能提高了四倍。
在工業(yè)數(shù)據(jù)化方面,未來每個(gè)工廠都將擁有一個(gè)與真實(shí)工廠運(yùn)作方式完全相同的數(shù)字孿生體。一切都在模擬中進(jìn)行。
黃仁勛預(yù)測(cè):自動(dòng)駕駛很可能是第一個(gè)萬億美元級(jí)的機(jī)器人產(chǎn)業(yè)。英偉達(dá)推出了下一代汽車處理器——Thor,處理能力是上一代Orin的20倍。
機(jī)器人技術(shù)領(lǐng)域,特別是人形機(jī)器人和通用機(jī)器人技術(shù),即將迎來ChatGPT時(shí)刻般的突破,有望成為世界上規(guī)模最大的技術(shù)產(chǎn)業(yè)。
英偉達(dá)還將推出一款A(yù)I高級(jí)計(jì)算機(jī),開箱即用。
本期價(jià)值線為讀者摘錄了其中的精彩內(nèi)容。
12年來,計(jì)算的每個(gè)層面都發(fā)生了革命性變化
如今,計(jì)算的每個(gè)層面都發(fā)生了革命性的變化,從手工編寫在CPU上運(yùn)行的指令到創(chuàng)建人類使用的軟件工具,機(jī)器學(xué)習(xí)可以創(chuàng)建和優(yōu)化在GPU上運(yùn)行的神經(jīng)網(wǎng)絡(luò),從而創(chuàng)造人工智能。技術(shù)棧的每一層都發(fā)生了徹底的改變,僅僅12年就發(fā)生了不可思議的轉(zhuǎn)變。
現(xiàn)在,我們可以理解幾乎任何形式的信息,包括文本、圖像、聲音、氨基酸和物理學(xué)知識(shí),并進(jìn)行翻譯和生成。應(yīng)用幾乎是無限的,其核心都基于三個(gè)基本問題:輸入是什么模態(tài)學(xué)習(xí)的?它翻譯成了什么形式的信息?它正在生成什么形式的信息?
我們做了兩件根本性的事情:使用可編程著色和光線追蹤加速生成美麗的像素;然后讓人工智能控制像素生成,大量生成其他像素。AI能夠在空間上生成其他像素,因?yàn)樗李伾珣?yīng)該是什么,最新一代的DLSS還能生成超出幀數(shù)的畫面,甚至可以預(yù)測(cè)未來畫面。
您看到的畫面,例如四幀畫面,實(shí)際上我們只渲染了一幀,其余三幀由AI生成。以全高清或4K顯示四幀畫面,大約有3300萬像素,而我們只計(jì)算了兩百萬像素。這堪稱奇跡。
可編程著色器現(xiàn)在也能處理神經(jīng)網(wǎng)絡(luò)。著色器能夠承載這些神經(jīng)網(wǎng)絡(luò),從而實(shí)現(xiàn)了神經(jīng)紋理壓縮和神經(jīng)材質(zhì)著色,最終獲得令人驚艷的圖像效果,這完全得益于AI對(duì)紋理和壓縮算法的學(xué)習(xí)。這就是全新的RTX Blackwell 5090。
RTX 4090售價(jià)1599美元,現(xiàn)在,Blackwell家族的RTX 5070售價(jià)僅為549美元,卻擁有4090的性能。這得益于四個(gè)頂級(jí)的、四個(gè)萬億次運(yùn)算的AI張量核心和G7內(nèi)存。 5090的性能是4090的兩倍。
我們從一月份開始大規(guī)模生產(chǎn),并成功地將這些強(qiáng)大的GPU應(yīng)用于筆記本電腦中。
計(jì)算機(jī)圖形學(xué)的未來是神經(jīng)渲染。 人工智能與計(jì)算機(jī)圖形學(xué)的融合令人驚嘆。
Blackwell:大模型訓(xùn)練性能提升三倍
Blackwell目前已全面投產(chǎn),由約15家計(jì)算機(jī)制造商提供200多種不同配置的系統(tǒng),采用液冷、風(fēng)冷等多種冷卻方式,并支持多種CPU和NVlink配置,以滿足全球數(shù)據(jù)中心的需求。這些系統(tǒng)目前在約45家工廠生產(chǎn),反映了人工智能的普及程度和各行業(yè)對(duì)人工智能的轉(zhuǎn)向。
這個(gè)NVlink系統(tǒng),GB200,NVlink 72,重達(dá)1.5噸,包含60萬個(gè)零件,相當(dāng)于20輛汽車,功率為120千瓦。
它有一個(gè)背板,連接所有這些GPU,兩英里長的銅纜,5000根電纜。這種產(chǎn)品正在全球45家工廠生產(chǎn)。我們制造它們,用液體冷卻它們,測(cè)試它們,拆卸它們,并將它們以部件的形式運(yùn)送到數(shù)據(jù)中心,因?yàn)樗鼈冎剡_(dá)一噸半。我們?cè)跀?shù)據(jù)中心外部重新組裝并安裝它們。生產(chǎn)規(guī)模令人難以置信。
但這一切的目標(biāo)是,由于規(guī)模定律正在推動(dòng)計(jì)算如此之快,以至于Blackwell與我們上一代相比,這種級(jí)別的計(jì)算使每瓦性能提高了四倍,每美元性能提高了三倍。這意味著在一代人的時(shí)間里,我們將這些模型的訓(xùn)練成本降低了三倍,或者,如果你想將模型的大小增加三倍,成本大致相同。
重要的是,這些是我們?cè)谑褂肅hatGPT或Gemini以及將來使用手機(jī)時(shí)都會(huì)使用的生成token,幾乎所有這些應(yīng)用程序都將消耗這些AItoken,而這些AItoken是由這些系統(tǒng)生成的。
每個(gè)數(shù)據(jù)中心都受到功率的限制,因此,如果Blackwell的每瓦性能是上一代的四倍,那么數(shù)據(jù)中心可以產(chǎn)生的收入、可以產(chǎn)生的業(yè)務(wù)量將增加四倍。所以,這些AI工廠系統(tǒng)如今確實(shí)就是工廠。
工業(yè)數(shù)字化場(chǎng)景將迎來重大變革
讓我們談?wù)勎锢鞟I。
我們需要做 的,是創(chuàng)建一個(gè)有效的世界模型,與GPT這種語言模型相對(duì)。這個(gè)世界模型必須理解世界的語言,理解物理動(dòng)力學(xué) (比如重力、摩擦力和慣性),理解幾何和空間關(guān)系,理解因果關(guān)系(如果你扔下什么東西,它就會(huì)落到地上; 如果你戳它一下,它就會(huì)倒),以及客體永久性(如果你把一個(gè)球滾過廚房的柜臺(tái),當(dāng)它滾到另一邊時(shí),球并沒有進(jìn)入另一個(gè)仍然存在的量子宇宙)。
今天,我 NVIDIA Cosmos是一個(gè)世界基礎(chǔ)模型開發(fā)平臺(tái),旨在推動(dòng)物理AI發(fā)展。
Cosmos優(yōu)先考慮AV和機(jī)器人用例的獨(dú)特需求,例如真實(shí)世界環(huán)境、照明和物體持久性。開發(fā)者使用NVIDIA Omniverse構(gòu)建基于物理的、地理空間精確的場(chǎng)景,然后將Omniverse渲染輸出到Cosmos,后者生成逼真的、基于物理的合成數(shù)據(jù),涵蓋不同的物體、環(huán)境以及天氣、時(shí)間或極端情況等條件。
開發(fā)者可以使用Cosmos為強(qiáng)化學(xué)習(xí)AI反饋生成世界,用于改進(jìn)策略模型,或測(cè)試和驗(yàn)證模型性能,甚至跨多傳感器視圖進(jìn)行測(cè)試。
NVIDIA Cosmos,全球首個(gè)世界基礎(chǔ)模型,利用2000萬小時(shí)的視頻進(jìn)行訓(xùn)練。 這些視頻重點(diǎn)關(guān)注物理動(dòng)態(tài)事物,例如動(dòng)態(tài)自然主題、人類行走、手部移動(dòng)、操作物體以及快速攝像機(jī)運(yùn)動(dòng)場(chǎng)景。
其核心在于教AI理解世界,而非生成創(chuàng)意內(nèi)容。通過物理AI,我們可以生成合成數(shù)據(jù)來訓(xùn)練模型,對(duì)其進(jìn)行蒸餾,將其轉(zhuǎn)化為機(jī) 器人模型的種子,并生成多個(gè)基于物理、物理上合理的未來場(chǎng)景,模擬“奇異博士”的場(chǎng)景。因?yàn)檫@個(gè)模型理解物理世界。
今天,我們宣布Cosmos采用開放許可,并在GitHub上開放。我們希望這個(gè)包含小型、中型和大型模型(快速模型、主流模型和教師模型,即知識(shí)遷移模型)的平臺(tái),能像LLAMA3改變企業(yè)AI一樣,改變機(jī)器人和工業(yè)AI領(lǐng)域。
將Cosmos連接 到Omniverse后,其魔法便顯現(xiàn)。Omniverse是一個(gè)基于算法物理學(xué)、遵循物理原理的仿真系統(tǒng),即模擬器。兩者結(jié)合,形成一個(gè)物理模擬的、基于物理的多元宇宙生成器,其應(yīng)用前景非常廣闊,尤其在機(jī)器人技術(shù)和工業(yè)應(yīng)用領(lǐng)域。
我們?nèi)绾螌⑦@些應(yīng)用于工業(yè)數(shù)字化?
一切都在模擬中進(jìn)行。未來,每個(gè)工廠都將擁有一個(gè)與真實(shí)工廠運(yùn)作方式完全相同的數(shù)字孿生體。事實(shí)上,您可以使用Omniverse和Cosmos生成大量未來場(chǎng)景,然后由人工智能選擇對(duì)任何KPI最優(yōu)的場(chǎng)景,這將轉(zhuǎn)化為部署到真實(shí)工廠中的AI程序或編程約束。
汽車自動(dòng)駕駛時(shí)代已來
機(jī)器人領(lǐng)域?qū)⒂瓉?ldquo;ChatGPT”時(shí)刻
另一個(gè)例子是自動(dòng)駕駛汽車。自動(dòng)駕駛革命已經(jīng)到來。
全球每年生產(chǎn)1億輛汽車,道路上行駛的汽車有10億輛,每年行駛里程達(dá)萬億英里,所有這些汽車都將實(shí)現(xiàn)高度自動(dòng)駕駛,甚至即將實(shí)現(xiàn)完全自動(dòng)駕駛。這將是一個(gè)極其龐大的產(chǎn)業(yè),我預(yù)測(cè)這很可能是第一個(gè)萬億美元級(jí)的機(jī)器人產(chǎn)業(yè)。我們的業(yè)務(wù),請(qǐng)注意,僅僅是這些開始投產(chǎn)的汽車中的一部分,規(guī)模就已經(jīng)達(dá)到40億美元,今年的運(yùn)行速度可能約為50億美元。
今天,我們宣布我們下一代汽車 處理器——Thor。
這是Thor,一款機(jī)器人電腦,它接收并處理來自大量傳感器的信息,包括無數(shù)個(gè)高分辨率攝像頭、雷達(dá)和激光雷達(dá)。該芯片將傳感器數(shù)據(jù)轉(zhuǎn)換成標(biāo)記,放入轉(zhuǎn)換器并預(yù)測(cè)下一條路徑。
Thor的處理能力是上一代Orin的20倍,而Orin是目前自動(dòng)駕駛車輛的行業(yè)標(biāo)準(zhǔn)。Thor已全面投產(chǎn),并廣泛應(yīng)用于各種機(jī)器人,例如自主移動(dòng)機(jī)器人(AMR),可作為機(jī)器人或機(jī)械手的大腦。它是一款通用的機(jī)器人計(jì)算機(jī)。
機(jī)器人技術(shù)領(lǐng)域,特別是人形機(jī)器人和通用機(jī)器人技術(shù),即將迎來ChatGPT時(shí)刻般的突破。
使能技術(shù)將推動(dòng)通用機(jī)器人技術(shù)在未來幾年取得令人驚訝的快速發(fā)展。通用機(jī)器人技術(shù)的重要性在于,它能創(chuàng)造出無需特殊環(huán)境就能適應(yīng)“棕色地帶”的機(jī)器人。
這三種機(jī)器人是:自主機(jī)器人和自主AI(信息工作者);自動(dòng)駕駛汽車(適應(yīng)已建成的道路和城市);人形機(jī)器人。如果我們擁有解決這三項(xiàng)問題的技術(shù),這將是世界上規(guī)模最大的技術(shù)產(chǎn)業(yè)。
關(guān)鍵在于如何訓(xùn)練這些機(jī)器人,而對(duì)于人形機(jī)器人而言,模仿信息的收集尤其困難,因?yàn)槠囍恍桉{駛即可收集數(shù)據(jù)。
我們一直在探索人形機(jī)器人的運(yùn)動(dòng)學(xué)習(xí)。直接模仿人類演示對(duì)機(jī)器人來說效率低下,因此我們需要一種巧妙的方法,利用少量的人類演示數(shù)據(jù),通過人工智能和Omniverse合成生成海量合成運(yùn)動(dòng)數(shù)據(jù),從而讓AI學(xué)習(xí)執(zhí)行任務(wù)。
NVIDIA Isaac Groot合成運(yùn)動(dòng)生成的藍(lán)圖是一個(gè)基于模仿學(xué)習(xí)的仿真工作流程,能夠從小數(shù)量的人類演示中生成指數(shù)級(jí)的大型數(shù)據(jù)集。最后,在將策略部署到真實(shí)機(jī)器人之前,開發(fā)人員可以在IsaacSim中進(jìn)行軟件在環(huán)測(cè)試和驗(yàn)證。
將推出AI高級(jí)計(jì)算機(jī)
開箱即用
我還想向大家展示一項(xiàng)技術(shù), 旨在為研究人員和初創(chuàng)公司提供一款開箱即用的AI超級(jí)計(jì)算機(jī)。
過去,超級(jí)計(jì)算機(jī)的構(gòu)建需要自行建造設(shè)施、搭建基礎(chǔ)設(shè)施并進(jìn)行復(fù)雜的系統(tǒng)設(shè)計(jì)。 2016年,我們向OpenAI公司交付了第一臺(tái)DGX-1,埃隆·馬斯克、伊利亞及眾多工程師見證了這一時(shí)刻,DGX-1徹底改變了人工智能計(jì)算。
如今,人工智能已無處不在,不再局限于研究人員和初創(chuàng)公司的實(shí)驗(yàn)室。正如演講伊始所言,我們希望人工智能成為一種新的計(jì)算方式,一種編寫軟件的新方法。每一位軟件工程師、工程師、創(chuàng)意藝術(shù)家,以及所有使用計(jì)算機(jī)作為工具的人,都需要一臺(tái)人工智能超級(jí)計(jì)算機(jī)。因此,我們希望DGX-1能更小巧一些。
這款A(yù)I超級(jí)計(jì)算機(jī)運(yùn)行著完整的NVIDIA AI軟件棧,包括所有NVIDIA軟件和DGX Cloud。通過無線連接或網(wǎng)絡(luò)連接至您的電腦,甚至可作為工作站使用。您可以像訪問云超級(jí)計(jì)算機(jī)一樣訪問它,并在其上運(yùn)行NVIDIA的AI。
它基于我們研發(fā)的超級(jí)秘密芯片GB110,這是我們生產(chǎn)的最小型的Grace Blackwell芯片。這款絕密芯片是我們?cè)谂c聯(lián)發(fā)科合作中研發(fā)的Gray CPU,專為英偉達(dá)打造。通過芯片到芯片的NVlink連接到Blackwell GPU。
這款小巧的設(shè)備目前正在全面生產(chǎn)中,預(yù)計(jì)將于五月左右上市,其功能令人難以置信。
如果您使用PC或Mac,它就是一個(gè)運(yùn)行在您桌面的云計(jì)算平臺(tái),您可以將其用作Linux工作站。如果您需要雙位數(shù)性能,只需使用ConnectX連接,它便具備Nickel、GPU Direct等功能,開箱即用,就像一臺(tái)超級(jí)計(jì)算機(jī),所有超級(jí)計(jì)算堆棧都可用,例如英偉達(dá)Digits項(xiàng)目。