英偉達(dá)官網(wǎng)公告顯示,亞馬遜云正式推出了由英偉達(dá)H100 Tensor Core GPU驅(qū)動的新的Amazon Elastic Compute Cloud(EC2)P5實例。

據(jù)介紹,該服務(wù)允許用戶通過瀏覽器輕松擴(kuò)展生成式AI、高性能計算(HPC)和其他應(yīng)用。

NVIDIA H100 GPU的一個重要特點(diǎn)是其對Transformer的優(yōu)化,這是許多最新的先進(jìn)AI應(yīng)用所使用的關(guān)鍵技術(shù),可確保H100在這些應(yīng)用中提供更高的性能和效率。
IT之家查詢發(fā)現(xiàn),雖然AWS尚未就集成AMD MI300芯片到其云服務(wù)中作出任何公開承諾,但亞馬遜彈性計算云副總裁Dave Brown證實AWS正在積極考慮這一方案。
英偉達(dá)表示,開發(fā)人員和研究人員幾乎每天都在借助大型語言模型(LLMs)發(fā)掘AI的新應(yīng)用,而將這些新用例推向市場需要加速計算的效率。
NVIDIA H100 GPU通過架構(gòu)創(chuàng)新提供超級計算級性能,包括第四代Tensor Cores、用于加速LLMs的新Transformer引擎以及最新的NVlink技術(shù),可以帶極其可觀的性能。
據(jù)介紹,EC2 P5實例非常適合訓(xùn)練和運(yùn)行復(fù)雜LLMs和計算機(jī)視覺模型的推理。這些神經(jīng)網(wǎng)絡(luò)驅(qū)動著最復(fù)雜和計算密集型的生成式人工智能應(yīng)用程序,包括問答、代碼生成、視頻和圖像生成、語音識別等。