機(jī)器學(xué)習(xí)需求將使得RISC-V芯片無處不在。
RISC-V是2010年首次推出的一種免費(fèi)開源計(jì)算機(jī)指令集架構(gòu),其應(yīng)用正在呈爆發(fā)性增長,這大部分得益于人工智能(AI)和機(jī)器學(xué)習(xí)的需求推動。Semico調(diào)研公司表示,或多或少采用RISC-V技術(shù)的芯片數(shù)量將每年增長73.6%,到2027年,生產(chǎn)的人工智能芯片將多達(dá)約250億個(gè),創(chuàng)造2910億美元的收入。
戴夫•迪澤爾(DaveDitzel)說,從幾年前還被認(rèn)為是一種“暴發(fā)戶”理念到今天引人矚目的增長,展現(xiàn)出人工智能的巨大變化。迪澤爾的Esperanto技術(shù)公司制造的首款高性能RISC-VAI處理器要與人工智能推薦系統(tǒng)中強(qiáng)大的圖形處理器(GPU)一爭高下。迪澤爾表示,在機(jī)器學(xué)習(xí)和人工智能的早期狂熱階段,人們認(rèn)為通用計(jì)算機(jī)處理器架構(gòu)(x86和Arm)永遠(yuǎn)追不上圖形處理器和許多特定用途的加速器架構(gòu)。
“我們想要證明,這些人都錯(cuò)了。”他說,“RISC-V似乎是一種理想的基礎(chǔ),解決人們想要人工智能去做的多種計(jì)算問題。”
隨著該公司的首款硅片(一種1092內(nèi)核人工智能處理器)送達(dá)早期合作伙伴手中,以及公司與英特爾達(dá)成重大開發(fā)協(xié)議,他也許很快就能證明自己是對的。
迪澤爾的整個(gè)職業(yè)生涯都在致力于闡明RISC-V的理論。RISC表示的是“精簡指令集計(jì)算機(jī)”,根據(jù)這種理念,我們可以減少處理器執(zhí)行的核心指令集,制造出尺寸小、功耗低,但性能好的處理器。1980年,IEEE會士大衛(wèi)•帕特森(DavidPatterson)在一篇開創(chuàng)性的論文中創(chuàng)造了這個(gè)詞,迪澤爾是他的學(xué)生,也是這篇論文的共同作者。在共同創(chuàng)辦全美達(dá)公司之前,迪澤爾在貝爾實(shí)驗(yàn)室和太陽微系統(tǒng)公司研究RISC處理器。全美達(dá)公司將x86指令代碼轉(zhuǎn)換為RISC架構(gòu),制造出一款低功耗處理器,旨在與英特爾展開競爭。
創(chuàng)辦Esperanto公司后,迪澤爾發(fā)現(xiàn),RISC-V是一種只需較低功耗就可加速人工智能的方法。從基本層上來看,指令集架構(gòu)越復(fù)雜,意味著需要硅片上有更多的晶體管來組成處理器,每個(gè)晶體管在關(guān)閉時(shí)都會有一點(diǎn)漏電流,在切換狀態(tài)時(shí)也消耗電能。他說:“這就是RISC-V的誘人之處,它的指令集很簡單。”

RISC-V內(nèi)核的指令集只有47條指令。x86指令的實(shí)際數(shù)量難以計(jì)算,可能將近1000個(gè)。盡管Arm的指令集很小,但仍然比RISC-V的指令集大很多。迪澤爾說,簡單地使用精簡指令集并不能夠使計(jì)算能力達(dá)到Esperanto公司的目標(biāo)。“大多數(shù)RISC-V內(nèi)核并沒有那么小或那么節(jié)能。因此,對于我們來說,問題并不只是采用RISC-V內(nèi)核并將1000個(gè)內(nèi)核堆在一塊芯片上。我們必須徹底重新設(shè)計(jì)CPU,使其適應(yīng)這些非常嚴(yán)苛的約束條件。”
迪澤爾和他的同事開始研究時(shí),RISC-V指令集缺少有效進(jìn)行機(jī)器學(xué)習(xí)計(jì)算(如矩陣乘法)所需的“向量”指令。于是Esperanto公司的工程師提出了自己的解決方法。正如ET-Minion處理器內(nèi)核架構(gòu)體現(xiàn)的那樣,其包含了處理8位整數(shù)向量以及32位和16位浮點(diǎn)向量的指令部件。
由此產(chǎn)生的片上系統(tǒng)ET-SoC-1由1088個(gè)ET-Minion內(nèi)核和4個(gè)ET-Maxion內(nèi)核組成,ET-Maxion可幫助管理Minion的工作。該芯片240億個(gè)晶體管所占面積為570平方毫米,約為熱門人工智能加速器英偉達(dá)A100的2/3,但這兩種芯片的基本原理是截然不同的。
ET-SoC-1的設(shè)計(jì)目的是在功率受限的數(shù)據(jù)中心加速人工智能,在這些數(shù)據(jù)中心,核心主板已安裝在服務(wù)器外部設(shè)備的互聯(lián)總線(PCIe)插槽上。這意味著,主板只有120瓦可用功率,但它必須至少進(jìn)行100萬億次運(yùn)算/每秒才有意義。Esperanto在這種功率條件下可實(shí)現(xiàn)超過800萬億次運(yùn)算。
在2021年12月的RISC-V峰會上,Esperanto公司的首席架構(gòu)師賈耶什•艾耶(JayeshIyer)告訴技術(shù)專家,大多數(shù)人工智能加速器都是基于單個(gè)芯片制造的,單個(gè)芯片占用了主板的大部分功率預(yù)算。“Esperanto公司的方法是使用多個(gè)低功耗芯片,仍然滿足功率預(yù)算。”他說。
執(zhí)行推薦系統(tǒng)基準(zhǔn)測試程序神經(jīng)網(wǎng)絡(luò)時(shí),每個(gè)芯片的功耗為20瓦,不到A100功耗的1/10,而且其主板上有6個(gè)芯片。這種功率和性能的組合是通過降低芯片的工作電壓而不犧牲性能來實(shí)現(xiàn)的。(通常,工作電壓越高意味著芯片的時(shí)鐘運(yùn)行越快,可完成更多的計(jì)算。)ET-SoC-1制造工藝的標(biāo)稱電壓為0.75伏,單個(gè)芯片將遠(yuǎn)遠(yuǎn)超過主板的功率預(yù)算。但是,如果將電壓下降到約0.4伏,就可以在120瓦的主板上運(yùn)行6個(gè)芯片,與高電壓的單個(gè)芯片相比,推薦系統(tǒng)的性能提升了4倍。在這種電壓下,每個(gè)ET-Minion內(nèi)核僅消耗約10毫瓦。
“低壓運(yùn)行是Esperanto公司的ET-Minion(內(nèi)核)設(shè)計(jì)的關(guān)鍵區(qū)別。”艾耶說。它為架構(gòu)和電路的決策提供了依據(jù),他說。例如,RISC-V整數(shù)指令的內(nèi)核流水線由每個(gè)時(shí)鐘周期數(shù)量最少的邏輯門組成,可在低電壓條件下實(shí)現(xiàn)更高的時(shí)鐘頻率。在內(nèi)核執(zhí)行長張量計(jì)算時(shí),該流水線會關(guān)閉以節(jié)約能量。

近期開發(fā)的其他人工智能處理器也開始結(jié)合RISC-V和其自身定制的機(jī)器學(xué)習(xí)加速。例如,Ceremorphic最近公開了其分層學(xué)習(xí)處理器,該處理器使用了RISC-V和Arm內(nèi)核及其定制的機(jī)器學(xué)習(xí)和浮點(diǎn)運(yùn)算單元。英特爾即將推出的MobileyeEyeQUltra的芯片將采用12個(gè)RISC-V內(nèi)核和神經(jīng)網(wǎng)絡(luò)加速器,為4級自動駕駛提供智能支持。
對于嵌入式人工智能處理器公司耐能來說,采用RISC-V既是一項(xiàng)商業(yè)舉措,也是一項(xiàng)技術(shù)舉措。該公司一直在銷售使用ArmCPU內(nèi)核及其定制加速器基礎(chǔ)架構(gòu)的芯片和知識產(chǎn)權(quán)。不過2021年11月,耐能發(fā)布了首款基于RISC-V技術(shù)的KL530芯片,旨在采用名為視覺互感(VisionTransformer)的新型神經(jīng)網(wǎng)絡(luò)來支持自動駕駛。耐能的首席執(zhí)行官劉峻誠表示,RISC-V架構(gòu)讓神經(jīng)網(wǎng)絡(luò)模型的預(yù)處理變得更簡單,運(yùn)行效率更高。不過,他說:“鑒于去年英偉達(dá)可能收購Arm,這也有望降低商業(yè)決策可能對自身造成影響的風(fēng)險(xiǎn)。”雖然英偉達(dá)的收購于今年2月終止,但這可能會把耐能先前的CPU內(nèi)核架構(gòu)的供應(yīng)商推到競爭者手中。
未來的RISC-V處理器將能夠使用達(dá)成社區(qū)共識的開源指令集來處理與機(jī)器學(xué)習(xí)有關(guān)的操作。2021年12月,管理和編纂內(nèi)核指令集架構(gòu)和新擴(kuò)展的國際機(jī)構(gòu)RISC-VInternational批準(zhǔn)了一個(gè)僅包含100條向量指令的指令集。
該管理機(jī)構(gòu)的首席技術(shù)官馬克•希梅爾斯坦(MarkHimelstein)說,即使有了向量擴(kuò)展,RISC-V社區(qū)的優(yōu)先任務(wù)仍然是促進(jìn)機(jī)器學(xué)習(xí)。大多數(shù)RISC-V機(jī)器學(xué)習(xí)擴(kuò)展的開發(fā)都發(fā)生在該組織的圖形特別興趣組,該組已與機(jī)器學(xué)習(xí)組合并,“因?yàn)樗麄兊哪繕?biāo)是一致的。”他說。不過其他組(例如高性能和數(shù)據(jù)中心計(jì)算興趣組)也在關(guān)注機(jī)器學(xué)習(xí)的擴(kuò)展。希梅爾斯坦的工作就是確保將這些努力盡可能集中到一處。
Semico的首席分析師里奇•瓦夫日尼亞克(RichWawrzyniak)說,盡管RISC-V取得了成功,但是在新增了大量人工智能功能的許多市場中,Arm仍然是主導(dǎo)者,這可能還會持續(xù)5年,在CPU內(nèi)核設(shè)計(jì)的總收益中,RISC-V可能占15%左右。“不是50%,也不是5%。RISC-V出現(xiàn)的時(shí)間不長,這樣的增長速度已經(jīng)相當(dāng)快了。”