IBM Research最近發(fā)表了一篇論文,揭示了一種模擬芯片的開發(fā)情況,該芯片有望在人工智能推理任務(wù)中實(shí)現(xiàn)GPU級(jí)別的性能,同時(shí)大幅提高能效。目前,GPU被廣泛用于人工智能處理,但其高能耗不必要地增加了成本。


新的模擬人工智能芯片仍在開發(fā)中,它能夠在同一位置同時(shí)計(jì)算和存儲(chǔ)內(nèi)存。這種設(shè)計(jì)模擬了人腦的運(yùn)作,從而提高了能效。該技術(shù)不同于當(dāng)前的解決方案,當(dāng)前的解決方案需要在內(nèi)存和處理單元之間不斷移動(dòng)數(shù)據(jù),從而降低了計(jì)算能力,增加了功耗。
在該公司的內(nèi)部測(cè)試中,在評(píng)估模擬內(nèi)存計(jì)算的計(jì)算精度時(shí),新芯片在CIFAR-10圖像數(shù)據(jù)集上顯示出92.81%的準(zhǔn)確率。IBM聲稱,這一精確度水平可與采用類似技術(shù)的任何現(xiàn)有芯片相媲美。更令人印象深刻的是它在測(cè)試過程中的能效,每次輸入僅消耗1.51微焦耳的能量。
上周發(fā)表在《自然-電子學(xué)》(Nature Electronics)上的這篇研究論文還提供了有關(guān)該芯片構(gòu)造的更多信息。該芯片采用14納米互補(bǔ)金屬氧化物半導(dǎo)體(CMOS)技術(shù)制造,擁有64個(gè)模擬內(nèi)存計(jì)算內(nèi)核(或瓦片)。每個(gè)內(nèi)核都集成了一個(gè)256 x 256的突觸單元交叉陣列,能夠執(zhí)行與一層深度神經(jīng)網(wǎng)絡(luò)(DNN)模型相對(duì)應(yīng)的計(jì)算。此外,該芯片還配備了一個(gè)全局?jǐn)?shù)字處理單元,能夠執(zhí)行對(duì)某些類型的神經(jīng)網(wǎng)絡(luò)至關(guān)重要的更復(fù)雜運(yùn)算。
IBM的新芯片是一項(xiàng)引人關(guān)注的進(jìn)步,尤其是考慮到近來(lái)人工智能處理系統(tǒng)的功耗呈指數(shù)級(jí)增長(zhǎng)。有報(bào)告顯示,人工智能推理機(jī)架的耗電量通常是普通服務(wù)器機(jī)架的10倍,這導(dǎo)致了高昂的人工智能處理成本和環(huán)境問題。在這種情況下,任何能提高處理效率的改進(jìn)都會(huì)受到業(yè)界的熱烈歡迎。
作為額外的好處,專用的高能效AI芯片有可能減少對(duì)GPU的需求,從而降低游戲玩家的價(jià)格。不過,值得注意的是,這目前只是推測(cè),因?yàn)镮BM芯片仍處于開發(fā)階段。其過渡到大規(guī)模生產(chǎn)的時(shí)間表仍不確定。在此之前,GPU仍將是人工智能處理的主要選擇,因此在不久的將來(lái),GPU的價(jià)格不太可能變得更低。