
【導(dǎo)讀】meta面臨著一個棘手問題:盡管對AI研究斥巨資,但產(chǎn)品轉(zhuǎn)化進(jìn)展緩慢,直到ChatGPT火了之后才開始注重。meta之前對生成式AI需要的GPU這種更貴的芯片部署不夠,而是靠CPU。當(dāng)發(fā)現(xiàn)不可行之后,meta轉(zhuǎn)而采購數(shù)十億美元的英偉達(dá)GPU,但這時候已經(jīng)被微軟和谷歌等巨頭甩開。目前,meta計劃開發(fā)一款新型芯片,能像GPU一樣訓(xùn)練AI模型并執(zhí)行推理,計劃在2025年左右完成。此外,相關(guān)負(fù)責(zé)人還表示,meta在AI開發(fā)的工具和流程方面都明顯需要改進(jìn)。
meta的內(nèi)部郵件顯示,2022年夏季末,meta首席執(zhí)行官馬克?扎克伯格(Mark Zuckerberg)曾召集他的主要助手,對meta的計算能力進(jìn)行了5個小時的分析討論,重點是meta開展先進(jìn)人工智能(AI)工作的能力。
根據(jù)內(nèi)部郵件、公司公告,以及相關(guān)知情人士的透露,meta面臨著一個棘手的問題:盡管在AI研究方面進(jìn)行了大規(guī)模投資,但關(guān)于如何在主營業(yè)務(wù)中引入對AI友好的軟硬件系統(tǒng),meta進(jìn)展緩慢。在meta越來越依賴AI去支撐進(jìn)一步增長的情況下,這影響了該公司推動全面創(chuàng)新的節(jié)奏。
這封來自meta新任基礎(chǔ)設(shè)施負(fù)責(zé)人桑托什?賈納爾漢(Santosh Janardhan)的郵件顯示:“在針對AI的開發(fā)方面,我們在工具、工作流和流程方面明顯落后,需要在這方面進(jìn)行大筆投資。”這封郵件于9月份發(fā)布在meta的內(nèi)網(wǎng),近期首次被曝光。
郵件中還表示,支撐AI工作需要meta“從根本上改變硬件基礎(chǔ)設(shè)施設(shè)計、軟件系統(tǒng),以及提供穩(wěn)定平臺的方法”。
在一年多時間里,meta正在開展一個龐大的項目,補足其AI基礎(chǔ)設(shè)施的短板。盡管meta公開承認(rèn)在AI的硬件發(fā)展上有些落后,但這方面的細(xì)節(jié),包括算力壓力、管理層更迭和一個被放棄的AI芯片項目,此前從未被報道過。
對于這封郵件和相關(guān)的重組舉措,meta發(fā)言人喬恩?卡維爾(Jon Carvill)表示,“憑借在AI研究和工程開發(fā)方面深厚的專業(yè)知識,meta在構(gòu)建和部署最先進(jìn)的大規(guī)?;A(chǔ)設(shè)施方面已經(jīng)得到了證明”。
他表示:“隨著我們?yōu)?a href="http://www.baoxianwx.cn/app/" target="_blank">應(yīng)用和消費產(chǎn)品提供新的AI體驗,我們很有信心能繼續(xù)拓展基礎(chǔ)設(shè)施能力,以滿足短期和長期的需求。”
但對meta放棄AI芯片項目的消息,他拒絕回應(yīng)。
根據(jù)meta披露的信息,此次重組導(dǎo)致該公司的資本支出每季度增加了約40億美元,幾乎比2021年翻一番,并導(dǎo)致4個地點數(shù)據(jù)中心的建設(shè)計劃分別暫?;蛉∠?。
meta還正面臨財務(wù)壓力。自去年11月以來,meta啟動了自千禧年代互聯(lián)網(wǎng)破滅之后未曾有過的大規(guī)模裁員。
另一方面,微軟支持的OpenAI于去年11月30日發(fā)布了ChatGPT,這一AI聊天機器人迅速成為有史以來用戶數(shù)增長最快的消費級應(yīng)用,并引發(fā)了科技巨頭之間的AI軍備競賽。大型科技公司紛紛推出自己的生成式AI產(chǎn)品。這種AI除了可以識別數(shù)據(jù)中的模式之外,還能根據(jù)輸入信息以類似人工的方式生成文字和視覺內(nèi)容。
多名消息人士稱,生成式AI消耗了大量算力,導(dǎo)致meta更加迫切地需要擴大計算基礎(chǔ)設(shè)施。
1、曾對燒錢的項目投入不夠
消息人士稱,問題的一大關(guān)鍵在于meta很遲才開始在AI工作中引入GPU芯片。GPU非常適合AI計算,可以并行執(zhí)行大量任務(wù),大幅減少處理海量數(shù)據(jù)的耗時。當(dāng)然,價格也更貴,市場份額的80%都在英偉達(dá)手里。
所以,meta很大程度上是靠CPU來承擔(dān)AI計算任務(wù)。CPU是計算機行業(yè)的主力芯片,在過去幾十年中遍布全球的數(shù)據(jù)中心,但不太適合處理AI計算任務(wù)。
根據(jù)兩名消息人士的說法,meta還使用自主設(shè)計的訂制芯片來進(jìn)行AI推理。然而到2021年,事實證明,采用CPU和訂制芯片在AI領(lǐng)域比GPU速度更慢、效率更低。此外,與meta采用的芯片相比,GPU在運行不同類型的AI模型時也更具靈活性。
meta拒絕對其AI芯片的性能置評。
消息人士表示,隨著扎克伯格推動meta轉(zhuǎn)向元宇宙,算力壓力影響了meta部署AI以應(yīng)對競爭威脅的能力,例如社交媒體對手TikTok的崛起,以及蘋果主導(dǎo)的廣告隱私政策調(diào)整。
這些挫折也引起了meta前董事會成員彼得?蒂爾(Peter Thiel)的注意。他于2022年初從meta董事會辭職,但沒有做出任何解釋。
知情人士稱,在他辭職前的一次董事會會議上,蒂爾對meta高管們表示,他們對meta的核心社交媒體業(yè)務(wù)太自滿,而且對元宇宙太走火入魔。
2、轉(zhuǎn)而選擇GPU,但已落后
一名消息人士稱,2022年,在取消了訂制推理芯片的大規(guī)模部署計劃后,meta高管們轉(zhuǎn)而開始采購價值數(shù)十億美元的英偉達(dá)GPU。到這時,meta已經(jīng)明顯落后于谷歌等競爭對手。谷歌早在2015年就開始部署訂制版本的GPU,即TPU。
2022年春季,meta高管還著手重組meta的AI部門,任命了兩名新的工程負(fù)責(zé)人,包括9月份郵件的作者賈納爾漢。根據(jù)領(lǐng)英平臺上的資料以及知情人士的說法,在長達(dá)數(shù)月的動蕩期內(nèi),十幾名管理者從meta離職。metaAI基礎(chǔ)設(shè)施的管理團隊幾乎被徹底更換。
接下來,meta開始重新規(guī)劃數(shù)據(jù)中心基礎(chǔ)設(shè)施,以適應(yīng)即將部署的GPU芯片。相比于CPU,GPU的耗電量和發(fā)熱量都更大,并且需要通過專門設(shè)計的網(wǎng)絡(luò)連接大量芯片,形成集群。
根據(jù)賈納爾漢的郵件以及消息人士提供的信息,這些設(shè)施需要24到32倍的網(wǎng)絡(luò)容量,以及新的水冷系統(tǒng)來管理芯片集群的散熱,因此相關(guān)設(shè)施需要“完全重新設(shè)計”。
隨著工作的推進(jìn),meta制定了內(nèi)部計劃,著手開發(fā)一種新的自主芯片。這種芯片可以像GPU一樣訓(xùn)練AI模型并執(zhí)行推理,目前計劃在2025年左右完成。
meta發(fā)言人卡維爾表示,一些數(shù)據(jù)中心建設(shè)項目目前處于暫停狀態(tài)并將過渡到新設(shè)計,這些項目將于今年晚些時候重新啟動。他拒絕就meta內(nèi)部的芯片項目置評。
3、產(chǎn)品落地進(jìn)展緩慢
在擴大GPU算力的過程中,meta目前幾乎沒有任何新的產(chǎn)品技術(shù)可以展示。相比較之下,微軟和谷歌等公司正在推動生成式AI產(chǎn)品的公開商用(必應(yīng)聊天、Bard等)。
今年2月,meta首席財務(wù)官Susan Li承認(rèn)目前沒有將太多算力投入到生成式AI。她表示,“我們所有的AI能力基本上都給了廣告、信息流和短視頻Reels”。
根據(jù)消息人士的說法,直到去年11月ChatGPT推出后,meta才開始重視生成式AI產(chǎn)品。他們表示,F(xiàn)acebook的AI實驗室FAIR雖然從2021年末就開始發(fā)布相關(guān)技術(shù)的原型,但并沒有把研究轉(zhuǎn)化為產(chǎn)品。
隨著投資者興趣的提升,情況正在改變。2月,扎克伯格宣布成立一支頂級生成式AI團隊,將“大幅推動”公司在該領(lǐng)域的工作。
meta首席技術(shù)官Andrew Bosworth本月也表示,生成式AI是目前他和扎克伯格花時間最多的領(lǐng)域,預(yù)計將在今年發(fā)布一款相關(guān)產(chǎn)品。
兩名熟悉新團隊的人士表示,該團隊的工作處于早期階段,重點是構(gòu)建基礎(chǔ)模型作為核心,未來可以針對不同產(chǎn)品需求進(jìn)行調(diào)整。
meta發(fā)言人卡維爾表示,一年多來,meta的許多團隊都在開發(fā)生成式AI產(chǎn)品。他證實,在ChatGPT到來后的幾個月里,這方面工作已經(jīng)提速。