IT之家6月4日消息,鈦媒體從華為內(nèi)部獨(dú)家獲悉,華為公司將發(fā)布一款直接對(duì)標(biāo)ChatGPT的多模態(tài)千億級(jí)大模型產(chǎn)品,名為“盤(pán)古Chat”。
據(jù)介紹,盤(pán)古大模型于2020年11月在華為云內(nèi)部立項(xiàng)成功。這款“盤(pán)古Chat”預(yù)計(jì)將于今年7月7日舉行的華為云開(kāi)發(fā)者大會(huì)(HDC.Cloud 2023)上對(duì)外發(fā)布以及內(nèi)測(cè),產(chǎn)品主要面向To B/G政企端客戶(hù)。

根據(jù)華為公布的一份論文數(shù)據(jù)顯示,華為盤(pán)古PanGu-Σ大模型參數(shù)最多為1.085萬(wàn)億,基于華為自研的MindSpore框架開(kāi)發(fā)。整體來(lái)看,PanGu-Σ大模型在對(duì)話方面可能已接近GPT-3.5的水平。
IT之家查詢(xún)公開(kāi)資料獲悉,華為盤(pán)古大模型于2021年4月正式對(duì)外發(fā)布,后來(lái)又在2022年4月升級(jí)到2.0版本。目前,AI大模型中的NLP大模型、CV大模型以及科學(xué)計(jì)算大模型(氣象大模型)均已被標(biāo)記為即將上線狀態(tài)。
據(jù)介紹,這是首個(gè)千億參數(shù)中文預(yù)訓(xùn)練大模型,CV大模型則首次達(dá)到30億參數(shù)。盤(pán)古CV大模型業(yè)界最大CV大模型、首次實(shí)現(xiàn)兼顧判別與生成能力、在ImageNet上小樣本學(xué)習(xí)能力上的業(yè)界第一;盤(pán)古氣象大模型提供秒級(jí)天氣預(yù)報(bào);紫東.太初是全球首個(gè)圖、文、音三模態(tài)大模型。
對(duì)于盤(pán)古大模型定位,華為內(nèi)部團(tuán)隊(duì)確立了三項(xiàng)最關(guān)鍵的核心設(shè)計(jì)原則:一是模型要大,可以吸收海量數(shù)據(jù);二是網(wǎng)絡(luò)結(jié)構(gòu)要強(qiáng),能夠真正發(fā)揮出模型的性能;三是要具有優(yōu)秀的泛化能力,可以真正落地到各行各業(yè)的工作場(chǎng)景。
根據(jù)華為云高管的演講PPT信息,目前華為“盤(pán)古系列AI大模型”基礎(chǔ)層主要包括NLP大模型、CV大模型、以及科學(xué)計(jì)算大模型等,上層則是與合作伙伴開(kāi)發(fā)的華為行業(yè)大模型。
華為云官網(wǎng)顯示,盤(pán)古大模型由NLP大模型、CV大模型、多模態(tài)大模型、科學(xué)計(jì)算大模型等多個(gè)大模型構(gòu)成,通過(guò)模型泛化,解決傳統(tǒng)AI作坊式開(kāi)發(fā)模式下不能解決的AI規(guī)?;?、產(chǎn)業(yè)化難題,可以支持多種自然語(yǔ)言處理任務(wù),包括文本生成、文本分類(lèi)、問(wèn)答系統(tǒng)等等。
具體來(lái)看,盤(pán)古NLP大模型首次使用Encoder-Decoder架構(gòu),兼顧NLP大模型的理解能力和生成能力,保證了模型在不同系統(tǒng)中的嵌入靈活性。下游應(yīng)用中,僅需少量樣本和可學(xué)習(xí)參數(shù)即可完成千億規(guī)模大模型的快速微調(diào)和下游適配,這一模型在智能輿論以及智能營(yíng)銷(xiāo)方面都有不錯(cuò)的表現(xiàn)。
盤(pán)古CV大模型是首次實(shí)現(xiàn)模型按需抽取的業(yè)界最大CV大模型,首次實(shí)現(xiàn)兼顧判別與生成能力,基于模型大小和運(yùn)行速度需求,自適應(yīng)抽取不同規(guī)模模型,AI應(yīng)用開(kāi)發(fā)快速落地。使用層次化語(yǔ)義對(duì)齊和語(yǔ)義調(diào)整算法,在淺層特征上獲得了更好的可分離性,使小樣本學(xué)習(xí)的能力獲得了顯著提升,達(dá)到業(yè)界第一,這一模型在智能巡檢以及智慧物流方面有不錯(cuò)的表現(xiàn)。
盤(pán)古氣象大模型提供秒級(jí)天氣預(yù)報(bào),借助創(chuàng)新的3DEST網(wǎng)絡(luò)結(jié)構(gòu)以及分層時(shí)間聚合算法,在氣象預(yù)報(bào)的關(guān)鍵要素和常用時(shí)間范圍上精度均超過(guò)當(dāng)前最先進(jìn)的預(yù)報(bào)方法,速度相比傳統(tǒng)方法提升1000倍以上。同時(shí),盤(pán)古氣象大模型支持廣泛的下游預(yù)報(bào)方案,如在臺(tái)風(fēng)路徑預(yù)測(cè)任務(wù)上,相比傳統(tǒng)數(shù)值氣象預(yù)報(bào)方法,盤(pán)古氣象大模型可以降低20%以上的位置誤差。
浙商證券此前披露的信息顯示,華為在訓(xùn)練千億參數(shù)的盤(pán)古大模型時(shí)調(diào)用了超過(guò)2000塊的昇騰910芯片,進(jìn)行了超2個(gè)月的數(shù)據(jù)訓(xùn)練能力。華為內(nèi)部稱(chēng),每年大模型訓(xùn)練調(diào)用GPU/TPU卡超過(guò)4000片,3年的大模型算力成本高達(dá)9.6億元人民幣。
東吳證券梳理的華為盤(pán)古大模型產(chǎn)業(yè)鏈研報(bào)中指出,華為盤(pán)古大模型的優(yōu)勢(shì)在于人才儲(chǔ)備和算力自主可控,有望成為國(guó)內(nèi)領(lǐng)先的大模型,其生態(tài)產(chǎn)業(yè)鏈標(biāo)的有望迎來(lái)加速發(fā)展,包括拓維信息、四川長(zhǎng)虹、麒麟軟件(中國(guó)軟件)、統(tǒng)信軟件(誠(chéng)邁科技)、麒麟信安等華為生態(tài)公司。國(guó)盛證券則認(rèn)為,華為盤(pán)古為首個(gè)多模態(tài)千億級(jí)大模型,有望賦能百業(yè)。