国产精品久久久久久久小说,国产国产裸模裸模私拍视频,国产精品免费看久久久无码,风流少妇又紧又爽又丰满,国产精品,午夜福利

熱搜: 佳士科技  irobot  工業(yè)機(jī)器人  機(jī)器人  機(jī)器人產(chǎn)業(yè)聯(lián)盟  ABB  發(fā)那科  機(jī)械手  碼垛機(jī)器人  機(jī)器人展覽 

中國工程院院士高文:沒有大算力做大模型就是天方夜譚

   日期:2023-07-10     來源:鳳凰科技     評論:0    
標(biāo)簽: 算力 大模型 科技
   7月7日消息,中國工程院院士、鵬城實(shí)驗(yàn)室主任高文在世界人工智能大會昇騰人工智能產(chǎn)業(yè)高峰論壇上演講時(shí)表示,沒有大算力做大模型就是天方夜譚,這就和電力是一樣的,可以省點(diǎn)電做出什么產(chǎn)品來,別人真正懂行的人聽了都不信的,一定要有算力作為基礎(chǔ)。
 
  “美國的算力現(xiàn)在指數(shù)是排第一,比我們大概多了30%的算力,那么也就代表GDP也比我們多30%,什么時(shí)候我們的算力超過了美國,咱們的GDP就可以超過美國了。”
 
  他表示,從現(xiàn)在開始,算力也是數(shù)字經(jīng)濟(jì)發(fā)展的一個指數(shù),算力夠,你的數(shù)字經(jīng)濟(jì)就能夠發(fā)展好,不夠就發(fā)展不好。
 
  以下為高文演講全文:
 
  各位專家、各位領(lǐng)導(dǎo),大家下午好!
 
  前面的領(lǐng)導(dǎo)都講得很好,算力是非常重要的一件事,今天上午陳書記在講的時(shí)候也講到,上要抓三件大事,人工智能方面其中就有一個是算力建設(shè),算力建設(shè)非常重要的一方面,就像電力一樣。
 
  從現(xiàn)在開始,算力也是數(shù)字經(jīng)濟(jì)發(fā)展的一個指數(shù),你算力夠,你的數(shù)字經(jīng)濟(jì)就能夠發(fā)展好,不夠就發(fā)展不好。所以,特別是智能算力就非常關(guān)鍵。
 
  所以跟大家分享關(guān)于鵬城云腦的智算平臺,再就是分享一下在這個平臺上面做的鵬城腦海大模型。
 
  首先,我們說算力很重要,重要到什么程度呢?
 
  清華大學(xué)的一個2022年的咨詢報(bào)告說到了,經(jīng)過統(tǒng)計(jì)計(jì)算力指數(shù)和GDP是正相關(guān)的關(guān)系,你算力越強(qiáng)你的GDP就越強(qiáng),最右邊的圖可以看到,美國的算力現(xiàn)在指數(shù)是排第一,比我們大概多了30%的算力,那么也就代表GDP也比我們多30%,什么時(shí)候我們的算力超過了美國,咱們的GDP就可以超過美國了。
 
  正是因?yàn)樗懔@么重要,所以發(fā)展人工智能和經(jīng)濟(jì)沒有算力不可能,要有算力要有芯片,芯片做成機(jī)器,用這個機(jī)器訓(xùn)練這個模型,為了做這件事,我們在2020年深圳就做了一臺機(jī)器,這臺機(jī)器叫鵬城云腦II,這臺機(jī)器的算力在2020年的時(shí)候是全世界做人工智能訓(xùn)練最強(qiáng)的一臺機(jī)器,比當(dāng)時(shí)微軟、谷歌的機(jī)器都要強(qiáng),相當(dāng)于是4000塊卡的機(jī)器,而且這臺機(jī)器是4000塊A100卡的機(jī)器,這臺機(jī)器是用全光網(wǎng)絡(luò)把它連起來的,節(jié)點(diǎn)和節(jié)點(diǎn)之間的延遲非常低。
 
  因?yàn)椋辛诉@臺機(jī)器可以做很多事,包括我們可以做科學(xué)研究,可以做產(chǎn)業(yè)應(yīng)用還有關(guān)鍵技術(shù)的研發(fā)。
 
  這臺機(jī)器剛剛我說有4000塊卡,一個是鯤鵬CPU,一個是昇騰NPU,都是華為的。
 
  有了這臺機(jī)器以后,那么這臺機(jī)器的性能行不行呢?就參加世界TOP500的超算的打榜,整個超算整個算力的打榜,同時(shí)它也有其他的賽道,我們參加的一個是IO500的賽道,你的輸出和輸入能力的賽道,我們從2020年10月份這臺機(jī)器做出來以后,11月份就參加打榜,連續(xù)6次第一,每半年有一次打榜,全節(jié)點(diǎn)連續(xù)二次第一。
 
  所以,這臺機(jī)器在做人工智能訓(xùn)練這件事,別人沒辦法和它比。這臺機(jī)器的AI算力,這個是三年一次的,也參加了打榜,連續(xù)三次第一。這臺機(jī)器不僅硬件強(qiáng),接口能力和網(wǎng)絡(luò)非常強(qiáng),同時(shí)上面的軟件也是配備得比較完備,包括怎么樣做分布式計(jì)算,怎么樣做命令調(diào)優(yōu)、自研的調(diào)度規(guī)劃等等。這臺機(jī)器這么大規(guī)模的機(jī)器以前還是第一次,相當(dāng)于它的四臺機(jī)器,其實(shí)是四臺我們的機(jī)器組成這一臺了,上面有很多軟件的挑戰(zhàn)。
 
  可能有的專家也許聽到過,有人說全世界能在1000塊卡上同時(shí)訓(xùn)練一個模型的只有幾千人,能在4000塊卡上訓(xùn)練的不超過100個人,在10000塊卡上訓(xùn)練模型的人數(shù)更少了,大規(guī)模的卡上一起做事,對于軟件規(guī)劃、資源調(diào)度挑戰(zhàn)非常大。
 
  我們不僅僅是把鵬城云腦II用好,我們也承擔(dān)了國家發(fā)改委的任務(wù),用鵬城云腦II類似的華為生態(tài)的,用在昇騰AI集群,不管是100P和900P的算力結(jié)點(diǎn),我們用網(wǎng)絡(luò)把資源連起來,可以給大家提供,告訴你這里有資源可以通過網(wǎng)絡(luò)去用。
 
  同時(shí),我們還把華為生態(tài)以外的,按照發(fā)改委的要求,希望這是異構(gòu)的算力網(wǎng)的平臺,我們也選擇了部分其他廠商的算力,在2022年6月這個項(xiàng)目驗(yàn)收的時(shí)候,已經(jīng)聚合的智能算力到了2300P,云腦II只是1000P,這個系統(tǒng)已經(jīng)聚集了2300P的智能算力。
 
  我們有了云腦II可以訓(xùn)練大模型了,訓(xùn)練大模型還是很費(fèi)算力的,但是即使你可以訓(xùn)練大模型,現(xiàn)在的需求根本不夠用,我們正在規(guī)劃做云腦III。
 
  下面我說說大模型,鵬城正在做一個大模型,這個是2000億參數(shù),也就是200B的參數(shù),為什么做這件事呢?
 
  不用再花時(shí)間了,因?yàn)橛蠧hatGPT和類ChatGPT大模型在不停地涌現(xiàn),同時(shí)因?yàn)楝F(xiàn)在很多公司都用這個東西做產(chǎn)業(yè)應(yīng)用,去做服務(wù)。所以,現(xiàn)在這個模型變得很重要了,但是現(xiàn)在有錢的公司可以砸?guī)讉€億做這樣的機(jī)器,甚至十幾個億和幾十個億,但是大多數(shù)的公司做不了。
 
  這個領(lǐng)域需求這么大,怎么辦呢?
 
  我們鵬城實(shí)驗(yàn)室可以做一個底座,模型訓(xùn)練完開放出去,大家在這個底座說做垂直應(yīng)用。按照這樣的思路,我們首先有鵬城云腦II的算力,前一階段我們積累了很多的數(shù)據(jù),這一段時(shí)間前幾個月我們通過各個渠道,包括購買拿到數(shù)據(jù),先下面做清洗,清洗的數(shù)據(jù)很重,可能我拿到了100個數(shù)據(jù),清洗完就剩幾個了,因?yàn)橛泻芏嗍侵貜?fù)和不規(guī)范的,這些東西拿掉就變得很小。雖然拿了很多的數(shù)據(jù),但是真正用來做訓(xùn)練的數(shù)據(jù)只有1%-5%。有了這個數(shù)據(jù)我們就可以做大模型底座。
 
  這個大模型底座,我們就是用的生成式預(yù)訓(xùn)練模型,就是和GPT完全類似的底層的東西,用這個東西訓(xùn)練一個好的模型,希望可以開放出去。
 
  現(xiàn)在這個模型我們想著2000億參數(shù),200B的參數(shù),這個訓(xùn)出來以后,我們希望把它給到合作伙伴那里,而且提供相應(yīng)的指令微調(diào)和相應(yīng)的人工增強(qiáng)學(xué)習(xí)的工具,甚至做一兩個垂直領(lǐng)域,做樣板作為垂直應(yīng)用,怎么樣用告訴大家,因?yàn)槿A為在這方面很有經(jīng)驗(yàn),我們建議誰想做垂直應(yīng)用,可以到華為得到一些咨詢用這個模型做他們的應(yīng)用。
 
  有了這個東西,我們希望能夠快速把這個模型做完可以推向社會,讓社會在這個模型上開發(fā)中國自己的人工智能大模型應(yīng)用系統(tǒng)?,F(xiàn)在我們正在緊鑼密鼓往前推,應(yīng)該是8月底第一次所有的訓(xùn)練就訓(xùn)練完了,9月份就會把模型開放出去。
 
  現(xiàn)在訓(xùn)練的數(shù)據(jù)有多大呢?我們說的是喂數(shù)據(jù),每天喂10個B,但是最重要喂一個T的數(shù)據(jù),一個T是由幾百個T清洗來的,現(xiàn)在數(shù)據(jù)都是中文和代碼數(shù)據(jù),現(xiàn)在4000多塊卡的機(jī)器每天可以吃掉10個B,100天就能吃掉1000個B,就是一個T,我訓(xùn)練2000億參數(shù)的模型,需要4000塊卡訓(xùn)練100天。
 
  這就是算力,你如果不夠大的話,做一個模型還是很辛苦的,而且我現(xiàn)在才訓(xùn)練了一個T的數(shù)據(jù),訓(xùn)練兩到三個T的話,還要加兩到三個100天,沒有大算力做大模型就是天方夜譚,當(dāng)然有很多人說我可以用限速(音)等等這樣那樣的,但是實(shí)際上這就和電力是一樣的,可以省點(diǎn)電做出什么產(chǎn)品來,別人真正懂行的人聽了都不信的,一定要有算力作為基礎(chǔ)。
 
  我們的算力到現(xiàn)在為止,怎么樣把數(shù)據(jù)做好訓(xùn)練得快,我們有一套體系,有一個開源社區(qū)叫啟智開源社區(qū),這里面有很多的工程師做飛輪數(shù)據(jù)工程,可以使你清洗數(shù)據(jù)做得非???,有很多自動和半自動的清洗數(shù)據(jù),都可以幫助你。
 
  模型訓(xùn)練,4000塊卡吃掉10個B的數(shù)據(jù),整個的損失每天都在降一點(diǎn),我們看著特別高興,每天有數(shù)據(jù)匯報(bào),一天降了0.2,我們現(xiàn)在大概在2的上下浮動,我們希望最終可以降到1.8左右。
 
  這是訓(xùn)練的過程,同時(shí)我們要考慮應(yīng)用的時(shí)候有隱私數(shù)據(jù)有一些數(shù)據(jù)應(yīng)用者,希望到你這個模型應(yīng)用一下,但是不希望自己的數(shù)據(jù)被丟掉或者是看到,我們提供了隱私數(shù)據(jù)保護(hù)的模塊,我們叫防損包,有了這樣一套體系就可以支持應(yīng)用了。
 
  我們希望鵬城腦海出來了可以快速向社會賦能,可以讓大家做數(shù)字政府、“一帶一路”、智能制造、智慧金融、智慧醫(yī)療等等各種各樣可能的應(yīng)用,這里有黃顏色和白顏色,黃顏色是現(xiàn)在已經(jīng)投進(jìn)人去做了,你做指令微調(diào)和正向?qū)W習(xí)都需要。后面是放給合作伙伴去做的,而且我們還有一些完整的整個教育計(jì)劃、人才計(jì)劃,人才計(jì)劃就希望這個模型訓(xùn)練放出來,大量培養(yǎng)人才,通過高校和合作伙伴培養(yǎng),能讓中國的大模型應(yīng)用快速啟動。
 
  小結(jié)一下,鵬城實(shí)驗(yàn)室在鵬城云腦II硬件平臺和鵬城腦海大模型這兩件事都在和華為合作正在往前推進(jìn),希望可以對中國人工智能大模型用貢獻(xiàn)一點(diǎn)力量,作為一個基石,希望大家多關(guān)心、多參與。
 
  謝謝大家。
 
 
聲明:凡資訊來源注明為其他媒體來源的信息,均為轉(zhuǎn)載自其他媒體,并不代表本網(wǎng)站贊同其觀點(diǎn),也不代表本網(wǎng)站對其真實(shí)性負(fù)責(zé)。您若對該文章內(nèi)容有任何疑問或質(zhì)疑,請立即與中國機(jī)器人網(wǎng)(www.baoxianwx.cn)聯(lián)系,本網(wǎng)站將迅速給您回應(yīng)并做處理。
電話:021-39553798-8007
更多>相關(guān)資訊
0相關(guān)評論

推薦圖文
推薦資訊
點(diǎn)擊排行
?