繼年初人工智能首次寫入政府工作報(bào)告后,國(guó)務(wù)院近日印發(fā)我國(guó)第一個(gè)人工智能(AI)規(guī)劃--《新一代人工智能發(fā)展規(guī)劃》,人工智能從一個(gè)技術(shù)熱點(diǎn)上升為一項(xiàng)國(guó)家戰(zhàn)略。而作為智慧計(jì)算領(lǐng)導(dǎo)者的浪潮,近期發(fā)布了M5新一代服務(wù)器,推出通用、融合架構(gòu)、應(yīng)用優(yōu)化和關(guān)鍵業(yè)務(wù)4大系列35款產(chǎn)品,面向云計(jì)算、大數(shù)據(jù)、深度學(xué)習(xí)三大應(yīng)用場(chǎng)景提供業(yè)界最豐富的產(chǎn)品陣列,為國(guó)家人工智能戰(zhàn)略的發(fā)展提供了極致豐富的計(jì)算平臺(tái)。

浪潮AI產(chǎn)品家族
人工智能是浪潮智慧計(jì)算的重心
新一代M5反映出浪潮比較重要的變化是,服務(wù)器設(shè)計(jì)從均衡開始走向極致,主打“面向應(yīng)用/場(chǎng)景的極致設(shè)計(jì)”概念,以此強(qiáng)有力的推進(jìn)智慧計(jì)算業(yè)務(wù)的持續(xù)發(fā)展。智慧計(jì)算是浪潮目前最為看重的一項(xiàng)高成長(zhǎng)性業(yè)務(wù),它以云計(jì)算為基礎(chǔ)平臺(tái),以大數(shù)據(jù)為認(rèn)知方法,以深度學(xué)習(xí)作為優(yōu)化工具,其核心是CBD(Cloud computing,Big data,Deep learning)。從組成要素來(lái)看,智慧計(jì)算與人工智能有著高度的重合,要知道目前引發(fā)人工智能熱潮的三個(gè)重要因素即是超大規(guī)模的計(jì)算能力、爆炸式的數(shù)據(jù)增長(zhǎng)、機(jī)器學(xué)習(xí)尤其是深度學(xué)習(xí)算法的出現(xiàn)。

浪潮智慧計(jì)算核心三要素
可以說,將人工智能視為浪潮智慧計(jì)算業(yè)務(wù)的重心一點(diǎn)都不為過,而在這一領(lǐng)域的成功也將有助于浪潮實(shí)現(xiàn)躋身全球前三服務(wù)器廠商的目標(biāo)。據(jù)埃森哲發(fā)布的研究報(bào)告,通過轉(zhuǎn)變工作方式以及開拓新的價(jià)值和增長(zhǎng)源,人工智能有潛力將2035年的中國(guó)經(jīng)濟(jì)總增加值提升7.111萬(wàn)億美元,即從6.3%提速至7.9%。而對(duì)現(xiàn)代人工智能產(chǎn)生深遠(yuǎn)影響的科學(xué)家于爾根?施米德胡貝教授(Jürgen Schmidhuber)認(rèn)為,人工智能將重構(gòu)幾乎所有的行業(yè),包括金融、醫(yī)療保健、汽車、消費(fèi)、娛樂等領(lǐng)域。毫無(wú)疑問,誰(shuí)能贏得人工智能,誰(shuí)就會(huì)贏得未來(lái)。
當(dāng)我們行至一個(gè)“萬(wàn)物AI時(shí)代”的大門之前,該如何以計(jì)算推開這扇大門呢?浪潮M5新一代服務(wù)器的發(fā)布將帶來(lái)耳目一新的AI計(jì)算體驗(yàn),其構(gòu)建了業(yè)界最全的AI的產(chǎn)品線,在部署密度、峰值性能、硬件解耦處于業(yè)界領(lǐng)先水平,相比上一代產(chǎn)品性能提升1.5倍。
應(yīng)對(duì)AI計(jì)算“成長(zhǎng)的煩惱”
M5系列所強(qiáng)調(diào)的極致、彈性兩大特點(diǎn)更加匹配人工智能對(duì)計(jì)算的需求。我們常說人工智能對(duì)計(jì)算力的需求是無(wú)止境的,但在實(shí)際應(yīng)用中并非總是如此。雖然人類社會(huì)的數(shù)據(jù)總量依然在爆炸式的增長(zhǎng),但能夠用于深度學(xué)習(xí)訓(xùn)練的標(biāo)注數(shù)據(jù)卻無(wú)法快速增長(zhǎng),因此很多從事人工智能研究和應(yīng)用的用戶必須要考慮彈性的問題:在初期訓(xùn)練數(shù)據(jù)總量不大的時(shí)候,可以使用小規(guī)模的AI計(jì)算平臺(tái);隨著訓(xùn)練數(shù)據(jù)規(guī)模的擴(kuò)大,可以非常簡(jiǎn)單的擴(kuò)容AI計(jì)算平臺(tái)。
M5系列中被稱為“AI超級(jí)計(jì)算機(jī)”的NF5288M5(AGX-2),具備良好AI計(jì)算擴(kuò)展能力,是全球首款在2U空間內(nèi)高速互聯(lián)集成8顆最高性能GPU加速器的服務(wù)器,在單位計(jì)算密度上體現(xiàn)出非常明顯的極致性,但它也可支持2-8卡的隨需擴(kuò)展,用戶可根據(jù)模型訓(xùn)練的實(shí)際需要自由選擇計(jì)算力。AGX-2具備良好的I/O擴(kuò)展能力,GPU間互聯(lián)帶寬高達(dá)150GB/s,提供8塊NVMe/SAS/SATA熱插拔硬盤,可支持最多4塊100Gbps的EDR InfiniBand接口卡的高速集群互聯(lián)。

浪潮發(fā)布全球最高密度、最強(qiáng)性能的AI服務(wù)器NF5288M5
另一款可靈活擴(kuò)展的新型AI加速計(jì)算產(chǎn)品GX4。實(shí)現(xiàn)了協(xié)處理器與CPU計(jì)算資源的解耦和重構(gòu),突破了常規(guī)AI計(jì)算設(shè)備的8卡擴(kuò)展限制,實(shí)現(xiàn)了更高的單機(jī)計(jì)算性能。每個(gè)GX4可在2U空間內(nèi)支持4塊加速卡,而單臺(tái)服務(wù)器最高可擴(kuò)展鏈接4臺(tái)GX4從而實(shí)現(xiàn)單機(jī)16卡的加速計(jì)算池。這種獨(dú)立的加速計(jì)算模塊設(shè)計(jì)極大提升了系統(tǒng)部署彈性,既能輕松實(shí)現(xiàn)2到16卡的高擴(kuò)展性,也能通過改變服務(wù)器與擴(kuò)展模塊的鏈接方式實(shí)現(xiàn)快速靈活的拓?fù)滢D(zhuǎn)換,使計(jì)算架構(gòu)與上層應(yīng)用更匹配。
極致滿足超大規(guī)模AI計(jì)算
而對(duì)于那些已經(jīng)擁有超大規(guī)模數(shù)據(jù)和復(fù)雜神經(jīng)網(wǎng)絡(luò)的用戶來(lái)說,AI計(jì)算平臺(tái)的性能自然是越強(qiáng)越好。M5系列中的SR-AI整機(jī)柜就是一款面向更大規(guī)模數(shù)據(jù)集和深層神經(jīng)網(wǎng)絡(luò)的超大規(guī)模AI計(jì)算平臺(tái),能夠高效支撐復(fù)雜的深度學(xué)習(xí)線下模型訓(xùn)練任務(wù),適用于圖像識(shí)別、語(yǔ)音識(shí)別、自然語(yǔ)言處理、搜索排序等AI應(yīng)用。
SR-AI整機(jī)柜是全球首個(gè)采用PCIe Fabric互聯(lián)架構(gòu)設(shè)計(jì)的AI方案,其I/O BOX單節(jié)點(diǎn)即可實(shí)現(xiàn)支持16個(gè)GPU的超大擴(kuò)展,并且可以通過PCI-E交換機(jī)實(shí)現(xiàn)4個(gè)BOX、64塊GPU的級(jí)聯(lián),峰值處理能力達(dá)到為512TFlops。
同時(shí),傳統(tǒng)的AI計(jì)算設(shè)備集群需要通過高速網(wǎng)絡(luò)實(shí)現(xiàn)數(shù)據(jù)的交互,這會(huì)帶來(lái)us級(jí)以上的延遲,而SR-AI整機(jī)柜中GPU BOX間的互聯(lián)是通過PCI-E交換機(jī)來(lái)實(shí)現(xiàn),并借助GPUDirect RDMA技術(shù)可以大幅下降跨節(jié)點(diǎn)GPU間的通信延遲,能夠?qū)崿F(xiàn)ns級(jí)網(wǎng)絡(luò)延時(shí)。
關(guān)注人工智能“上層建筑”
除了在底層架構(gòu)層面關(guān)注人工智能的計(jì)算需求外,浪潮也從AI軟件實(shí)現(xiàn)、框架優(yōu)化和應(yīng)用加速著手,解決AI計(jì)算中面對(duì)的各類復(fù)雜問題。目前,深度學(xué)習(xí)的模型訓(xùn)練往往流程較長(zhǎng)、開發(fā)環(huán)境較復(fù)雜,涉及數(shù)據(jù)準(zhǔn)備和處理、特征工程、建模、調(diào)參等多個(gè)步驟及多個(gè)框架和模型,每個(gè)框架依賴環(huán)境不同且有可能交叉使用。更大的“痛點(diǎn)”在于,深度學(xué)習(xí)模型在訓(xùn)練時(shí)往往耗時(shí)較長(zhǎng),短則數(shù)小時(shí)長(zhǎng)則數(shù)天,以往在訓(xùn)練完成后才意識(shí)到模型存在問題,大大耗費(fèi)了用戶的精力和時(shí)間。
為此,浪潮除獨(dú)立開發(fā)出AIStation深度學(xué)習(xí)系統(tǒng)管理平臺(tái)、Teye應(yīng)用特征分析系統(tǒng)以及Caffe-MPI深度學(xué)習(xí)并行計(jì)算框架之外,同時(shí)也在不斷強(qiáng)化GPU、MIC和FPGA三種異構(gòu)計(jì)算平臺(tái)下的應(yīng)用加速能力,協(xié)助用戶完成AI應(yīng)用的遷移、優(yōu)化。
突破傳統(tǒng),創(chuàng)新研發(fā)
浪潮之所以能夠打破服務(wù)器均衡設(shè)計(jì)的束縛,開發(fā)出一系列貼近應(yīng)用場(chǎng)景的AI計(jì)算產(chǎn)品,很重要的原因得益于JDM(聯(lián)合開發(fā),Join Design Manufacture)模式。這是一種有別于OEM、ODM的新商業(yè)模式,即面向應(yīng)用、融合產(chǎn)業(yè)鏈、與客戶聯(lián)合定制開發(fā)模式,能夠創(chuàng)造出更顯著的商業(yè)價(jià)值。同時(shí),JDM模式也讓浪潮建立了更難以逾越的競(jìng)爭(zhēng)壁壘,因?yàn)檫@種能力很難復(fù)制,需要長(zhǎng)時(shí)間的經(jīng)驗(yàn)積累和不斷的技術(shù)資源投入,以及對(duì)客戶保持專注和對(duì)其需求的準(zhǔn)確理解,并不是簡(jiǎn)單的靠投錢就能砸出來(lái)的。
目前,JDM模式主要集中在浪潮與互聯(lián)網(wǎng)客戶之間。以浪潮與百度合作為例,雙方從單純的產(chǎn)品合作向研發(fā)模式、生產(chǎn)模式的兩端深入推進(jìn),使得硬件產(chǎn)品與軟件算法從研發(fā)設(shè)計(jì)階段就開始接觸和磨合,這令研發(fā)出的AI計(jì)算產(chǎn)品更符合業(yè)務(wù)需求,最大化發(fā)揮AI計(jì)算力和創(chuàng)新能力。浪潮兩度獲得百度頒發(fā)的服務(wù)器領(lǐng)域唯一的“技術(shù)創(chuàng)新獎(jiǎng)”,可以說是JDM模式最好的詮釋。
可以說,浪潮是隱身在眾多超大互聯(lián)網(wǎng)公司身后的產(chǎn)品“研發(fā)部門”。關(guān)鍵的是,這種聯(lián)合創(chuàng)新背后,既代表了最前沿的技術(shù)需求,也意味著浪潮必須在快速交付以及定制化、個(gè)性化解決方案方面必須具備強(qiáng)大能力。
孕育無(wú)限可能的人工智能將是一場(chǎng)沒有既定方向的長(zhǎng)跑,對(duì)于AI解決方案在中國(guó)占有率達(dá)到60%的浪潮而言,只有保持強(qiáng)大的創(chuàng)新能力與準(zhǔn)確的趨勢(shì)預(yù)判,才能持續(xù)領(lǐng)跑。