美國(guó)本地時(shí)間5月9日,科大訊飛在圣何塞召開(kāi)的GTC 2017大會(huì)期間宣布,訊飛開(kāi)放平臺(tái)將基于NVIDIA最新Pascal架構(gòu)的NVIDIA Tesla P4平臺(tái),提供語(yǔ)音云服務(wù)的深度學(xué)習(xí)推理,進(jìn)一步提升訊飛語(yǔ)音云平臺(tái)的效率。
科大訊飛美國(guó)分公司總裁李春燕博士表示,隨著對(duì)深度學(xué)習(xí)和人工智能技術(shù)要求日益提高,GPU在扮演越來(lái)越重要的角色。在NVIDIA推出Pascal架構(gòu)的GPU平臺(tái)后,科大訊飛第一時(shí)間應(yīng)用NVIDIA Tesla P4深度學(xué)習(xí)進(jìn)行訓(xùn)練,并取得了相對(duì)于CPU訓(xùn)練的50倍以上速度提升。
“原先需要兩個(gè)月時(shí)間來(lái)完成的訓(xùn)練,現(xiàn)在只需要一天就能完成。”李春燕告訴記者。

李春燕介紹,科大訊飛從2013年便開(kāi)始使用NVIDIA的K10 GPU平臺(tái)進(jìn)行相關(guān)人工智能產(chǎn)品的開(kāi)發(fā),目前科大訊飛在線日業(yè)務(wù)量過(guò)35億人次,總用戶數(shù)超過(guò)10億,擁有30萬(wàn)家合作伙伴、是中文語(yǔ)音技術(shù)市場(chǎng)的領(lǐng)先者。目前,科大訊飛的全行業(yè)語(yǔ)音產(chǎn)品和人工智能產(chǎn)品在教育、客服、車載、智能家居、智能硬件、醫(yī)療等方面均有著廣泛的應(yīng)用。
“目前深圳有超過(guò)60%做機(jī)器人的公司,他們用的都是訊飛的方案。”得知記者來(lái)自深圳,李春燕如是說(shuō)。
科大訊飛此次投入應(yīng)用的Tesla P4具備超高的運(yùn)算能力,主要將其應(yīng)用于訊飛開(kāi)放平臺(tái)的深度學(xué)習(xí)推理,在語(yǔ)音識(shí)別的線上解碼引擎上。相比起之前科大訊飛使用的M40,Tesla P4的并發(fā)路數(shù)提升了3-4倍,而功耗峰值降低至75W,僅相當(dāng)于M40的1/2-1/3。

在性能優(yōu)化上,科大訊飛也下了一番功夫。Tesla P4理論上能提供每秒22T INT8運(yùn)算的計(jì)算峰值,在實(shí)際應(yīng)用中,科大訊飛跑出了超過(guò)20T INT8運(yùn)算的接近理論峰值的計(jì)算能力,這一結(jié)果讓NVIDIA刮目相看。
“這是所有合作伙伴達(dá)到的最高數(shù)值。”NVIDIA全球副總裁、亞太區(qū)總裁Raymond Teh告訴記者。
Tesla P4運(yùn)算能力的提升和計(jì)算并發(fā)路數(shù)的提升對(duì)于科大訊飛來(lái)說(shuō)至關(guān)重要。前者有助于幫助科大訊飛提升訓(xùn)練時(shí)間,加快迭代的速度,后者可以大大提高云端服務(wù)響應(yīng)速度。通過(guò)在訓(xùn)練和推理兩端同時(shí)用GPU加速,不僅能夠降低在線識(shí)別的成本,更能有效提升客戶的體驗(yàn)。
據(jù)NVIDIA業(yè)務(wù)發(fā)展總監(jiān)何濤介紹,Tesla P4是為了適應(yīng)未來(lái)數(shù)據(jù)中心低功耗計(jì)算能力而設(shè)計(jì)的。GPU對(duì)于所有計(jì)算中心的計(jì)算能力管理至關(guān)重要,P4迎合了數(shù)據(jù)中心的需求,不僅在性能上有顯著提升,體積更小,可以在同樣空間中配置更多的GPU;功率降低,更重要的是可以用PCIE供電,無(wú)需額外電源,能夠便于客戶更靈活地管理計(jì)算能力。
“中國(guó)的傳統(tǒng)機(jī)房一般是給一個(gè)恒定的能耗,如果用大(功率的)GPU不可能放很多。”何濤說(shuō)。“這樣的設(shè)計(jì),特別適合中國(guó)。”他接著補(bǔ)充道。