熱搜： 佳士科技 irobot 工業(yè)機(jī)器人機(jī)器人 ABB 機(jī)器人產(chǎn)業(yè)聯(lián)盟發(fā)那科機(jī)械手庫(kù)卡碼垛機(jī)器人

醫(yī)學(xué)AI部署探索，“推理效率”將成為下一個(gè)角斗場(chǎng)？

日期：2021-10-11 來(lái)源：動(dòng)脈網(wǎng) 作者：angela 評(píng)論：0

標(biāo)簽： 醫(yī)學(xué) AI 人工智能 TensorRT Triton

當(dāng)我們談到影像醫(yī)療AI時(shí)，首先想到的可能是模型的準(zhǔn)確率度、敏感度，產(chǎn)品應(yīng)用范疇或是產(chǎn)品的審批審評(píng)狀況。但當(dāng)醫(yī)療人工智能陸續(xù)通過(guò)器審中心審批，開(kāi)始以商品形式落地于醫(yī)院時(shí)，醫(yī)生的實(shí)際使用體驗(yàn)逐漸成為醫(yī)療AI廠商關(guān)注的重點(diǎn)。

阻礙醫(yī)院AI正常調(diào)用的環(huán)節(jié)非常多。PACS系統(tǒng)接口、醫(yī)院電腦等軟硬件的兼容能力、工作站與電子病歷數(shù)據(jù)傳輸限制等因素，都有可能降低AI在實(shí)際使用中的推理速度，甚至出現(xiàn)多AI系統(tǒng)不兼容的問(wèn)題。

近日，NVIDIA將TensorRT、Triton兩個(gè)工具用之于醫(yī)療AI的部署環(huán)節(jié)。這位人工智能計(jì)算的引領(lǐng)者曾助力大量醫(yī)療AI企完成AI模型訓(xùn)練與構(gòu)建，現(xiàn)又繼續(xù)向AI落地的下游延伸，嘗試解決醫(yī)院各科室與AI企業(yè)之間的部署糾纏。

一方面，新的工具將幫助醫(yī)療AI企業(yè)把握充分利用GPU硬件資源、充分發(fā)揮GPU的算力進(jìn)行AI推理；高效部署、優(yōu)化計(jì)算資源實(shí)用；安全、高效調(diào)度GPU等細(xì)節(jié)，加速院端AI推理過(guò)程，提高醫(yī)療AI的實(shí)際使用體驗(yàn)。

另一方面，在當(dāng)前以單病種AI為主流的時(shí)代下，許多科室通常會(huì)向某AI公司采購(gòu)多種AI，并在診斷時(shí)進(jìn)行多個(gè)AI間切換。在這種情況下，NIVIDA能夠?yàn)锳I公司提供一種通用的支持框架，幫助企業(yè)在各種環(huán)境下部署多個(gè)人工智能。

當(dāng)醫(yī)療人工智能進(jìn)入精細(xì)化競(jìng)爭(zhēng)時(shí)代，NVIDIA的新工具或?qū)椭t(yī)療AI企業(yè)重構(gòu)競(jìng)爭(zhēng)力。

新一代TensorRT 8入駐醫(yī)療，

AI推理效率數(shù)倍提升

推理（Inference）意為把深度學(xué)習(xí)從影像AI訓(xùn)練中學(xué)習(xí)到的診斷能力應(yīng)用到實(shí)際中去，是醫(yī)療人工智能模擬醫(yī)生進(jìn)行輔助診斷的關(guān)鍵。

對(duì)于醫(yī)學(xué)這樣一門(mén)嚴(yán)肅的學(xué)科，AI診斷的速度與精度必須滿(mǎn)足高要求。這意味著，醫(yī)學(xué)AI的模型及推理過(guò)程總是非常復(fù)雜，以至于我們很難窺探AI推理的過(guò)程。

為了使醫(yī)療AI的推理變?yōu)楦装芽?，NIVIDA將TensorRT的適用范圍拓展至醫(yī)療場(chǎng)景。作為一種高性能深度學(xué)習(xí)推理（Inference）的優(yōu)化器和運(yùn)行引擎，TensorRT以TensorFlow框架訓(xùn)練得到的模型作為輸入，為CUDA GPU生成優(yōu)化了的模型運(yùn)行時(shí)間，減少推理的時(shí)間來(lái)降低應(yīng)用程序的延遲，減少計(jì)算和內(nèi)存訪(fǎng)問(wèn)，并利用稀疏張量核心提供額外的性能提升。

此外，TensorRT可以將研發(fā)人員訓(xùn)練好的模型分解再進(jìn)行融合，融合后的模型具有高度的集合度。例如，將卷積層和激活層進(jìn)行融合后，計(jì)算速度可獲得顯著提升。

2021年7月，最新一代TensorRT 8.0版本將上述的優(yōu)勢(shì)進(jìn)行了極致提升。

TensorRT 8.0使用量化感知訓(xùn)練，實(shí)現(xiàn)與 FP32 相當(dāng)?shù)木群?INT8 精度，相比7.0版本運(yùn)行速度和精準(zhǔn)度都提升了1倍。此外，TensorRT 8.0加速支持大量推理模型，其中基于BERT模型的推理速度提高 2 倍。

由于采用了稀疏性技術(shù)，TensorRT 8.0可顯著提升 Ampere GPU性能，將 Ampere GPU 的吞吐量提高多達(dá) 50%，加速2:4細(xì)粒度結(jié)構(gòu)。數(shù)據(jù)顯示，通過(guò)消除神經(jīng)網(wǎng)絡(luò)中不必要的計(jì)算，用戶(hù)可以獲得超過(guò)30%的性能增長(zhǎng)。

更為高效推理能夠解決現(xiàn)階段部署的眾多問(wèn)題。譬如，由于醫(yī)療信息化系統(tǒng)對(duì)于醫(yī)院計(jì)算機(jī)系統(tǒng)的限制，許多醫(yī)院的軟件系統(tǒng)版本相對(duì)滯后，難以支撐醫(yī)療人工智能對(duì)于軟硬件的要求，TensorRT 8.0的介入則能更為充分的運(yùn)用有限的計(jì)算資源，有效降低AI部署成本。

此外，高效推理、低延遲能夠優(yōu)化線(xiàn)上流程的流暢性。無(wú)紙化時(shí)代，TensorRT 8.0將極大提升醫(yī)生的AI使用體驗(yàn)。

抽絲剝繭，Triton支持下，

GPU實(shí)現(xiàn)極致利用

TensorRT 8.0的入駐優(yōu)化了醫(yī)療AI的推理，但在實(shí)際之中，NVIDIA還需解決同一環(huán)境下多種類(lèi)AI部署這一關(guān)鍵問(wèn)題。

NVIDIA Triton推理服務(wù)器是一款開(kāi)源軟件，提供單一標(biāo)準(zhǔn)化推理平臺(tái)，可支持在多框架模型、CPU 和 GPU 以及不同部署環(huán)境（例如數(shù)據(jù)中心、云、嵌入式設(shè)備和虛擬化環(huán)境）中運(yùn)行推理。

對(duì)于所有推理模式，Triton都可以簡(jiǎn)化模型在任一框架中以及任何 GPU或CPU上的運(yùn)行方式，從而在生產(chǎn)環(huán)境中使用 AI。結(jié)合 NVIDIA AI部署框架的最新版本NVIDIA TensorRT 8，Triton可以進(jìn)一步提高神經(jīng)網(wǎng)絡(luò)的推理效率，在不損失精度的前提下減少計(jì)算和存儲(chǔ)成本，實(shí)現(xiàn)高效推理。

目前，Triton支持多模型ensemble，以及TensorFlow、PyTorch、ONNX等多種深度學(xué)習(xí)模型框架，可以很好的支持多模型聯(lián)合推理的場(chǎng)景，構(gòu)建起視頻、圖片、語(yǔ)音、文本整個(gè)推理服務(wù)過(guò)程，大大降低多個(gè)模型服務(wù)的開(kāi)發(fā)和維護(hù)成本。

在金融行業(yè)，螞蟻集團(tuán)借助NVIDIA Triton 推理服務(wù)器，配合T4GPU、DALI的圖像預(yù)處理能力，將多模型推理性能整體提升2.4倍，延遲降低20%，既滿(mǎn)足了業(yè)務(wù)的低延時(shí)需求，成本也降低了50%。這意味著，在多模態(tài)業(yè)務(wù)場(chǎng)景中，螞蟻集團(tuán)以更低的成本構(gòu)建了高性能的推理服務(wù)，同時(shí)以更低的延遲降低了整條系統(tǒng)鏈路的響應(yīng)時(shí)間，優(yōu)化了用戶(hù)體驗(yàn)。

同樣的成功也有可能復(fù)制于醫(yī)療之中。一方面，Triton支持下，醫(yī)學(xué)AI企業(yè)的研究人員可以自由地為他們的項(xiàng)目選擇合適的框架，最大化利用GPU，幫助其盡快進(jìn)行推理型；另一方面，Triton的多環(huán)境支持功能及安全保障能夠保證醫(yī)療AI在任何一家醫(yī)院順利部署，幫助部署人員更為輕松地滿(mǎn)足不同醫(yī)院對(duì)于不同部署環(huán)境的偏好。

解鎖TensorRT和Triton

在醫(yī)療影像診斷中的應(yīng)用

為了進(jìn)一步幫助大家理解TensorRT和Triton在醫(yī)療影像診斷中的應(yīng)用，英偉達(dá)將在10月13日14:00-15:20召開(kāi)網(wǎng)絡(luò)研討會(huì)《解鎖TensorRT和Triton在醫(yī)療影像診斷中的應(yīng)用》，詳解醫(yī)療中的TensorRT和Triton。

講解實(shí)際真實(shí)應(yīng)用環(huán)境下的模型部署和調(diào)度。

　　本次網(wǎng)絡(luò)研討會(huì)邀請(qǐng)到了NVIDIA 高級(jí)架構(gòu)師趙凡博士以及安德醫(yī)智算法總監(jiān)劉盼博士，兩位嘉賓將在會(huì)上分享以下內(nèi)容：

　　TensorRT 8最新特性；

　　Triton的應(yīng)用特性及如何高效使用；

　　醫(yī)療影像 AI 在部署中的常見(jiàn)問(wèn)題以及使用技巧；

　　介紹Triton多后端的優(yōu)勢(shì)及基于Pytorch/tensorflow后端的推理流程；

　　講解3D大尺度模型如何從 GraphDef 轉(zhuǎn)換到 TtensorRT plan的實(shí)戰(zhàn)案例；

聲明：凡資訊來(lái)源注明為其他媒體來(lái)源的信息，均為轉(zhuǎn)載自其他媒體，并不代表本網(wǎng)站贊同其觀點(diǎn)，也不代表本網(wǎng)站對(duì)其真實(shí)性負(fù)責(zé)。您若對(duì)該文章內(nèi)容有任何疑問(wèn)或質(zhì)疑，請(qǐng)立即與中國(guó)機(jī)器人網(wǎng)(www.baoxianwx.cn)聯(lián)系，本網(wǎng)站將迅速給您回應(yīng)并做處理。
電話(huà)：021-39553798-8007

更多>相關(guān)資訊

0 條相關(guān)評(píng)論

推薦圖文

機(jī)器人賦能產(chǎn)業(yè)，智贏	機(jī)器人也會(huì)創(chuàng)造英國(guó)
2018年中國(guó)智慧機(jī)場(chǎng)行	智能工廠全面解讀！
艾貓?jiān)缃虣C(jī)器人亮相20	360智能硬件助力美國(guó)

推薦資訊

點(diǎn)擊排行

?

• 皮特大學(xué)醫(yī)學(xué)副教授開(kāi)發(fā)機(jī)器人研究電子煙對(duì)健康	• 云譯專(zhuān)業(yè)醫(yī)學(xué)機(jī)器翻譯系統(tǒng)，助力醫(yī)療領(lǐng)域業(yè)務(wù)多
• 濱州醫(yī)學(xué)院煙臺(tái)附屬醫(yī)院脊柱外科成功開(kāi)展骨科機(jī)	• 在生物醫(yī)學(xué)應(yīng)用中，F(xiàn)LIR CMOS相機(jī)將成為sCMOS傳
• 《自然·通訊》報(bào)道北理工在微納機(jī)器人與生物醫(yī)	• 科研人員發(fā)表納米機(jī)器人及其生物醫(yī)學(xué)應(yīng)用研究綜
• 科研人員發(fā)表納米機(jī)器人及其生物醫(yī)學(xué)應(yīng)用研究綜	• “人機(jī)大戰(zhàn)”！人工智能為遺傳醫(yī)學(xué)裝上“最強(qiáng)大
• 智能醫(yī)學(xué)機(jī)器人如何創(chuàng)新賦能藥品全生命周期管理	• 教育部：今年碩士研究生招生規(guī)模同比或增18.9萬(wàn)

恰佩克獎(jiǎng)	機(jī)器人高峰論壇	北大機(jī)器人	金屬加工在線(xiàn)	AI中國(guó)網(wǎng)	埃森焊接展	機(jī)氣林
工博會(huì)	趕考網(wǎng)	中國(guó)機(jī)床網(wǎng)	ITES深圳工業(yè)展	電氣自動(dòng)化網(wǎng)	高壓電氣網(wǎng)	人工智能機(jī)器人
亞洲工業(yè)網(wǎng)	二手設(shè)備網(wǎng)	中國(guó)（南京）國(guó)際應(yīng)急產(chǎn)業(yè)博覽會(huì)	庫(kù)卡機(jī)器人	2022SSE職業(yè)技術(shù)教育現(xiàn)代化博覽會(huì)	海南教育裝備展覽會(huì)	VLAI未來(lái)四足機(jī)器人官網(wǎng)
中國(guó)傳動(dòng)網(wǎng)	華北機(jī)床網(wǎng)	數(shù)控機(jī)床市場(chǎng)網(wǎng)	國(guó)家標(biāo)準(zhǔn)化委員會(huì)

国产精品久久久久久久小说,国产国产裸模裸模私拍视频,国产精品免费看久久久无码,风流少妇又紧又爽又丰满,国产精品,午夜福利

醫(yī)學(xué)AI部署探索，“推理效率”將成為下一個(gè)角斗場(chǎng)？

醫(yī)學(xué)AI部署探索，“推理效率”將成為下一個(gè)角斗場(chǎng)？