“在中國,有70%的診療需要根據醫(yī)療影像給出的信息做出診斷。而且這個系統(tǒng)還在不斷地發(fā)展,影像圖片量每年大概有40%左右的增長,但是相應的,每年影像醫(yī)生數量卻頂多只以3%的速度在增加,所以說現在中國非常缺乏影像科醫(yī)生。”上海第二軍醫(yī)大學長征醫(yī)院放射科主任、中華放射學會副主任委員劉士遠告訴記者。

缺少影像科醫(yī)生又引發(fā)了另外一個問題,即導致醫(yī)生的超負荷工作。而當醫(yī)生超負荷工作時,出錯誤的概率會增加,甚至會漏掉原本可以發(fā)現的一些早期病癥。這樣的惡性循環(huán)也成為醫(yī)患關系緊張的推手之一。
目前看來,人工智能有可能成為解決這一問題的鑰匙。2013年,自動識別疾病,提高醫(yī)院診斷的深度學習方法就被《MIT科技評論》評為當年的十大技術突破之一。目前,人工智能在金融、醫(yī)療和制造等領域的應用正在迅速增長。麥肯錫估計,到 2025 年,AI 應用的總市場將達到 1270 億美元。而另一個機構IDC預測,國內醫(yī)療信息化解決方案市場在 2012 年至 2016 年的年復合增長率達到14.3%,未來這一市場有望超 300 億元。
在國內,利用深度學習技術訓練模型,已經可以在臨床診斷上幫助醫(yī)生識別肺部病變和癌癥。上海第二軍醫(yī)大學長征醫(yī)院成為最早擁抱這一技術的醫(yī)院之一,而與他們合作的公司是一家在2016年前無人關注的初創(chuàng)公司——推想科技。
“2014年我回國的時候,發(fā)現國內醫(yī)療領域的痛點,很多醫(yī)生其實每天都在超負荷工作。當我決心要做這件事的時候,才發(fā)現原來其實自己身邊真的有很多人因為醫(yī)院的漏診或誤診錯過了最佳治療的時間。”陳寬在接受專訪時說。
用靠譜的數據教機器識別病變
不過說說容易,做起來難。
“我們與陳寬的合作開始于2016年的10月份,說實話一開始合作的時候結果并不樂觀。雖然機器能發(fā)現肺部病變,但是許多是假陽性。”劉士遠主任說。
之所以先在肺部進行醫(yī)療影像識別診斷的應用,其實有一定的科學依據。因為肺本身是一個含空氣的臟器,擁有最好的天然對比。如果病人的肺里面有病灶,相當于在黑紙上面有個白點,一目了然,對于機器來說,比較容易識別。而其他器官,比如肝臟、大腦等部位的醫(yī)療影像,如果有病灶就像在灰色的紙上,點了個白點,對比并不強烈。
那何為機器檢查出來的假陽性,劉士遠做了一個比喻,機器檢測出的假陽性,相當于一個警察在人群中找出十個壞人,最后發(fā)現只有兩個是壞人,八個是好人,這8個就是假陽性。另外一個問題是機器還存在漏診的可能性。也就是說警察能識別出殺人犯等重罪犯人,卻無法識別出小偷小摸的輕度罪犯。對于肺部的病變來說,許多肺里結節(jié)一開始是小且淡的,需要時間才能變大,但對于許多病人來說,這時候其實是就診的最佳時機。
要改變上述情況,高精準的醫(yī)療數據集成了關鍵。Facebook人工智能實驗室主任楊樂昆曾對機器學習的圖像識別技術進行過解釋。對于機器來說,要識別圖中有什么,首先需要人類通過大量標記好的圖片告訴它圖片里是什么。劉士遠和推想科技進行了合作,利用醫(yī)院自己清晰標注的數據集對模型進行了訓練,提高機器識別的準確率。
“這相當于請老師教一個無知的孩子識字辨是非。如果你請了不靠譜的老師,交給他錯誤的信息,這個孩子會越學越壞;相反,如果你請了靠譜的老師,他才能越學越聰明。”劉主任說。
借助長征醫(yī)院一整套完善的肺部標準化重建和評價體系,經過6個月左右的訓練和實驗,目前推想科技的產品在肺部病變的識別率上已經有所提高。在識別的10個“犯人”中,機器的錯誤率已經降至1個或者半個。同時,與醫(yī)院里年輕的醫(yī)生相比,機器發(fā)現小結節(jié)的敏感度比人的肉眼要高出20%左右。人類可能肉眼會錯過的小結節(jié),目前機器已不會漏掉。
超高識別率背后的艱辛
推想科技在長征醫(yī)院取得的成果令人振奮,但在國內愿意擁抱新技術的醫(yī)院卻還是少數,大部分的醫(yī)院目前還在觀望階段。
“用人工智能來解決醫(yī)療領域的一些問題,其實現在還是一個相對早期的階段,或者說才剛剛開始。大家已經感覺到人工智能是第四次工業(yè)革命,是一個巨大的機遇。有很多公司在從事這個工作。而對于醫(yī)院或者醫(yī)生來說,只有部分人看到前景,覺得是個值得關注的領域。可惜進行工作和探索的醫(yī)生目前還是少數,大多數還在觀望階段。”劉士遠說。
陳寬在回國創(chuàng)業(yè)的初期也遇到了同樣的問題,他告訴記者:“其實創(chuàng)業(yè)路上遇到很多挑戰(zhàn)非常正常,最開始給我最大壓力的,反而不是技術上的問題。更多的是當時去醫(yī)院談合作,遇到的醫(yī)生并不接受。這讓我無事可做。”
除了傳統(tǒng)觀念對新技術尚不認可外,另一個攔路虎來自數據。對于推想科技來說,為了讓自己的模型變得更精準需要和國內一流的醫(yī)院合作;另一方面,如何保證數據安全也需要考慮。在與醫(yī)院合作上,推想科技利用智能X線輔助篩查產品(AI-DR)、智能CT輔助篩查產品(AI-CT)和智能深度學習科研平臺(AI-Scholar),與北京協(xié)和醫(yī)院、上海長征醫(yī)院、武漢同濟醫(yī)院進行了合作。

據劉士遠介紹,目前由他本人牽頭的上海市多中心肺癌篩查研究,正在對上海40歲以上上海居民進行肺癌數據統(tǒng)計和篩查。該研究中的6千多例的低劑量肺部結節(jié)的數據經過脫敏后,“喂”給了機器。所謂脫敏指的是將病人的個人信息抹去,只留下機器需要的內容。借助這樣的研究和精準的數據,機器在后期的肺癌識別準確率上才有了較大的提升。
對于機器來說,能擁有科研用研究數據進行訓練其實相當幸運。因為更多時候,來自于醫(yī)院臨床診療的數據更多、更復雜,卻不是很有用。這樣一來,就需要醫(yī)生進行輸入機器前的精準標記。這對于醫(yī)院醫(yī)生來說是一件非常艱苦的過程。因為每個病人的圖像按照正常保存的話,都有二百張以上,甚至有的可能有四五百張的圖像。

“這些圖像需要有人認真的一張張去看、去過濾,看完了以后里面有病灶、有異常再去標記出來,還要確保標記正確,過程非常辛苦。我們有經驗的主治醫(yī)生看一個病人,可能最起碼要半個小時以上,你再想想如果要標記6000例病人,我們得花多長時間。有些醫(yī)生需要坐電腦前面非常長的時間,看得眼花頭暈的,還得保障正確率。”劉士遠說。他還以小孩子的教育做比喻,解釋了數據標記階段的辛苦。“這其實就像年輕媽媽帶孩子,最后孩子考上了耶魯、劍橋,外人看到了最終結果,卻不知道過程艱辛。這個產品在醫(yī)院上線的時候,大概一秒鐘就能看出病人的病癥,但是實際前期需要做大量的細致工作。”
AI讓醫(yī)生看片不累,還能平衡醫(yī)療資源
俗話說磨刀不誤砍柴工。盡管前期數據的標記和輸入需要花費大量的時間和精力,但訓練好的模型卻能給醫(yī)院的診療效果帶來巨大的提升。首先是解放了許多醫(yī)生的勞動力。用機器替代醫(yī)生對醫(yī)療影像進行識別,可以減少醫(yī)生看片的時間,從而解放了更多醫(yī)療資源。讓醫(yī)生能有更多地精力放在與病人溝通上。
“人不是機器,他會疲勞,還要上廁所、吃飯。太疲勞的時候做事情的效率就會下降,然后就有可能會漏診甚至誤診。如果出現誤診、漏診,還有可能會有醫(yī)療糾紛。另外,其實醫(yī)學影像科的工作就是看圖像、寫報告、描寫病癥,這是一個非常枯燥無聊重復的過程。”劉士遠說。
其次,人工智能與醫(yī)療的結合,未來還能解決落后地區(qū)的醫(yī)療資源不足問題。推想科技與長征醫(yī)院的合作還在繼續(xù),但雙發(fā)共同打造的診療系統(tǒng)最終會形成產品和經驗,從而給偏遠地區(qū)的醫(yī)院使用。
“現在國家提倡分級診療,提倡優(yōu)質醫(yī)療資源下沉。北上廣的優(yōu)質醫(yī)療資源不可能到青海,西藏,因為讓醫(yī)生放棄北上海的生活去這些地方去工作不現實。但是如果說因為我們的經驗,以及和推想的合作形成了好的人工智能產品,能用在邊遠地區(qū)的某些醫(yī)院,可能得出來的結果是一樣的。這就相當于邊遠小醫(yī)院也能夠達到長征醫(yī)院這樣的診斷水平,這對于全國的老百姓來說無疑是一個巨大的福音。” 劉士遠說。
第三,人工智能還能提高醫(yī)院管理效率。據陳寬介紹,人工智能除了能在醫(yī)學影像識別上有用武之地外,未來還可以整合疾病的各方面信息。此外,從醫(yī)院的管理角度出發(fā),對病人的病種數據、財務管理、床位使用率、周轉率等進行挖掘,對于醫(yī)院的管理提升非常有效。
最后,隨著人工智能在醫(yī)療領域里發(fā)揮的作用越來越大,也引發(fā)了討論:未來,它會不會代替醫(yī)生?
“在海量數據的學習、記憶和超強的計算能力方面,機器超過人類是沒有問題的。但人類的大腦是靠復雜的化學遞質連接的,現在人類對大腦的工作原理的理解還只是冰山一角。而機器僅僅是在模仿人腦的部分機理,從這個角度上來說,人工智能要想取代人類,目前是不可能的,甚至永遠都是不可能的。但人工智能完全可以取代影像科醫(yī)師機械性重復性的勞動,成為醫(yī)師的不知疲倦的助手。最后還有一點很重要,醫(yī)生是個職業(yè)。它需要拿到執(zhí)業(yè)醫(yī)師證,有倫理的一些限制,有個準入門檻,有執(zhí)業(yè)資質的醫(yī)師簽字報告方能生效,這些都是機器無法取代的。”劉士遠告訴記者。