近日,頂尖學術期刊《自然》上線了一項有關癌癥診斷的重要研究。
與以往不同的是,來自美國加州大學圣迭戈分校的科學家,通過訓練人工智能從血液中鑒定微生物的遺傳物質,不僅可以識別出癌癥,還能對不同類型的癌癥做出區(qū)分。
“這是一個很有前景的方向,改變了傳統(tǒng)的檢測方法,而且運用人工智能技術,使得海量的檢索和比對工作得以快速而準確地完成。”南京信息工程大學教授徐軍評價道。
微生物與腫瘤微環(huán)境息息相關
菌群與人體的關系毫無疑問是十分密切的。有科學家估計,在每個人的身體中細菌的數量占到了人體所有活細胞的90%。此外,我們體內還有許多病毒存在。
這些常駐人體的微生物幾乎參與了人體的一切生命活動,所以,它們的核酸片段(DNA或RNA)也就經血液游蕩在我們體內。
近年來,許多研究證據顯示,人體微生物對多種類型的腫瘤有“貢獻”。科學家猜想,這些微生物在癌癥中所起的作用也許比我們已知的更多。因為以前的癌癥研究工作,忽略了人體癌細胞與微生物可能有復雜的相互作用。
這也就提供了一種全新的檢測癌癥的思路:用正常人血液中與癌癥患者血液做對比,其中的微生物是否會有差別呢?
于是,美國加州大學圣迭戈分校的科學家有了一個大膽的設想:分析血液中來自微生物的遺傳物質,可以根據其特征模式來識別體內的腫瘤。
如果在過去,這種設想真的只能是想想罷了,“這是因為細菌的數量十分龐大,檢測它們的基因序列將是一個海量工程。”徐軍說,但是得益于基因測序技術的發(fā)展,現(xiàn)在測序的費用與時間都在大幅下降,同時微生物的基因測序也能夠運用AI技術,效率能大大提升。
徐軍告訴記者,疾病的檢測、診斷和治療是一個非常復雜的過程,需要借助多方面信息,比如圖像數據、基因數據、分子和蛋白的表達,患者的病史、遺傳背景、家族史等其他數據化信息,以及患者的臨床數據,微生物的核酸特征等等。大數據和機器學習技術的加入,從基因層面、細胞層面、以及微生物層面展現(xiàn)患者個體化的信息。
“我們對這些問題理解越深刻,治療疾病的成功率就越高。”徐軍說,在沒有AI技術之前,盡管我們能夠采集大量的數據,但是由于能力限制,能夠獲取的知識很有限。比如盡管我們能夠破譯人類的基因,但是目前90%以上的信息我們還不能理解對疾病的診斷和治療有什么作用。
人工智能測癌可靠性有多高
研究人員在幾千份樣本中找到相應的微生物特征后,把工作交給了人工智能。通過相應的機器學習模型來挖掘大量數據,把特定的微生物序列特征與特定的癌癥相匹配。
“機器學習的方式主要有監(jiān)督學習和非監(jiān)督學習,從這個項目公開的信息來看,采用的是監(jiān)督學習模式。”徐軍分析說,監(jiān)督學習的特點是人類會把知識傳授給計算機,計算機根據樣本的特征進行學習,接下來就能夠自動區(qū)分疾病或者健康的樣本。
另一種非監(jiān)督學習將能夠使得機器具備更高的智能,即人類沒有給計算機提示,計算機通過歸納的樣本之間的規(guī)律和模式,突破了以往需人類干預才可學習的局限。
“現(xiàn)在還有一種新的非監(jiān)督學習模式——對抗學習,其特點是人類設計出兩個模型,一個用于制造偽裝數據,另一個用于鑒別偽裝,在你來我往中實現(xiàn)互贏,最后達到納什均衡狀態(tài)。”徐軍認為,我國擁有大量的疾病數據,醫(yī)學和人工智能領域之間如果能夠長期深入合作,將能夠更好地為患者服務。
從此項研究的結果來看,這套AI模型在實際診斷中是可靠的??茖W家讓AI對100名患者的樣本血漿進行分析,并與69名健康無癌個體的血樣進行比較。機器學習模型不僅可以區(qū)分患癌和無癌的樣本,還能區(qū)分不同類型的癌癥:以86%的敏感性識別出肺癌患者,對于無肺部疾病的個體沒有出現(xiàn)假陽性報告,并且以81%的準確率區(qū)分出前列腺癌和肺癌。
“達到這個準確率具備了參考價值,但需要注意的是,這個結果可能是在理想的條件下得到的,論文作者可能也剔除了許多不規(guī)范的樣本和數據。”徐軍認為,這還是一項早期的概念驗證研究,應用到臨床還需要做大量工作。
專家認為,AI和大數據的加入,可以完成更加復雜的任務。比如基因序列的讀取,是人的眼睛和智力水平基本上無法完成的,而人工智能和大數據技術的廣泛使用將能夠很好地解決這個問題。
徐軍告訴記者,人工智能技術在醫(yī)學領域得到廣泛的關注,它并不是偶然發(fā)生的,而是建立在近年來以機器學習為代表的深度學習技術取得了巨大突破的基礎上。
“2019年,《自然·醫(yī)學》出版了一期特刊,該特刊的12篇論文全部和人工智能相關,這說明人工智能技術和醫(yī)學結合的爆發(fā)點已經到來。”徐軍說,以人工智能技術為核心的機器能夠極大地彌補人類的不足。
但徐軍也指出,人類醫(yī)生的優(yōu)勢是冷冰冰的機器無法代替的,機器不具備人對疾病的認知和理解,同時,治療的過程不僅僅是數據處理過程,更重要的是醫(yī)生和患者之間的溝通和互動。醫(yī)生對于患者的關懷和安慰是機器無法做到的,而這在治療過程中有時非常關鍵。因此,未來最好的模式是機器與醫(yī)生協(xié)同開展工作。(記者 張 曄)