有數(shù)據(jù)顯示,新藥研發(fā)周期平均需要6-7年,而一款藥物從研發(fā)到成功上市至少需要十年的時間以及26億美元的資金投入。借助人工智能,現(xiàn)在從計算機設(shè)計到合成有效蛋白,只需要幾個星期。
瑞典查爾默斯理工大學(xué)的研究人員最近開發(fā)了一種基于AI的方法,稱為ProteinGAN,該方法使用了生成型深度學(xué)習(xí)方法。

蛋白質(zhì)是大而復(fù)雜的分子,在所有活細胞中起著至關(guān)重要的作用,它們會自然地構(gòu)建,修飾和分解我們細胞內(nèi)的其他分子。以蛋白質(zhì)為基礎(chǔ)的藥物非常普遍。糖尿病藥物胰島素是醫(yī)生開具最多的藥物之一。一些最昂貴和有效的抗癌藥物也是基于蛋白質(zhì)的,包括目前用于抵抗新冠病毒的抗體配方。
用于蛋白質(zhì)工程的當前方法依賴于將隨機突變引入蛋白質(zhì)序列。但是,每引入一個額外的隨機突變,蛋白質(zhì)活性就會下降。因此,必須進行多輪非常昂貴且耗時的實驗,篩選出數(shù)百萬個變體,以改造最終與自然界發(fā)現(xiàn)的蛋白質(zhì)和酶截然不同的蛋白質(zhì)和酶。
感謝科技,利用ProteinGAN,現(xiàn)在我們可以在短短幾周內(nèi)從計算機設(shè)計過渡到工作蛋白。
ProteinGAN先是分析處理大量來自經(jīng)過深入研究的蛋白質(zhì)的數(shù)據(jù),然后嘗試創(chuàng)建新的蛋白質(zhì)。同時,系統(tǒng)還需要弄清楚合成蛋白是否是存在。蛋白質(zhì)在系統(tǒng)中來回發(fā)送,直到AI不再區(qū)分天然和合成蛋白質(zhì)為止。
研究團隊使用蘋果酸脫氫酶(MDH)作為模板酶,通過實驗,ProteinGAN生成和實驗測試的序列中有24%(在55個測試中占13個)是可溶的,并在體外測試條件下(包括106個氨基酸取代的高度突變變體)顯示出MDH催化活性。因此,ProteinGAN證明了人工智能在序列空間允許的生物學(xué)限制內(nèi)快速生成高度多樣化的功能蛋白的潛力。
研究人員的下一步是探索如何將該技術(shù)用于蛋白質(zhì)特性的特定改進,例如提高穩(wěn)定性,這可能會對工業(yè)技術(shù)中使用的蛋白質(zhì)產(chǎn)生極大的好處。
降低蛋白質(zhì)工程設(shè)計的速度對于降低酶催化劑的開發(fā)成本非常重要。這是實現(xiàn)環(huán)境可持續(xù)的工業(yè)流程和消費產(chǎn)品的關(guān)鍵。而該研究提出的AI模型將能夠?qū)崿F(xiàn)這一目標,為許多未來的應(yīng)用提供了巨大的潛力。
參考資料:
https://www.sciencedaily.com/releases/2021/03/210330081242.htm
論文鏈接:
https://doi.org/10.1038/s42256-021-00310-5